Suarez Alvarez - Items Invertidos - En.es
Suarez Alvarez - Items Invertidos - En.es
Suarez Alvarez - Items Invertidos - En.es
Copyright © 201
www.psi
Utilización de los elementos invertidos en las escalas de Likert: Una práctica cuestionable
Javier Suárez-Álvarez 1, Ignacio Pedrosa 2, Luis M. Lozano 3, Eduardo García-Cueto 4, Marcelino Cuesta 4
y José Muñiz 4
1 Organización para la Cooperación Económica y el Desarrollo, 2 CTIC Centro Tecnológico, 3 Universidad de Granada y 4 Universidad de Oviedo
Abstracto Resumen
Antecedentes: El uso de elementos formulados en positivo y formas invertidas El USO de ítems inversos en las escalas tipo Likert: una practical
objetivos de reducir el sesgo de respuesta y es una práctica comúnmente utilizado cuestionable. Antecedentes: EL USO de ítems formulados junto con
hoy en día. El objetivo principal de esta investigación es analizar las implicaciones Positivamente Otros inversos Es Una Práctica habitual para Tratar de Evitar
psicométricas de la utilización de elementos positivos y hacia abajo en los sesgos de Respuesta. El objetivo m del Presente Trabajo es analizar v
instrumentos de medición. Las implicaciones psicométricas de Como utilizar ítems Directos e
Método: Una muestra de 374 participantes fue probado con edades comprendidas entre inversos en La Misma prueba. Método: se utilizó Una Muestra de 374
18 y 73 (M = 33,98;
Participantes con Edades comprendidas Entre 18 y 73 años (M =
SD = 14,12), 62,60% eran mujeres. Se utilizó un diseño de medidas repetidas, la
33,98; DT = 14,12), con la ONU
evaluación de los
participantes con positiva, invertida, y las formas de una prueba de fi cacia auto-ef
combinado. resultados: Cuando 62,60% de mujeres. Mediante Un diseño de Medidas repetidas se evaluó a
se utilizan combinaciones de elementos positivos y hacia abajo en la misma prueba Los Participantes En Una prueba de Autoe fi Cacia con tres Condiciones:
de la fiabilidad de la prueba es fl impresionado y la unidimensionalidad de la Todos los ítems Positivos, Negativos todos y Un Combinado de Ambos.
prueba se pone en peligro por fuentes secundarias de varianza. Además, la Resultados:
varianza de las puntuaciones se reduce, y los medios difieren fi significativamente
de los de pruebas en las que todos los artículos son ya sea positivo o invertido, pero no combinado. conclusiones: Cuando Se utilizan en La Misma prueba del tanto ítems Positivos
Negativos Como su fi abilidad
Los resultados de este estudio presente un compromiso entre un potencial de sesgo se deteriora, y la unidimensionalidad de la prueba se ve comprometida por
aquiescencia cuando fuentes secundarias
los artículos están redactados positivamente y un potencial comprensión diferente cuando de varianza. La varianza de las puntuaciones Disminuye, medios y Las di fi eren
se combinan signi fi
elementos regulares y hacia abajo en la misma prueba. La literatura especializada cativamente RESPECTO de las Pruebas en las Que todos los ítems formulados
recomienda la ESTÁN
combinación de elementos regulares e invierte para controlar el sesgo de estilo de positiva o negativamente. Conclusiones: Los Resultados de Este estudio Presentan
respuesta, pero estos Una
resultados los investigadores advierten en su uso, así después de considerar el efecto disyuntiva Entre ONU Posible sesgo de aquiescencia Cuando Los ítems Tienen Una
potencial de las redacción
positiva y Una Comprensión potencialmente diferente Cuando Se combinan ítems
habilidades lingüísticas y los hallazgos presentados en este estudio. Regulares e
invertidos en La Misma prueba. La literatura Especializada Recomienda combinar
ítems
Regulares e invertidos párrafo Poder Controlar el sesgo del Estilo de Respuesta,
Pero estos
resultados advierten un los Investigadores Que los us también Despues De Tener
en Cuenta el
potencial efecto de las Habilidades lingüísticas y de los Hallazgos presentados En
Este estudio .
palabras clave: artículos invierte, recodificada, validez, sesgo de respuestas, teoría de
respuesta al ítem.
Palabras Clave: Ítems invertidos, recodi cación fi, Validez, sesgo de respuestas, Teoría
de
Respuesta al artículo.
Las respuestas a los ítems de una prueba puede ser influenciada por se pueden distinguir, llamado conjunto de respuestas, y el estilo de respuesta
factores (Chiorri,
personales que pueden afectar tanto a los resultados y la validez de las Anselmi, y Robusto, 2009; van Sonderen, Sanderman, y Coyne, 2013). sesgo
interpretaciones Conjunto
(Cronbach, 1946, 1950; Ferrando y LorenzoSeva, 2010; Fonseca-Pedrero de respuestas se refiere al contenido de los ítems, por ejemplo, la elección de
y Debanne, una
2017; NavarroGonzález, Lorenzo-Seva, y Vigil-Colet, 2016). Esto se respuesta socialmente deseable en lugar de la verdad (deseabilidad social). Se
conoce como sesgo de han
propuesto varias alternativas en un intento de evitar este tipo de sesgo, más
respuesta, y se refiere a cualquier tendencia individuo para responder
independientemente
notablemente cuestionarios en los que los examinados elegir entre dos
elementos con la
del contenido que el artículo está evaluando, distorsionando la
puntuación en el rasgo que
deseabilidad social similar (Brown, 2015) de elección forzada. Además, en los
se está midiendo. Dos tipos de sesgo de respuesta últimos
Maydeu-Olivares, 2012).
Recibido: 2 Febrero 2018 • Aceptado: March 22, 2018 sesgo de estilo de respuesta es la tendencia a responder a artículos sin
Autor correspondiente: Javier Organización Suárez
prestar suficiente atención a su contenido. Aquiescencia o la tendencia a
Álvarez de Cooperación y Desarrollo Económico
2, rue André Pascal - Paris Cedex 16 75775 estar de acuerdo con las declaraciones es un ejemplo de sesgo de estilo de
París (Francia) respuesta. Este tipo de sesgo puede producir patrones de respuesta que no
e-mail: [email protected]
reflejen la verdadera per fi l de los examinados, y constituyen una signi fi
cativa
149
Javier Suárez-Álvarez, Ignacio Pedrosa, Luis M. Lozano, Eduardo García-Cueto, Marcelino Cuesta y José Muñiz
amenaza para la validez de las interpretaciones basadas en las fl impresionado, y los patrones de respuesta atípicos aparece (Bourque y Shen,
puntuaciones de 2005;
auto-informe (van Sonderen et al., 2013). El uso de artículos en ambas
formas regulares Carlson et al, 2011;. Hughes, 2009). Estos resultados convergen con las que se
(redactado positivamente) y inversa se introdujo hace décadas con el
objetivo de reducir el encuentran en el marco IRT (Ebesutani et al.,
sesgo de estilo de respuesta (Nunnally, 1978; Paulhus, 1991). Hay dos
estrategias 2012), en la que los elementos que no están codificados inversa demuestran una mejor
principales para la reversión de artículos con el fin de reducir el sesgo de
asentimiento. La precisión (la función de información) y el poder discriminatorio (parámetro una).
primera consiste en añadir negación de tal manera que el sentido de que
el artículo se
cambió sin cambiar sustancialmente el texto (por ejemplo, “ Me A pesar de que en los últimos años la inclusión de temas ordinarios y hacia abajo en
considero una buena la
persona ”Vs“ No me considero una persona buena “). El segundo se misma prueba ha comenzado a ser cuestionada, poco trabajo se ha abordado el tema
puede lograr mediante el de
uso de una expresión antonimia (por ejemplo “ Me considero una mala manera sistemática y, de hecho, todavía se recomienda (Weijters, Baumgartner, y
persona “). Para Schillewaert,
reducir el sesgo de estilo de respuesta, los desarrolladores de prueba 2013) . La mayoría de los instrumentos de medición utilizados tanto en la investigación,
recomiendan que así
algunos de los elementos que componen una prueba de la carrocería son como en las diferentes áreas de la psicología aplicada todavía incluye ambos tipos de
inverso (Abad, artículos
Olea, Ponsoda y 2011; Nunnally, 1978; Paulhus, 1991; Prieto y Delgado, en la misma prueba. Desde un punto de vista metodológico, una de las principales
1996). Más limitaciones
específicamente, la práctica más común es incluir elementos con encontradas en la investigación anterior es el uso de diferentes muestras para evaluar
negaciones (Swain, los
Weathers, y Niedrich, 2008). Sin embargo, hay varias razones para
criticar esta estrategia, y diferentes tipos de artículos, lo cual no garantiza la comparabilidad de los resultados,
afirman que hay más desventajas que ventajas (Weijters y Baumgartner, confundiendo artículos y efectos de los participantes. La manera más rigurosa para
2012; Weijters, evaluar el
Cabooter, y Schillewaert, 2010; Weijters, Geuens, y Schillewaert, 2009). efecto de combinar elementos regulares y invertidas son la evaluación de los mismos
La primera, y más los
obvia desventaja, es que la estrategia de incluir artículos inversa de la examinados en diferentes momentos, utilizando un diseño de medidas repetidas. Hasta
carrocería contradice la
una de las principales directrices para el desarrollo material: tratar de fecha, este diseño no se ha utilizado, y esto va a ser nuestro propósito. El objetivo
evitar formulaciones principal de
negativas (Haladyna, Downing, y Rodríguez, 2002; Haladyna y Rodríguez, esta investigación es analizar el efecto del uso de elementos invertidos en las
2013; Carril, propiedades
Raymond, y Haladyna, 2016; Moreno, Martínez, y Muñiz, 2004, 2006, psicométricas de la prueba. Todos los participantes fueron evaluados tres veces de
2015). Además, diferentes
invirtiendo artículos mediante el uso de una expresión antonimia puede
producir problemas maneras con una prueba de fi cacia auto-EF.
de interpretación debido a que el significado de que el elemento puede
cambiar
sustancialmente (por ejemplo, hace “ No soy una buena persona
”Significa lo mismo que“ yo
soy una mala persona “?). Investigaciones anteriores sugieren que el
procesamiento
cognitivo de estos dos tipos de artículos no es necesariamente lo mismo, Investigaciones anteriores sugieren que el procesamiento cognitivo no es el
más aún cuando mismo para
las habilidades de lectura son pobres (Marsh, 1986, 1996). Por otra los elementos positivos y negativos formulados (Marsh, 1986, 1996; Mestre,
parte, el uso de 1988). Para
elementos invertidos en conjunto con los objetos directos implica que las analizar si la formulación de los elementos (positivamente, negativamente,
respuestas a los combinadas)
elementos invertidos tienen que ser recodificados con el fin de obtener la influye en los resultados, una prueba general de inteligencia (razonamiento
puntuación total de abstracto) y dos
la escala. Este proceso asume que los dos extremos de un elemento de escalas de comprensión verbal se administraron, lo que permitió un análisis más
tipo Likert (por detallado de
ejemplo “ Totalmente en desacuerdo ”Y“ Completamente de acuerdo “) las respuestas de los participantes. Otro aspecto a destacar es que, además de
Dará exactamente la la perspectiva
misma puntuación y tienen el mismo significado semántico en el de la Teoría de prueba clásica, modelos de IRT se han utilizado, que permite un
constructo que se está análisis más
midiendo, y estos supuestos son cuestionables y afecta a las preciso de las propiedades psicométricas los instrumentos de medición (De
propiedades psicométricas de Ayala, 2009; van
la prueba. Essau et al. (2012) llevaron a cabo una investigación der Linden y Hambleton, 1997; Wilson , 2005). En resumen, este estudio se
transcultural en cinco países realizó para
europeos para analizar la estructura factorial de la La fuerza y la di fi cultades CuestionarioSDQ),(comparar las propiedades psicométricas de la prueba fi cacia
auto-EF a través de tres formas
concluyendo que cuando los elementos invertidos se eliminan el modelo fi cio a los datos fi (Forma A: artículos formulados en positivo; Formulario B: artículos
redactados en sentido
mejora de forma significativa, tanto para el total de la muestra y por país. van Sonderen et inverso; y la Forma C: tanto el tipo de formulación combinada) a través
de coeficientes
al. (2013) en comparación las propiedades psicométricas de un conjunto de elementos fiabilidad coe fi, índices de discriminación artículo, bondad de fi t del
modelo de un factor, las
regulares con un conjunto de elementos que contienen ambos elementos regulares y pruebas de invariancia de medición, y comparación de medias y
correlaciones.
150
Utilización de los elementos invertidos en las escalas de Likert: Una práctica cuestionable
en la prueba requiere las respuestas a los ítems invertidos para ser recodificados,
suponiendo que anotar en cada medio de elementos una puntuación baja en la auto-e fi cacia (por ejemplo “ Me
los dos de una escala de tipo Likert pueden dar exactamente el mismo resultado.
extremos Sin siento incapaz de superar los obstáculos ”O“ No hago uso de los recursos a mi alrededor “). Para
embargo, las respuestas de los examinados tienden a estar en desacuerdo con los
objetos la construcción de la Forma C, sólo los elementos reversekeyed, que usa palabras de
invertidos más de lo que están de acuerdo con los artículos regulares (Solís-Salazar,
2015). Por lo significado opuesto en lugar de la negación, fueron seleccionados. Una vez que se aplicó este
tanto, la cuarta hipótesis es que hay diferencias estadísticamente significantes fi
cativas en las criterio para la selección de artículos inversa de la carrocería, los elementos regulares fueron
puntuaciones medias entre las formas regulares, invertidas, y combinadas de la misma
prueba. seleccionados al azar. Esto indica que la selección de los artículos regulares no fue
Específicamente, se espera que la Forma B para mostrar la media más alta y la Forma A
para completamente al azar, pero condicionado por los criterios de negaciones evitando, en la
mostrar la media más baja. El proceso cognitivo utilizado por los encuestados para los
artículos investigación anterior ha sugerido que esto es una estrategia mejor (Weijters y Baumgartner,
regulares y invertida no es necesariamente el mismo desde la comprensión de un
elemento inverso 2012). Finalmente, 10 unidades regulares positivamente formulan y se incluyeron 10 unidades
requiere de habilidades lingüísticas mejor. La dificultad en la comprensión se agrava
cuando la gente invertidas.
tiene que alternar entre el procesamiento de elementos regulares e invertidas. Por lo
tanto, nuestra
quinta hipótesis es que las diferencias de puntuación entre regular, invierten, y formas
combinadas
desaparecen cuando se controla por la comprensión verbal. Por último, la consecuencia
lógica prueba de razonamiento abstracto
deriva de la combinación de elementos regulares y combinados es que si la combinación
de
artículos, de hecho, reducir el sesgo de allanamiento, la variabilidad de las respuestas
debe ser los Aptitudes Mentales Primarias se utilizó; (Thurstone, 1996 PMA) Escala de
mayor en la forma combinada que en las formas en la que todos de los artículos son o
bien regular o razonamiento abstracto. Se compone de 30 artículos de la serie de letras lógicas con
invertido. Por lo tanto, la sexta hipótesis es que la combinación de temas ordinarios y
hacia abajo en opciones 6 de respuesta. El coeficiente de fiabilidad de la escala en la muestra actual es
la misma prueba aumentaría la variabilidad de las respuestas. la consecuencia lógica
derivada de la 0,95. El primer factor explica 36.23% de la varianza, y los datos muestran una escala
combinación de elementos regulares y combinados es que si la combinación de los
elementos, de unidimensional modesto (GFI [Bondad de Índice Fit] = 0,93; estandarizado Root Mean
hecho, reducir el sesgo de allanamiento, la variabilidad de las respuestas debe ser
mayor en la Square de Residuos [SRMSR] = 0,14).
forma combinada que en las formas en que la totalidad de la artículos son ya sea
normal o invertida.
Por lo tanto, la sexta hipótesis es que la combinación de temas ordinarios y hacia abajo
en la misma
prueba aumentaría la variabilidad de las respuestas. la consecuencia lógica derivada de la combinación de elementospruebasderegularescomprensiónycombinadosverbal es que si la combinación de los elementos, de hecho,
reducir el sesgo de allanamiento, la variabilidad d
Método Con el fin de probar las hipótesis propuestas, se desarrollaron tres formas diferentes de la misma
prueba. La primera, la Forma A, se compone de 20 elementos, todos formulados positivamente (por
Participantes ejemplo, “ Soy capaz de superar los obstáculos ”O“ Hago uso de los recursos a mi alrededor “). La
segunda, la Forma B, se compone de 20 elementos, todos ellos formulados negativamente. Parte de los
artículos invertidas utiliza palabras de significado opuesto, y otros utilizan negaciones directos de los
La muestra utilizada es incidental y se compone de 374
participantes de la población española en general, evaluado en artículos regulares (4 negación y 16 expresiones antonimia). Como todos los elementos se invierten, un
instrumentos
151
Javier Suárez-Álvarez, Ignacio Pedrosa, Luis M. Lozano, Eduardo García-Cueto, Marcelino Cuesta y José Muñiz
explica 28.14% de la varianza y los índices de fi t confirman que los Medición invariancia través de los formularios se analizó usando el único modelo
datos fi ts una CFA un
estructur rasgo de tres forma. El modelo de base se compone de 60 indicadores y tres
a esencialmente unidimensional (GFI = factores
.96; SRMSR = 0,10). En cuanto a evidencia de validez en relación con otras correlacionados (Forma A, Forma B y Forma C), con 20 indicadores de carga en
variables, la cada factor.
prueba refranes tiene una correlación de 0,49 ( p < . 001) con la escala de Para la prueba de invariancia factor de carga, restricciones de igualdad en los
razonamiento tres pesos de
abstracto PMA y 0.49 ( p < . 001) con los antónimos de prueba utilizados en los factores de los 20 artículos se resolvieron simultáneamente, es decir, el
este estudio. punto 1 = 21 =
elemento de objeto 41 al punto 20 del artículo = 40 = artículo 60. Además, se
estimaron los
parámetros de los ítems junto con la función de información de análisis en el
marco de la
IRT utilizando el modelo de respuesta gradual (Samejima, 1969). Los errores
Diseño residuales
estandarizadas de los artículos en las tres formas de la prueba fi cacia auto-ef
se analizaron
Un diseño de medidas repetidas se utilizó en el que se evaluaron todos los gráficamente para examinar la fi t de los datos al
participantes modelo.
en tres momentos diferentes por tres formas de una prueba selfef fi cacia
(Forma A: artículos
regulares; Forma B: artículos invertidas; Forma C: artículos combinados). Cada
forma se
administró con una diferencia de al menos una semana a efectos de memoria Además, se realizó un análisis multivariado de varianza (MANOVA) para
evitar. Al mismo examinar el
tiempo, se les administró el razonamiento abstracto se ha mencionado efecto de la orden de aplicación. Entonces, al sesgo de aquiescencia estudio, se
anteriormente y las realizó
escalas de comprensión verbal. Para controlar el efecto del orden de una prueba de Levene de homogeneidad de la varianza. Una
administración, 6 prueba de medidas
cuadernillos de la prueba con diferentes combinaciones de las formas de repetidas ANOVA se realizó para estudiar la diferencia en las medias de los
ensayo fueron participantes
asignados aleatoriamente (ABC = 59; ACB = 48; BAC = 59; BCA = 53; CAB = 78; en las tres medidas fi cacia auto-EF (factor intrasujeto). Finalmente, se
CBA = 77). añadieron las
puntuaciones en razonamiento abstracto y la comprensión verbal como
covariables para
controlar la influencia que las variables de aptitud pueden tener en las
puntuaciones de los
participantes (ANCOVA). El tamaño del efecto se estimó utilizando parcial eta
cuadrado
(Trigo y Martínez, 2016). Los datos se analizaron con el programa SPSS 20 (IBM,
Procedimiento 2011),
factor de 9,2 (Lorenzo-Seva y Ferrando, 2013; Ferrando y
Lorenzo-Seva,
Con el fin de estandarizar la administración de la prueba, un
protocolo fue creado
dando instrucciones para la aplicación de la prueba. Esto fue dado a los
administradores
de la prueba junto con el folleto de prueba. La prueba se realizó en 2017), TAP 12 (Brooks & Johanson, 2003), MPLUS 7,3 (Muthén y
formato lápiz (75,40%) Muthén,
y en línea (24,60%) de papel y aunque en este último caso se omitieron 2012), FlexMIRT 2 (Cai, 2013) y ResidPlots-2 (Liang, Han, y
las pruebas de Hambleton,
razonamiento abstracto y la comprensión verbal, debido a la dificultad
de controlar las 2009).
condiciones de prueba (es decir, tiempo, ayuda externa en el
contestador, etc). Los
participantes no reciben ningún tipo de compensación por su
participación, su
tabla 1
participación era voluntaria y la confidencialidad de sus datos fue
asegurada. La
índices de discriminación de elementos regulares,
invertidas y combinados
evaluación se llevó a cabo en cumplimiento de las normas éticas
actuales, y la
Formulario A:
Regular Formulario B: Invertida Forma C: Combinado
investigación fue aprobado por el comité de ética de la Universidad de
Oviedo. Todos los Artículos
criterios: TPI> 0,90; TLI> 0,90; RMSEA <0,08; SRMR <0,08 (Kline, 2010).
Los criterios de 20 . 644 1.95 . 606 1 1.82 1 . 358 0.97
información de Akaike (AIC) y el Criterio de Información Bayesiano (BIC)
también se
Alfa de
utilizaron para el estudio de la pérdida de información, por lo que cuanto
más bajo mejor . 932 . 921 . 879
Cronbach
(Kline, 2010).
Nota: 1 artículos Invertida - antonyms-; 2 artículos Invertida - negaciones -; r ix = correlación-test elemento
corregido; a = parámetro
de
discriminación
IRT
Función de Información de la IRT se presentan en
la Figura 1
152
Utilización de los elementos invertidos en las escalas de Likert: Una práctica cuestionable
resultados ser la forma regular, con la forma inversa de estar muy cerca de ella.
Estos resultados explican, en gran medida, las diferencias
La fiabilidad y la discriminación de artículos encontradas entre las funciones de información de las pruebas, y
convergen con los resultados de CTT.
Los coe fi cientes fiabilidad también se reducen, alcanzando Con el fin de evaluar la invariancia de medición, una trait- tres
significación forman solo modelo CFA que constreñido el factor de cargas a ser
estadística cuando se comparan las formas regulares y combinados ( p < igual a través de las formas
. 001) y cuando
A, B, y C, disminuyendo sustancialmente el modelo fi t, se llevó a
el invertido y combinado se comparan ( pag
cabo ( χ 2= 2914.259, df = 1750; CFI = 0,604; TLI = 0,599; RMSEA =
<0,001), pero no entre las formas regulares e inversa ( p = . 074). La 0,042; SRMR = 0,095; AIC = 54786; BIC = 55.335).
fórmula de Spearman-Brown se utilizó para predecir la fiabilidad
prueba-reprueba si en lugar de 10 elementos comunes no había
habido 20. El test-retest fiabilidad coeficiente para los elementos
regulares (2, 5, 6, 8, 9, 25
11, 13, 16, 18, y 20) fue 0,77, para los elementos inversa (1, 3, 4, 7, 10,
12, 14, 15, 17, y 19) era 0,80. Los datos también fueron analizados 20
parámetro
0
-3 -2 -1 0 1 2 3
una para los elementos de las formas regulares, invertidas, y
Informaci
0,99 y
puntajes theta
3,01 para la forma regular ( una = media 1,86), entre 0,55 y 2,54 para
la forma inversa ( una = media 1,71), y entre 0,82 y 1,99 para la forma
combinada ( una = media 1,36). Está claro que los elementos con poder Un formulario: Regular B formulario: Invertida C formulario: Combinado
Tabla 2
Propiedades psicométricas de la regular, invertido, y formas combinadas de la prueba fi cacia auto-ef
RMSEA [IC
90%]
341.624 0,052
(170) * [0,044-0,060]
298.821 . 911 . 901 0,045 0,048 18.249 18.484
Formulario B: Invertida
(170) * [0,036-0,053]
455.306 0,067
Nota: χ 2= Prueba de chi-cuadrado; df = grados de libertad; CFI = comparativo Índice Fit; TLI = Tucker Índice de Lewis; RMSEA = Root Mean Square Error de aproximación; SRMR =
estandarizada Root Mean Square residual; AIC = Información de Akaike Criterio; BIC = Información Bayesiano Criterios
* p < . 001
El porcentaje de varianza explicada - utilizando el enfoque CFA - era 48,19 para la forma regular, 46,89 para la forma inversa y 35,87 para la forma combinada
153
Javier Suárez-Álvarez, Ignacio Pedrosa, Luis M. Lozano, Eduardo García-Cueto, Marcelino Cuesta y José Muñiz
Medios, varianzas y correlaciones entre las varianzas de las formas regulares, invertidas, y combinados.
Con el fin de comprobar el efecto de la orden de aplicación, un Tabla 3 muestra los resultados de los ANOVA de medidas repetidas para
MANOVA se realizó para estudiar las diferencias entre las puntuaciones examinar la diferencia en las medias entre la regular, invierte, y formas
totales en el regular, invierte, y forma combinada por el orden de seis combinadas de la prueba fi cacia
aplicación. Las pruebas multivariantes para el efecto de orden auto-ef. Mauchly es prueba de esfericidad fue estadísticamente significativo ( p = . 004) y la
Greenhouse-Geisser
utilizando el test de traza la Pillai' no fueron estadísticamente
significativos ( F = 1.165; df
la corrección se utilizó en la interpretación de los resultados. Como puede verse en la
=15; p = . 294; η 2= 0,021) usando Lambda ambos Wilks' ( F = 1.167; df
Tabla
= 15; p = . 293; η 2= 0,021) y la traza de Hotelling ( F =
3, las diferencias entre las medias fueron estadísticamente significantes
1.168; df = 15;
( p < . 001) y el tamaño efecto moderado ( η 2> 0,10). Además, el
p = . 291; η 2= 0,021). El examen de las diferencias en las tres
Bonferroni prueba fue estadísticamente significativo en todas las
formas de la prueba e fi auto-ef en términos de la orden de
comparaciones por pares ( p < . 001). Las puntuaciones más altas fi
aplicación (pruebas de efecto entre-sujetos) demostró que no hay
Cacy media auto-EF se observaron en la forma inversa, seguida por las
diferencias estadísticamente significantes fi cativas, ya sea en la
formas de la combinada y las regulares. Tres ANCOVAs medidas
forma regular ( F
repetidas se llevaron a cabo incluyendo las puntuaciones obtenidas por
(5, 276) = 0,914; p = . 472) o la forma inversa ( F ( 5, 276) = 1.536; pag
los participantes en la comprensión verbal y pruebas de razonamiento
=0,179). Aunque se encontraron estadísticamente signi fi
abstracto como covariables. Las diferencias anteriormente visto en
diferencias signifi en forma combinada ( F ( 5, 276) = 2.447; p = . 034),
medio de la normal invierten, y formas combinadas desaparecen cuando
el tamaño del efecto estimado a través parcial eta cuadrado ( η 2=
se controla por el efecto de la comprensión verbal (dichos y antónimos).
0,042) indica que las diferencias son pequeñas. El examen de las
En el caso del razonamiento abstracto, las diferencias son
diferencias en las tres formas de la prueba e fi auto-ef en términos
estadísticamente significativos, pero el tamaño del efecto indica que las
de orden de aplicación (pruebas de efecto entre-sujetos) demostró
diferencias encontradas son prácticamente cero.
que no existen
Tabla 3
Las estadísticas descriptivas y pruebas de signi fi cación: normal, invertido, y formas combinadas de la prueba fi cacia auto-ef
Orden de administración
UNA si C
ABC 73,10 (10,25) 80,07 (11,75) 77,42 (10,15) 16.58 <.001 0,222
(12,37 (9,77
ACB 70,00 (10,41) 75,13 ) 70,54 ) 4.98 . 016 0,096
BAC 71,04 (12,30) 76,48 (11,75) 73,69 (12,87) 8.94 <.001 0,160
BCA 72,08 (13,39) 74,46 (14,18) 72,24 (10,83) . 849 . 432 0,023
TAXI 71,93 (10,21) 77,56 (12,35) 74,95 (10,63) 7.49 <.001 0,151
CBA 74,45 (11,59) 79,09 (11,82) 75,13 (11,48) 5.74 . 004 0,111
UNA si C
notas: A = Forma A (elementos regulares); B = Forma B (artículos invertidas); C = Forma C (elementos regulares y revirtió combinados). M = promedio global entre sujetos. Media, SD = Desviación Estándar
* Tenga en cuenta que la F ensayos indicados en esta tabla son las diferencias intra-sujetos, los promedios globales de A, B, y C son estadísticamente significativos en todos los casos. Post-hoc test: B> C> A, p < . 001
Tabla 4
compuesta 1
1 Las puntuaciones compuestas se crean mediante la conversión de cada puntaje bruto de refranes, antónimos, y PMA
154
Utilización de los elementos invertidos en las escalas de Likert: Una práctica cuestionable
Discusión
Basándose en los resultados del presente estudio hay cuatro razones
fundamentales para desalentar la combinación de elementos regulares y invertidas en
El uso de ambos elementos regulares y hacia abajo en la misma prueba. La primera razón es que el proceso cognitivo utilizado por los
las pruebas se introdujo con el objetivo de reducir el sesgo encuestados para cada tipo de elemento no es necesaria la misma, según la
de respuesta (Nunnally, 1978; Paulhus, 1991). En la investigación anterior (Marsh, 1986, 1996; Mestre, 1988). Aunque este estudio no
actualidad, un número significativo de los instrumentos de proporciona específico evidencia empírica sobre este tema, los resultados obtenidos
medición continúan utilizando esta estrategia y hay están de acuerdo con esta hipótesis. Desde un punto de vista psicológico, la
investigadores que recomiendan su uso (Weijters et al., comprensión de un elemento inverso necesita mejores habilidades lingüísticas, por lo
2013). Los que abogan por la combinación de elementos que estos elementos favorecen a aquellos examinados con mejor capacidad verbal. El
regulares y hacia abajo en la misma prueba argumentan problema se agrava cuando los examinados tienen que alternan entre
que cuando todos los artículos están en la misma dirección,
el sesgo de allanamiento y otro sesgo de respuesta pueden
estar presentes. La razón que dan para justificar el uso de
esta estrategia es que los efectos producidos por el método
de estos mecanismos están enmascarados por completo, y
pueden ser indetectable a menos que una medida directa
de efectos de método se utiliza (Podsakoff, MacKenzie, Lee,
y Podsakoff, 2003); los cuales medios de combinación
elementos regulares e invertidas para obtener una medida
de este tipo.
La tercera razón es que las propiedades psicométricas de al, 2003; Woods, 2006). Estos resultados parecen estar en línea con la
la prueba son sustancialmente peor cuando los temas idea de que, cuando los elementos regulares y su reversión, se
ordinarios y su reversión, se combinan en la misma prueba. combinan en la misma prueba, se bene fi cios aquellos examinados con
Los resultados muestran que la precisión de la prueba y el mejores habilidades verbales. Como consecuencia, el constructo que
poder discriminatorio de los elementos disminuye cuando se está midiendo puede estar contaminado por otras variables que
los artículos regulares y su reversión, se incluyen en la tienen poca relación con el objetivo de la evaluación. Algunos
misma prueba. Estos resultados están en línea con los investigadores han sugerido que la personalidad también pueden
encontrados por otros autores (Bourque y Shen, 2005;. estar involucrados en la forma de responder a cuestiones regulares y
Carlson et al, 2011; Chiavaroli, 2017; Ebesutani et al, 2012;. hacia abajo en la misma prueba (DiStefano y Motl, 2009;. Horan et al,
Hughes, 2009; Józsa y Morgan, 2017; Solís-Salazar, 2015). 2003). Las investigaciones futuras arrojar más luz sobre lo que
También vale la pena señalar que la fiabilidad prueba- realmente está siendo evaluado cuando los elementos se combinan y
reprueba es de alrededor de 0,80, sin embargo, las sobre cómo el constructo supuestamente se está midiendo es
también se ve afectada, lo que hace más difícil para apoyar puntuaciones más altas se ven en la forma inversa, seguido por el
la idea de la unidimensionalidad. Estos resultados convergen combinado, y el regular. Estos resultados pueden estar relacionados con el
con otros resultados en la literatura científica, y apoyan la sesgo con fi rmación, la tendencia para activar las creencias que son
155
Javier Suárez-Álvarez, Ignacio Pedrosa, Luis M. Lozano, Eduardo García-Cueto, Marcelino Cuesta y José Muñiz
sentido en el que el artículo está escrito (Davies, 2003). Estudios previos han artículos invertido para controlar el sesgo de estilo de respuesta, pero estos
sugerido que si un resultados los
elemento se presenta primero, las puntuaciones en los ítems invertidos son investigadores advierten en su uso, así después de considerar el efecto
inverso más altos potencial de las
(Weijters et al., 2013). Sin embargo, los resultados del presente estudio
muestran que las habilidades lingüísticas y los hallazgos presentados en este estudio.
puntuaciones más altas se obtienen cuando todos los elementos se invierten.
Con respecto a estos
resultados, vale la pena recordar que los examinados tienden a estar en Ciertas limitaciones deben tenerse en cuenta a la hora de interpretar los
desacuerdo con los objetos resultados.
invertidos más de lo que están de acuerdo con los artículos regulares (Solís- Lo más importante, sería conveniente mejorar tanto la representatividad de la
Salazar, 2015). Por muestra y
ejemplo, con el tema “ Soy capaz de organizar mi propio trabajo ”38% de los usar otras muestras para comprobar la validez de los resultados a nivel
participantes transcultural
respondieron,“ Totalmente de acuerdo ”. Cuando el artículo fue presentado a (Byrne y van de Vijver, 2017;. Essau et al, 2012; Muñiz, Elosua , Padilla, y
los mismos como los Hambleton,
examinados “ Soy incapaz de organizar mi propio trabajo ”, El 48,2% 2016). Esto mejoraría la robustez de los resultados relacionados con la bondad
respondió“ Totalmente en de la
desacuerdo ”. Tenga en cuenta que estos dos elementos tendrían la máxima evaluación fi cio, la precisión de las estimaciones de los parámetros, y la
puntuación en la auto-e evaluación
invariancia de medición. Los resultados de esta investigación se centran
fi cacia vez que se redirige el elemento inverso. principalmente
en la aquiescencia sesgo, en el futuro, sería útil examinar más profundamente
en el otro
sesgo de respuesta como descuidada responder (Kam y Meyer, 2015). En esos
casos,
En resumen, de acuerdo con los resultados obtenidos, la estrategia sería aconsejable el uso de escalas de infrecuencia (donde la respuesta al ítem
de utilizar se
elementos regulares y revirtió combinados en una sola prueba tiene conoce previamente), que permitiría la detección de personas que responden al
significantes azar o
consecuencias fi no puede negativas: a) la precisión de la medición del
instrumento es fl de forma deshonesta (Muñiz et al., 2014). Para una estimación del efecto de
awed; b) la interpretación de unidimensionalidad instrumento se pone en
peligro por aquiescencia en las respuestas, post-hoc se recomiendan controles a través de
fuentes secundarias de varianza; c) la varianza de la forma combinada es medidas explícitas de consentimiento (Baumgartner y Steenkamp, 2001;
reducida; d) Weijters et al,
las puntuaciones de los examinados difieren fi significativamente de los 2013).. La importancia de sesgo aquiescencia cuando se utiliza una
obtenidos en administración test
pruebas en las que todos los artículos son de forma similar; e) las
habilidades verbales adaptativo informatizado tiene que ser investigado (Pedrosa, Suárez-Álvarez,
en las respuestas de los examinados uir fl. Estas conclusiones son dignas García-Cueto, y Muñiz, 2016). Por último, una de las alternativas más
de promisorias para
consideración por varias razones. En primer lugar, se utilizó un diseño de el control de los estilos de respuesta es el uso de viñetas de anclaje (Bolt, Lu, y
medidas Kim,
repetidas, que no ha sido usado antes con estos objetivos. Esto permite 2014) a pesar de que también se han presentado limitaciones cuando los
una supuestos son
investigación mucho más exhaustiva, rigurosa, la reducción de las
fuentes de error, y la violados (von Davier, Sim, Khorramdel, y Stankov, 2017).
atribución de diferencias en las características del instrumento de
medición, evitando
efectos de confusión. En segundo lugar, la comparación de los resultados
cuando todos
los artículos son regulares, todos están invertidas, y cuando se
combinan ambos tipos
destaca que el problema no es con los objetos regulares, sino más bien
con la
combinación de elementos regulares y hacia abajo en la misma prueba.
En tercer lugar,
la evaluación de clientes potenciales habilidades verbales para una
mejor comprensión Agradecimientos
de las consecuencias de la combinación de elementos en los procesos
psicológicos de
los participantes al responder, que confirman investigaciones anteriores Las opiniones expresadas en el documento representan los puntos de
(van Sonderen, vista
2013;. Weijters et al, 2013). En conclusión, los resultados de este de los autores y no representan una posición de fi cial de la Organización
estudio presente un para la
compromiso entre un potencial de sesgo aquiescencia cuando los Cooperación y el Desarrollo. Esta investigación fue financiada por la
artículos están Asociación
redactados positivamente y un potencial comprensión diferente cuando Española de Metodología de las Ciencias del Comportamiento y de la
se combinan Salud
(AEMCCO), miembro de la Asociación Europea de Metodología (EAM), y por
elementos regulares y hacia abajo en la misma prueba. el
programa FPI del Ministerio de Economía y Competitividad del Gobierno
de
España (PSI2014- 56114-P, BES2012-053488, y PSI2017-85724-P).
referencias
Abad, FJ, Olea, J., y Ponsoda, V. (2011). Medición en Ciencias Sociales
y de la Salud [ De medición en las ciencias sociales y de salud]. Madrid: Síntesis.
Alessandri, G., Vecchione, M., Fagnani, C., Bentler, PM,
Barbaranelli, Bolt, DM, Lu, Y., y Kim, JS (2014). Medición y control de
C., Medda, E., ..., y Caprara, GV (2010). Mucho más que el estilos de respuesta utilizando viñetas de anclaje: un enfoque basado en modelos.
modelo fi tting? La evidencia de la heredabilidad del efecto Métodos psicológicos, 19 ( 4), 528-541. doi:
método asociado ítems formulados en positivo de la 10.1037 / met0000016 Bourque, LB, y Shen, H. (2005).
orientación de vida Revisado Test. Características psicométricas de español
Modelos de Ecuaciones Estructurales, 17, 642-653. DOI: 10.1080 / y versiones en inglés de la escala Mississippi Civil. Journal of
10705511.
Traumatic Stress, 18 ( 6), 719-728. doi: 10.1002 / jts.20080
2010.510064
Brooks, GP, y Johanson, GA (2003). programa de análisis de la prueba. Aplicado
Baker, F. (2001). Los fundamentos de la teoría de respuesta al ítem.
Universidad de
La medición psicológica, 27, 305-306. Brown, A. (2015). modelos de
respuesta al ítem de cuestionarios de elección forzada:
Maryland: College Park: Cámara de compensación en
Valoración y Evaluación. Un marco común. Psychometrika, 81 ( 1), 135-160. dOI: 10.1007 / s11336-
014-9434-9
Brown, A., y Maydeu-Olivares, A. (2012). ¿Cómo podemos resolver los problemas IRT
Baumgartner, H., y Steenkamp, JBEM (2001). estilos de respuesta ipsativas de los datos en el cuestionario de elección forzosa. Métodos psicológicos, 18 ( 1),
36-52.
en la comercialización de la investigación: Una investigación transnacional. Journal of Marketing
Research, 38, 143-156. doi: 10.1509 / jmkr.38.2.143.18840 Böckenholt, U. (2012). Modelado de Byrne, B., & van de Vijver, FJR (2017). La máxima verosimilitud
múltiples procesos de respuesta en el juicio enfoque de alineación para las pruebas de invariancia medida aproximada: Una
aplicación
y la elección. Psychological Methods, 17, 665-678. transcultural paradigmático. Psicothema, 29, 539-551.
156
Utilización de los elementos invertidos en las escalas de Likert: Una práctica cuestionable
437. doi: 10.1080 / 00223891.2012.662188. of Mathematical y Psicología de Estadística, 63, 427-448. Ferrando, PJ, y Lorenzo-
Seva, U.
Elosua, P., y Zumbo, BD (2008). cientes fiabilidad coe fi para
(2017). FACTOR programa a las 10:
ordinal
escalas de respuesta. Psicothema, 20 ( 4), 896-901. Orígenes, el desarrollo y las direcciones futuras. Psicothema, 29, 236-240.
Ferrando, PJ, Lorenzo-Seva, U., y Chico, E. (2003). Factor sin restricciones
Esaú, CA, Guzmán, BO, Anastassiou-Hadjicharalambous, X., Pauli,
G., Gilvarry, C, Bray, D., ..., y Ollendick, TH (2012). propiedades procedimientos analíticos para evaluar la respuesta aquiescente en escalas de personalidad, teóricamente
unidimensionales equilibrado. Multivariante Investigación del Comportamiento, de 38 años, 353-374.
psicométricas de la
fuerza y di fi cultades al cuestionario de cinco países
europeosInternational. Journal of Methods in Psychiatric Research, Fernández-Alonso, R., Suárez-Álvarez, J., y Muñiz, J. (2012). imputación
21 ( 3), 232-245. doi: 10.1002 / mpr.1364 métodos para datos faltantes en la evaluación de diagnóstico educativo.
Psicothema, 24 ( 1), 167-175.
Evers, A., Muñiz, J., Hagemeister, C., Hstmælingen, A., Lindley, P., Fonseca-Pedrero, E., y Debbané, M. (2017). y los rasgos esquizotípicos
Sjöberg, A., y Bartram, D. (2013). La evaluación de la calidad de las psicóticos similares a las experiencias durante la adolescencia: Una actualización.
Psicothema,
pruebas: Revisión del
29, 5-17. IRT software para análisis residuales gráficas. Applied Psychological
Measurement, 33 ( 5), 411-412.
Lorenzo-Seva, U., y Ferrando, PJ (2013). Manual del programa
FACTOR v. 9.20. Obtenido de: http: // factor de psico.fcep.urv.es/utilitats/ /
documentación / manual-de-la-Factor-Programa-v92.pdf Marsh, HW (1986).
Negativo tema sesgo en las calificaciones de las escalas para preadolescentes
hijos: Un fenómeno cognitivo-evolutivo. Psicología del Desarrollo, 22
( 1), 37-49.
doi: 10.1037 / 0012-1649.22.1.37
Marsh, HW (1996). Positiva y negativa autoestima mundial:
Una sustantivamente distinción significativa o artifactors?
Journal of Personality and Social Psychology, 70, 810-819. doi:
10.1037 / 0022-
3514.70.4.810
Mestre, JP (1988). El papel de la comprensión del lenguaje en matemáticas
y la resolución de problemas. En RR Cocking y JP Mestre (Eds.),
Lingüística y cultural influencias sobre el aprendizaje de las
matemáticas ( pp. 200-220). Hillsdale, NJ: Lawrence Erlbaum
Associates. Moreno, R., Martínez, R., y Muñiz, J. (2004). Directrices
para la construcción
de varios elementos de prueba elección. Psicothema, 16 ( 3), 490-497.
Moreno, R., Martínez, R., y Muñiz, J. (2006). Nuevas directrices para
el desarrollo de preguntas de elección múltiple. Metodología, 2 ( 2), 65-72.
Moreno, R., Martínez, R., y Muñiz, J. (2015). Directrices sobre la base de validez
criterios para el desarrollo de reactivos de opción múltiple. Psicothema, 27 ( 4),
388-394. doi:
10.7334 / psicothema2015.110
Muñiz, J., Elosua, P., Padilla, JL, y Hambleton, RK (2016). Prueba
normas de adaptación para la evaluación cruzada lingual. En CS Wells y
M. Faulkner-Bond (Eds.), La medición de la Educación. Desde los cimientos
para el futuro (pp. 291-304). Nueva York: Guilford Press El. Muñiz, J.,
Sánchez, P., y Yela, M. (1986). Comprensión verbal en
157
Javier Suárez-Álvarez, Ignacio Pedrosa, Luis M. Lozano, Eduardo García-Cueto, Marcelino Cuesta y José Muñiz
Navarro-González, D., Lorenzo-Seva, U., y Vigil-Colet, A. (2016). Trigo, ME, y Martínez, RJ (2016). plaza de ETA generalizada
Como respuesta sesgo afecta a la estructura factorial de la personalidad autoinformes. Psicothema, comparaciones múltiples en diseños inter-grupos.
Psicothema, 28,
28, 465-470. Nunnally, JC (1978). teoría psicométrica (2ª ed.). Nueva
York, NY: 340-345.
van der Linden, WJ, y Hambleton, RK (1996). Handbook of Modern
Teoría de Respuesta. Nueva York: Springer-Verlag. van Sonderen, E.,
McGraw-Hill. Sanderman,
Paulhus, DL (1991). Medición y control del sesgo de respuesta. En
J. R., y Coyne, JC (2013). Inoperancia
P. Robinson, PR máquina de afeitar, y LS Wrightsman (Eds.), Las medidas redacción del reverso de los ítems del cuestionario: Aprendamos de vacas en la lluvia. PLoS
de la personalidad y ONE,
las actitudes sociales y psicológicos ( pp. 17-59). San Diego, CA: Academic
Press.
von Davier, M., Shin, HJ., Khorramdel, L., y Stankov, L. (2017). los
Pedrosa, I., Suárez-Álvarez, J., García-Cueto, E., y Muñiz, J. (2016). UNA efectos de puntuación viñeta sobre la fiabilidad y la validez de auto-informes.
test adaptativo informatizado para la evaluación de la personalidad emprendedora Aplicada Psicología de medición. La publicación anticipada en línea. dOI:
en la juventud. Psicothema, 28, 471-478.
10.1177 / 0146621617730389
Podsakoff, PM, MacKenzie, SB, Lee, JY, y Podsakoff, NP (2003). Weijters, B., y Baumgartner, H. (2012). Misresponse a reversa y
sesgos método común en la investigación del comportamiento: Una revisión
Los productos negados en las encuestas: una revisión. Journal of Marketing Research,
crítica de la literatura y de los remedios recomendados. Journal of Applied
49, 737-747.
Psychology,
Weijters, B., Baumgartner, H., y Schillewaert, N. (2013). elemento inversa
88, 879-903. doi: 10.1037 / 0021-9010.88.5.879
sesgo: Un modelo integrador. Psychological Methods, 18, 320-334.
Prieto, G., y Delgado, AR (1996). Construcción de los elementos [artículo
Weijters, B., Cabooter, E., y Schillewaert, N. (2010). El efecto de la
desarrollo]. En J. Muñiz (Ed.), psicometría ( pp. 105-135). Madrid:
Universitas. calificación
formato de escala de estilos de respuesta: El número de categorías de
Samejima, F. (1969). Estimación de la capacidad latente usando un patrón de respuesta y la respuesta de la categoría etiquetas. Revista Internacional de
respuesta de Investigación en Marketing, 27 ( 3), 236-247. doi: 10.1016 /
las puntuaciones graduadas. Psychometrika Monografía, 17. j.ijresmar.2010.02.004
Savalei, V., y Falk, CF (2014). Recuperación de pesos de los factores fundamentales en Weijters, B., Geuens, M., y Schillewaert, N. (2009). El efecto de proximidad:
la presencia de sesgo de aquiescencia: Comparación de tres enfoques. La función de la distancia entre tema sobre el sesgo-elemento inverso. Revista
Multivariante Investigación del Comportamiento, 49 ( 5), 407-424. doi: 10.1080 / Internacional de Investigación en Marketing, 26 ( 1), 2-12. DOI: 10.1016 / j.
00273 ijresmar.2008.09.003
171.2014.931800
Solís-Salazar, M. (2015). El dilema de combinar positivo y Weijters, B., Geuens, M., y Schillewaert, N. (2010). La estabilidad de
elementos negativos en las escalas. Psicothema, 27 ( 2), 192-
estilos de respuesta individual. Psychological Methods, 15, 96-
199. doi: 10.7334 / psicothema2014.266
110. Wilson, M. (2005). La construcción de medidas: el modelado Una
Suárez-Álvarez, J., Pedrosa, I., García-Cueto, E., y Muñiz, J. (2014). respuesta al ítem
La detección de la personalidad emprendedora en la juventud: un modelo empírico.
Acercarse. Mahwah, NJ: Erlbaum.
Revista Española de Psicología, 17 ( E60). doi: 10.1017 / Woods, CM (2006). Careless responder a revertir redactadas
sjp.2014.61 Swain, SD, Weathers, D., y Niedrich, RW (2008). La
artículos: Implicaciones para el análisis con fi rmación del factor. Diario
evaluación de tres
de la psicopatología y de Comportamiento Evaluación, 28 ( 3), 189-194.
fuentes de misresponse a artículos de Likert invierte. Journal of
doi: 10.1007 / s10862-005-9004-7 Yela, M. (1987). Estudios sobre
Marketing Research, 45, 116-131. Thurstone, L. (1996). Test de
inteligencia y lenguaje [ Los estudios sobre
Aptitudes Primarias [ mental primaria