Confiabilida y Validez de Un Instrumento PDF
Confiabilida y Validez de Un Instrumento PDF
Confiabilida y Validez de Un Instrumento PDF
de un instrumento
Universidad del Desarrollo Profesional
Posgrado
Resumen Cap. 8 del libro Introducción a la Investigación Pedagógica de Ary, Jacobs y Razavieh y cap 9. del libro Metodología de la investigación de
Hernández S. y otros.
De acuerdo a definiciones clásicas como la de Stevens (1951), significa “asignar números o valores a objetos y eventos de acuerdo a reglas”. Sin embargo,
como lo señala Carmines y Zeller (1979), esta definición es más apropiada para las ciencias físicas que para las ciencias sociales, las cuales trabajan con una
serie de conceptos más abstractos que no pueden verse directamente o tratarse como productos o resultados.
Este razonamiento nos hace sugerir que es más adecuado definir medición como el “proceso de vincular conceptos abstractos con indicadores empíricos”,
proceso que se realiza mediante un plan explícito y organizado para clasificar y frecuentemente cuantificar los datos que me puedan suministrar conductas
observables relacionadas con las variables en estudio. El centro de atención es por lo tanto la respuesta observable (bien sea una respuesta marcada en un
cuestionario, una conducta grabada o una respuesta dada en una entrevista). Un instrumento de medición adecuado va a ser aquél que me registra datos
observables que verdaderamente representan los conceptos o variables (más abstractas) que el investigador tiene en mente.
Toda medición o instrumento de recolección de datos debe reunir tres requisitos esenciales; confiabilidad, validez y objetividad
LA CONFIABILIDAD de un instrumento de medición se refiere al grado de precisión o exactitud de la medida, en el sentido de que si aplicamos repetidamente
el instrumento al mismo sujeto u objeto produce iguales resultados. Es el caso de un balanza o de un termómetro, los cuales serán confiables si al pesarnos o
medirnos la temperatura en dos ocasiones seguidas, obtenemos los mismos datos.
LA VALIDEZ se refiere al grado en que un instrumento mide la variable que pretende medir. Por ejemplo, un test de inteligencia no será válido, si lo que mide
es realmente memoria y no inteligencia. Ciertas variables como el sexo, la nacionalidad, son muy fáciles de observar o de preguntar y obtener una respuesta
Universidad del Desarrollo Profesional
Posgrado
válida. Pero cuando se trata de diversas variables que se trabajan en ciencias sociales como motivaciones, actitudes, sentimientos, emociones,
etc, la validez de un instrumento que pretenda medirlas se torna más compleja, y por lo tanto, cabe preguntarse si ¿realmente el instrumento estará midiendo
lo que pretende medir?
LA OBJETIVIDAD: se refiere al grado en que un instrumento es permiable a la influencia de los sesgos y tendencias del investigador que lo adm inistra, califica
e interpreta.
Evidencia relacionada con el contenido LA VALIDEZ DE CONTENIDO se refiere al grado en que un instrumento refleja un dominio específico de
contenido de lo que se mide. Por ejemplo, una prueba de operaciones aritméticas no tendrá validez de contenido si explora suma y división y excluye
problemas de resta y multiplicación. Un instrumento de medición debe contener representados a todos los items del dominio de contenido de las variables
a medir.
Evidencia relacionada con el criterio. LA VALIDEZ DE CRITERIO implica que la medición del instrumento se ajusta o sirve a un criterio externo. Si el
criterio se ajusta al futuro se habla de validez predictiva. Por ejemplo una prueba de admisión en las universidades puede comparar sus resultados con el
rendimiento futuro de los estudiantes en la carrera. Si el criterio se fija en el presente se habla de validez concurrente; es cuando los resultados del
instrumento correlacionan con el criterio en el mismo momento o punto de tiempo. Por ej. una encuesta administrada un día antes de las votaciones para
detectar preferencias del electorado, correlaciona con los resultados finales de la elección.
Evidencia relacionada con el constructo. LA VALIDEZ DE CONSTRUCTO es probablemente la más importante, sobretodo desde la perspectiva científica,
ya que se refiere al grado en que una medición aportada por un instrumento relaciona consistentemente con otras mediciones que han surgido de
hipótesis y construcción de teorías antecedentes.
Cabe agregar que un instrumento de medición puede ser confiable pero no válido, puede medir consistentemente un aspecto más no medir lo que pretende
medir el investigador. Por ello es requisito que un instrumento de medición que demuestre ser confiable y válido.
b) El no estar validados en el contexto donde se aplican. Traducir un instrumento, aún cuando adaptemos los términos a nuestro lenguaje no es ni
remotamente validarlo. Es simplemente un primer paso ya que validar un instrumento implica realizar una investigación extensa y compleja. Los grupos,
las personas cambian y tienen valores diferentes de acuerdo a la cultura. Por lo tanto, se deben aplicar instrumentos ya validados en el contexto.
c) El instrumento e inadecuado o no es empático. Hay instrumentos que tienen un lenguaje muy elevado para el entrevistado o no toma en cuenta diferencias
de sexo, edad nivel ocupacional y educativo; todo esto puede resultar en errores de validez y confiabilidad del instrumento de medición
d) El cuarto factor lo constituyen las condiciones en que se aplica el instrumento. El ruido, presionar para que una persona conteste un instrumento largo en
un período de tiempo corto, el hambre o falta de motivación para responder influirá negativamente en la validez y confiabilidad de la medida.
e) El quinto factor se refiere a los aspectos mecánicos. Que el instrumento tenga instrucciones precisas, que se lea bien (si se trata de un cuestionario
escrito), que no le falten páginas, que haya un espacio adecuado para contestar.
En la práctica es casi imposible que una medición sea perfecta, generalmente se tiene un grado de error. Desde luego, se trata que este error sea el mínimo
posible y para ello hay formas de calcular la confiabilidad y la validez.
Para la confiabilidad, generalmente todos los procedimientos utilizan fórmulas que producen “coeficientes de confiabilidad”, los cuales pueden oscilar entre 0
y 1, donde 0 significa confiabilidad nula y 1 representa el máximo de confiabilidad. Entre más se acerque el coeficiente a 0 habrá mayor error en la medición.
Los procedimientos más utilizados son:
Medida de estabilidad (confiabilidad por test-retest). Un mismo instrumento es aplicado dos o más veces a un mismo grupo de personas. Si la correlación
entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable.. Desde luego, el período de tiempo entre
las mediciones es un factor a considerar. Si es muy largo, otros factores como maduración o cambio de condiciones pueden afectar la segunda medida. Si
es muy corto, las personas pueden recordar cómo contestaron la primera vez y aparecer como más consistentes la segunda vez.
Universidad del Desarrollo Profesional
Posgrado
Medidas paralelas o formas equivalentes de medir. En este procedimiento no se aplica el mismo instrumento de medición sino dos o más
versiones equivalentes de éste. Las versiones deben ser similares en contenido, instrucciones, duración, etc. Por ej. cuando un profesor administra 2 o
más modalidades de examen en su grupo de alumnos. El instrumento es confiable si la correlación entre los resultados de las dos o más pruebas
administradas es significativamente positiva.
Método de mitades divididas. Aquí se administra un solo instrumento, una sola vez, pero se dividen las preguntas o los items (Por ejemplo los items pares
con respecto a los impares, o la primera mitad con respecto a la segunda mitad). Si correlacionan los resultados de las dos partes, se considera el
instrumento confiable. Ahora bien, la confiabilidad varía de acuerdo al número de items de la prueba. Cuantos más items mayor es la confiabilidad.
Cotejo entre observadores. Se utiliza fundamentalmente cuando se aplican instrumentos de observación y registro. Dos o más observadores aplican el
mismo instrumento al mismo tiempo. Luego se calcula la correlación de aspectos coincidentes observados. Se considera confiable el instrumento si hay un
porcentaje de coincidencias superior al 80%. Por supuesto que este método implica que los observadores tengan el mismo nivel de preparación o de
entrenamiento para observar.
Para calcular la validez, la validez que más interesa obtener en una investigación es la validez de contenido. Para obtener validez de contenido primero que
nada hace falta revisar como ha sido tratada esta variable por otros investigadores anteriormente. Segundo, elaborar un universo de items tan amplio como
sea posible, para medir la variable en todas sus dimensiones. Posteriormente, se consulta con investigadores familiarizados con el tema y la variable a medir
para ver si el contenido es exhaustivo. Esto se conoce con el nombre de validación por expertos.
1. El primer paso consiste en listar las variables que se pretenden medir u observar. Recordemos que las variables son propiedades de los objetos o de
los sujetos que adquieren distintos valores y que son razón de nuestro estudio o fenómeno a investigar.
2. Revisar su definición conceptual y comprender su significado. Por ejemplo, comprender qué es “integración escolar” y qué dimensiones o grandes
aspectos envuelve.
La definición conceptual se refiere a la descripción de la esencia o de las características propias, reconocidas por consenso de un fenómeno u objeto, a la
cual se le llama cotidianamente “definición real”; se reconoce la importancia de una conceptualización teórica, dada por autores reconocidos.
Universidad del Desarrollo Profesional
Posgrado
3. Revisar cómo han sido definidas operacionalmente las variables. La operacionalización de las variables se refiere a un conjunto de procedimientos
que narran o describen las actividades que el investigador realiza para medir las variables en estudio.
Cuando el investigador dispone de varias opciones debe utilizar el procedimiento que le reporte mayor información sobre la esencia del objeto o fenómeno
de estudio.
3. Elegir el instrumento o los instrumentos (ya desarrollados) que han sido favorecidos por la comparación y adaptación al contexto de la
investigación. Deben seleccionarse los instrumentos que reporten mayor validez y confiabilidad. Si se selecciona un instrumento desarrollado en otro
país deben hacerse pruebas piloto más extensas. Tampoco debe olvidarse que traducir no es validar un instrumento, por muy buena que sea la
traducción.
4. En caso de no encontrar un instrumento desarrollado adecuado, válido y confiable y se quiera construir o desarrollar uno propio, debe
pensarse en cada variable, sus categorías, los indicadores más precisos y los items para cada uno de ellos. Un ejemplo de ello podría ser el
siguiente:
En este caso, debemos asegurarnos de tener un número suficiente de items para medir todas las variables en todas sus dimensiones.
Otro ejemplo:
Universidad del Desarrollo Profesional
Posgrado
Variable Definición Categorías Indicadores Items
operacional
Nivel de Compromisos Académicas Rendimiento 1.¿Cuál es tu índice académico
participación adquiridos por Delegado de curso acumulado?
de los el alumno para Ayudantías 2. ¿Eres actualmente o has sido
alumnos de realizar Preparadurías delegado de curso
Unimet diferentes 3.¿Has realizado alguna
tareas y ayudantía? Describe.......
funciones 4.¿Has realizado alguna
propias de la preparaduría? Cátedra...............
Unimet. Tiempo.........
No académicas Deportes 5.¿Participas o has participado
Cultura en algún equipo o selección de
Gremiales portiva en Unimet? ¿Cual.....?
Capital Social 6.¿Participas o has participado
en alguna agrupación cultural
dentro de Unimet? ¿Cuál?.......
7.¿Has participado en alguna de
estas agrupaciones:
-Aisec ___
-Centro de estudiantes____
-Aje (jóvenes empresarios)____
8.¿Participas o has participado
en alguna agrupación de
proyecto social y comunitarios?
¿Cuál?_____
5. Indicar el nivel de medición de cada ítem y por ende, el de las variables. Recordemos que existen cuatro (4) niveles de medición ampliamente
conocidos
Universidad del Desarrollo Profesional
Posgrado
El nivel de medición nominal indica que hay dos o más categorías de respuesta las cuales no tienen orden o jerarquía. Por ej. cuando
preguntamos el estado civil, la religión, etc. Las variables nominales pueden ser dicotómicas (admiten solo dos valores, como el sexo, tipo de escuela a la
que asiste : privada u oficial, etc.) y politómicas (cuando admiten tres valores de medición o más).
El nivel de medición ordinal, indica que hay varias categorías, pero además estas mantienen un orden jerárquico, de mayor a menor. Por ejemplo el Grado
o Nivel de Instrucción de las personas, el cargo que una persona ocupa dentro de una empresa o Institución, etc. En los dos niveles mencionados no se
pueden utilizar las operaciones matemáticas básicas, porque sería absurdo y no tiene sentido, darle numeración en escala a las respuestas.
El nivel de medición por intervalo, implica crear escalas de medición donde las distancias entre las diferentes categorías de respuestas son iguales. El
cero o punto de partida, es arbitrario, es decir no es real, como el caso de la temperatura, donde el cero no significa que no haya temperatura. Algunas
escalas de observación y de medición de opinión de actitudes suelen tratarse como si fueran mediciones de intervalo. Aquí se permite utilizar las
operaciones matemáticas básicas y algunas estadísticas. Ej. las escalas de evaluación que los estudiantes llenan sobre sus profesores. ¿Cómo considera
el sistema de evaluación de la materia? 1 --- 2 --- 3 --- 4 --- 5 (1 = deficiente, 5 = excelente)
El nivel de medición de razón, además de tener todas las características del nivel de intervalo (distancias iguales entre las categorías de respuesta y
aplicación de operaciones matemáticas básicas), implica que parte de un cero real y absoluto donde no existe la propiedad a medir. Por ej. ¿Cuántos hijos
tiene usted?
O --- 1 --- 2 --- 3 --- 4 --- 5 --- 6 --- 7 --- 8 --- 9 --- 10 ó más
6. Indicar cómo se han de codificar los datos . La codificación es necesaria para analizar cuantitativamente los datos (aplicar análisis estadísticos). La
mayoría de las veces se usan números o cantidades, aunque también se pueden utilizar letras o símbolos.
7. Aplicar una prueba piloto del instrumento de medición. Es decir, aplicar el instrumento a personas con características semejantes a las de la muestra o
población objetivo de nuestra investigación
En esta prueba se analiza si las instrucciones se comprenden y si los items funcionan adecuadamente. Los resultados se utilizan para calcular la
confiabilidad y de ser posible, la validez del instrumento de medición. La prueba piloto se realiza con una pequeña muestra; los investigadores aconsejan
un 10% de personas semejantes a las que integrarán la muestra definitiva.
8. Sobre la base de la prueba piloto, el instrumento de medición preliminar, se modifica, se ajusta y se mejora, para lograr mayor nivel de confiabilidad
y validez. En un trabajo de investigación habrá que narrar el procedimiento, el pilotaje y la reestructuración del instrumento posterior al pilotaje.