Validez y Confiabilidad 30-08-2015

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

Dr.

Walter Ivn Abanto Vlez


28 de Junio de 2015

VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS


para trabajos de investigacin

Per - 2015

Dr. Walter Ivn Abanto Vlez


28 de Junio de 2015

Elaborada por:
Dr. Walter Ivn Abanto Vlez
[email protected]

Dr. Walter Ivn Abanto Vlez


28 de Junio de 2015

Validez y confiabilidad de los instrumentos para trabajos de investigacin

Para la recoleccin de datos son indispensables los instrumentos, los cuales deben precisar
dos requisitos bsicos: validez y confiabilidad. En tal sentido hablar de instrumentos de
medicin con procedimientos de validez y confiabilidad es hablar de objetividad y
credibilidad de los resultados. Es decir no podemos pretender hacer un trabajo de
investigacin con carcter cientfico, si no contamos con instrumentos debidamente
validados y fiables para la recogida de datos.

1.- VALIDEZ:

Relacionada con el contenido


Validez juicio de Experto
VALIDEZ

Relacionada con el Criterio


Validez concurrente
Validez predictiva
Relacionada con el Constructo
Anlisis factorial del test
Validez Convergente- Discriminante.
Anlisis de las diferencias individuales que
pone de manifiesto un test
Anlisis de los cambios en las diferencias
individuales
Anlisis lgico de los elementos del test

Dr. Walter Ivn Abanto Vlez


28 de Junio de 2015

La validez est referida a la objetividad y claridad de los tems o preguntas que se utiliza en
un instrumento de medicin. Es decir con que veracidad los tems o preguntas miden lo que
realmente se quiere medir. Por ejemplo, ante un instrumento para medir CREENCIAS (son
presunciones bsicas que han arraigado en la mente de las personas, por lo tanto es cognicin o
forma de pensar) podemos encontrar el siguiente ejemplo:
tems errado
tems correcto
Yo siento que la vida es una sola y hay que Yo opino que la vida es una sola y hay que
vivirla al mximo.
vivirla al mximo.
Como se puede observar en el siguiente ejemplo si creencia (forma de pensar, opinar o modo de ver
el mundo) est relacionada a la cognicin, los tems deben de estar direccionados a ese aspecto y no
al sentir que contempla el rea emocional.
Por otro lado la validez tiene tres tipos:
1.1.- Validez de Contenido: Grado en que un instrumento refleja un dominio especfico del contenido
de lo que se mide; sin omisiones y sin desequilibrios de contenido.
La validez de contenido se utiliza generalmente con instrumentos o test de rendimiento, y
especialmente con los tests educativos y tests referidos al criterio. En este tipo de tests se trata de
comprobar los conocimientos respecto a una materia o un curso.
Ejm: Una prueba de operaciones aritmticas no tendr validez de contenido si incluye slo problemas
de adicin y excluye problemas de sustraccin, multiplicacin y divisin.
1.1.1.- Validez de juicio de experto: Para Escobar Prez, J. & Cuervo-Martnez, A. (2008) la validez de
contenido generalmente se evala a travs de un panel o un juicio de expertos. De igual modo el
juicio de expertos se define como una opinin informada de personas con trayectoria en el tema, que
son reconocidas por otros como expertos cualificados en ste, y que pueden dar informacin,
evidencia, juicios y valoraciones. La identificacin de las personas que formarn parte del juicio de
expertos es una parte crtica en este proceso, frente a lo cual Escobar Prez, J. & Cuervo-Martnez, A.
(2008) cita a Skjong & Wentworht (2000) quienes proponen los siguientes criterios de seleccin:
- Experiencia en la realizacin de juicios y toma de decisiones basada en evidencia o experticia
(grados, investigaciones, publicaciones, posicin, experiencia y premios entre otras).
- Reputacin en la comunidad.
- Disponibilidad y motivacin para participar.
- Imparcialidad y cualidades inherentes como confianza en s mismo y adaptabilidad.
Tambin plantean que los expertos pueden estar relacionados por educacin similar, entrenamiento,
experiencia, entre otros; y en este caso la ganancia de tener muchos expertos disminuye. Otros

Dr. Walter Ivn Abanto Vlez


28 de Junio de 2015
autores como McGartland, Berg, Tebb, Lee y Rauch (2003), proponen como criterio bsico de
seleccin nicamente el nmero de publicaciones o la experiencia.
De otra parte, el nmero de jueces que se debe emplear en un juicio depende del nivel de experticia y
de la diversidad del conocimiento; sin embargo, la decisin sobre qu cantidad de expertos es la
adecuada vara entre autores. As, mientras Gable y Wolf (1993), Grant y Davis (1997), y Lynn (1986)
(citados en McGartland et al. 2003) sugieren un rango de 2 hasta 20 expertos, Hyrks et al. (2003)
manifiestan que 10 expertos brindaran una estimacin confiable de la validez de contenido de un
instrumento. Si un 80 % de los expertos han estado de acuerdo con la validez de un tem ste puede
ser incorporado al instrumento (Voutilainen & Liukkonen, 1995, citados en Hyrks et al. (2003).
Sin embargo teniendo en cuenta lo mencionado anteriormente y conociendo nuestra realidad
sociocultural se recomienda que el nmero de expertos sea de 7 a ms.

Elaborado por: Dr. Walter Ivn Abanto Vlez

Dr. Walter Ivn Abanto Vlez


28 de Junio de 2015
1.2.- Validez de Criterio: Un criterio es una variable distinta del test que se toma como referencia,
que se sabe que es un indicador de aquello que el test pretende medir o que se sabe que debe
presentar una relacin determinada con lo que el test pretende medir.
En otras palabras la validez de criterio se establece al validar un instrumento de medicin al
compararlo con algn criterio externo que pretende medir lo mismo. Validez concurrente y la validez
predictiva.
Ejemplo: En las campaas electorales, los sondeos se comparan con los resultados finales de las
elecciones.
A la correlacin entre las puntuaciones en el test (X) y en el criterio (Y) se le denomina coeficiente de
validez. Dentro de la validez de criterio se pueden utilizar los estadsticos de Coeficiente de
Contingencias, Spearman Brow, Pearson, Alfa de Cronbach y la Tcnica Aiken.
Segn Casas Vilchis, Luis (2011) refiere que este tipo de validez se divide en concurrente y predictiva:
1.2.1.- Validez concurrente: Esta referido al grado en que un instrumento mide lo mismo que miden
otros instrumentos ya existentes, considerados como medidas adecuadas del mismo rasgo. As mismo
se da cuando el instrumento se correlaciona con algn criterio existente que mida lo mismo que el
instrumento (ejemplo: en un hospital se utiliza la produccin del personal administrativo como
criterio para evaluar a personal nuevo y como criterio para validacin de una prueba para seleccin
de personal administrativo). Es relevante precisar que la validez concurrente de un instrumento no
indica nada acerca de la capacidad predictiva de ste, solo seala que el instrumento nuevo que se ha
elaborado para medir un determinado atributo es tan eficiente o vlida como el criterio previo.
1.2.2.- Validez predictiva: Hace referencia al grado en que la aplicacin de un instrumento o test
sirve para predecir la conducta futura de las personas que han sido evaluadas. Se deben sealar
coeficientes de validez predictiva para cada tipo de prediccin que se pretenda hacer con un mismo
instrumento (ejemplo: exmenes de inteligencia para medir xito acadmico de los sujetos en
distintos grados escolares). La prediccin del comportamiento futuro, con un instrumento que se
administre en el presente, se limita al lapso incluido en la determinacin de la validez predictiva del
instrumento. Solo es vlida su capacidad predictiva de acuerdo al lapso en que se ha probado. La
validez predictiva es esencial y se requiere en las pruebas de aptitud e inteligencia. El psiclogo que
hace predicciones sobre comportamiento futuro sin tener sustento para tales, incurre a una mala
prctica sujeta a consideraciones ticas y legales.

Dr. Walter Ivn Abanto Vlez


28 de Junio de 2015
1.3.- Validez de Constructo: El trmino constructo hace referencia a un concepto terico psicolgico
inobservable (ej. la inteligencia, personalidad, las aptitudes, asertividad, etc.). Es decir no son
directamente visibles.
Estos constructos a pesar de no ser distinguibles al ojo humano; a pesar de estar basado en teoras
psicolgicas, precisan de indicadores observables para su estudio. En tal sentido es necesario que
estos indicadores estn precisados en los tems de un instrumento o test, y debe comprobarse
empricamente que resultan adecuados para reflejar el constructo de referencia.
As tambin la validez de constructo debe explicar el modelo terico emprico que subyace a la
variable de inters. Ejm: El Anlisis de Factores y Anlisis de Cofactores, el Anlisis de Covarianza.
Para la estimacin de la validez de constructo se utiliza una metodologa variada. Algunos de los
mtodos ms utilizados son:
1.3.1.- Anlisis factorial del test: El anlisis factorial permite ordenar los datos y facilitar la
interpretacin de las correlaciones. Se espera un factor explicativo del constructo con saturaciones
altas del test y los tests que miden aspectos parecidos, y con saturaciones bajas de aquellos tests que
miden aspectos diferentes. Con frecuencia se habla de la estructura factorial de un test como validez
estructural o validez factorial.
Se utiliza para probar que rasgos tcnicos (factores o componentes, constructos) se miden a travs de
los tems del test o instrumento.
1.3.2.- Validez Convergente- Discriminante. Matrices Multirasgo Multimtodo
Muy en relacin con la validez factorial se encuentra tambin la validez convergente- discriminante,
la cual se evala mediante las matrices multirrasgo- multimtodo. El sentido de estas definiciones es
el siguiente:
a) Validez convergente: Est referido a aplicar dos test que miden el mismo atributo y establecer la
relacin existente entre ambos resultados; vale aclarar que la correlacin debe ser significativa o alta
(relacin positiva).
b) Validez discriminante: Indica que dos test miden atributos diferentes, en tal sentido sus
correlaciones debe ser baja o nula.
A travs de estos dos tipos de validez se podra ir definiendo un constructo psicolgico.
1.3.3.- Anlisis de las diferencias individuales que pone de manifiesto un test: Se refiere al anlisis
de la distribucin de las puntuaciones de test y a comparaciones de estos aspectos en distintas
muestras. Diferentes edades, sexos, niveles profesionales, etc. Estas comparaciones no son
arbitrarias, sino que se derivan de hiptesis que se hacen en funcin de los conocimientos que se
tiene del constructo.

Dr. Walter Ivn Abanto Vlez


28 de Junio de 2015
1.3.4.- Anlisis de los cambios en las diferencias individuales: Se refiere a la investigacin diacrnica
de los mismos sujetos con el mismo test. Este tipo de estudios permite conocer la estabilidad del
rasgo a lo largo del tiempo y a travs de situaciones.
1.3.5.- Anlisis lgico de los elementos del test: Se refiere al anlisis de tems del test en relacin con
el constructo. Aquellos tems que correlacionan positivamente entre s, pertenecen al mismo
constructo. Esto significa que el anlisis de consistencia interna de un test no slo aporta datos
respecto a su fiabilidad, sino a su validez. Si se obtiene un coeficiente de consistencia interna bajo,
significa que el test no mide un nico constructo. Todos estos mtodos enumerados se
complementan entre s. Se trata de ver el constructo que trata de medir el test desde diferentes
ngulos. Por tanto, no existe una nica medida de la validez de constructo.

2.- CONFIABILIDAD:
Menndez, A. (S. / F.) Refiere que la confiabilidad es la consistencia de los resultados. En el anlisis
de la confiabilidad se busca que los resultados de un cuestionario concuerden con los resultados del
mismo cuestionario en otra ocasin. Si esto ocurre se puede decir que hay un alto grado de
confiabilidad. Tambin se habla de confiabilidad cuando dos o ms evaluadores evalan al mismo
estudiante sobre el mismo material y se obtienen puntuaciones semejantes.
Por otro lado Arias Pittman, J. (2013) refiere que la confiabilidad del instrumento de medicin
constituye el criterio fundamental para evaluar su calidad y adecuacin; no es un concepto
unitario que pueda ser descrito o definido con facilidad, lo que continu desventaja para el
investigador novato. En esencia la confiabilidad de un instrumento es el grado de congruencia con la
que mide el atributo que se supone evala. Si una balanza arroja un dato de 54.43k para el peso de
una persona ni un minuto despus da una lectura de 68.03k (descontando cualquier intromisin con
el instrumento o el sujeto), debemos tener gran cautela al usarla porque la informacin que genera
ser poco fidedigna. Cuanto menor variacin produzca un instrumento de mediciones repetidas de un
atributo, mayor ser su confiabilidad de este modo, la confiabilidad puede equiparse con la
estabilidad congruencia o confiabilidad de un instrumento de medicin.
Otra forma de definir la confiabilidad es en trminos de precisin es posible sealar que un
instrumento es confiable si sus mediciones reflejan exactamente las mediciones verdaderas del
atributo en estudios. La definicin anterior vincula la confiabilidad con puntos sealados en nuestro
comentario del error de medicin. Intentaremos esclarecer an ms tal medicin, para indicar que el
instrumento es confiable y preciso en la medida en que no existan errores de medicin en los
resultados obtenidos. En otras palabras, una medicin confiable es aquella que lleva al mximo el
componente verdadero y el mnimo componente de error. Cuando mayor el error, mayor ser la falta
de confiabilidad.
Por consiguiente podemos decir que la confiabilidad es la "exactitud o precisin de un instrumento de
medicin (Arias Pittman, J. 2013 pag. 7)". Existen distintos tipos de confiabilidad:

La estabilidad a travs del tiempo (medible a travs de un diseo test-retest);

Dr. Walter Ivn Abanto Vlez


28 de Junio de 2015

La representatividad, que se refiere a la ausencia de variaciones en la capacidad del instrumento


para medir un mismo constructo en distintas subpoblaciones; y por ltimo
La equivalencia o formas paralelas, que se aplica a las variables latentes, medidas a travs de
mltiples indicadores, y que se puede poner a prueba mediante diversos mtodos, incluyendo el
llamado Alpha de Cronbach, split-half, y distintas formas de verificar la consistencia entre
evaluadores.

Alfa de Cronbach:
El coeficiente alfa de Cronbach se basa en el clculo de la confiabilidad de un compuesto donde cada
tem se considera una subcuestionario del cuestionario total y los tems se consideran cuestionarios
paralelos. Como esta propiedad de paralelismo es prcticamente imposible para los tems, por lo
general el coeficiente alfa de Cronbach subestima el coeficiente de correlacin. < CC La frmula
para el coeficiente alfa es

Dr. Walter Ivn Abanto Vlez


28 de Junio de 2015

3.- FACTORES QUE AFECTAN LA VALIDEZ Y LA CONFIABILIDAD DE UN INSTRUMENTO DE MEDICIN:


Hay diversos factores que pueden afectar la confiabilidad y la validez de los instrumentos de
medicin; algunos podran ser:

3.1.- Improvisacin; pretender elaborar un instrumento de recoleccin de informacin de un da para


otro o utilizar una prueba sin ningn criterio tcnico, metodolgico o cientfico que se ajuste a
las necesidades de lo que se pretende investigar.
3.2.- Utilizacin de instrumentos desarrollados en el extranjero que no han sido sometidos al proceso
psicomtrico de validez y confiabilidad en el propio contexto. Las culturas segn su nacin o
regin son diferentes; y esto debemos tomarlo en cuenta al elegir un instrumento de medicin.
3.3.- Inadecuacin o incompatibilidad para las personas a las que se aplica; es decir el instrumento
est diseado para ser aplicado a mayores de 25 aos y se aplica a personas de menor edad
consignada en la prueba.
3.4.- Condiciones en la que se aplica; es decir su aplicacin se realiza con muchos estmulos
distractores o en lugares inapropiados e incluso cuando la persona evaluada se encuentra
apurado/a en querer retirarse, generando que rinda su evaluacin rpidamente marcando o
respondiendo a las preguntas de forma subjetiva.
3.5.- Pobreza en el N de sujetos que se utiliza para determinar la validez y confiabilidad de un
instrumento; es decir pretender validar y determinar la fiabilidad de un instrumento con una
muestra de 20 o 30 personas. En tal sentido se recomienda establecer estadsticamente una
muestra representativa o utilizar un criterio con rigor cientfico.
3.6.- Nmero de tems de la prueba supera el nmero de muestra para establecer la valides y
fiabilidad; es decir el instrumento que se pretende utilizar tiene 80 tems y la muestra para
validar es de 20 sujetos.

Dr. Walter Ivn Abanto Vlez


28 de Junio de 2015
REFERENCIAS:

Arias Pittman, J. (2013). Confiabilidad y Validez para evaluar los instrumentos de medicin.
Recuperado de:
https://docs.google.com/document/d/10ECoSNkohHF50qE1s1axrujaDawaNPyG2iv677tC
KJs/edit

Casas Vilchis, L. (2011). Elaboracin de Instrumentos (Validez de Criterio)


https://luiscasasvilchis.wordpress.com/2011/09/15/elaboracion-de-instrumentosvalidez-de-criterio/

Chiner Esther (S./F.). La Validez. Tema 6. Recuperado de:


http://rua.ua.es/dspace/bitstream/10045/19380/25/Tema%206-Validez.pdf

Escobar Prez, J. & Cuervo-Martnez, A. (2008). VALIDEZ DE CONTENIDO Y JUICIO DE EXPERTOS: UNA
APROXIMACIN A SU UTILIZACIN. Avances en Medicin, 6, 2736. Universidad El
Bosque, Colombia. Recuperado de:
http://www.humanas.unal.edu.co/psicometria/files/7113/8574/5708/Articulo3_Juicio_d
e_expertos_27-36.pdf

Menndez, A. (S. / F.) Confiabilidad. Taller CES revisado en la pgina. Recuperado de:
http://www.gobierno.pr/NR/rdonlyres/CC1286A8-310F-48CF-AB2CD30417D9AF78/0/15confiabilidad.pdf

También podría gustarte