Art 16
Art 16
Art 16
ARTÍCULO ESPECIAL
125
Rev Méd Chile 2008; 136: 125-130
operativos tanto para la construcción, como para ciones a procesos, contribuyendo a delimitar
la evaluación de instrumentos de medición en marcos teóricos, y mejorando la comprensión del
salud, particularmente escalas y cuestionarios utili- contexto en que se produce el evento de salud5,6.
zados en estudios de población. Se abordarán En consecuencia, son las representaciones de los
temas tales como: la generación y selección de sujetos, más las propias del investigador clínico,
ítems que configuran el objeto de medición, las que se configuran como ítems en un cuestio-
ciertas consideraciones respecto del diseño de nario. Estas formas de obtención de ítems equiva-
instrumentos, y finalmente algunas indicaciones len a las fuentes de datos necesarios para lograr
para la evaluación de la calidad de un instrumento una muestra representativa de los ítems.
de medición; este último aspecto es esencial para Los desafíos inherentes a esta etapa son, deter-
quienes utilizan cuestionarios o escalas ya diseña- minar el universo de ítems o preguntas que
das en otras partes del mundo. Su propósito es representen totalmente al evento, establecer sus
contribuir con algunos elementos teóricos básicos límites, y discriminar lo que pertenece o no, al
para guiar al investigador clínico a tomar decisio- evento en estudio. El tema es particularmente
nes basadas en mediciones válidas y confiables. complejo porque no existe más herramienta que el
criterio, experiencia y sensibilidad teórica del inves-
Generación y selección de ítems de un instrumen- tigador clínico para reunir el máximo de propieda-
to de medición en salud. La etapa inicial en la des observables del evento que pretende estudiar.
construcción de un cuestionario o escala que
tenga por objetivo recoger la percepción u opi- Consideraciones sobr e el diseño del instrumento
nión de los pacientes, implica los siguientes de medición. El diseño de un instrumento de
pasos: a) definir con máxima precisión el objeto medición –sea éste escala o cuestionario–, depen-
de la medición, b) atribuir a los objetos o eventos de de múltiples factores entre los que podemos
de salud ciertos indicadores que expresen con- mencionar: el objetivo para el cual se propone el
ceptualmente las propiedades del objeto que se instrumento, los recursos financieros para su
pretende medir, y c) reflejar la variabilidad entre construcción y prueba, acceso a la información,
los sujetos que están siendo objeto de medición. edad y educación de los pacientes quienes serán
Habitualmente el investigador parte de ideas que objeto de medición, y el nivel de precisión de la
provienen de su experiencia clínica, del análisis medida que se pretende obtener. El conjunto de
de literatura científica, y de diálogos con sus estos factores determinará la extensión del instru-
pacientes y colegas, de esta forma produce una mento, el formato, y su presentación; sin embargo
conceptualización que le permite identificar di- lo más relevante en el diseño es la decisión del
mensiones y variables de su objeto de estudio. investigador clínico sobre el nivel de medida de
Este proceso implica la construcción y recons- sus variables. Por ejemplo, es diferente decirle a
trucción del concepto que se quiere medir en la un paciente –cualquiera sea su patología–, que
población; tomemos como ejemplo la definición construya una lista con sus síntomas, que elija de
del concepto “calidad de vida”, y la identificación una lista aquellos que presenta con mayor fre-
de sus propiedades manifiestas, tales como, “estar cuencia, o que ordene de una lista que el médico
bien”, “sentirse feliz”, “dormir bien”, “visitar ami- le presenta, aquellos que le provocan mayor
gos”, entre otras; son justamente estas propieda- molestia. La decisión por una u otra forma
des o características las que contribuirán a dependerá tanto de los intereses del clínico en
reconstruir el concepto “calidad de vida” como profundizar sobre los síntomas de sus pacientes,
objeto de medición. de la aplicación de los resultados; como de la
En esta fase, que podríamos llamar explorato- calidad de sus variables, es decir, hasta dónde su
ria, la incorporación de métodos y técnicas cuali- variable le permite variar en respuesta. En resu-
tativas de investigación tales como, entrevistas en men, lo que se intenta es representar la variabili-
profundidad, observaciones no estructuradas, y dad de respuestas entre los pacientes a los que se
grupos focales constituyen herramientas esencia- les aplicará finalmente el instrumento7.
les para indagar en la condición subjetiva de los En términos operativos significa que para
pacientes, produciendo descripciones y explica- construir un cuestionario, el clínico deberá seguir
A R T Í C U L O
126 E S P E C I A L
MEDICI Ó N EN SALU D - A M Alarcón et al
los siguientes pasos: definir el concepto y objetivo Deter minación de la validez de un instrumento.
de la medición, elaborar una lista extensiva de sus La validez de un instrumento se refiere a la
ítems, determinar la forma de medición de las pertinencia de las inferencias realizadas a partir de
respuestas, expresar las preguntas (variables) en las mediciones; en otras palabras, validez significa
palabras apropiadas a la cultura, educación y edad cuán bien un resultado obtenido refleja al fenó-
de sus pacientes, construir un borrador de prueba, meno bajo estudio, o la capacidad del instrumento
y finalmente probar el instrumento en una mues- para medir la cualidad para la que fue construi-
tra de pacientes. Los resultados de su prueba do9,10. Por ejemplo, un test que mida depresión
determinarán: el contenido esencial del instru- en un paciente debe dar cuenta de la calidad y
mento, la dificultad de aplicación y comprensión, magnitud de ese fenómeno, y no del stress de ese
y la posibilidad de análisis de las medidas obteni- paciente; por lo tanto, cuando un investigador
das. clínico construya un cuestionario o intente aplicar
alguno ya existente debe –en primer término-
Calidad y pertinencia de un instrumento: temas examinar con profundidad la naturaleza del even-
de validez y confiabilidad. La determinación de la to que desea medir (llámese depresión, stress,
calidad de un instrumento implica plantearse angustia, calidad de vida, etc.), y al mismo tiempo,
preguntas tanto de la exactitud con que mide el examinar si las variables del cuestionario repre-
fenómeno bajo estudio, la estabilidad de la medi- sentan en forma precisa el fenómeno que desea
ción o resultado, como de la pertinencia del medir.
instrumento para los sujetos o realidad en que se Existen diversas formas de determinar la vali-
aplican las mediciones. Por ejemplo, un clínico dez de un instrumento, no obstante la distinción
que evalúe la calidad de vida de sus pacientes sea entre ellas, refleja más una necesidad operativa
ésta en forma específica o genérica, se enfrenta a que conceptual para el investigador. Entre éstas se
la incertidumbre de si los valores obtenidos a encuentran la validez de: a) criterio, b) constructo,
través del cuestionario reflejan o no la condición y c) contenido.
del paciente, si el instrumento es capaz de
detectar diferencias entre los sujetos, si cambios Validez de criterio. Este tipo de validez se asocia
en los resultados de la medición en un paciente generalmente a la capacidad de un instrumento
son consecuencia de cambios en su condición de para predecir una conducta o evento de salud. En
salud, y finalmente si las preguntas del cuestiona- clínica es común evaluar ciertas conductas de
rio fueron respondidas comprensivamente por el riesgo sanitario y predecir quiénes tienen el riesgo
paciente. potencial de desencadenar el problema, enferme-
Este conjunto de interrogantes aluden directa- dades cardiovasculares, depresión entre otros
mente a los conceptos de confiabilidad y validez ejemplos. El procedimiento más común para
de un instrumento. La estimación de la calidad de determinar la capacidad predictiva de un instru-
un cuestionario o escala es requisito esencial, no mento, es demostrar una correlación entre las
sólo en su proceso de construcción, sino también medidas obtenidas con algún criterio exterior
en la utilización de aquellos obtenidos en la habitualmente llamado “gold standard”, de modo
literatura médica internacional. Por ejemplo, aun- que, si la correlación es alta, la medida obtenida
que el investigador clínico haya encontrado algún es considerada válida11. Desafortunadamente no
cuestionario muy apropiado a sus objetivos, vali- siempre se dispone de un criterio de comparación
dado y utilizado en otras partes del mundo; aceptable, por lo tanto el desafío para el clínico
deberá igualmente validarlo con sus pacientes, ya será buscar o construir alguno con el que pueda
que su aplicabilidad se limita sólo al contexto comparar los resultados de su medición, para lo
social y cultural en que fue creado. Para ello debe cual deberá conjugar tanto su experiencia clínica
utilizar, si corresponde, los mismos procedimien- como la revisión crítica de literatura.
tos de determinación de validez y confiabilidad La selección del criterio se basa en una
que aquí se exponen, sin embargo, deberá iniciar supuesta relación entre el evento medido y el
el proceso de validación del instrumento, con una criterio elegido, como ejemplos clásicos se pue-
adaptación idiomática y cultural8. den mencionar los cuestionarios de calidad de
A R T Í C U L O
E S P E C I A L
127
Rev Méd Chile 2008; 136: 125-130
vida específicos, cuyos resultados son contrasta- por ello, la validez de constructo se pregunta cuán
dos con criterios clínicos elaborados por socieda- bien la medición refleja la naturaleza del concepto
des profesionales12,13. o “constructo” que se pretende medir15. Por ejem-
Algunas variantes de este tipo de validez se plo si el propósito es medir la depresión post-parto
asocian al tiempo en que se realizan las pruebas al (como constructo), el investigador debería pregun-
paciente. Por ejemplo, si se realizan las medicio- tarse por las dimensiones teóricas que subyacen en
nes antes que aparezca el evento, y se espera su el tema, y las relaciones que se configuran entre
ocurrencia, estamos frente a una forma de validez éstas. El análisis factorial es el procedimiento
predictiva. Estas mediciones son bastantes apro- estadístico más apropiado para determinar este tipo
piadas para determinar la asociación entre riesgo de validez, ya que puede identificar la cantidad de
sanitario y evento, o predicción de éxito o fracaso constructos o factores que existen en el test, y la
de intervenciones. medida en que cada ítem está relacionado con cada
Por otra parte, si se selecciona un gold standard factor16. En la construcción o evaluación de un
o criterio, y se compara simultáneamente con los instrumento de medición, el análisis de factores se
resultados obtenidos a través del test aplicado, puede utilizar de forma exploratoria o confirmato-
estamos frente a una forma de validez concurrente. ria. Usualmente esta técnica estadística es empleada
En este caso se busca saber si la medida obtenida en forma exploratoria, ya que su análisis proporcio-
con el test diseñado para tal efecto se acerca o no al na al investigador una idea de cuáles y cuántas son
criterio, de forma tal que el clínico pueda sustituir el las dimensiones que conforman el constructo que
criterio por la medida obtenida a través de su test. está investigando.
No obstante, al aplicar criterios o medidas compara- Existen dos variantes de validación de constructo
tivas, siempre debería preguntarse si éstas son denominadas: validez convergente y validez concu-
apropiadas a la cultura, situación social o nivel rrente. En la primera, se correlaciona la medición
educativo en que se aplican, de modo que constitu- obtenida a través de un instrumento con otro, que
yan una fuente válida de comparación. mide el mismo constructo. Tomemos como ejemplo
la medición del dolor postoperatorio en un mismo
Validez de contenido o aparente. La validez de grupo de pacientes; una medida se obtendrá a través
contenido se refiere al grado en que un instru- de la escala análoga visual, y la otra mediante el test
mento representa el universo o la totalidad de los de dolor específico para pacientes quirúrgicos. Si los
contenidos del fenómeno que se pretende medir, resultados con una y otra medida, correlacionan
apunta por tanto, a cuán bien la muestra de positivamente o “convergen”, significa que ambos
preguntas del cuestionario representa el concepto test miden el mismo constructo.
bajo estudio14. Sin embargo, no se espera que un En la segunda variante –validez concurrente- ,
instrumento cubra detalladamente cada uno de los los resultados de un test se comparan con los de
dominios que conforman un concepto –ello impli- otro que mide un constructo diferente. Siguiendo
caría un instrumento extremadamente largo–, lo el ejemplo anterior, se pueden comparar los
que debería esperarse es que el instrumento resultados de percepción del dolor postoperatorio
contenga una muestra representativa de sus domi- con capacidad funcional, en el mismo grupo de
nios y posibles preguntas. Una forma habitual de pacientes. En teoría, ambos test debiesen tener
establecer la validez de contenido es la consulta a correlaciones negativas o inversas, de lo contrario
expertos en el tema, quienes evalúan a través de significa que el test de dolor postoperatorio no es
una pauta elaborada por el investigador, si los suficientemente específico para medir ese cons-
contenidos de un test son pertinentes y adecua- tructo en pacientes quirúrgicos.
dos; no obstante, es el investigador clínico, quien
finalmente decidirá hasta dónde desea extender el
contenido de su cuestionario. CONFIABILIDAD O ESTABILIDAD DE LAS MEDIDAS
A R T Í C U L O
128 E S P E C I A L
MEDICI Ó N EN SALU D - A M Alarcón et al
A R T Í C U L O
E S P E C I A L
129
Rev Méd Chile 2008; 136: 125-130
validez y consistencia del constructo y sus propie- muestra cumplir con los estándares estadísticos
dades a través del análisis tanto de los ítems, como adecuados al tipo de medición, y a los supuestos
de su interacción en el conjunto del instrumento. que fundamentan su construcción.
Sin embargo, el uso de técnicas cualitativas y Los elementos presentados en este artículo,
estadísticas debe ser apropiado al tipo de medición proveen guías operacionales y analíticas para
que el clínico desea realizar, y a la naturaleza del construir medidas en salud que reflejen con
constructo que desea conocer. Un instrumento de mayor grado de validez y confiabilidad aquellas
medición es válido y confiable cuando es pertinen- condiciones y percepciones subjetivas de los
te a la cultura que le dio origen, es amigable y pacientes, reconociendo que ninguna medida de
comprensible para quienes lo responden, y de- este tipo es libre de error.
A R T Í C U L O
130 E S P E C I A L