Art 16

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

Rev Méd Chile 2008; 136: 125-130

ARTÍCULO ESPECIAL

Medición en salud: Algunas


consideraciones metodológicas
A NA M. ALARCÓ N Ma, Sergio Muñoz N b.

Some methodological issues


about measurements in health
M e a s u r e m e n t p r o c e ss i s a p a r t o f e v e r y d a y w o r k o f h e a l t h
professionals. Technological advances have created pr ecise and sensitive instruments whose
r e s u l ts a r e h i g h l y a cc u ra te a n d c a s t l i ttl e d o u b ts . H o w e v e r, h e a l th c a r e h a s d i v e rs i f i e d ,
becoming a multidimensional and complex task. This means that new aspects, that are difficult
to measure, must be addr essed, such as health perception by patients or cost usefulness ratios of
health actions. Therefor e, clinicians and r esearchers must have a good perception of the quality
of measures that they use in their daily work, to make the correct diagnostic, therapeutic or
prognostic decisions. This article explores the operational concepts that help in the development
and assessment of measuring instruments in ter ms of validity and truthfulness (Rev Méd Chile
2008; 136: 125-30).
(Key words: Delivery of health car e; Research design; Statistics as topic)

Recibido el 30 de agosto, 2006. Aceptado el 13 de marzo, 2007.


Departamento de Salud Pública, Facultad de Medicina, Centro de Investigación y Gestión
para la Evidencia en Salud (CIGES), Universidad de La Frontera, Temuco, Chile.
aPhD en Antropología Médica
bPhD en Bioestadística

E l proceso de medición forma parte de la


práctica diaria de todos los profesionales de
salud; está presente por ejemplo, en la evaluación
Medición es simplemente el proceso de asig-
nar valores a ciertos eventos de la realidad3. La
dificultad del proceso radica al menos en dos
de la capacidad funcional de los adultos mayores, aspectos: que el valor represente realmente el
en la detección de actitudes hacia el beber evento que se quiere medir, y que el evento sea
problema, o en la valoración del dolor subjetivo expresado en toda su complejidad. En medicina,
de un paciente1,2. La aplicación de cuestionarios o los instrumentos para determinar la condición
escalas generan mediciones que muchas veces biológica de un paciente han experimentado tal
determinan importantes decisiones pronósticas y desarrollo tecnológico, que han logrado disminuir
terapéuticas; sin embargo, en la mayoría de los la incertidumbre de los resultados de una medi-
casos se desconoce el origen y capacidad real del ción4. No obstante, es la medición de salud como
instrumento para evaluar la condición bajo estudio. fenómeno psicosocial que requiere refinar la
precisión de sus instrumentos, dado que el objeti-
vo principal en este campo de la salud es recoger,
Correspondencia a: Ana M. Alarcón M. Departamento Sa- en forma válida y confiable, la percepción subjeti-
lud Pública, Facultad de Medicina-CIGES, Universidad de va de los pacientes.
La Frontera. Montt 112, Temuco. Fono: 45- 325740. Fax: Este artículo expone, desde una perspectiva
45-325741. E mail: [email protected] metodológica, algunos conceptos esenciales y

125
Rev Méd Chile 2008; 136: 125-130

operativos tanto para la construcción, como para ciones a procesos, contribuyendo a delimitar
la evaluación de instrumentos de medición en marcos teóricos, y mejorando la comprensión del
salud, particularmente escalas y cuestionarios utili- contexto en que se produce el evento de salud5,6.
zados en estudios de población. Se abordarán En consecuencia, son las representaciones de los
temas tales como: la generación y selección de sujetos, más las propias del investigador clínico,
ítems que configuran el objeto de medición, las que se configuran como ítems en un cuestio-
ciertas consideraciones respecto del diseño de nario. Estas formas de obtención de ítems equiva-
instrumentos, y finalmente algunas indicaciones len a las fuentes de datos necesarios para lograr
para la evaluación de la calidad de un instrumento una muestra representativa de los ítems.
de medición; este último aspecto es esencial para Los desafíos inherentes a esta etapa son, deter-
quienes utilizan cuestionarios o escalas ya diseña- minar el universo de ítems o preguntas que
das en otras partes del mundo. Su propósito es representen totalmente al evento, establecer sus
contribuir con algunos elementos teóricos básicos límites, y discriminar lo que pertenece o no, al
para guiar al investigador clínico a tomar decisio- evento en estudio. El tema es particularmente
nes basadas en mediciones válidas y confiables. complejo porque no existe más herramienta que el
criterio, experiencia y sensibilidad teórica del inves-
Generación y selección de ítems de un instrumen- tigador clínico para reunir el máximo de propieda-
to de medición en salud. La etapa inicial en la des observables del evento que pretende estudiar.
construcción de un cuestionario o escala que
tenga por objetivo recoger la percepción u opi- Consideraciones sobr e el diseño del instrumento
nión de los pacientes, implica los siguientes de medición. El diseño de un instrumento de
pasos: a) definir con máxima precisión el objeto medición –sea éste escala o cuestionario–, depen-
de la medición, b) atribuir a los objetos o eventos de de múltiples factores entre los que podemos
de salud ciertos indicadores que expresen con- mencionar: el objetivo para el cual se propone el
ceptualmente las propiedades del objeto que se instrumento, los recursos financieros para su
pretende medir, y c) reflejar la variabilidad entre construcción y prueba, acceso a la información,
los sujetos que están siendo objeto de medición. edad y educación de los pacientes quienes serán
Habitualmente el investigador parte de ideas que objeto de medición, y el nivel de precisión de la
provienen de su experiencia clínica, del análisis medida que se pretende obtener. El conjunto de
de literatura científica, y de diálogos con sus estos factores determinará la extensión del instru-
pacientes y colegas, de esta forma produce una mento, el formato, y su presentación; sin embargo
conceptualización que le permite identificar di- lo más relevante en el diseño es la decisión del
mensiones y variables de su objeto de estudio. investigador clínico sobre el nivel de medida de
Este proceso implica la construcción y recons- sus variables. Por ejemplo, es diferente decirle a
trucción del concepto que se quiere medir en la un paciente –cualquiera sea su patología–, que
población; tomemos como ejemplo la definición construya una lista con sus síntomas, que elija de
del concepto “calidad de vida”, y la identificación una lista aquellos que presenta con mayor fre-
de sus propiedades manifiestas, tales como, “estar cuencia, o que ordene de una lista que el médico
bien”, “sentirse feliz”, “dormir bien”, “visitar ami- le presenta, aquellos que le provocan mayor
gos”, entre otras; son justamente estas propieda- molestia. La decisión por una u otra forma
des o características las que contribuirán a dependerá tanto de los intereses del clínico en
reconstruir el concepto “calidad de vida” como profundizar sobre los síntomas de sus pacientes,
objeto de medición. de la aplicación de los resultados; como de la
En esta fase, que podríamos llamar explorato- calidad de sus variables, es decir, hasta dónde su
ria, la incorporación de métodos y técnicas cuali- variable le permite variar en respuesta. En resu-
tativas de investigación tales como, entrevistas en men, lo que se intenta es representar la variabili-
profundidad, observaciones no estructuradas, y dad de respuestas entre los pacientes a los que se
grupos focales constituyen herramientas esencia- les aplicará finalmente el instrumento7.
les para indagar en la condición subjetiva de los En términos operativos significa que para
pacientes, produciendo descripciones y explica- construir un cuestionario, el clínico deberá seguir

A R T Í C U L O

126 E S P E C I A L
MEDICI Ó N EN SALU D - A M Alarcón et al

los siguientes pasos: definir el concepto y objetivo Deter minación de la validez de un instrumento.
de la medición, elaborar una lista extensiva de sus La validez de un instrumento se refiere a la
ítems, determinar la forma de medición de las pertinencia de las inferencias realizadas a partir de
respuestas, expresar las preguntas (variables) en las mediciones; en otras palabras, validez significa
palabras apropiadas a la cultura, educación y edad cuán bien un resultado obtenido refleja al fenó-
de sus pacientes, construir un borrador de prueba, meno bajo estudio, o la capacidad del instrumento
y finalmente probar el instrumento en una mues- para medir la cualidad para la que fue construi-
tra de pacientes. Los resultados de su prueba do9,10. Por ejemplo, un test que mida depresión
determinarán: el contenido esencial del instru- en un paciente debe dar cuenta de la calidad y
mento, la dificultad de aplicación y comprensión, magnitud de ese fenómeno, y no del stress de ese
y la posibilidad de análisis de las medidas obteni- paciente; por lo tanto, cuando un investigador
das. clínico construya un cuestionario o intente aplicar
alguno ya existente debe –en primer término-
Calidad y pertinencia de un instrumento: temas examinar con profundidad la naturaleza del even-
de validez y confiabilidad. La determinación de la to que desea medir (llámese depresión, stress,
calidad de un instrumento implica plantearse angustia, calidad de vida, etc.), y al mismo tiempo,
preguntas tanto de la exactitud con que mide el examinar si las variables del cuestionario repre-
fenómeno bajo estudio, la estabilidad de la medi- sentan en forma precisa el fenómeno que desea
ción o resultado, como de la pertinencia del medir.
instrumento para los sujetos o realidad en que se Existen diversas formas de determinar la vali-
aplican las mediciones. Por ejemplo, un clínico dez de un instrumento, no obstante la distinción
que evalúe la calidad de vida de sus pacientes sea entre ellas, refleja más una necesidad operativa
ésta en forma específica o genérica, se enfrenta a que conceptual para el investigador. Entre éstas se
la incertidumbre de si los valores obtenidos a encuentran la validez de: a) criterio, b) constructo,
través del cuestionario reflejan o no la condición y c) contenido.
del paciente, si el instrumento es capaz de
detectar diferencias entre los sujetos, si cambios Validez de criterio. Este tipo de validez se asocia
en los resultados de la medición en un paciente generalmente a la capacidad de un instrumento
son consecuencia de cambios en su condición de para predecir una conducta o evento de salud. En
salud, y finalmente si las preguntas del cuestiona- clínica es común evaluar ciertas conductas de
rio fueron respondidas comprensivamente por el riesgo sanitario y predecir quiénes tienen el riesgo
paciente. potencial de desencadenar el problema, enferme-
Este conjunto de interrogantes aluden directa- dades cardiovasculares, depresión entre otros
mente a los conceptos de confiabilidad y validez ejemplos. El procedimiento más común para
de un instrumento. La estimación de la calidad de determinar la capacidad predictiva de un instru-
un cuestionario o escala es requisito esencial, no mento, es demostrar una correlación entre las
sólo en su proceso de construcción, sino también medidas obtenidas con algún criterio exterior
en la utilización de aquellos obtenidos en la habitualmente llamado “gold standard”, de modo
literatura médica internacional. Por ejemplo, aun- que, si la correlación es alta, la medida obtenida
que el investigador clínico haya encontrado algún es considerada válida11. Desafortunadamente no
cuestionario muy apropiado a sus objetivos, vali- siempre se dispone de un criterio de comparación
dado y utilizado en otras partes del mundo; aceptable, por lo tanto el desafío para el clínico
deberá igualmente validarlo con sus pacientes, ya será buscar o construir alguno con el que pueda
que su aplicabilidad se limita sólo al contexto comparar los resultados de su medición, para lo
social y cultural en que fue creado. Para ello debe cual deberá conjugar tanto su experiencia clínica
utilizar, si corresponde, los mismos procedimien- como la revisión crítica de literatura.
tos de determinación de validez y confiabilidad La selección del criterio se basa en una
que aquí se exponen, sin embargo, deberá iniciar supuesta relación entre el evento medido y el
el proceso de validación del instrumento, con una criterio elegido, como ejemplos clásicos se pue-
adaptación idiomática y cultural8. den mencionar los cuestionarios de calidad de

A R T Í C U L O

E S P E C I A L
127
Rev Méd Chile 2008; 136: 125-130

vida específicos, cuyos resultados son contrasta- por ello, la validez de constructo se pregunta cuán
dos con criterios clínicos elaborados por socieda- bien la medición refleja la naturaleza del concepto
des profesionales12,13. o “constructo” que se pretende medir15. Por ejem-
Algunas variantes de este tipo de validez se plo si el propósito es medir la depresión post-parto
asocian al tiempo en que se realizan las pruebas al (como constructo), el investigador debería pregun-
paciente. Por ejemplo, si se realizan las medicio- tarse por las dimensiones teóricas que subyacen en
nes antes que aparezca el evento, y se espera su el tema, y las relaciones que se configuran entre
ocurrencia, estamos frente a una forma de validez éstas. El análisis factorial es el procedimiento
predictiva. Estas mediciones son bastantes apro- estadístico más apropiado para determinar este tipo
piadas para determinar la asociación entre riesgo de validez, ya que puede identificar la cantidad de
sanitario y evento, o predicción de éxito o fracaso constructos o factores que existen en el test, y la
de intervenciones. medida en que cada ítem está relacionado con cada
Por otra parte, si se selecciona un gold standard factor16. En la construcción o evaluación de un
o criterio, y se compara simultáneamente con los instrumento de medición, el análisis de factores se
resultados obtenidos a través del test aplicado, puede utilizar de forma exploratoria o confirmato-
estamos frente a una forma de validez concurrente. ria. Usualmente esta técnica estadística es empleada
En este caso se busca saber si la medida obtenida en forma exploratoria, ya que su análisis proporcio-
con el test diseñado para tal efecto se acerca o no al na al investigador una idea de cuáles y cuántas son
criterio, de forma tal que el clínico pueda sustituir el las dimensiones que conforman el constructo que
criterio por la medida obtenida a través de su test. está investigando.
No obstante, al aplicar criterios o medidas compara- Existen dos variantes de validación de constructo
tivas, siempre debería preguntarse si éstas son denominadas: validez convergente y validez concu-
apropiadas a la cultura, situación social o nivel rrente. En la primera, se correlaciona la medición
educativo en que se aplican, de modo que constitu- obtenida a través de un instrumento con otro, que
yan una fuente válida de comparación. mide el mismo constructo. Tomemos como ejemplo
la medición del dolor postoperatorio en un mismo
Validez de contenido o aparente. La validez de grupo de pacientes; una medida se obtendrá a través
contenido se refiere al grado en que un instru- de la escala análoga visual, y la otra mediante el test
mento representa el universo o la totalidad de los de dolor específico para pacientes quirúrgicos. Si los
contenidos del fenómeno que se pretende medir, resultados con una y otra medida, correlacionan
apunta por tanto, a cuán bien la muestra de positivamente o “convergen”, significa que ambos
preguntas del cuestionario representa el concepto test miden el mismo constructo.
bajo estudio14. Sin embargo, no se espera que un En la segunda variante –validez concurrente- ,
instrumento cubra detalladamente cada uno de los los resultados de un test se comparan con los de
dominios que conforman un concepto –ello impli- otro que mide un constructo diferente. Siguiendo
caría un instrumento extremadamente largo–, lo el ejemplo anterior, se pueden comparar los
que debería esperarse es que el instrumento resultados de percepción del dolor postoperatorio
contenga una muestra representativa de sus domi- con capacidad funcional, en el mismo grupo de
nios y posibles preguntas. Una forma habitual de pacientes. En teoría, ambos test debiesen tener
establecer la validez de contenido es la consulta a correlaciones negativas o inversas, de lo contrario
expertos en el tema, quienes evalúan a través de significa que el test de dolor postoperatorio no es
una pauta elaborada por el investigador, si los suficientemente específico para medir ese cons-
contenidos de un test son pertinentes y adecua- tructo en pacientes quirúrgicos.
dos; no obstante, es el investigador clínico, quien
finalmente decidirá hasta dónde desea extender el
contenido de su cuestionario. CONFIABILIDAD O ESTABILIDAD DE LAS MEDIDAS

Validez de constructo. El propósito de la validez de La confiabilidad se refiere al grado en que los


constructo es ratificar la teoría que fundamenta la puntajes observados en una medición están libres
utilización de un test, más que el test en sí mismo; de error de medida; se relaciona con la estabilidad

A R T Í C U L O

128 E S P E C I A L
MEDICI Ó N EN SALU D - A M Alarcón et al

de las observaciones e inferencias realizadas y su aplica un cuestionario o escala para evaluar la


precisión17. Para obtener un alto grado de confia- presencia de stress en ciertos sujetos, probable-
bilidad, el esfuerzo debe dirigirse hacia el control mente se obtendrán resultados diferentes si el
del error en las respuestas de los pacientes, dado cuestionario se aplica antes o después de las
que el supuesto es que, si las condiciones son vacaciones de los trabajadores. Es por ello, que el
constantes los resultados serán idénticos. Por investigador clínico que desee realizar un test-
ejemplo, al aplicar un test de esfuerzo, el clínico retest debe aplicar su cuestionario resguardando
debe controlar ciertos factores como: la motiva- que las condiciones en que se aplica sean simila-
ción de sus pacientes, las condiciones del ambien- res entre la primera y segunda aplicación.
te físico en que aplica la prueba, o la dificultad del
test. Algunas formas de estimar la confiabilidad de C o n f i a b i l i d a d i n te r o b s e rv a d o r o e q u i v a l e n c i a .
los datos son: a) análisis de consistencia interna, Esta forma de estimar confiabilidad se utiliza
b) test-retest, y c) confiabilidad interobservador. principalmente en observaciones clínicas diagnós-
ticas, y cuestionarios con preguntas abiertas19. El
Consistencia inter na o inter-ítem. Consiste en objeto es correlacionar los puntajes obtenidos
determinar cuán bien los ítems de un cuestionario entre distintos observadores, indicando de esta
o escala correlacionan unos con otros a través de forma, el porcentaje de acuerdo respecto de la
diversos procedimientos estadísticos. Uno de éstos medida observada corrigiendo el factor azar. La
consiste en partir el cuestionario en dos mitades; forma habitual de obtener esta confiabilidad es a
por ejemplo todas las respuestas pares y todas las través del coeficiente de Kappa; considerando un
impares, y correlacionar ambos grupos de res- valor muy bueno a partir de 0,8 y muy malo por
puestas. Otra forma consiste en correlacionar cada debajo de 0,20, así mientras más cerca de cero es
ítem con todos los otros, en este caso se estima la el valor, más azar hay presente en las medidas20.
consistencia del ítem en forma individual en Finalmente es necesario señalar que los ele-
relación con todos los demás. El coeficiente alpha mentos discutidos sobre evaluación de calidad de
de Cronbach es el más apropiado para ítems que las medidas obtenidas a través de la aplicación de
tienen tres o más alternativas de respuestas, y instrumentos, deben cumplir dos requisitos funda-
Kuder Richardson para ítems que ofrecen respues- mentales; primero, un equipo de trabajo multidis-
tas dicotómicas; ambas son pruebas estadísticas ciplinario con el cual discutir contenidos,
que evalúan el ítem y su relación con la extensión resultados y tomar decisiones, y segundo la
del cuestionario18. El análisis de consistencia provisión de programas de estadísticos adecuados
interna de un instrumento es frecuentemente para realizar las pruebas mencionadas, entre éstos
realizado con posterioridad al análisis factorial, y el más utilizado en ciencias de la salud es Stata®, y
contribuye complementariamente a evaluar su en ciencias sociales SPSS®.
validez. Basado en estos resultados el investigador
clínico podrá determinar la pertinencia de un ítem
en el cuestionario; decisión que va a depender DISCUSIÓN
tanto de sus intereses y motivaciones, como de los
parámetros estadísticos obtenidos. El diseño y construcción de un instrumento de
medición en salud constituye un proceso complejo
Test-retest o medida de estabilidad. Consiste en en el que confluyen múltiples disciplinas y metodo-
repetir la prueba dos o más veces a los mismos logías, en particular si el propósito es construir
sujetos con el objeto de correlacionar sus respues- escalas de medida. En su fase inicial el aporte de
tas y determinar su estabilidad. Este método tiene los métodos cualitativos de investigación es funda-
la dificultad que muchas veces las diferencias mental para obtener un mayor acercamiento a los
observadas en las respuestas no se deben sólo al atributos del objeto de estudio; es así como
azar, interviniendo por ejemplo, sesgos de memo- entrevistas y grupos focales con la población
ria de los pacientes, cambios en la forma de objetivo, incrementan el universo de ítems al
plantear las instrucciones, o de las condiciones en construir un instrumento de medición21. Por otra
que se administra la prueba. Por ejemplo, si se parte, las herramientas estadísticas evidencian la

A R T Í C U L O

E S P E C I A L
129
Rev Méd Chile 2008; 136: 125-130

validez y consistencia del constructo y sus propie- muestra cumplir con los estándares estadísticos
dades a través del análisis tanto de los ítems, como adecuados al tipo de medición, y a los supuestos
de su interacción en el conjunto del instrumento. que fundamentan su construcción.
Sin embargo, el uso de técnicas cualitativas y Los elementos presentados en este artículo,
estadísticas debe ser apropiado al tipo de medición proveen guías operacionales y analíticas para
que el clínico desea realizar, y a la naturaleza del construir medidas en salud que reflejen con
constructo que desea conocer. Un instrumento de mayor grado de validez y confiabilidad aquellas
medición es válido y confiable cuando es pertinen- condiciones y percepciones subjetivas de los
te a la cultura que le dio origen, es amigable y pacientes, reconociendo que ninguna medida de
comprensible para quienes lo responden, y de- este tipo es libre de error.

REFERENCIAS Organizaciones: Epistemología y Técnicas. Bue-


nos Aires: Editorial de las Ciencias, 2004.
1. CLANCY C, EISENBERG J. Outcomes research: measu- 10. STREINER D, NORMAN G. Health measurement scales
ring the end results of health care. Science 1998; a practical guide to their development and use.
282: 246-7. NY: Oxford Medical Publications, 2003.
2. GARRANT A, SCHMITH P, MACKINTOSH A. Quality of life 11. NUNNALLY J. Psychometric theory. NY: McGraw-
measurement: bibliographic study of patients as- Hill, 1978.
sessed health outcome measures. BMJ 2002; 324: 12. JUNNIPER E, GUYANTT G, FEENY D. Measuring quality
1417-22. of life in children with asthma. Qual Life Res
3. KERLINGER F, LEE H. Investigación del comporta- 1996; 5: 35-46.
miento. Métodos de investigación en ciencias 13. STREINER D. A checklists for evaluating the usefulness
sociales. México: McGraw-Hill, 2002. of rating scales. Con J Psychiatry 1991; 38: 140-8.
4. BANGDIWALA S, MUÑOZ S. Medición de confiabilidad 14. DOOLEY D. Social r esearch methods. NY: Prentice-
y validez en instrumentos clínicos. Rev Méd Chile hall Inc. 1995.
1997; 125: 446-73. 15. CRONBACH L. Essentials of psychological testing.
5. MILES M, HUBERMAN A. Qualitative data analysis. NY: Harper and Row, 1984.
CA: Thousands Oaks Sage Publications, 1994. 16. HARMAN H. Moder n factor analysis. Chicago: Uni-
6. CRABTREE B, MILLER W. Doing qualitative research versity of Chicago Press, 1976.
methods for primary care. CA: Newbury Park 17. STREINER DL. Starting at the beginning: An intro-
Sage Publications, 1992. duction to coefficient alpha and internal consis-
7. HANDWERKER WP, BORGATTI S. Reasoning with num- tency. J Personality Ass 2003; 80: 99-103.
bers. En: H. Russell Bernard, ed. Handbook of 18. NORMAN G, STREINER D. PDQ statistics. Toronto:
Methods in Cultural Anthropology. CA: Altamira Decker, 2003.
Press, 1998; 593-549. 19. MUÑOZ S, BANGDIWALA S. Interpretation of Kappa
8. SÁNCHEZ R, ECHEVERRY J. Validación de escalas de and B statistics measures of agreement. J App Stat
medición en salud. Rev Salud Pública 2004; 1997; 24: 105-11.
6:302-318. Disponible en: http:/www.scielos 20. HANLEY B. Standard error of the kappa statistic.
p.org/scielo.php?pid=S0124-00642004000 Psychological Bulletin 1987; 114: 235-41.
300006&script=sci_arttext [Consultado el 13 de 21. DE SOUZA M. El desafío del conocimiento: Investi-
noviembre de 2006]. gación cualitativa en salud. Buenos Aires: Lugar
9. VIEYTES R. Metodología de la Investigación en Editorial, 2004.

A R T Í C U L O

130 E S P E C I A L

También podría gustarte