Material Teórico Módulo 2
Material Teórico Módulo 2
Material Teórico Módulo 2
Estadística
El enfoque epidemiológico
El enfoque epidemiológico incorpora una serie ordenada de pasos que permiten
una toma de decisiones y acciones más efectivas.
Consiste básicamente en:
i) la observación de los fenómenos de salud y enfermedad en la población;
ii) la cuantificación de éstos en frecuencias y distribuciones;
iii) el análisis de las frecuencias y distribuciones de salud y de sus
determinantes, comparación; y,
iv) la definición de cursos de acción apropiados.
- nominal,
- ordinal,
- de intervalo y
- proporcional o de razón.
Una variable nominal tiene categorías a las que se les asignan nombres que no tienen
ningún orden entre ellos; por ejemplo, el sexo. La categoría “hombre” no tiene ninguna
relación de orden sobre la categoría “mujer”.
Las variables nominales no tienen que ser necesariamente dicotómicas (dos
categorías) sino que pueden tener varias categorías, como por ejemplo el estado civil
(soltero, casado, divorciado, viudo, unión libre) o el grupo sanguíneo según el sistema
ABO (A, B, AB y O). El hecho de cambiar el orden no tiene ninguna implicación
en el análisis de los datos.
Una variable ordinal, que se define como aquella cuyas categorías tienen un orden,
aunque las diferencias entre ellas pueden no ser iguales.
P. Ej., si se nos pregunta sobre la calidad de este curso y se nos ofrecen las siguientes
opciones de respuesta: muy malo, malo, regular, bueno y excelente. Esta clasificación
tiene un orden: excelente es mejor que bueno, bueno que regular y así sucesivamente;
sin embargo, la “distancia” que hay entre excelente y bueno no tiene porque ser la
misma que entre malo y muy malo.
Una variable ordinal se define como aquella cuyas categorías tienen un orden,
aunque las diferencias entre ellas pueden no ser iguales.
Otros ejemplos de variables ordinales son los estadíos de un cáncer (I, II, III y IV) o
los resultados de un cultivo de laboratorio (–, +, ++, +++).
Una variable de intervalo tiene distancias iguales entre sus valores y una característica
fundamental: el cero es arbitrario.
El ejemplo típico de variable de intervalo es la temperatura corporal. Existe la misma
diferencia entre 37°C y 39°C que entre 38°C y 40°C (o sea, 2°C). Sin embargo, no
podemos decir que una temperatura de 60°C sea ‘tres veces más caliente’ que una de
20°C. Tampoco podemos concluir que un individuo con un coeficiente de inteligencia
de 120 es el doble de inteligente que otro con coeficiente 60.
Por último, si la variable de intervalo tuviese un punto de origen que es el valor cero
significativo, estaríamos hablando de una variable proporcional o de razón.
Ésta tiene intervalos iguales entre valores y punto de origen cero. El peso y la altura
son ejemplos típicos de variables proporcionales, 80 Kg. es el doble que 40Kg. y hay la
misma diferencia entre 50 y 35Kg. que entre 105 y 90 Kg.
En este nivel se puede sumar, restar, multiplicar y dividir.
Los datos sobre casos de enfermedades atendidas o notificadas por el centro o servicio
de salud pueden provenir de un listado de nombres, edades, sexo, etc., del cual se
puede obtener el número total o frecuencia de casos.
Si se busca agrupar los casos según algunas características de los mismos, la tarea de
identificar los grupos poblacionales con mayores problemas se simplifica.
P. ej., entre las características de la persona, se pueden agrupar los casos según su
edad, sexo. A partir de este listado se puede identificar los casos que han ocurrido en
determinado lugar y comparar la frecuencia de la enfermedad en distintos lugares o
áreas geográficas.
Por último, se puede examinar el número de casos según el momento en que ocurrieron
o fueron notificados. La distribución de los casos en el tiempo se puede agrupar en
días, semanas, meses o cualquier otro período de tiempo que se considere adecuado.
Esto permite saber en qué momento se presentó el mayor número de casos, cuánd o
empezó a aumentar y cuándo a disminuir. Es necesario recordar que la frecuencia es
el número de veces que se repite un valor de la misma variable.
Los datos agrupados según determinadas características (edad, sexo, residencia, clase
social, etc.) pueden presentarse en cuadros y/o gráficos; esto facilita los cálculos y la
comparación e interpretación de los resultados como se puede ver en el siguiente Cuadro.
Cuadro 1: Distribución de los casos de gastroenteritis según edad. Centro de
Salud A, mayo de 2000
Ejemplo para la elaboración de un cuadro:
El siguiente listado corresponde a las edades en años de 120 personas afectadas por
malaria durante el verano de 2001, en una isla del Caribe
Para calcular la mediana primero tenemos que ordenar los números de menor a
mayor (o de mayor a menor). Por ejemplo, los datos de la frecuencia cardíaca.
72 52 63 68 66 72 74 81 76 56
Se ordenarán así
Datos sobre la frecuencia cardíaca ordenados:
52 56 63 66 68 72 72 74 76 81
Ya podemos decir que la mediana se ubica entre 68 y 72
Ahora tenemos un pequeño problema. Dado que tenemos un número par de datos, no
tenemos un número que caiga en el medio. En este caso, tendremos que calcular el
promedio de los números centrales o sea la mediana es 70.
En un conjunto de datos, la moda es el número es el número que se repite con mayor
frecuencia.
Si miramos de nuevo nuestros datos sobre la frecuencia cardíaca:
72 52 63 68 66 72 74 81 76 56
La moda es 72.
Como se puede apreciar, el número 72 aparece dos veces en nuestro conjunto de
datos. Todos los demás solo aparecen una vez.
Media= 68 Mediana = 70 Moda = 72
Se observa que las tres medidas de tendencia central (media, mediana y moda) tienen
valores diferentes. Se usan en situaciones estadísticas distintas, según la naturaleza de
los datos y las pruebas estadísticas que se requieran.
Medidas de dispersión
Para las variables cuantitativas continuas las medidas de dispersión más usadas son
básicamente tres: el rango o amplitud, la varianza y la desviación estándar.
El rango o amplitud es la diferencia entre el valor máximo y el valor mínimo de una
serie de datos.
La varianza (s2), que mide la desviación promedio de los valores individuales con
respecto a la media, es el cociente entre la suma de los cuadrados de la diferencia
entre cada valor y el promedio, y el número de valores observados (menos 1).
La desviación estándar (DE) es la raíz cuadrada de la varianza.
En la fórmula, se elevan al cuadrado todas las desviaciones para que no se anulen las
negativas con las positivas y se extrae la raíz cuadrada al final.
Distribución normal
Finalmente, otra forma útil de representar la dispersión de la distribución de una serie de datos es
usando cuantiles, que son los valores que ocupan una determinada posición en función de la
cantidad de partes iguales en que se ha dividido una serie ordenada de datos. Si dividimos nuestra
serie en 100 partes iguales, hablamos de percentiles; si la dividimos en 10 partes iguales, deciles; en
cinco partes, quintiles; y en cuatro, cuartiles. Como ejemplo, en el siguiente cuadro se presentan
nueve percentiles de edad correspondientes a la serie de casos de malaria del ejemplo dado más
arriba: el percentil 25 de esta distribución es 33 años, que equivale a decir que 25% de los casos
tenían edad menor o igual a 33 años (y, en consecuencia, 75% de los casos eran mayores de 33
años). Nótese que la mediana de la distribución corresponde al percentil 50 (o cuartil 2).
Percentiles y sus valores en una distribución de casos de Malaria
Para comprender esta medida de posición proponemos las tradicionales tablas de crecimiento de niñas
y niños usadas en pediatría (Tablas de Peso y Talla) donde se grafican el peso y talla del niño/a
evaluado ubicando el valor en un percentilo del gráfico. Por ejemplo: en la siguiente tabla de
Peso/Edad para Niños un lactante varón de 12 meses de edad que pesa 9 kg y 600 gr se ubica en el
percentilo 50 de la tabla.
Medidas de frecuencia
El enfoque epidemiológico parte de la observación de hechos en la población.
Estos hechos son: la presencia de enfermedad y la exposición a determinados
factores, u otros atributos o eventos de interés.
La cuantificación es asignar números a los hechos y medir la frecuencia u
ocurrencia de tales hechos en la población es una tarea fundamental.
La probabilidad es una medida de ocurrencia de un hecho incierto, o sea, el número
de veces que se espera ocurra un evento a futuro.
La tasa es una medida de la rapidez de cambio de un estado a otro estado (v.g., de
sano a enfermo) y, por tanto, también expresa un riesgo.
Al comparar cuál de los dos años tuvo una prevalencia más alta de
Tuberculosis, nos encontramos que:
Medidas de Mortalidad
Otra forma importante de medir la ocurrencia de enfermedad en la población es a
través de la tasa de mortalidad, un estimador del riesgo absoluto de morir.
Mientras la mortalidad hace referencia a las defunciones entre la población total (sana o
enferma), la letalidad sólo hace referencia a las defunciones entre la población enferma.
P. ej., si en un distrito de 30.000 habitantes ocurrieron 200 casos de tifoidea con 6
muertes en un año determinado, podemos afirmar que, en ese distrito y en ese año, la
mortalidad por tifoidea fue 2 por 10.000 y su letalidad 3%; es decir:
Cuando la distribución proporcional se refiere a datos de mortalidad, entonces hablamos
Específicamente de mortalidad proporcional, una medida de mortalidad útil para
describir el perfil y las contribuciones de causas de muerte específicas a la mortalidad
general de un lugar y periodo determinados; esto es:
14,0
12,0
10,0
8,0
6,0
4,0
2,0
0,0
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
T.MORT. INF. 14,8 15,7 16,2 13,0 12,9 12,5 13,5 12,3 12,4 12,0 11,7 11,4 11,0
T.M. NEO 9,1 9,9 9,7 8,5 8,3 7,9 8,1 7,8 8,0 7,7 7,3 7,6 7,2
T.M. POST 5,7 5,8 6,5 4,5 4,6 4,6 5,4 4,4 4,3 4,4 4,4 3,9 3,8
La siguiente tabla muestra la tasa de mortalidad proporcional postneonatal,
comparativa entre los años 2011 – 1012.
DEFUNCIONES POSTNEONATALES POR CAUSAS MAS FRECUENTES
PROVINCIA DE BUENOS AIRES - 2011/2012
16
2009 2010 2011 2012 2013
14
12
10
0
I II III IV V VI VII VIII IX X XI XII Total Prov.
2009 10,9 9,6 13,9 14,0 11,5 12,9 13,6 10,1 8,7 12,3 12,8 12,2 12,4
2010 8,5 9,1 11,6 12,2 11,7 12,6 13,3 10,7 9,7 10,8 13,0 11,4 12,0
2011 10,0 11,5 9,8 10,5 11,7 13,0 11,8 10,7 12,6 10,2 11,6 10,1 11,7
2012 8,6 11,9 10,2 12,0 11,3 12,1 13,0 9,4 9,8 9,4 11,8 12,3 11,4
2013 9,0 14,9 10,4 11,1 10,7 12,3 11,6 7,3 8,3 8,4 10,8 11,1 11,0
Como podrá observarse, hay diferentes maneras de observar la
evolución de la mortalidad, en estos ejemplos los lugares que tienen
valores más altos y sus principales causas.
Significación estadística
Un valor de P< 0.05 equivale a decir que menos del 5 % de la diferencia observada
se explica por el azar, luego se puede afirmar que la misma se debe a una asociación
estadística entre las 2 variables.
daño daño
Un intervalo de confianza del 95 % (IC 95%) para un RR= 2,5 (IC 95 % 1,7 – 5) quiere
decir que en la población el riesgo se encontrará entre 1,7 y 5 con una probabilidad del 95
%, o que si repitiéramos nuestra investigación 100 veces en 95 de ellas el valor obtenido
estará comprendido entre RR= 1,7 y un RR= 5.
“una investigación realizada por la Fundación INFANT que se propuso analizar factores de
riesgo asociados a defunciones infantiles en el hogar durante el sueño encontró que la
vacunación incompleta en lactantes se asoció con la defunción durante el sueño, con una
significación de p= 0,01; OR= 2,47 (IC95% 1,23 – 4,98)”
1. Una p= 0,01 nos habla de que sólo 1 % de las diferencias se explican por el azar: hay
asociación estadística entre las 2 variables
2. OR= 2,47 expresa que el factor de riesgo (vacunas incompletas) aumenta la probabilidad del
evento (defunción durante el sueño) en más de 2 veces
El análisis estadístico de estos datos nos confirma que la vacunación incompleta en lactantes
es un potente factor de riesgo para muerte durante el sueño.
Resumiendo:
El análisis estadístico de una asociación entre dos variables (por ej. un factor de riesgo y una
enfermedad), suele incluir los siguientes pasos:
Por lo tanto, mediante una prueba estadística se debe testear si la asociación sometida a
estudio no se debe únicamente al azar, para lo cual se calcula el valor de P. La magnitud del
efecto (valor del Riesgo Relativo u del Odds Ratio) nos permitirá evaluar la importancia clínica
de dicha asociación y diferenciar la significación estadística de su significación clínica. Y
finalmente, si estas medidas son estimadas a través de una muestra, deben ir acompañadas
de sus respectivos intervalos de confianza, que dan idea de la precisión ó del grado de
confiabilidad con que se está estimando el parámetro.