Cálculo de Muestra 1
Cálculo de Muestra 1
Cálculo de Muestra 1
RESUMEN INTRODUCCIÓN
En la investigación en salud, es muy difícil estudiar a toda la Cuando se desea realizar un estudio, lo que se desea
población que presenta la variable de interés, por lo que es compartir con la comunidad médica son: 1) observaciones
necesario realizar un muestreo que resulte representativo de realizadas en la práctica cotidiana, 2) datos específicos del
la población objetivo. El cálculo de la muestra permite expediente clínico en grupos de pacientes con alguna
responder a la pregunta del investigador de ¿cuántos característica en común 3) diferencias que se consideran
individuos se deben considerar para estudiar un parámetro importantes al comparar grupos de pacientes.
con un grado de confianza determinado? o ¿cuántos
individuos se deben estudiar para detectar en los resultados En cualquiera de estos tres casos, el cálculo del tamaño de la
de los dos grupos, una diferencia que sea estadísticamente muestra apoya al objetivo de cualquier investigación, el cual
significativa? El artículo realiza las consideraciones previas puede ser de dos tipos: a) estimar un parámetro, o b)
sobre la profundidad del estudio y las variables. Presenta contrastar una hipótesis. Entonces, el cálculo permite
las fórmulas para calcular muestras con variables cualitativas responder a cualquiera de las siguientes preguntas: ¿cuántos
y cuantitativas para estudios descriptivos y explicativos. individuos se deben considerar para estimar un parámetro
En estos últimos, cuando se utilizan las pruebas de con un grado de confianza determinado? o ¿cuántos
contrastación de hipótesis más comunes, como son la Chi individuos se deben estudiar para detectar en los resultados
cuadrada, la t de student y el coeficiente de correlación de de los dos grupos, una diferencia que sea estadísticamente
Pearson. significativa?
Palabras claves: cálculo de muestra, fórmulas, muestra El resultado del cálculo de una muestra debe considerarse
representativa, investigación en salud. como orientativo, ya que se fundamenta en supuestos que
pueden ser incorrectos y que en el momento de introducirlos
numéricamente en las fórmulas, afectan la viabilidad del
SUMMARY estudio, el costo y hasta los aspectos éticos. Por otro lado,
un estudio con una muestra insuficiente, puede afectar la
In health research, is very difficult to study all the population precisión y la sensibilidad para detectar diferencias entre los
that has the interesting attribute, so that, is necessary to grupos y conducir a conclusiones falsas.1
make a sampling representative of the target population.
The sample calculation let answer the research question Existen, por lo menos cuatro razones para estudiar muestras,
about, how many persons we must considerate for study a en vez de poblaciones:
parameter with a specific grade of confidence? Or how many 1) Las muestras pueden estudiarse con más rapidez
persons we must study for detect in the results of the two que las poblaciones.
groups, a difference significative statistically? The article 2) Es menos costoso estudiar una muestra que una
do the previously considerations about the depth of the población.
study and the attributes. It presents the formulas for calculate 3) En la mayor parte de las situaciones el estudio de la
the sample with qualitative and quantitative attributes for población entera es imposible.
descriptive and explicative research. In the last one, for use 4) Los resultados de una muestra son más precisos
the tests for contrast the hypothesis must common, like chi que los derivados de poblaciones. Esto es por la
square, t of student and the correlation coefficient of Pearson. calidad de los datos, la capacitación de quien recoge
Keywords: sample calculation, formulas, representative los datos; la estimación del error en los parámetros
sample, health research. resultantes y la homogeneidad de las muestras.
(1)
Profesora de bioestadística en la DACS-UJAT. Coordinadora de la Red Estatal de Laboratorios, Secretaría de Salud del estado de
Tabasco.
En la investigación médica, incluir más sujetos de estudio, Los estudios clínicos son estudios descriptivos a
no es sinónimo de mejor estudio. Por esta razón, se debe de partir de la práctica cotidiana, revisiones de
planear el tamaño apropiado de la muestra antes de iniciarlo. expedientes o ambos. En caso de que establecer
Este proceso se conoce como la determinación de la fuerza una serie de tiempo no sea suficiente, se requiere
o potencia del estudio (1-β) cuya definición es la capacidad calcular una muestra para una sola población.
de un estudio para identificar una diferencia de un tamaño En estudios epidemiológicos pueden ser
2
dado, si en realidad la diferencia existe. encuestas de cualquier tipo. También se requiere
El tamaño de la muestra dará la fuerza o potencia del estudio muestra.
(1-β), sobre todo en el caso de que se vaya a contrastar una
hipótesis y se pueda cometer cualquiera de los dos tipos de l Nivel III, de correlación. Buscan las relaciones o
errores, el tipo I, que consiste en rechazar una hipótesis asociaciones entre los factores estudiados. Son
nula, cuando es cierta y el II en aceptarla cuando es falsa. estudios observacionales, estudian dos
Un buen cálculo de muestra nos protege de ignorar una poblaciones y verifican hipótesis.
diferencia significativa entre los dos grupos y, por lo tanto,
de cometer el error tipo II. Es importante recordar que la Cálculo de la muestra:
Hipótesis Nula (Ho) es un enunciado que afirma que no hay Los estudios clínico-epidemiológicos son casos y
diferencia entre el valor XA del grupo A y el valor XB del controles y de cohorte, que sí requieren de calcular
grupo B. Mientras que la Hipótesis alternativa (H1) es un muestra en las poblaciones para establecer de
enunciado en desacuerdo con la hipótesis nula, que enuncia: antemano su potencia.
si hay diferencia entre el valor XA del grupo A y el valor X
B del grupo B. l Nivel IV, explicativos. Buscan establecer las causas
de las asociaciones. Son estudios cuasi-
I.- CONSIDERACIONES PREVIAS experimentales o experimentales, comparan dos
poblaciones y verifican hipótesis.
El tamaño de la muestra necesario dependerá básicamente
del nivel de la investigación y las variables insertadas en el Cálculo de la muestra:
objetivo de la investigación. Los estudios epidemiológicos son intervenciones
en poblaciones con seguimiento de la cohorte y
a) .- Con respecto al nivel de la investigación son altamente exigentes en los valores que se
introducen para el cálculo de la muestra para las
l Nivel I, de tipo exploratorias. Son investigaciones dos poblaciones que se van a comparar.
que responden preguntas sencillas para determinar
si hay o no hay tal o cual característica. Aquí solo Los estudios clínicos son ensayos aleatorizados,
se van a estimar parámetros de la población, su casi siempre para probar la efectividad de un
presencia y magnitud. Son estudios tratamiento. También son altamente exigentes en
observacionales de una población. los valores que se introducen para el cálculo de la
muestra para las dos poblaciones, los que recibirán
Cálculo de la muestra: el tratamiento y los controles.
Los estudios exploratorios de tipo clínico pueden
ser series de casos, donde no se requiere cálculo Los experimentos puros se realizan en laboratorios
de la muestra, pues se presentan todos los casos de investigación en animales y se calcula el número
que se hayan tenido. de repeticiones que se tienen que realizar. A pesar
En estudios epidemiológicos, pueden ser cálculos de que son los más poderosos, por el riguroso
de prevalencia, encuestas de opinión, encuestas control de las variables confusionales, se utilizan
serológicas. En este caso se calcula una muestra pocos sujetos de estudio. En este tipo de diseños
para una sola población. a medida que las repeticiones aumentan, las
estimaciones de las medias observadas, se hacen
l Nivel II, de tipo descriptivo. En estos estudios se más precisas. Ambas se influyen mutuamente, de
trata de realizar una descripción detallada de las tal forma que, a mayor número de repeticiones
3
características que presenta el sujeto en estudio. mayor grado de precisión y viceversa.
Son estudios observacionales en un solo tipo de
población. b) .- Con respecto a la variable insertada en el objetivo
Cálculo de la muestra: general.
Aún cuando varios autores mencionan que hay que tomar se puede apreciar, el que nos pidan los datos de algo que
4
en cuenta los objetivos de la investigación, para no aún no estudiamos, resulta sumamente confuso. Sin
confundir al lector es mejor precisar que es con respecto al embargo, sí hay solución a este problema.
objetivo general, sin tomar en cuenta los objetivos Estos datos se pueden obtener de tres formas: 1) de estudios
específicos. Ese objetivo general, que se desprendió de una reportados en revistas, con una población parecida o similar
pregunta de investigación, lleva insertada la variable de a la que queremos estudiar; 2) con un estudio piloto de 25
interés. Hay que determinar si es una variable cualitativa, sujetos, o 3) si no se pude lo anterior, se asigna la máxima
con escala nominal u ordinal, o cuantitativa con escala probabilidad con que se puede presentar la variable en
discreta o continua. cuestión, que es, en variables cualitativas del 50% y en el
caso de variables cuantitativas se determina la diferencia
En las variables cualitativas hay dos tipos de posibilidades: entre el máximo y el mínimo valor esperable, se divide entre
a) nominales, que pueden ser dicotómicas o multicotómicas cuatro y, por lo tanto, se tiene una cierta aproximación al
5
y b) ordinales. En ambos casos los resultados se expresan valor de la desviación estándar.
como porcentajes o tasas, datos que se introducen en la
fórmula para el cálculo de la muestra. El nivel de confianza deseado (Z). Indica el grado de
confianza que se tendrá de que el valor verdadero del
En variables cuantitativas también hay dos tipos de parámetro en la población se encuentre en la muestra
posibilidades: a) discretas, cuando los resultados se expresan calculada. Cuanta más confianza se desee, será más elevado
numéricamente, pero no aceptan fracciones, por ejemplo, el número de sujetos necesarios. Se fija en función del
número de dientes, número de hijos, etc. y b) continuas, interés del investigador. Los valores más comunes son 99%
cuando los resultados numéricos sí aceptan fracciones, como 95% o 90%. Hay que precisar que los valores que se
peso, estatura, todos los parámetros de química sanguínea, introducen en la fórmula son del cálculo del área de la curva
etc. En ambos casos los resultados se resumen en forma de normal para esos porcentajes señalados:
medias y varianzas, mismas que se introducen en la fórmula
del cálculo de la muestra. Nivel de Valor de Z calculado
Es importante destacar, que las variables cuantitativas son % Error
Confianza en tablas
más poderosas para el análisis estadístico y no hay que
1 99 % 2.58
convertirlas en cualitativas. Por ejemplo, para la variable
5 95 % 1.96
obesidad, es mejor analizar el índice de masa corporal, que
10 90 % 1.645
es la razón peso/talla, de tipo continua, que escoger la escala
de obeso y no obeso.
A veces se afirma erróneamente, por ejemplo, que un nivel
II.- CÁLCULO DEL TAMAÑO DE LA MUESTRA de confianza al 95%, con relación a la media muestral, da la
Para el cálculo de la muestra debe conocerse: amplitud dentro de la cual se encontrará el 95% de futuras
medias muestrales. Esto es incorrecto, ya que la distribución
La variabilidad del parámetro que se desea estudiar (p, q, de medias muestrales se centra en la media poblacional y no
S). Aunque esto parezca paradójico, ya que de eso se trata en la media muestral particular. La mayoría de este tipo de
precisamente la investigación, hay que conocer, cómo se afirmaciones son desorientadoras e incorrectas.3 Lo que sí
presenta en la población la variable que se quiere estudiar. se puede afirmar es que se tiene el 95% de probabilidad de
La primera reflexión que asalta al investigador es: si supiera que el valor verdadero de lo que se esté estudiando en la
cómo se presenta, no estaría diseñando una investigación población, se encuentre en la muestra calculada.
para conocerla, ¿cómo me piden eso…? La precisión absoluta (d) . Es la amplitud deseada del
Si se trata de variables cualitativas, se necesita conocer el intervalo de confianza a ambos lados del valor real de la
porcentaje con que se presenta la variable en la población. diferencia entre las dos proporciones (en puntos
Por ejemplo, si deseamos conocer la presencia de hábito porcentuales). Su uso es para dejar margen al error aleatorio
tabáquico en los médicos, debemos saber qué porcentaje de exigido en el modelo lineal aditivo, el cual expresa que la
médicos fuman (p) y qué porcentaje no fuman (q) justamente observación i-ésima es una observación de la media µ, pero
en la población que deseamos estudiar. Si es una variable está sujeta a un error de muestreo εi (épsilon sub i). El
3
cuantitativa, cuál es la desviación estándar (S) con que se modelo lineal aditivo más simple es:
presenta en la población. Por ejemplo, si queremos realizar
una investigación para establecer los picogramos séricos Yi= µ + εi
de nicotina en los fumadores, debemos precisar la media
que esperamos encontrar y su desviación estándar. Como Cuanta más precisión se desee, más estrecho será este
% Valor d Z2 pq
90 0.1 n=
d2
95 0.05
99 0.001
b) Para población finita (cuando se conoce el total de
La precisión también puede expresarse de forma relativa (ε) unidades de observación que la integran):
con respecto a la estimación. La diferencia con la absoluta
es que esta última se expresa en puntos porcentuales, N Z2 pq
n=
mientras que la relativa es en porcentaje y los más comunes d 2 (N - 1) + Z2 pq
son: 10%, 20%, 25% y el 50%.4
Donde:
III.- FORMULAS PARA CALCULAR LA MUESTRA EN
ESTUDIOS DESCRIPTIVOS p = proporción aproximada del fenómeno en estudio en la
población de referencia
A) PARA ESTUDIOS CUYA VARIABLE PRINCIPAL ES DE q = proporción de la población de referencia que no presenta
TIPO CUANTITATIVO 6 el fenómeno en estudio (1 -p).
La suma de la p y la q siempre debe dar 1. Por ejemplo, si p=
a) Para una población infinita (cuando se desconoce el total 0.8 q= 0.2
de unidades de observación que la integran o la población Z, N y d se explicaron en el párrafo anterior.
es mayor a 10,000):
IV) FÓRMULAS PARA CALCULAR LA MUESTRA EN
Z2 S2
n= ESTUDIOS EXPLICATIVOS
d2
b) Para una población finita (cuando se conoce el total de Los conceptos presentados al inicio de esta revisión con
unidades de observación que la integran): respecto a los errores tipo I y tipo II y el poder de la prueba,
son esenciales para una clara comprensión del problema del
n= N Z2S2 tamaño de la muestra. Al escoger un tamaño de muestra para
d (N-1) + Z2S2
2
detectar una diferencia en la variable que se quiere estudiar
al comparar dos grupos, se debe admitir la posibilidad de un
Donde: error tipo I o un error de tipo II y calcular el tamaño de
n = tamaño de la muestra muestra en consecuencia.3
N = tamaño de la población Además de los elementos para calcular la muestra en los
Z = valor de Z crítico, calculado en las tablas del área de la estudios descriptivos ya mencionados, se deben conocer
curva normal. Llamado también nivel de confianza. otros datos que intervienen en el cálculo del número de
1
S2 = varianza de la población en estudio (que es el cuadrado sujetos necesarios para contrastar una hipótesis, como son:
de la desviación estándar y puede obtenerse de estudios 1. Si la hipótesis que se quiere contrastar es uni o bilateral.
similares o pruebas piloto) 2. Cuál es el riesgo que el investigador acepta de cometer
d = nivel de precisión absoluta. Referido a la amplitud del error tipo α
intervalo de confianza deseado en la determinación del valor 3. El riesgo aceptado de cometer un error β (potencia 1-β)
promedio de la variable en estudio. 4. Cuál es la magnitud mínima de la diferencia o asociación
que se considera importante detectar.
B) PARA ESTUDIOS CUYA VARIABLE PRINCIPAL ES DE 5. Cuál es la variabilidad de respuesta en el grupo de
( Z α + Z β )σ
2
2
Zα π 1(1 − π 1) + Z β π 0 (1 − π 0 ) n= 2
n= ε
π1 −π 0
Fórmula: Fórmula:
2
( Zα + Zβ )
0.5 ln [(1 + r ) /(1 − r )] + 3
1 1
[
* + *
] [ *
P1 (1 − P1 ) P2 (1 − P2 )
*
] N=
n = Z 21− a / 2
2
[log e(1-ε)]
V.- CONSIDERACIONES FINALES
E) CÁLCULO DE MUESTRA PARA PROBAR
HIPOTESIS EN ESTUDIOS DE COHORTES 4 En la planificación de un estudio de investigación, es
fundamental decidir sobre el tamaño de la muestra de la
Este cálculo de muestra permite realizar el cálculo de un población objeto de estudio. La respuesta a la pregunta
riesgo relativo con precisión relativa específica. ¿Qué tamaño de muestra necesito? dependerá
básicamente del alcance del estudio, las variables y el
Información necesaria y notación: plan de análisis. Si no se toman en cuenta estos
a) Deben conocerse dos de los siguientes parámetros: aspectos, el investigador no podrá decidir la fórmula
l Probabilidad prevista de enfermedad en las personas que utilizará y los datos que deberá incluir en ella.
expuestas al factor investigado P1 Además, deberá estar lo suficientemente familiarizado
l Probabilidad prevista de enfermedad en las personas con el comportamiento de la variable en la población en
no expuestas al factor investigado P2 estudio para que pueda establecer su variabilidad,
l Riesgo relativo previsto RR decidir el nivel de confianza con el que puede trabajar y
b) Nivel de confianza (1−α) 100% el grado de precisión más apropiado.
c) Precisión relativa ε Todas las fórmulas presentadas, se pueden establecer
con ayuda de una calculadora manual, computadora,
Fórmula: tablas ya calculadas o con programas de estadística
como SPSS o Minitab.®
Finalmente, una vez que se ha obtenido el tamaño de
la muestra, es necesario analizar las dificultades
operativas, la disponibilidad de tiempo y recursos para
(1 − p1 ) (1 − p2 )
p + p que verdaderamente sea viable aplicarla, de lo contrario,
1 2 por muy bien calculada que esté la muestra, será
Z 21− a / 2 2
imposible llevarla a la realidad, lo que podría invalidar
[log e(1-ε)]
las conclusiones del estudio.