Seleccion de La Muestra Datos
Seleccion de La Muestra Datos
Seleccion de La Muestra Datos
INTRODUCCIÓN
Una vez definido el problema a investigar, formulados los objetivos y delimitadas las variables se
hace necesario determinar los elementos o individuos con quienes se va a llevar a cabo el estudio
o investigación. Esta consideración nos conduce a delimitar el ámbito de la investigación
definiendo una población y seleccionando la muestra. Cualquier característica medible de la
población se denomina parámetro, los valores de los parámetros calculados sobre muestras se
conocen como estadísticos o estadígrafos, utilizan letras latinas (0, s2, r..., media, varianza,
coeficiente de correlación) y describen a las citadas muestras.
Se define tradicionalmente la población como “el conjunto de todos los individuos (objetos,
personas, eventos, etc.) en los que se desea estudiar el fenómeno. Éstos deben reunir las
características de lo que es objeto de estudio” (Latorre, Rincón y Arnal, 2003). El individuo, en
esta acepción, hace referencia a cada uno de los elementos de los que se obtiene la información.
Los individuos pueden ser personas, objetos o acontecimientos.
Hoy se prefiere hablar de “unidad de observación” o “elemento” para referirse al objeto sobre el
cual se realiza una medición. En los estudios con poblaciones humanas, con frecuencia ocurre que
la unidad de observación son los individuos.
5. SELECCIONAR LA MUESTRA
Hasta este momento hemos visto que se debe definir cuál será la unidad de análisis y cuáles
son las características de la población. En este inciso hablaremos de la muestra, o mejor dicho
de los tipos de muestra, con la finalidad de poder elegir la más conveniente para un estudio.
La muestra es, en esencia, un subgrupo de la población. Digamos que es un subconjunto de
elementos que pertenecen a ese conjunto definido en sus características al que llamamos
población. Con frecuencia leemos y escuchamos hablar de muestra representativa, muestra al
azar, muestra aleatoria, como si con los simples términos se pudiera dar más seriedad a los
resultados. En realidad, pocas veces es posible medir a toda la población, por lo que
obtenemos o seleccionamos una muestra y, desde luego, se pretende que este subconjunto sea
un reflejo fi el del conjunto de la población. Todas las muestras bajo el enfoque cuantitativo
deben ser representativas; por tanto, el uso de este término resulta por demás inútil. Los
términos al azar y aleatorio denotan un tipo de procedimiento mecánico relacionado con la
probabilidad y con la selección de elementos; pero no logran esclarecer tampoco el tipo de
muestra y el procedimiento de muestreo. Hablemos entonces de estos conceptos en los
siguientes apartados.
𝑁𝜎 2 𝑍 2
𝑛=
(𝑁 − 1)𝑒 2 + 𝜎 2 𝑍 2
Donde:
n = el tamaño de la muestra.
N = tamaño de la población.
𝜎 = Desviación estándar de la población que, generalmente cuando no se tiene su valor, suele
utilizarse un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene
su valor, se lo toma en relación al 95% de confianza equivale a 1,96 (como más usual) o en
relación al 99% de confianza equivale 2,58, valor que queda a criterio del investigador.
e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele
utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del
encuestador.
La fórmula del tamaño de la muestra se obtiene de la fórmula para calcular la estimación del
intervalo de confianza para la media, la cual es:
𝜎 𝑁−𝑛 𝜎 𝑁−𝑛
𝑋̅ − 𝑍 √ ≤ 𝜇 ≤ 𝑋̅ + 𝑍 √
√𝑛 𝑁 − 1 √𝑛 𝑁 − 1
De donde el error es:
𝜎2 𝑁 − 𝑛
𝑒 2 = 𝑍2
𝑛 𝑁−1
Multiplicando fracciones:
𝑍 2 𝜎 2 (𝑁 − 𝑛)
𝑒2 =
𝑛(𝑁 − 1)
Eliminando denominadores:
𝑒 2 𝑛(𝑁 − 1) = 𝑍 2 𝜎 2 (𝑁 − 𝑛)
Eliminando paréntesis:
𝑒 2 𝑛𝑁 − 𝑒 2 𝑛 = 𝑍 2 𝜎 2 𝑁 − 𝑍 2 𝜎 2 𝑛
Transponiendo n a la izquierda:
𝑒 2 𝑛𝑁 − 𝑒 2 𝑛 + 𝑍 2 𝜎 2 𝑛 = 𝑍 2 𝜎 2 𝑁
Factor común de n:
𝑛(𝑒 2 𝑁 − 𝑒 2 + 𝑍 2 𝜎 2 ) = 𝑍 2 𝜎 2 𝑁
Despejando n:
𝒁𝟐 𝝈𝟐 𝑵
𝒏=
𝒆𝟐 (𝑵 − 𝟏) + 𝒁𝟐 𝝈𝟐
8. EJEMPLOS ILUSTRATIVOS
1) Calcular el tamaño de la muestra de una población de 500 elementos con un nivel de
confianza del 95%
Solución:
Realizando el gráfico que representa el 95% de confianza se obtiene:
Se tiene
N=500, para el 95% de confianza Z = 1,96, y como no se tiene los demás valores se tomará
𝜎 = 0,5, y e = 0,05.
2) Calcular el tamaño de la muestra de una población de 500 elementos con un nivel de confianza
del 99%
Solución:
Realizando el gráfico que representa el 99% de confianza se obtiene:
GEOGEBRA
9. TAREA DE INTERAPRENDIZAJE
1) Proponga 3 ejemplos de población, muestra y elemento.
2) Calcule el tamaño de la muestra para una población de 500 con un error de muestreo del 5%
y nivel de confianza del 95%. Realice los cálculos de manera manual y empleando Excel.
Respuesta: 217
3) Calcule el tamaño de la muestra para una población de 500 con un error de muestreo del 5%
y nivel de confianza del 99%. Realice los cálculos de manera manual y empleando Excel.
Respuesta: 285
4) Calcule el tamaño de la muestra para una población de 500 con un error de muestreo del 9%
y nivel de confianza del 95%. Realice los cálculos de manera manual y empleando Excel.
Respuesta: 96
5) Calcule el tamaño de la muestra para una población de 500 con un error de muestreo del 9%
y nivel de confianza del 99%. Realice los cálculos de manera manual y empleando Excel.
NIVEL DE CONFIANZA
Z P(Z ≤ Z)
0.67 0.749
0.99 0.839
1.00 0.841
1.15 0.875
1.28 0.900
1.64 0.950
1.96 0.975
2.00 0.977
EJEMPLO
Problema de investigación: Supongamos que el gobierno de un estado, provincia o departamento ha
emitido una ley que impide (prohibición expresa) a las estaciones de radio transmitir comerciales que
utilicen un lenguaje procaz (groserías, malas palabras). Dicho gobierno nos solicita analizar en qué
medida los anuncios radiofónicos transmitidos en el estado utilizan en su contenido este lenguaje,
digamos, durante el último mes.
Población (N): Comerciales transmitidos por las estaciones radiofónicas del estado durante el último
mes.
Tamaño de muestra (n): Lo primero es determinar o conocer N (recordemos que significa población
o universo).
En este caso N = 20000 (20 mil comerciales transmitidos).
Lo segundo es establecer el error máximo aceptable, el porcentaje estimado de la muestra y el nivel
de confianza.
EJEMPLO
Problema de investigación: Analizar la motivación intrínseca que tienen los empleados de la cadena
de restaurantes “Lucy y Laura Bunny”.
Población: N = 600 empleados (cocineros, meseros, ayudantes, etcétera). Tamaño de muestra:
Con un error de 5% y un nivel de confianza de 95%, el tamaño requerido para que la muestra sea
representativa es de 234 empleados.
Conforme disminuye el tamaño de la población aumenta la proporción de casos que necesitamos en
la muestra.
En ocasiones el interés del investigador es comparar sus resultados entre segmentos, grupos o nichos
de la población, porque así lo señala el planteamiento del problema. Por ejemplo, efectuar
comparaciones por género (entre hombres y mujeres), si la selección de la muestra es aleatoria,
tendremos unidades o elementos de ambos géneros, no hay problema, la muestra reflejará a la
población.
Pero a veces, nos interesan grupos que constituyen minorías de la población o universo y entonces si
la muestra es aleatoria simple, resultará muy difícil determinar qué elementos o casos de tales grupos
serán seleccionados. Imaginemos que nos interesan personas de todas las religiones para contrastar
ciertos datos, pero en la ciudad donde se efectuará el estudio la mayoría es por ejemplo
predominantemente católica. Con MAS es casi seguro que no elijamos individuos de diversas
De manera que el total de la subpoblación se multiplicará por esta fracción constante para obtener el
tamaño de la muestra para el estrato. Al sustituirse, tenemos que:
Total
Estrato población
Directores de recursos humanos Muestra
por giro (fh) = 0.2534
Nh (fh) = nh
1 Extractivo y siderúrgico 53
2 Metal-mecánicas 109
3 Alimentos, bebidas y tabaco 215
4 Papel y artes gráficas 87
5 Textiles 98
6 Eléctricas y electrónicas 110
7 Automotriz 81
8 Químico-farmacéutica 221
9 Otras empresas de transformación 151
10 Comerciales 51
Total 1176 KKKKKK
Por ejemplo:
Nh = 53 directores de empresas extractivas corresponden a la población total de este giro.
fh = 0.2534 es la fracción constante.
nh = 13 es el número redondeado de directores de empresa del giro extractivo y siderúrgico
que tendrá que entrevistarse.