Poblacion y Muestra
Poblacion y Muestra
Poblacion y Muestra
Las variables siempre están ubicadas –o contenidas- en algún elemento, sea persona
(Ej. edad, sexo, inteligencia, categoría laboral, desempeño, etc.), cosa (Ej. informes,
empresas, oficinas, leyes, exportaciones, etc.) o situaciones. Cada uno de estos
elementos es una “unidad de análisis” y, a todo el conjunto, se le conoce como
“población”.
Muchas veces es imposible tener contacto y observar a toda la población, por eso
suele trabajarse solo con una parte. Este sub-conjunto es conocido con el nombre de
“muestra” y al proceso de seleccionarla se le conoce como “muestreo”.
Trabajar con una muestra proporciona muchas ventajas: a) ahorra tiempo, b) reduce
costos y c) posibilita mayor profundidad y exactitud en los resultados. Sin embargo,
también tiene algunos inconvenientes: a) es dificultoso, b) una muestra mal
seleccionada o sesgada distorsiona tus resultados, c) las limitaciones propias del tipo
de muestreo.
El muestreo tiene seis etapas muy bien definidas. Cada una de las etapas requiere
que tomes decisiones. Veamos cada una de ellas:
Determina si
Define la Identifica el Selecciona a los
Calcula el
realizarás muestreo y el tipo adecuada.
población o poblaciones. marco poblacional. individuos de tu muestra.
tamaño muetral.
Estas etapas son genéricas, casi siempre idénticas para todas las investigaciones. Las
variaciones ocurren dependiendo del tipo de investigación que se realiza.
Son características que sirven para diferenciar quién participa como población en tu
investigación y quién no. Los criterios de inclusión y exclusión son límites que
discriminan entre los que serán parte del estudio y los que no lo serán.
r los estudiantes de nivel secundario de las instituciones educativas de la UGEL X. Los criterios de inclusión y exclusión considerados para la delimita
4 años de edad.
cundaria.
arde.
ativas públicas.
maño de la población asciende a 4,632 estudiantes…”
Conocido también como “muestreo aleatorio”, utiliza el azar y las estadísticas para
determinar el tamaño y la selección de cada integrante de la muestra.
Este tipo de muestreo es el que alcanza mayor rigor científico, y se caracteriza porque
se cumple el principio de la equi-probabilidad, según el cual todos los elementos de la
población tienen la misma probabilidad de ser elegidos en una muestra. Las muestras
probabilísticas siempre son representativas de la población. Y como son
representativas, con este muestreo se puede generalizar con precisión los resultados
a la población.
Los muestreos probabilísticos son los más costosos. Requieren más tiempo y
recursos. Es más lento y complicado. Sin embargo, su costo vale la pena porque los
resultados se pueden generalizar a toda la población.
Tabla 36
Características, ventajas y desventajas de los muestreos probabilísticos
Tipos de Características y usos Ventajas Inconvenientes Ejemplos
muestreo
probabilístico
Aleatorio Se selecciona una muestra de Sencillo, rápido y de Se necesita un Se quiere determinar cuántas
simple tamaño n de una población de N fácil comprensión. listado completo de empresas manufactureras de 3
unidades, cada elemento tiene una Se basa en la teoría toda la población a 5 años de antigüedad
probabilidad de inclusión igual y estadística. (marco poblacional). presentan problemas logísticos
conocida de n/N. Requiere siempre No se aplica para y cuántos no, y qué variables
cálculo de tamaño de poblaciones están asociadas, en San Juan
muestra. estratificadas. de Lurigancho. Por eso, realiza
un muestreo probabilístico local
de 350 empresas solo
para San Juan de Lurigancho.
Sistemático Se consigue un listado de toda la Fácil de aplicar. No Si la constante de Tenemos 10,000
población. siempre es necesario muestreo está microempresas (en una lista) y
Se determina el tamaño muestral n. tener un listado de asociada con el queremos obtener una muestra
Se define un intervalo k=N/n. toda la población. fenómeno de de 100. Primero elegimos al
Cuando la población interés, las azar una empresa entre los
Se elige un número aleatorio, r, está ordenada estimaciones 10000/100=100 primeros
entre 1 y k (r=arranque aleatorio). siguiendo una obtenidas a partir de (supongamos que salga el 26),
Se selecciona los elementos de la tendencia conocida, la muestra pueden el segundo elemento será la
lista. asegura una contener sesgo de empresa 100+26 (126), la
cobertura de selección. siguiente será
unidades de todos el 226, luego el 326, etc.
los tipos.
Estratificado Se utiliza cuando la población está Se obtienen Se ha de conocer la Supongamos que, en Cuzco,
constituida en estratos o subgrupos estimaciones más distribución en la 70% de empresas son
(conjuntos homogéneos con precisas. Consigue población de las informales y el 30% formales.
respecto a la característica que se una muestra lo más variables utilizadas Si queremos encuestar a 100
estudia). Dentro de cada estrato se semejante posible a para estratificar. empresas, lo que haremos es
puede aplicar el muestreo aleatorio la población en lo dividir las empresas en 2
simple o sistemático. que a las variables estratos (formales e
estratificadoras se informales) y se eligen
El muestreo estratificado consiste refiere. aleatoriamente 70 empresas
en sub-dividir la población en informales y aleatoriamente 30
subgrupos o estratos según las formales.
características que se consideren y
en elegir la muestra de modo que
estén representados los diferentes
estratos.
Conglomerados Se utiliza cuando los individuos de Es muy eficiente La probabilidad de Se quiere realizar una encuesta
la población constituyen grupos cuando la población cometer errores es nacional durante las elecciones
naturales muy grandes o es demasiado mayor. de la nueva directiva del SUTEP.
conglomerados que contienen otros grande y dispersa. El cálculo del error es Los conglomerados, en este
grupos más pequeños de forma más complejo. caso, pueden ser los distritos
sucesiva (Ej. País, provincia, distrito, electorales y, dentro de ellos,
empresas, oficinas, etc.). las mesas electorales. Con este
muestreo lo que se hace es
Se realizan varias fases de escoger algunos distritos
muestreo sucesivas (polietápico) electorales y luego, dentro de
Solo se necesita marco poblacional ellos, algunas mesas electorales
para la última etapa del muestreo. al azar y de ahí se toman todos
los votos de las
mesas seleccionadas.
Fuente: Arístides Vara
Dado que este no es un libro de estadística, te recomiendo revisar otros
especializados sobre muestreo. Hacer una investigación no solo implica estudiar a
fondo el tema de tu investigación, sino también aprender sobre el método y las
técnicas que vas a emplear. Por eso, no solo revises bibliografía de tu tema, revisa
también bibliografía metodológica.
Ejemplo
“Del total de Defensorías del Niño y del Adolescente (DNA´s) ubicadas en el Perú (N=1,537), fueron
seleccionadas aleatoriamente 148 DNA´s. Se usó un muestreo probabilístico estratificado.
Para la asignación de los tamaños muestrales a los diferentes estratos en el muestreo aleatorio estratificado se
utilizó el procedimiento de asignación proporcional.
La selección de la muestra de acuerdo a los estratos respectivos, se obtuvo a través de una tabla de números
aleatorios. El marco muestral se presenta en el anexo N°1.
Nota: Observa que en esta tabla se presentan los estratos (columna 1), la población inicial, la muestra calculada
y la proporción entre la muestra y la población. Esa es la forma típica de presentar un muestreo estratificado.
Tabla 37
Características, ventajas y desventajas de los muestreos no probabilísticos
Muestreos no Características Ejemplos
probabilísticos
Accidental Se obtiene sin ningún plan pre-concebido. Las unidades “La muestra elegida fue de tipo accidental compuesta
elegidas resultan producto de circunstancias fortuitas y por 138 empleados administrativos de universidades
descontroladas. Con este muestreo nunca sabrás hasta qué privadas cuyas edades oscilan de los 22 a 61 años, por
punto tus resultados son válidos y si en verdad representan a lo que los resultados son exclusivos para este grupo.”
la población. Este es el tipo de muestreo menos confiable.
que cerca del 10% de los trabajadores faltan al trabajo, pero no determinan las causas del ausentismo. Decides investigar las razones más frecuent
Substituyendo los números en la fórmula se tiene:
n= 22. 10 . 90 . 500
= 222,47
2 2
3 . (500-1) + 2 . 10 . 90
En este caso, el estudiante tendría que investigar aproximadamente 223 empleados para poder determinar
cuáles son las principales causas del ausentismo laboral. Si se aumentase el porcentaje de error admisible al
5%, el tamaño de la muestra se reduciría a 112.
Te aconsejo nunca usar un error máximo del 5%.