Cap 7 Muestreo y Distribuciones Muestrales
Cap 7 Muestreo y Distribuciones Muestrales
Cap 7 Muestreo y Distribuciones Muestrales
Humanidades
Maestría en Desarrollo y Planeación de la
Educación
Seminario
Estadística aplicada
Tema:
Capítulo 7 Muestreo y distribuciones
muestrales
Presentan
María Isabel Pérez Ornelas
Armando Tapia Chávez
México, D.F. a 24 de enero de 2011
1
Muestreo y distribuciones muestrales
Contenido
Introducción
Referencias consultadas
2
Introducción
3
- Muestra. Es una fracción o subconjunto de cualquier tamaño de la población de la
cual proviene. Las muestras se escogen por diversos procedimientos (sean
apropiados o no) para realizar las observaciones o recogida de datos. El método de
muestreo aplicado y el tamaño de la muestra que se decida, determinan su grado de
representatividad.
Según Sharon Lohr,1 existen tres justificaciones principales para el uso del muestreo,
las cuales se apuntan a continuación:
- El muestreo puede proporcionar información confiable con costos mucho menores
que los de un censo. Con las muestras probabilísticas se puede cuantificar el error
de muestreo a partir de una encuesta. En algunos casos, una unidad de
observación debe ser destruida para ser observada, como cuando una galleta debe
pulverizarse para determinar el contenido de grasa.
- Los datos se pueden reunir más rápido, de modo que las estimaciones se pueden
publicar de una manera programada.
- Las estimaciones basadas en las encuestas y sus respectivas muestras son, con
frecuencia, más precisas que las basadas en un censo pues los investigadores
pueden tener más cuidado al reunir los datos. Un censo completo necesita, por lo
regular, de una gran organización administrativa e implica a muchas personas en
la recolección de datos.
Y
Desviación estándar poblacional σ =√ σ2
Desviación estándar
Es la raíz cuadrada positiva de la varianza.
s denota la desviación estándar muestral s=√s2 y
σ la desviación estándar poblacional σ =√ σ2
La desviación estándar se mide en las mismas unidades que los datos originales.
Donde
Recordemos que para obtener la varianza que está basada en la diferencia entre el valor de
cada observación (xi) y la media, se recurre a la siguiente formula
σ2=∑( xi - µ)
N
Cuando los datos son de una población las elevaciones son al cuadrado y se denota
varianza poblacional y se denota con la letra griega σ2
A la diferencia entre cada valor xi y la media se le llama desviación estándar respecto de
la media. Para calcular la varianza, las desviaciones respecto a la media se elevan al
cuadrado.
Cuando se calcula una muestra lo que interesa es estimar la varianza poblacional σ2. La
suma de los cuadrados de las desviaciones respecto de la media se divide entre n- 1, en
lugar entre n, la varianza muestra que se obtiene constituye un estimador no sesgado de la
varianza poblacional.
2
Datos recuperados del capítulo 7. Muestreo y distribuciones muestrales en Estadística para
administración y economía. 10ª edición, México, CENGAGE Learning, pp. 241- 283.
5
Varianza muestral: s2=∑( xi - )
n -1
En todo conjunto de datos, la suma de las desviaciones respecto de la media será siempre
igual a cero.
Con los estadísticos anteriores tenemos los parámetros de la población que se está
estudiando: la media del salario anual de la población (µ = 51 800), su desviación
estándar (σ = 4000) y la proporción que terminó el programa de adiestramiento (p= 0.60)
son parámetros de la población de los gerentes de EAI. Por lo anterior, se puede decir que
un parámetro es una característica numérica de una población.
Con lo anterior se demuestra que es común que la información de una muestra se pueda
usar para elaborar estimaciones de los parámetros poblacionales de interés.
Una muestra aleatoria simple de tamaño n, de una población finita de tamaño N, es una
muestra seleccionada de tal manera que cada muestra posible de tamaño n tenga la misma
probabilidad de ser seleccionada.
Un procedimiento para identificar una muestra aleatoria simple a partir de una población
finita es seleccionar por uno los elementos que constituyen a la muestra, de tal modo que
cada uno de los elementos que aún queden en la población tengan la misma probabilidad
de ser seleccionados. Al muestrear n elementos en esa forma, se satisfará la definición de
una muestra aleatoria simple de una población finita.
Al realizar este proceso para la selección de una muestra aleatoria simple, es posible que
un número que haya sido usado se encuentre de nuevo, a este tipo de selección se le
conoce como muestreo con reemplazo. Cualquier número aleatorio que ya ha sido usado
se ignora se esta muestreando con reemplazo. Muestrear con reemplazo es una forma
6
válida de identificar una muestra aleatoria simple. Sin embargo el muestreo sin reemplazo
es el procedimiento de muestreo más usado.
En algunas situaciones la población o bien es infinita o tan grande que, para fines
prácticos, se considera infinita.
Una muestra aleatoria simple de una población infinita es una muestra seleccionada de
manera que se satisfagan las condiciones siguientes:
Las poblaciones infinitas suelen asociarse con un proceso que opera continuamente a lo
largo del tiempo. En tales casos un procedimiento de muestreo creativo garantiza que no
haya sesgos de selección y que los elementos de la muestra sean seleccionados en forma
independiente.
Por ejemplo, si elegimos una muestra aleatoria de 30 gerentes para estimar la media de la
7
población µ y la desviación estándar de la población σ del salario anual para calcular los
Formulas
Media muestral
=∑xi (xi= x1+x2+xn) = 1554 420 = 51 814.00 dólares
n 30
= 19 = 0.63
30
8
Ahora suponga que el proceso de seleccionar una muestra aleatoria simple de 30
administradores se repite una y otra vez y que cada vez que se calculan los valores de
y de .
experimento, la media muestral tiene una media o valor esperado, una desviación
estándar y una distribución de probabilidad. Como los distintos valores que toma son
resultados de distintas muestras aleatorias simples, a la distribución de probabilidad de
Como ocurre con , es una variable aleatoria. Si se tomara cada muestra posible de
tamaño de 30 y para cada muestra se calculara el valor de , la distribución de
probabilidad que se obtuviera sería la distribución muestra de
Valor esperado de
Distintas muestras aleatorias simples dan como resultado varios valores de la media de la
Valor esperado de
E( )=µ
donde
E( ) = valor esperado de
µ = media de la población
Con muestreo aleatorio simple, el valor esperado o media de es igual a la media
de la población. Por ejemplo, el sueldo anual promedio de la población de gerentes es µ
51 800 dólares, entonces, la media de todas las posibles medias de la muestra son 51 8000
dólares.
Desviación estándar
Para la desviación estándar de la distribución normal de se usa la siguiente
notación:
10
Desviación estándar de
Población finita Población infinita
= N-n σ =σ
N -1 √n √n
La población finita requiere un factor de corrección para la población finita que es √(N-
n)/ (N-1). Cuando la población es grande y el tamaño de la muestra pequeño el factor de
corrección del a población finita es cercano a 1.
=σ
√n
siempre que
1. La población sea infinita
2. La población sea finita y también el tamaño de la muestra sea menor o igual
que el 5% del tamaño de la población, n/N≤ 0.05
Para poblaciones finitas que contengan casos en que n/N > 0.05 se debe usar la ecuación
para Población finita.
11
cualquier tamaño de la muestra.
Z = x -µ
σ
Figura 7.7 Probabilidad de que una media muestral quede a 500 dólares o menos de la
media poblacional
Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para
administración y economía. 10ª edición, México, CENGAGE Learning, pp. 275.
3
Mood, Alexander y Franklin Graybill, “Muestreo”, en Introducción a la teoría de la estadística, España,
Aguilar s a ediciones, 1978, p. 172.
12
Relación entre el tamaño de la muestra y la distribución
muestral de
Para la relación entre el tamaño de la muestra y la distribución muestral de ,
estándar de la media = σ /√n está relacionado con la raíz cuadrada del tamaño de
la muestra. Siempre que aumente el tamaño de la muestra disminuye el error estándar de
Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para
administración y economía. 10ª edición, México, CENGAGE Learning, p. 262.
13
La proporción muestral de es una variable aleatoria y su distribución de probabilidad
se conoce como distribución muestral de .
Valor esperado de
El valor esperado de , la media de todos los posibles valores de , es igual a la
proporción poblacional de .
14
Desviación estándar de
la probabilidad de .
15
Una distribución binomial se aproxima mediante una distribución normal siempre que el
tamaño de la muestra sea lo suficientemente grande para satisfacer las dos condiciones
siguientes.
Par lograr este comparativo entre estos dos valores de probabilidad, es necesario hacer
uso de lo que anteriormente estudiamos llamado valores de z, lo cuales se pueden calcular
haciendo uso de la siguiente fórmula.
xi - x
zi =
s
7.7 Propiedades de los estimadores puntuales
Para utilizar algún estadístico de muestra como estimador puntual, se debe comprobar si
tiene ciertas propiedades asociadas con los buenos estimadores puntuales: insesgadez,
eficiencia y consistencia.
Debido a que pueden emplearse diversos estadísticos de muestra como estimadores
puntuales de distintos primeros poblacionales, se usa la siguiente notación:
θ = parámetro poblacional de interés (letra griega, theta)
θ̂= estadístico de muestra o estimador puntual de θ (theta con sombrero)
16
estándar poblacional, proporción poblacional.
La theta con sombrero θ̂representa el estadístico de la muestra correspondiente como la
media de la muestra, la desviación estándar de la muestra y la proporción muestral.
Insesgadez
El estimador insesgado del parámetro poblacional se da cuando el valor esperado del
estadístico de muestra es igual al parámetro poblacional que se estima.
El estadístico de muestra θ̂es un estimador insesgado del parámetro poblacional θ si
︢E (θ)̂ = θ
donde E (θ̂) = valor esperado del estadístico de muestra θ̂
Por ejemplo, sea x1, x2… una muestra aleatoria de una densidad cuya media es µ. En tal
Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para
administración y economía. 10ª edición, México, CENGAGE Learning, p. 272.
4
Ejemplo tomado de Spiegel, Murray et al. Teoría y problemas de Probabilidad y Estadística, Colombia,
McGrawHill, 2003, p. 209.
17
Eficiencia
Se habla de eficiencia relativa cuando en un estimador puntual tiene menor desviación
estándar. Si las distribuciones muestrales de dos estadísticos tienen la misma media, el
estadístico con la varianza menor es el estimador más eficiente de la media, por ejemplo,
para una población normal, la distribución normal de la media y la mediana tiene la
misma media de la población, sin embargo, la varianza de la distribución muestral de
medias es más pequeña que la varianza muestral de medianas, entonces, la media provee
un estimador más eficiente que la mediana.
Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para
administración y economía. 10ª edición, México, CENGAGE Learning, p. 2723
En la figura se muestra que la desviación estándar de θ̂1 es menor que la θ̂2, los valores
de θ̂1 tienen mayor probabilidad de estar cerca del parámetro θ que los valores de θ̂2.
Consistencia
Un estimador puntual es consistente si sus valores tienden a acercarse al parámetro de
población conforme se incrementa el tamaño de la muestra, es decir, el estimador es
mejor cuando se basa en una muestra de de 20 observaciones que si se basa en dos.
La condición de consistencia establece que para muestras grandes θ̂n tiende a aproximarse
a θ, es decir, un tamaño grande de muestra tiende a proporcionar un mejor estimador
puntual que un tamaño pequeño.
18
= σ /√n. Como se relaciona con el tamaño de muestra, de tal manera que
Una vez formados los estratos, se toma una muestra aleatoria simple de cada estrato.
Existen fórmulas para combinar los resultados de las muestras de los varios estratos en
una estimación del parámetro poblacional de interés. El valor aleatorio estratificado
depende de qué tan homogéneos sean los elementos dentro de cada estrato. Si los
elementos de un estrato son homogéneos, el estrato tendrá una varianza pequeña. Por
tanto, con muestras relativamente pequeñas de los estratos se obtienen buenas
estimaciones de las características de los estratos. Si los estratos son homogéneos, el
muestreo aleatorio estratificado, proporciona resultados tan precisos como los de un
muestreo aleatorio simple, pero con una muestra de tamaño total menor.
19
conglomerados. La muestra está formada por todos los elementos dentro de cada uno de
los conglomerados que forman la muestra. El muestreo por conglomerados tiende a
proporcionar mejores resultados cuando los elementos dentro de conglomerados no son
semejantes. Lo ideal es que cada conglomerado sea una representación, a pequeña escala,
de la población. Si todos los conglomerados son semejantes en este aspecto, tomando en
la muestra un número pequeño de conglomerados se obtendrá una buena estimación de
los parámetros poblacionales.
Muestreo sistemático
Para ciertos muestreos, en especial en aquellos con poblaciones grandes, se necesita
mucho tiempo para tomar una muestra aleatoria simple. Una alternativa al muestreo
aleatorio simple es el muestreo sistemático. Por ejemplo, si se quiere una muestra de
tamaño de 50 de una población que tiene 500 elementos, se muestra uno de cada
5000/50= 100 elementos de la población, en este caso, un muestreo sistemático consiste
en forma aleatoria uno de los primeros elementos de la lista de la población. Los otros
elementos se identifican contando a partir del primer elemento de 100 elementos para
tomar el elemento que tenga la posición 100 en la lista de la población, a partir de este
elemento se cuentan otros 100 y así se continua.
Muestreo de conveniencia
El muestreo de conveniencia es una técnica de muestreo no probabilístico. Como el
nombre lo indica, la muestra se determina por conveniencia. Los elementos se incluyen en
la muestra sin que haya una probabilidad previamente especificada o conocida de que
sean incluidos en la muestra. Por ejemplo, un profesor que realiza una investigación en
una universidad puede usarse estudiantes voluntarios para que constituyan una muestra
¿la razón para elegirlos? Simple, los tienen al alcance y participarán como sujetos a un
costo bajo o sin costo.
Muestreo subjetivo
Otra técnica de muestreo no probabilístico es el muestreo subjetivo. En este método la
persona que más sabe sobre un asunto selecciona elementos de la población que considera
los más representativos de la población. Este método suele ser una manera relativamente
fácil de seleccionar un muestra.
Referencias consultadas
Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para
administración y economía. 10ª edición, México, CENGAGE Learning, pp. 241-
283.
Lohr, Sharon, Muestreo: Diseño y análisis, México, Internacional Thomson Editores,
20
2000. Trad. de Óscar Alfredo Palmas Velasco.
Mood, Alexander y Franklin Graybill, “Muestreo”, en Introducción a la teoría de la
estadística, España, Aguilar s a ediciones, 1978, p. 172.
Spiegel, Murray et al. Teoría y problemas de Probabilidad y Estadística, Colombia,
McGrawHill, 2003.
21