Clase #2 - DISTRIBUCIÓN MUESTRAL
Clase #2 - DISTRIBUCIÓN MUESTRAL
Clase #2 - DISTRIBUCIÓN MUESTRAL
ESTADÍSTICA INFERENCIAL
Unidad I:
DISTRIBUCIÓN MUESTRAL Y TEORÍA DE ESTIMACIÓN
DISTRIBUCIÓN MUESTRAL
DISTRIBUCIÓN MUESTRAL PARA LA MEDIA
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se
calcula la media muestral 𝑥 para cada muestra; la colección de todas estas medias muestrales recibe
el nombre de distribución muestral de medias, lo que se puede ilustrar en la siguiente figura:
𝑠 es equivalente al error estándar de la media, entonces la fórmula para calcular la probabilidad del
comportamiento del estadístico, en este caso la media de la muestra , quedaría de la siguiente manera:
Solución:
La probabilidad que la media de la muestra de 16 baterías sea menor a 775 horas es de 0.0062 o 0.62 %.
a) El número de las medias muestrales que caen entre 172,5 y 175,8 centímetros.
b) El número de medias muestrales que caen por debajo de 172 centímetros.
Solución:
𝑛 200
Como 𝑁 = 1000 = 0.2 se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin
reemplazo, por lo que se tendrá que agregar el factor de corrección. Se procederá a calcular el denominador de 𝑧.
𝑥ҧ − 𝜇
𝑡= 𝑠
𝑛
Solución:
Número de grados de libertad: 𝑛 − 1 = 20 − 1 = 19
La media de la población es igual a 100
La media de la muestra es igual a 110
La desviación estándar de la muestra es igual a 15
ҧ
𝑥−𝜇 110−100
El valor de t es 𝑡= 𝑠 = 15 = 2.9814
𝑛 20
Usando estos valores interpolamos[1] y nos da un resultado de probabilidad acumulada de 0,004038. Esto
implica una probabilidad de 0,404% de que el promedio de una muestra sea mayor que 110.
Esta distribución se genera de igual manera que la distribución muestral de medias, a excepción de
que al extraer las muestras de la población se calcula el estadístico proporción (𝑝 = 𝑥/𝑛 en donde “𝑥”
es el número de éxitos u observaciones de interés y “𝑛” el tamaño de la muestra) en lugar de la media
de cada muestra.
Si se cumplen con las condiciones de que sea una población finita (N/n< 20) y sin reemplazo.
Usando las tablas de valor 𝑧, para 𝑧 = −2.02 encontramos que la probabilidad de que no más de (es decir, menos
de) 80% de los alumnos de la muestra fumen es de 0.0217 o sea 2.17%
(𝑛 − 1)𝑠 2
𝜒2 =
𝜎2
Tiene una distribución chi cuadrada con 𝑣 = 𝑛 − 1 grados de libertad.
La probabilidad de que una muestra aleatoria produzca un valor 𝜒 2 mayor que algún valor específico
es igual al área bajo la curva a la derecha de este valor. El valor 𝜒 2 por arriba del cual se encuentra un
área de 𝛼 por lo general se representa con 𝜒𝛼2 . Esto se ilustra mediante la región sombreada
(𝑛 − 1)𝑠 2 (7 − 1)(6)
𝜒2 = = = 2.25
𝜎2 42
El valor de 2.25 se busca dentro de la tabla en el reglón 6 grados de libertad, interpolando se encuentra que a ese
valor le corresponde un área a la derecha de 0.8947 o sea 89.47%.
Este método se utiliza para comparar las medias de dos distribuciones muestrales distintas y
formular una inferencia con respecto a la diferencia de estas.
Suponga que se tienen dos poblaciones distintas, la primera con media 𝜇1 y desviación
estándar 𝜎1 , y la segunda con media 𝜇2 y desviación estándar 𝜎2 . Y después se elige una
muestra aleatoria de tamaño 𝑛1 de la primera población y una muestra independiente
aleatoria de tamaño 𝑛2 de la segunda población.
Se calcula la media muestra para cada muestra y la diferencia entre dichas medias. La colección de todas estas
diferencias se llama distribución muestral de la diferencia entre medias.
Donde:
𝑥ҧ1 : Media de la muestra aleatoria simple 1
𝑥ҧ2 : Media de la muestra aleatoria simple 2
𝜇1 : Media de la población 1
𝜇2 : Media de la población 2
𝜎12 : Varianza de la población 1
𝜎22 : Varianza de la población 2
Solución:
Datos
𝜇1 = 35.01 𝑘𝑔
𝜇2 = 32.26 𝑘𝑔
𝜎12 = 3.12 = 9.61
𝜎22 = 3.52 = 12.25
𝑛1 = 20
𝑛2 = 25
Usando las tablas de valor 𝑧, para 𝑧 = 2.28 encontramos la probabilidad de 𝑃 𝑥ҧ1 − 𝑥ҧ2 ≤ 5 = 0.9887, luego
entonces el valor pedido es
𝑃 𝑥ҧ1 − 𝑥ҧ2 ≥ 5 = 1 − 0.9887 = 0.0113 o sea 1.13%
Este método se utiliza para comparar las proporciones o porcentajes de dos distribuciones
muestrales distintas y formular una inferencia con respecto a la diferencia de estas.
𝑝1 − 𝑝2 − (𝑃1 − 𝑃2 )
𝑧=
𝑃1 𝑞1 𝑃2 𝑞2
𝑛1 + 𝑛2
Donde:
𝑝1 : Proporción de la muestra aleatoria simple 1
𝑝2 : Proporción de la muestra aleatoria simple 2
𝑃1 : Proporción de la población 1
𝑃2 : Proporción de la población 2
𝑞1 : Proporción restante de la población 1
𝑞2 : Proporción restante de la población 2
Solución:
Datos
𝑃1 = 12% = 0.12
𝑃2 = 10% = 0.10
𝑞1 = 1 − 0.12 = 0.88
𝑞2 = 1 − 0.10 = 0.90
𝑛1 = 100 hombres
𝑛2 = 100 mujeres
Usando las tablas de valor 𝑧, para 𝑧 = 0.22 encontramos la probabilidad de 𝑃 𝑥ҧ1 − 𝑥ҧ2 ≤ 0.03 = 0.5871, luego
entonces el valor pedido es
𝑃 𝑥ҧ1 − 𝑥ҧ2 ≥ 0.03 = 1 − 0.5871 = 0.4129 o sea 41.29%
Entonces la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos sea 3% mayor
que el de las mujeres es 41.29%