Clase #2 - DISTRIBUCIÓN MUESTRAL

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 24

UNIVERSIDAD DEL ATLÁNTICO

ESTADÍSTICA INFERENCIAL
Unidad I:
DISTRIBUCIÓN MUESTRAL Y TEORÍA DE ESTIMACIÓN

DISTRIBUCIÓN MUESTRAL
DISTRIBUCIÓN MUESTRAL PARA LA MEDIA

Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se
calcula la media muestral 𝑥 para cada muestra; la colección de todas estas medias muestrales recibe
el nombre de distribución muestral de medias, lo que se puede ilustrar en la siguiente figura:

Dr. Freddy Marín González, 2017.


El Teorema del Límite Central nos indica que cuando se extraen muestras de tamaño mayor a
30 o bien de cualquier tamaño pero provenientes de una población normal, la distribución
muestral de medias tiene un comportamiento aproximadamente normal, por lo que se puede
utilizar la formula de la distribución normal con

𝑠 es equivalente al error estándar de la media, entonces la fórmula para calcular la probabilidad del
comportamiento del estadístico, en este caso la media de la muestra , quedaría de la siguiente manera:

Dr. Freddy Marín González, 2017.


El teorema del límite central y el error estándar de la media y de la proporción están basados
en que las muestras son seleccionadas con reemplazo. Sin embargo, todos los casos reales, el
muestreo se hace sin reemplazo de poblaciones con tamaño finito N. En estos casos, y
particularmente cuando el tamaño de la muestra NO ES PEQUEÑO en comparación con el de
la población (por ejemplo, más del 5% de la población) de manera que:

Siendo 𝑛 el tamaño de la muestra y 𝑁 el de la población. Entonces es necesario emplear un Factor de Corrección


para Población Finita para la desviación estándar:

La corrección modifica la ecuación del estadístico de la siguiente forma.

Dr. Freddy Marín González, 2017.


Ejemplo 1: Una empresa eléctrica fabrica baterías que tienen una duración que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40
horas. Encuentre la probabilidad de que una muestra aleatoria de 16 baterías tenga una vida
promedio de menos de 775 horas.

Solución:

La probabilidad que la media de la muestra de 16 baterías sea menor a 775 horas es de 0.0062 o 0.62 %.

Dr. Freddy Marín González, 2017.


Ejemplo 2: Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma
normal con una media de 174,5 centímetros y una desviación estándar de 6,9 centímetros. Si
se extraen 200 muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine:

a) El número de las medias muestrales que caen entre 172,5 y 175,8 centímetros.
b) El número de medias muestrales que caen por debajo de 172 centímetros.

Solución:

𝑛 200
Como 𝑁 = 1000 = 0.2 se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin
reemplazo, por lo que se tendrá que agregar el factor de corrección. Se procederá a calcular el denominador de 𝑧.

Dr. Freddy Marín González, 2017.


a)

Por lo tanto la respuesta es (0.761)(200) = 152 medias muestrales

Dr. Freddy Marín González, 2017.


b)

Por lo tanto la respuesta es (0.0330)(200) = 7 medias muestrales

Dr. Freddy Marín González, 2017.


DISTRIBUCIÓN MUESTRAL PARA LA MEDIA DE MUESTRAS PEQUEÑAS

DISTRIBUCIÓN t: Si el tamaño de la muestra es suficientemente grande, digamos n≥30, la distribución


de T no difiere mucho de la normal estándar. Sin embargo, para n<30 es útil tratar con la distribución
exacta de t. Para desarrollar la distribución muestral de t, supondremos que nuestra muestra aleatoria
se selección de una población normal. Podemos escribir, entonces

𝑥ҧ − 𝜇
𝑡= 𝑠
𝑛

Dr. Freddy Marín González, 2017.


Ejemplo 3: Supongamos que las calificaciones de una prueba están distribuidos normalmente
con una media de 100. Ahora supongamos que seleccionamos 20 estudiantes y les hacemos
un examen. La desviación estándar de la muestra es 15.
¿Cuál es la probabilidad de que el promedio en el grupo de la muestra sea más de 110?

Solución:
Número de grados de libertad: 𝑛 − 1 = 20 − 1 = 19
La media de la población es igual a 100
La media de la muestra es igual a 110
La desviación estándar de la muestra es igual a 15

ҧ
𝑥−𝜇 110−100
El valor de t es 𝑡= 𝑠 = 15 = 2.9814
𝑛 20

Usando estos valores interpolamos[1] y nos da un resultado de probabilidad acumulada de 0,004038. Esto
implica una probabilidad de 0,404% de que el promedio de una muestra sea mayor que 110.

[1] Ver link https://youtu.be/88YNQ3Ys7ys

Dr. Freddy Marín González, 2017.


DISTRIBUCIÓN MUESTRAL PARA LA PROPORCIÓN

Esta distribución se genera de igual manera que la distribución muestral de medias, a excepción de
que al extraer las muestras de la población se calcula el estadístico proporción (𝑝 = 𝑥/𝑛 en donde “𝑥”
es el número de éxitos u observaciones de interés y “𝑛” el tamaño de la muestra) en lugar de la media
de cada muestra.

Dr. Freddy Marín González, 2017.


La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de
proporciones está basada en la aproximación de la distribución binomial a la normal . Esta
fórmula nos servirá para calcular la probabilidad del comportamiento de la proporción en la
muestra es:

A la fórmula anterior se le puede agregar el factor de corrección (en el denominador):

Si se cumplen con las condiciones de que sea una población finita (N/n< 20) y sin reemplazo.

Dr. Freddy Marín González, 2017.


Ejemplo 4: Se ha determinado que 85,1% de los estudiantes de una universidad fuman
cigarrillos. Se toma una muestra aleatoria de 200 estudiantes. Calcular la probabilidad de que
no más de 80% de alumnos de la muestra fume.

Solución: La media o valor esperado de la distribución muestral es de P=0.851 (la proporción


de la población), por lo que:

Usando las tablas de valor 𝑧, para 𝑧 = −2.02 encontramos que la probabilidad de que no más de (es decir, menos
de) 80% de los alumnos de la muestra fumen es de 0.0217 o sea 2.17%

Dr. Freddy Marín González, 2017.


DISTRIBUCIÓN MUESTRAL PARA LA VARIANZA

Si 𝑆 2 es la varianza de una muestra aleatoria de tamaño 𝑛 que se toma de una


población normal que tiene la varianza 𝜎 2 , entonces el estadístico

(𝑛 − 1)𝑠 2
𝜒2 =
𝜎2
Tiene una distribución chi cuadrada con 𝑣 = 𝑛 − 1 grados de libertad.

La probabilidad de que una muestra aleatoria produzca un valor 𝜒 2 mayor que algún valor específico
es igual al área bajo la curva a la derecha de este valor. El valor 𝜒 2 por arriba del cual se encuentra un
área de 𝛼 por lo general se representa con 𝜒𝛼2 . Esto se ilustra mediante la región sombreada

Dr. Freddy Marín González, 2017.


Ejemplo 5: Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus
destinos en una ciudad grande forman una distribución normal con una desviación estándar
igual a 1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de
que la varianza muestral sea mayor que 2

Solución: Primero se encontrará el valor de chi cuadrada correspondiente a 𝑠 2 = 2, como


sigue:
2
(𝑛 − 1)𝑠 2 (17 − 1)(2)
𝜒 = = = 32
𝜎2 12
El valor de 32 se busca dentro de la tabla en el reglón 16 grados de libertad y se encuentra que a ese valor le
corresponde un área a la derecha de 0.01. En consecuencia, el valor de la probabilidad es de 𝑃(𝑠 2 > 2)

Dr. Freddy Marín González, 2017.


Ejemplo 6: La compañía de baterías Duramás ha desarrollado una nueva batería para
celulares. La desviación estándar es de 4 minutos. Supongamos que el departamento de
manufactura corre una prueba de control de calidad. Ellos seleccionan 7 baterías al azar. La
desviación estándar de las baterías seleccionadas es de 6 minutos. ¿Qué valor del estadístico
chi-cuadrada tenemos para esta prueba?

Solución: Primero se encontrará el valor de chi cuadrada correspondiente a 𝑠 2 = 6, como sigue:

(𝑛 − 1)𝑠 2 (7 − 1)(6)
𝜒2 = = = 2.25
𝜎2 42

El valor de 2.25 se busca dentro de la tabla en el reglón 6 grados de libertad, interpolando se encuentra que a ese
valor le corresponde un área a la derecha de 0.8947 o sea 89.47%.

Dr. Freddy Marín González, 2017.


DISTRIBUCIÓN MUESTRAL PARA LA DIFERENCIA DE MEDIAS

Este método se utiliza para comparar las medias de dos distribuciones muestrales distintas y
formular una inferencia con respecto a la diferencia de estas.

Suponga que se tienen dos poblaciones distintas, la primera con media 𝜇1 y desviación
estándar 𝜎1 , y la segunda con media 𝜇2 y desviación estándar 𝜎2 . Y después se elige una
muestra aleatoria de tamaño 𝑛1 de la primera población y una muestra independiente
aleatoria de tamaño 𝑛2 de la segunda población.
Se calcula la media muestra para cada muestra y la diferencia entre dichas medias. La colección de todas estas
diferencias se llama distribución muestral de la diferencia entre medias.

Dr. Freddy Marín González, 2017.


La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de
diferencia de medias es:

𝑥ҧ1 − 𝑥ҧ2 − (𝜇1 − 𝜇2 )


𝑧=
𝜎12 𝜎22
+
𝑛1 𝑛2

Donde:
𝑥ҧ1 : Media de la muestra aleatoria simple 1
𝑥ҧ2 : Media de la muestra aleatoria simple 2
𝜇1 : Media de la población 1
𝜇2 : Media de la población 2
𝜎12 : Varianza de la población 1
𝜎22 : Varianza de la población 2

Dr. Freddy Marín González, 2017.


Ejemplo 7: En un estudio para comparar los pesos promedios de niños y niñas de sexto grado
de una escuela primaria, se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se
sabe que tanto para niños como para niñas los pesos siguen una distribución normal. El
promedio de los pesos de todos los niños de sexto grado de esa escuela es de 35.01 kg y su
desviación estándar es de 3.1 kg, mientras que el promedio de los pesos de todas las niñas de
sexto grado de esa escuela es de 32.26 kg y su desviación estándar es de 3.5 kg. Encontrar la
probabilidad de que el promedio de los pesos de los 20 niños y sea al menos 5 kg más grande
que el de las 25 niñas.

Solución:
Datos
𝜇1 = 35.01 𝑘𝑔
𝜇2 = 32.26 𝑘𝑔
𝜎12 = 3.12 = 9.61
𝜎22 = 3.52 = 12.25
𝑛1 = 20
𝑛2 = 25

Dr. Freddy Marín González, 2017.


Solución: 𝑃(𝑥ҧ1 − 𝑥ҧ2 ≥ 5)

5 − (35.01 − 32.26) 5 − 2.75 2.25


𝑧= = = = 2.28
9.61 12.25 0.4805 + 0.49 0.9705
20 + 25

Usando las tablas de valor 𝑧, para 𝑧 = 2.28 encontramos la probabilidad de 𝑃 𝑥ҧ1 − 𝑥ҧ2 ≤ 5 = 0.9887, luego
entonces el valor pedido es
𝑃 𝑥ҧ1 − 𝑥ҧ2 ≥ 5 = 1 − 0.9887 = 0.0113 o sea 1.13%

Dr. Freddy Marín González, 2017.


DISTRIBUCIÓN MUESTRAL PARA LA DIFERENCIA DE PROPORCIÓN

Este método se utiliza para comparar las proporciones o porcentajes de dos distribuciones
muestrales distintas y formular una inferencia con respecto a la diferencia de estas.

Dr. Freddy Marín González, 2017.


La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de
diferencia de proporciones es:

𝑝1 − 𝑝2 − (𝑃1 − 𝑃2 )
𝑧=
𝑃1 𝑞1 𝑃2 𝑞2
𝑛1 + 𝑛2

Donde:
𝑝1 : Proporción de la muestra aleatoria simple 1
𝑝2 : Proporción de la muestra aleatoria simple 2
𝑃1 : Proporción de la población 1
𝑃2 : Proporción de la población 2
𝑞1 : Proporción restante de la población 1
𝑞2 : Proporción restante de la población 2

Dr. Freddy Marín González, 2017.


Ejemplo 8: Los hombres y las mujeres adultos radicados en una ciudad grande del norte
difieren en sus opiniones sobre la promulgación de la pena de muerte para personas
culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de
muerte, mientras que sólo el 10% de las mujeres adultas lo están. Si se pregunta a dos
muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la
pena de muerte, determine la probabilidad de que le porcentaje de hombres a favor sea al
menos 3% mayor que el de las mujeres.

Solución:
Datos
𝑃1 = 12% = 0.12
𝑃2 = 10% = 0.10
𝑞1 = 1 − 0.12 = 0.88
𝑞2 = 1 − 0.10 = 0.90
𝑛1 = 100 hombres
𝑛2 = 100 mujeres

Dr. Freddy Marín González, 2017.


Solución: 𝑃(𝑝1 − 𝑝2 ≥ 0.03)

0.03 − (0.12 − 0.10) 0.03 − 0.02 0.01


𝑧= = = = 0.2261
(0.12 ⋅ 0.88) (0.10 ⋅ 0.90) 0.001056 + 0.0009 0.001956
+
100 100

Usando las tablas de valor 𝑧, para 𝑧 = 0.22 encontramos la probabilidad de 𝑃 𝑥ҧ1 − 𝑥ҧ2 ≤ 0.03 = 0.5871, luego
entonces el valor pedido es
𝑃 𝑥ҧ1 − 𝑥ҧ2 ≥ 0.03 = 1 − 0.5871 = 0.4129 o sea 41.29%

Entonces la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos sea 3% mayor
que el de las mujeres es 41.29%

Dr. Freddy Marín González, 2017.

También podría gustarte