14 - Distribuciones de Muestreo - Una Población y Dos Poblaciones

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 68

Análisis de Datos I

Unidad 4: Distribuciones de Muestreo

Clase: Distribuciones de Muestreo – Una Población y Dos Poblaciones

I Semestre de 2023
Profesor: Virginia González y César Henao
2
Unidad 4

Conceptos Distribuciones de
básicos muestro

Asociadas a la Con 2 o más


Con 1 población
normal poblaciones

3
4
Estimadores para una población
Media Varianza Proporción
Representa el punto de Mide qué tan alejados se encuentran los Es la probabilidad de
equilibrio, se ve afectada por datos respecto a la media, a mayor éxito que proviene de
valores extremos. Se varianza mayor variabilidad. Se una Distribución
denotará como 𝑥ҧ para la denotará 𝑠 2 para la muestra y 𝜎 2 para la Binomial. Se denotará
muestra y 𝜇 para la población. población. 𝑝Ƹ para la muestra y 𝑝
para la población.
σ𝑛𝑖=1 𝑥𝑖 σ 𝑛
(𝑥
𝑖=1 𝑖 − 𝑥)
ҧ 2
𝑥ҧ = 𝑠2 = 𝑥
𝑛 𝑛−1 𝑝Ƹ =
𝑛
σ𝑁
𝑖=1 𝑥𝑖 𝑥
𝜇= σ𝑁 𝜇)2 𝑝=
𝑁 𝑖=1(𝑥𝑖 −
𝑁
𝜎2 =
𝑁

5
Estimadores para una población
Media Varianza Proporción
Representa el punto de Mide qué tan alejados se encuentran los Es la probabilidad de
equilibrio, se ve afectada por datos respecto a la media, a mayor éxito que proviene de
valores extremos. Se varianza mayor variabilidad. Se una Distribución
denotará como 𝑥ҧ para la denotará 𝑠 2 para la muestra y 𝜎 2 para la Binomial. Se denotará
muestra y 𝜇 para la población. población. 𝑝Ƹ para la muestra y 𝑝
para la población.
σ𝑛𝑖=1 𝑥𝑖 σ 𝑛
(𝑥
𝑖=1 𝑖 − 𝑥)
ҧ 2
𝑥ҧ = 𝑠2 = 𝑥
𝑛 𝑛−1 𝑝Ƹ =
𝑛
σ𝑁
𝑖=1 𝑥𝑖 𝑥
𝜇= σ𝑁 𝜇)2 𝑝=
𝑁 𝑖=1(𝑥𝑖 −
𝑁
𝜎2 =
𝑁

6
Distribución muestral de la media
Suponga que de una población normal con media 𝜇 y varianza 𝜎 2 se toma una
muestra aleatoria de 𝑛 observaciones. Cada observación 𝑋𝑖 de la muestra
aleatoria tendrá entonces la misma distribución normal que la población de donde
se tomó. Así, por la propiedad reproductiva de la distribución normal:
1
𝑋ത = ∙ (𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 )
𝑛
tiene una distribución normal con media 𝜇𝑋ത y varianza 𝜎𝑋2ത :

1 1 𝜎 2 𝜎
𝜇𝑋ത = ∙ 𝜇 + 𝜇 + ⋯ + 𝜇 = 𝜇 2 2 2 2
𝜎𝑋ത = 2 ∙ 𝜎 + 𝜎 + ⋯ + 𝜎 = → 𝜎𝑋ത =
𝑛 𝑛 𝑛 𝑛
𝑛 términos 𝑛 términos

7
Distribución muestral de la media
Si tomamos muestras de una población con distribución desconocida, la
distribución muestral de 𝑋ത aún será aproximadamente normal con media 𝜇 y
varianza 𝜎 2 /𝑛, siempre que el tamaño de la muestra sea grande (𝑛 ≥ 30). Esto se
conoce como el teorema del límite central:

Teorema del límite central: Si 𝑋ത es la media de una muestra aleatoria de tamaño 𝑛, tomada
de una población con media 𝜇 y varianza finita 𝜎 2 , entonces la forma límite de la distribución de
𝑋ത − 𝜇
𝑍= 𝜎
𝑛

a medida que 𝑛 → ∞, es la distribución normal estándar 𝑁(𝑧; 0,1)

8
Distribución muestral de la media
𝑋ത es la media de una muestra aleatoria de tamaño 𝑛 con su propia desviación
estándar 𝑠, tomada de una población con media 𝜇 y varianza finita 𝜎 2 . La
variable aleatoria de la población es 𝑋.
Tamaño de la Distribución de
Casos Variable aleatoria Varianza 𝝈𝟐 Estandarización
muestra 𝒏 muestreo
𝑋 distribuye
I No importa 𝑋ത − 𝜇
normal 𝑋ത distribuye normal 𝑍= 𝜎
Es conocida
𝑋 no distribuye 𝑛 ≥ 30 (Teorema estándar
II 𝑛
normal de límite central)
𝑋ത − 𝜇
𝑋 distribuye 𝑋ത distribuye t de 𝑇 = 𝑠 ;𝑣 = 𝑛 − 1
III No importa
normal Student
𝑛
No es conocida
𝑋ത − 𝜇
𝑋 no distribuye 𝑛 ≥ 30 (Teorema 𝑋ത distribuye normal 𝑍= 𝑠
IV
normal de límite central) estándar
𝑛
ത Realizar inferencias con respecto a la media poblacional 𝜇.
Usos: Calcular probabilidades asociadas a 𝑋.
9
10
Las Baterías (1)

11
Un productor de baterías afirma que la duración de cierto tipo de
batería es en promedio 40 h con una desviación estándar de 5 h.

(a) Si se toma una muestra aleatoria de 100 baterías determine la


probabilidad que la media sea cuando mucho 36.7 h.

(b) Suponga que el tiempo de duración de las baterías se distribuye


normalmente. Si se toma una batería al azar, determine la
probabilidad que el tiempo de duración sea cuando mucho 36.7 h.

12
La duración de cierto tipo de batería es en promedio 40 h con una desviación estándar de 5 h.
(a) Si se toma una muestra aleatoria de 100 baterías determine la probabilidad que la media
sea cuando mucho 36.7 h.
𝑋: Duración de las baterías en horas
Población 𝜇 = 40 horas
𝜎 = 5 horas → 𝜎 2 = 25

𝑛 = 100 baterías
Muestra ത Media muestral de la duración de las baterías en horas
𝑋:
𝑃 𝑋ത < 36.7 ?
36.7 − 40
𝑧= = −6.60
¿𝜎 2 es conocida? Sí CASO II: 𝑋ത − 𝜇 5
¿𝑋 ~ Normal? No D. Normal 𝑍= 𝜎 100
¿𝑛 ≥ 30? Sí Estándar 𝑛 𝑃 𝑋ത < 36.7 = 𝑃 𝑍 < −6.60 = 0

Hay una probabilidad nula que la duración promedio de las baterías sea cuando mucho 36.7
13
La duración de cierto tipo de batería es en promedio 40 h con una desviación estándar de 5 h.
(b) Suponga que el tiempo de duración de las baterías se distribuye normalmente. Si se toma una
batería al azar, determine la probabilidad que el tiempo de duración sea cuando mucho 36.7 h.
Solución 1 (como lo veíamos en la unidad 3)

𝑋: Duración de las baterías en horas → 𝑋~𝑁𝑜𝑟𝑚𝑎𝑙


𝜇 = 40 horas
𝜎 = 5 horas → 𝜎 2 = 25
𝑃 𝑋 < 36.7 ?

D. Normal 𝑋−𝜇 36.7 − 40


𝑍= 𝑧= = −0.66 𝑃 𝑋 < 36.7 = 𝑃 𝑍 < −0.66 = 0.2546
Estándar 𝜎 5

Hay una probabilidad de 25.46% de que el tiempo de duración sea cuando mucho 36.7

14
La duración de cierto tipo de batería es en promedio 40 h con una desviación estándar de 5 h.
(b) Suponga que el tiempo de duración de las baterías se distribuye normalmente. Si se toma una
batería al azar, determine la probabilidad que el tiempo de duración sea cuando mucho 36.7 h.
Solución 2 (como lo vemos en la unidad 4)

𝑋: Duración de las baterías en horas → 𝑋~𝑁𝑜𝑟𝑚𝑎𝑙


Población 𝜇 = 40 horas
𝜎 = 5 horas → 𝜎 2 = 25
𝑛 = 1 batería
Muestra ത Media muestral de la duración de las baterías en horas
𝑋:
𝑃 𝑋ത < 36.7 ?
36.7 − 40
CASO I: 𝑋ത − 𝜇 𝑧= = −0.66
¿𝜎 2 es conocida? Sí 𝑍= 𝜎 5/√1
D. Normal
¿𝑋 ~ Normal? Sí Estándar 𝑛 𝑃 𝑋ത < 36.7 = 𝑃 𝑍 < −0.66 = 0.2546

Hay una probabilidad de 25.46% de que el tiempo de duración promedio sea cuando mucho 36.7
15
La duración de cierto tipo de batería es en promedio 40 h con una desviación estándar de 5 h.
(b) Suponga que el tiempo de duración de las baterías se distribuye normalmente. Si se toma una
batería al azar, determine la probabilidad que el tiempo de duración sea cuando mucho 36.7 h.

Solución 1 (como lo veíamos en la unidad 3) Solución 2 (como lo vemos en la unidad 4)

𝑋−𝜇 𝑋ത − 𝜇
𝑍= 𝑍= 𝜎
𝜎 𝑛

36.7 − 40 36.7 − 40
𝑧= = −0.66 𝑧= = −0.66
5 5/√1

𝑃 𝑋 < 36.7 = 𝑃 𝑍 < −0.66 = 0.2546 𝑃 𝑋ത < 36.7 = 𝑃 𝑍 < −0.66 = 0.2546

Son iguales porque n=1.

16
Servicio Técnico

17
El tiempo necesario para el mantenimiento periódico de un
automóvil nuevo (revisión y servicio) después de 5000 millas tiene
una media de 1.4 horas y una desviación estándar de 0.7 horas.
Suponga que el departamento de servicio planea reparar 50
automóviles en 10 días, y que un día de trabajo es de 8 horas.
¿Cuál es la probabilidad de que el departamento de servicio deba
trabajar horas extras?

18
𝑋: Tiempo necesario para el mantenimiento periódico de un automóvil
Población 𝜇 = 1.4 horas
𝜎 = 0.7 horas→ 𝜎 2 = 0.49

𝑛 = 50 automóviles
ത Media muestral del tiempo necesario para el mantenimiento periódico de un automóvil
𝑋:
Muestra El tiempo promedio para reparar 50 vehículos en 10 días de 8 horas de trabajo es
10∙8
𝑥ҧ = = 1.6 horas
50

𝑃 𝑋ത > 1.6 ?

1.6 − 1.4
𝑧= = 2.02
¿𝜎 2 es conocida? Sí CASO II: 𝑋ത − 𝜇 0.7
¿𝑋 ~ Normal? No D. Normal 𝑍= 𝜎 50

¿𝑛 ≥ 30? Sí Estándar 𝑛 𝑃 𝑋ത > 1.6 = 𝑃 𝑍 > 2.02 = 0.022

Hay una probabilidad 2.2% de que el departamento de servicio deba trabajar horas extras
19
Los Cojinetes

20
En la fabricación de cojinetes para motores se sabe que el diámetro
promedio es de 5 cm, con una desviación estándar de 0.05 cm. El
proceso es vigilado de forma periódica mediante la selección de 64
cojinetes, midiendo sus correspondientes diámetros. Si se desea
que la probabilidad que el promedio real diste de la media muestral
en menos de 0.01 sea de por lo menos 0.95 ¿Qué tamaño de
muestra se necesita?

21
𝑋: Diámetro de los cojinetes en cm
Población 𝜇 = 5 cm
𝜎 = 0.05 cm

𝑛 = 64 cojinetes
ത Media muestral del diámetro de los cojinetes en cm
𝑋:
Muestra 𝑥ҧ − 𝜇 < 0.01 → 4.99 < 𝑥ҧ < 5.01
𝑃 4.99 < 𝑥ҧ < 5.01 > 0.95
¿Cuánto vale 𝑛?
𝑃 4.99 < 𝑥ҧ < 5.01 = 0.95

¿𝜎 2 es conocida? Sí 𝑃 −1.96 < 𝑧 < 1.96 = 0.95


CASO II: 𝑋ത − 𝜇
¿𝑋 ~ Normal? No D. Normal 𝑍= 𝜎 5.01 − 5
𝑧= = 1.96
¿𝑛 ≥ 30? Sí Estándar 𝑛 0.05
𝑛

𝑛 = 96.04
Se necesita una muestra de 96 cojinetes o más.
22
Estimadores para una población
Media Varianza Proporción
Representa el punto de Mide qué tan alejados se encuentran los Es la probabilidad de
equilibrio, se ve afectada por datos respecto a la media, a mayor éxito que proviene de
valores extremos. Se varianza mayor variabilidad. Se una Distribución
denotará como 𝑥ҧ para la denotará 𝑠 2 para la muestra y 𝜎 2 para la Binomial. Se denotará
muestra y 𝜇 para la población. población. 𝑝Ƹ para la muestra y 𝑝
para la población.
σ𝑛𝑖=1 𝑥𝑖 σ 𝑛
(𝑥
𝑖=1 𝑖 − 𝑥)
ҧ 2
𝑥ҧ = 𝑠2 = 𝑥
𝑛 𝑛−1 𝑝Ƹ =
𝑛
σ𝑁
𝑖=1 𝑥𝑖 𝑥
𝜇= σ𝑁 𝜇)2 𝑝=
𝑁 𝑖=1(𝑥𝑖 −
𝑁
𝜎2 =
𝑁

23
Distribución muestral de la varianza
Si 𝑆 2 es la varianza de una muestra aleatoria de tamaño 𝑛 que se toma de una
población normal que tiene la varianza 𝜎 2 , entonces el estadístico:

𝑛
2
(𝑛 − 1) ∙ 𝑆2 𝑋𝑖 − 𝑋ത 2
𝜒 = =෍
𝜎2 𝜎2
𝑖=1

tiene una distribución chi cuadrada con v=n-1 grados de libertad. Los valores de la
variable aleatoria 𝜒 2 se calculan de cada muestra mediante la fórmula:

(𝑛 − 1) ∙ 𝑠 2
𝜒2 =
𝜎2

24
Distribución muestral de la varianza
𝑆 2 representa la varianza de una muestra aleatoria de tamaño 𝑛, tomada de una
población normal de varianza 𝜎 2 . La variable aleatoria de la población es 𝑋.

Tamaño de la Distribución de
Casos Variable aleatoria Estandarización
muestra 𝒏 muestreo

I 𝑋 distribuye normal No importa


𝑆 2 distribuye chi (𝑛 − 1) ∙ 𝑆 2
𝜒2 = ;𝑣 = 𝑛 − 1
cuadrado 𝜎2
𝑋 no distribuye 𝑛 ≥ 30 (Teorema de
II
normal límite central)

Usos: Calcular probabilidades asociadas a 𝑆 2 o 𝑆. Realizar inferencias con respecto a la varianza o


desviación estándar poblacionales 𝜎 2 y 𝜎 respectivamente.

25
26
Las Baterías (2)

27
Un productor de baterías afirma que la duración de cierto tipo de
batería es en promedio 40 h con una desviación estándar de 5 h. Si
se toma una muestra aleatoria de 20 baterías. Determine la
probabilidad que la varianza sea inferior a 23. Considere que la
población distribuye normalmente.

28
La duración de cierto tipo de batería es en promedio 40 h con una desviación estándar de 5 h.
Si se toma una muestra aleatoria de 20 baterías determine la probabilidad que la varianza sea
inferior a 23. Considere que la población distribuye normalmente.
𝑋: Duración de las baterías en horas
Población 𝜇 = 40 horas
𝜎 = 5 horas → 𝜎 2 = 25

𝑛 = 20 baterías
Muestra 𝑆 2 : Varianza muestral de la duración de las baterías en horas
𝑃 𝑆 2 < 23 ?
𝑣 = 20 − 1 = 19
CASO I: 2
(𝑛 − 1) ∙ 𝑆 (20 − 1) ∙ 23
¿𝑋 ~ Normal? Sí D. Chi 𝜒2 = 2
; 𝜒2 = = 17.48
𝜎 25
Cuadrado 𝑣 =𝑛−1
2
𝑃 𝑆 2 < 23 = 𝑃 𝜒19 < 17.48 = 0.4426

Hay una probabilidad de 44.26% que la varianza de la duración de las baterías sea menor a 23 horas.
29
Estimadores para una población
Media Varianza Proporción
Representa el punto de Mide qué tan alejados se encuentran los Es la probabilidad de
equilibrio, se ve afectada por datos respecto a la media, a mayor éxito que proviene de
valores extremos. Se varianza mayor variabilidad. Se una Distribución
denotará como 𝑥ҧ para la denotará 𝑠 2 para la muestra y 𝜎 2 para la Binomial. Se denotará
muestra y 𝜇 para la población. población. 𝑝Ƹ para la muestra y 𝑝
para la población.
σ𝑛𝑖=1 𝑥𝑖 σ 𝑛
(𝑥
𝑖=1 𝑖 − 𝑥)
ҧ 2
𝑥ҧ = 𝑠2 = 𝑥
𝑛 𝑛−1 𝑝Ƹ =
𝑛
σ𝑁
𝑖=1 𝑥𝑖 𝑥
𝜇= σ𝑁 𝜇)2 𝑝=
𝑁 𝑖=1(𝑥𝑖 −
𝑁
𝜎2 =
𝑁

30
Distribución muestral de la proporción
Si 𝑝 representa la proporción de éxito de una población binomial, entonces 𝑃෠
representa la proporción muestral y tiene una distribución normal de media 𝜇𝑃෠ y
varianza 𝜎𝑃2෠ :
2 𝑝∙𝑞
𝜇𝑃෠ = 𝑝 𝜎𝑃෠ = 𝑞 =1−𝑝
𝑛

siempre que 𝑛 ∙ 𝑝 ≥ 5 y 𝑛 ∙ 𝑞 ≥ 5 de aquí que la variable aleatoria:

𝑃෠ − 𝑝
𝑍=
𝑝∙𝑞
𝑛

tiene una distribución normal estándar.

31
Distribución muestral de la proporción
𝑃෠ representa la proporción de una muestra aleatoria de tamaño 𝑛, tomada de
una población binomial con proporción de éxito 𝑝. La variable aleatoria de la
población es 𝑋.

Tamaño de la muestra 𝒏 y Distribución de


Casos Variable aleatoria Estandarización
proporción de éxito 𝒑 muestreo

𝑃෠ − 𝑝
𝑋 distribuye binomial (no. 𝑃෠ distribuye normal 𝑍= ; 𝑞 =1−𝑝
I 𝑛 ∙ 𝑝 ≥ 5 y 𝑛 ∙ (1 − 𝑝) ≥ 5 𝑝∙𝑞
de éxitos en n ensayos) estándar
𝑛

෠ Realizar inferencias con respecto proporción de éxito


Usos: Calcular probabilidades asociadas a 𝑃.
poblacional 𝑝.

32
33
Los Tornillos

34
El jefe de control de calidad de una planta de producción de tornillos
considera que el 5% de la producción diaria se encuentra
defectuosa. Seleccionó al azar 100 tornillos de la producción de un
día.

(a) Determine la probabilidad que la proporción de tornillos


defectuosos de la muestra sea superior al 6%.

(b) Si desea que la probabilidad pedida en la parte (a) sea de 0.1


¿qué tamaño de muestra necesita?

35
El 5% de la producción diaria se encuentra defectuosa. Seleccionó al azar 100 tornillos de la
producción de un día. (a) Determine la probabilidad que la proporción de tornillos defectuosos
de la muestra sea superior al 6%.
𝑋: Número de tornillos defectuosos de n muestras → 𝑋~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙
Población
𝑝 = 0.05 (5% de la producción diaria se encuentra defectuosa)
𝑛 = 100 tornillos de la producción diaria → 𝑛 ∙ 𝑝=5 ; 𝑛 ∙ 1 − 𝑝 = 95
Muestra ෠ Proporción muestral de tornillos defectuosos
𝑃:
𝑃(𝑃෠ > 0.06) ?

¿𝑋 ~ Binomial? Sí 𝑃෠ − 𝑝 0.06 − 0.05


CASO I: 𝑍= ; 𝑧= = 0.46
D. Normal 𝑝∙𝑞 0.05 ∙ 0.95
¿𝑛 ∙ 𝑝 ≥ 5 y
Estándar 𝑛 100
𝑛 ∙ (1 − 𝑝) ≥ 5? Sí
𝑞 =1−𝑝
𝑃 𝑃෠ > 0.06 = 𝑃 𝑍 > 0.46 = 0.3232

La probabilidad que la proporción de tornillos defectuosos de la muestra sea superior al 6% es 32.32%.

36
El 5% de la producción diaria se encuentra defectuosa. Seleccionó al azar 100 tornillos de la
producción de un día. (b) Si desea que la probabilidad pedida en la parte (a) sea de 0.1 ¿qué
tamaño de muestra necesita?
𝑋: Número de tornillos defectuosos de n muestras → 𝑋~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙
Población
𝑝 = 0.05 (5% de la producción diaria se encuentra defectuosa)
𝑛 = ? tornillos de la producción diaria
Muestra ෠ Proporción muestral de tornillos defectuosos
𝑃:
𝑃 𝑃෠ > 0.06 = 0.1 0.06 − 0.05
𝑧=
0.05 ∙ 0.95
𝑛

𝑃−𝑝
¿𝑋 ~ Binomial? Sí CASO I: 𝑍= ; 0.06−0.05
𝑃 𝑍> = 0.1 ¿cuánto vale z?
D. Normal 𝑝 ∙ 𝑞 0.05∙0.95
¿𝑛 ∙ 𝑝 ≥ 5 y
Estándar 𝑛 𝑛
𝑛 ∙ (1 − 𝑝) ≥ 5? Sí
𝑞 =1−𝑝 𝑃 𝑍 > 1.28 = 0.1
0.06 − 0.05
𝑧= = 1.28 → 𝑛 = 778.24 ≈ 779
0.05 ∙ 0.95
𝑛
37
El Aeropuerto

38
Una línea aérea se da cuenta de que 5% de las personas que
hacen sus reservaciones para cierto vuelo no se presentan. Si la
aerolínea vende 160 boletos para un vuelo con solo 155 asientos
¿Cuál es la probabilidad de que haya un asiento para cada persona
con reservación que se presenta para el vuelo?

39
Solución 1 (como lo veíamos en la unidad 3)

𝑋: Número de pasajeros que se presentan al vuelo de 160 que hicieron reservaciones → 𝑋~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙
𝑥 = 0, 1, 2, … , 160
𝑝 = 0.95 (éxito es que se presenten al vuelo)
𝑛 = 160 pasajeros con reservación
𝑃(𝑋 ≤ 155) ?
155

𝑃 𝑋 ≤ 155 = ෍ 𝑏 𝑥; 160,0.95 = 0.9061


𝑥=0
La probabilidad que haya un asiento para cada pasajero con
reservación que se presente al vuelo es 90%

40
Solución 2 (como lo vemos en la unidad 4)

𝑋: No. pasajeros que se presentan al vuelo de 160 que hicieron reservaciones → 𝑋~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙
Población
𝑝 = 0.95 (éxito es que se presenten al vuelo)
𝑛 = 160 pasajeros → 𝑛 ∙ 𝑝=152 ; 𝑛 ∙ 1 − 𝑝 = 8
෠ Proporción de éxito muestral
𝑃:
Muestra 155
𝑝Ƹ = = 0.96875
160
𝑃(𝑃෠ < 0.9688) ?

¿𝑋 ~ Binomial? Sí 𝑃෠ − 𝑝 0.9688 − 0.95


CASO I: 𝑍= ; 𝑧= = 1.088
D. Normal 𝑝∙𝑞 0.95 ∙ 0.05
¿𝑛 ∙ 𝑝 ≥ 5 y
Estándar 𝑛 160
𝑛 ∙ (1 − 𝑝) ≥ 5? Sí
𝑞 =1−𝑝
𝑃 𝑃෠ < 0.9688 = 𝑃 𝑍 < 1.088 = 0.86

La probabilidad que haya un asiento para cada pasajero con reservación que se presente al vuelo es 86%

41
Unidad 4

Conceptos Distribuciones de
básicos muestro

Asociadas a la Con 2 o más


Con 1 población
normal poblaciones

42
43
Estimadores para dos poblaciones
Diferencia de Medias Cociente de Varianzas Diferencia de proporciones
Se denotará como 𝑥ҧ para la Se denotará 𝑠 2 para la muestra y 𝜎 2 Se denotará 𝑝Ƹ para la muestra
muestra y 𝜇 para la población. para la población. y 𝑝 para la población.

σ𝑛𝑖=1 𝑥𝑖 σ 𝑛
(𝑥 − 𝑥)
ҧ 2 𝑥
𝑥ҧ = 𝑠2 =
𝑖=1 𝑖 𝑝Ƹ =
𝑛 𝑛−1 𝑛
𝑥
σ𝑁
𝑖=1 𝑥𝑖 𝑁
𝑝=
𝜇= σ (𝑥 − 𝜇) 2 𝑁
𝑁 𝑖=1 𝑖
𝜎2 =
𝑁
𝑥1ҧ − 𝑥ҧ2 𝑝Ƹ1 − 𝑝Ƹ 2
𝑠12 /𝑠22
𝜇1 − 𝜇2 𝑝1 − 𝑝2
𝜎12 /𝜎22

44
Estimadores para dos poblaciones
Diferencia de Medias Cociente de Varianzas Diferencia de proporciones
Se denotará como 𝑥ҧ para la Se denotará 𝑠 2 para la muestra y 𝜎 2 Se denotará 𝑝Ƹ para la muestra
muestra y 𝜇 para la población. para la población. y 𝑝 para la población.

σ𝑛𝑖=1 𝑥𝑖 σ 𝑛
(𝑥 − 𝑥)
ҧ 2 𝑥
𝑥ҧ = 𝑠2 =
𝑖=1 𝑖 𝑝Ƹ =
𝑛 𝑛−1 𝑛
𝑥
σ𝑁
𝑖=1 𝑥𝑖 𝑁
𝑝=
𝜇= σ (𝑥 − 𝜇) 2 𝑁
𝑁 𝑖=1 𝑖
𝜎2 =
𝑁
𝑥1ҧ − 𝑥ҧ2 𝑝Ƹ1 − 𝑝Ƹ 2
𝑠12 /𝑠22
𝜇1 − 𝜇2 𝑝1 − 𝑝2
𝜎12 /𝜎22

45
Distribución muestral de la diferencia de medias
Si tenemos dos poblaciones con medias 𝜇1 y 𝜇2 , y varianzas 𝜎12 y 𝜎22
respectivamente, el estadístico que da un estimador puntual de la diferencia
entre 𝜇1 y 𝜇2 es 𝑋ത1 − 𝑋ത2 . Se seleccionan muestras aleatorias de tamaño 𝑛1 y 𝑛2 .
Las variables aleatorias de las poblaciones son 𝑋1 y 𝑋2 .
Muestras Variables Varianzas Tamaño de las Distribución de
Casos 𝟐 𝟐 Estandarización
aleatorias aleatorias 𝝈𝟏 y 𝝈𝟐 muestras 𝒏𝟏 y 𝒏𝟐 muestreo
𝑋1 y 𝑋2
I distribuyen No importa
normal 𝑋ത1 − 𝑋ത2 𝑋ത1 − 𝑋ത2 − (𝜇1 − 𝜇2 )
Indepen- Son
distribuye normal 𝑍=
dientes 𝑋1 y 𝑋2 no conocidas 𝜎12 /𝑛1 + 𝜎22 /𝑛2
𝑛1 ≥ 30 y estándar
II distribuyen
𝑛2 ≥ 30
normal
Continúa…

46
Distribución muestral de la diferencia de medias
Si tenemos dos poblaciones con medias 𝜇1 y 𝜇2 , y varianzas 𝜎12 y 𝜎22
respectivamente, el estadístico que da un estimador puntual de la diferencia
entre 𝜇1 y 𝜇2 es 𝑋ത1 − 𝑋ത2 . Se seleccionan muestras aleatorias de tamaño 𝑛1 y 𝑛2 .
Las variables aleatorias de las poblaciones son 𝑋1 y 𝑋2 .
Muestras Variables Varianzas Tamaño de las Distribución de
Casos Estandarización
aleatorias aleatorias 𝝈𝟐𝟏 y 𝝈𝟐𝟐 muestras 𝒏𝟏 y 𝒏𝟐 muestreo
𝑋ത1 − 𝑋ത2 − (𝜇1 − 𝜇2 )
𝑇= ;
𝑋1 y 𝑋2 Descono- 𝑋ത1 − 𝑋ത2 𝑠𝑝2 ∙ (1/𝑛1 + 1/𝑛2 )
Indepen-
III distribuyen cidas pero No importa distribuye t de 𝑣 = 𝑛1 + 𝑛2 − 2;
dientes
normal iguales Student
2 2
𝑛1 − 1 ∙ 𝑠1 + (𝑛2 − 1) ∙ 𝑠2
𝑠𝑝2 =
𝑛1 + 𝑛2 − 2
Continúa…

47
Distribución muestral de la diferencia de medias
Si tenemos dos poblaciones con medias 𝜇1 y 𝜇2 , y varianzas 𝜎12 y 𝜎22
respectivamente, el estadístico que da un estimador puntual de la diferencia
entre 𝜇1 y 𝜇2 es 𝑋ത1 − 𝑋ത2 . Se seleccionan muestras aleatorias de tamaño 𝑛1 y 𝑛2 .
Las variables aleatorias de las poblaciones son 𝑋1 y 𝑋2 .
Muestras Variables Varianzas Tamaño de las Distribución de
Casos Estandarización
aleatorias aleatorias 𝝈𝟐𝟏 y 𝝈𝟐𝟐 muestras 𝒏𝟏 y 𝒏𝟐 muestreo
𝑋ത1 − 𝑋ത2 − (𝜇1 − 𝜇2 )
𝑇= ;
(𝑠12 /𝑛1 + 𝑠22 /𝑛2 )
𝑋1 y 𝑋2 Descono- 𝑋ത1 − 𝑋ത2 2 2 2
Indepen- 𝑠1 𝑠2
IV
dientes
distribuyen cidas y No importa distribuye t de 𝑛1 + 𝑛2
normal diferentes Student 𝑣= 2 2
𝑠12 𝑠22
𝑛1 𝑛2
+
𝑛1 − 1 𝑛2 − 1
Continúa…
48
Distribución muestral de la diferencia de medias
Si tenemos dos poblaciones con medias 𝜇1 y 𝜇2 , y varianzas 𝜎12 y 𝜎22
respectivamente, el estadístico que da un estimador puntual de la diferencia
entre 𝜇1 y 𝜇2 es 𝑋ത1 − 𝑋ത2 . Se seleccionan muestras aleatorias de tamaño 𝑛1 y 𝑛2 .
Las variables aleatorias de las poblaciones son 𝑋1 y 𝑋2 .
Muestras Variables Varianzas Tamaño de las Distribución de
Casos Estandarización
aleatorias aleatorias 𝝈𝟐𝟏 y 𝝈𝟐𝟐 muestras 𝒏𝟏 y 𝒏𝟐 muestreo
Las
diferencias 𝑠𝑑 ഥ − 𝜇𝑑
𝐷
𝑇= ;
𝐷 entre representa 𝑠𝑑 / 𝑛
Depen- valores la ഥ distribuye t de
𝐷
V 𝑛1 = 𝑛2 = 𝑛 𝑣 = 𝑛 − 1;
dientes correspon- desviación Student
ഥ = 𝑋ത1 − 𝑋ത2 ;
𝐷
dientes estándar
distribuyen de 𝐷 𝜇𝑑 = 𝜇1 − 𝜇2
normal

Usos: Calcular probabilidades asociadas a 𝑋ത1 − 𝑋ത2 . Realizar inferencias con respecto a 𝜇1 − 𝜇2 .
49
50
Los Operadores

51
Se diseña un experimento para probar cuál de los operadores A o B
obtiene un trabajo para operar una nueva máquina. Se toma el
tiempo de 50 pruebas que involucran la realización de cierto trabajo
en la máquina para cada operador. Si las medias para las muestras
de las 50 pruebas difieren en más de 1 segundo, el operador con la
media más pequeña obtiene el trabajo, de otra manera se considera
que el experimento termina en empate. Si se supone que las
deviaciones estándar de los tiempos para ambos operadores son de
dos segundos ¿Cuál es la probabilidad de que el operador A
obtenga el trabajo, aún cuando son igualmente hábiles?
𝑋𝐴 : Tiempo del operador A para realizar el trabajo, en segundos
Población
𝑋𝐵 : Tiempo del operador B para realizar el trabajo, en segundos
Condición 𝑋ത𝐴 − 𝑋ത𝐵 > 1 El operador con media más baja obtiene el trabajo, esto es equivalente a:
𝑋ത𝐴 − 𝑋ത𝐵 > 1 Obtiene B; 𝑋ത𝐵 − 𝑋ത𝐴 > 1 Obtiene A
Igualmente hábiles 𝜇𝐴 = 𝜇𝐵 . Se debe calcular 𝑃(𝑋ത𝐵 − 𝑋ത𝐴 > 1)
52
Si las medias para las muestras de las 50 pruebas difieren en más de 1 segundo, el operador
con la media más pequeña obtiene el trabajo. Si se supone que las deviaciones estándar de los
tiempos para ambos operadores son de dos segundos ¿Cuál es la probabilidad de que el
operador A obtenga el trabajo, aún cuando son igualmente hábiles?
𝑋1 : Tiempo del operador B para realizar el trabajo, en segundos
Población 𝑋2 : Tiempo del operador A para realizar el trabajo, en segundos
𝜇1 = 𝜇2 (igualmente hábiles)
𝜎1 = 𝜎2 = 2 segundos
𝑛1 = 𝑛2 = 50 pruebas
Muestra 𝑋ത1 − 𝑋ത2 : Diferencia de medias muestral del tiempo para realizar el trabajo en segundos
𝑃(𝑋ത1 − 𝑋ത2 > 1) ?
¿muestras
independientes? Sí
CASO II: 𝑋ത1 − 𝑋ത2 − (𝜇1 − 𝜇2 ) 1 − (0)
¿𝜎12 y 𝜎22 son D. Normal 𝑍= 𝑧= = 2.50
conocidas? Sí Estándar 𝜎12 /𝑛1 + 𝜎22 /𝑛2 4/50 + 4/50
¿𝑋1 y 𝑋2 ~ normal? No
¿𝑛1 ≥ 30 y 𝑛2 ≥ 30? Sí 𝑃 𝑋ത1 − 𝑋ത2 > 1 = 𝑃 𝑍 > 2.50 = 0.0062
53
Los Programadores

54
Un científico de la computación está investigando la utilidad de dos lenguajes
de diseño para mejorar las tareas de programación. Se pide a 12
programadores expertos, familiarizados con los dos lenguajes, que codifiquen
una función estándar en ambos lenguajes, anotando el tiempo en minutos que
requieren para hacer esta tarea. Los datos obtenidos son los siguientes:

Prog. Leng. I Leng. II Prog. Leng. I Leng. II Prog. Leng. I Leng. II


1 17 18 5 18 23 9 21 19
2 16 14 6 24 21 10 13 20
3 21 19 7 16 10 11 13 15
4 14 11 8 14 13 12 18 20

Suponiendo que la medias poblacionales son iguales, calcule la probabilidad de


que la diferencia entre las medias muestrales del Lenguaje I y Lenguaje II no
supere 1 minuto. Considere que las diferencias están normalmente distribuidas.

55
Prog. Leng. I Leng. II ഥ 𝟐
𝒅 (𝒅 − 𝒅)
¿muestras ¿diferencias
1 17 18 -1 1.36
independientes? No normales? Sí
2 16 14 2 3.36
3 21 19 2 3.36 ഥ − 𝜇𝑑
𝐷
4 14 11 3 8.03 CASO V: 𝑇= ; 𝑣 = 𝑛 − 1;
5 18 23 -5 26.69 D. t de 𝑠𝑑 / 𝑛
6 24 21 3 8.03 Student ഥ = 𝑋ത1 − 𝑋ത2 ; 𝜇𝑑 = 𝜇1 − 𝜇2
𝐷
7 16 10 6 34.03
8 14 13 1 0.69
9 21 19 2 3.36 𝑋1 : Tiempo para codificar en Leng. I, en minutos
10 13 20 -7 51.36
11 13 15 -2
Población 𝑋2 : Tiempo para codificar en Leng. II, en minutos
4.69
12 18 20 -2 4.69 𝜇𝑑 = 0
Total 205 203 2.00 149.67
𝑛1 = 𝑛2 = 12 programadores
𝑥ҧ1 = 205/12 = 17.08 ഥ : Dif. medias muestral del tiempo para codificar
𝐷
Muestra 𝑠𝑑 = 3.69 minutos
𝑥ҧ2 = 203/12 = 16.92
𝑑ҧ = 𝑥ҧ1 − 𝑥ҧ2 = 17.08 − 16.92 = 0.1667
σ𝑛 ҧ 2 149.67
𝑖=1(𝑑𝑖 − 𝑑)
2
𝑠𝑑 = = = 13.61 → 𝑠𝑑 = 3.69
𝑛−1 12 − 1
56
𝑋1 : Tiempo para codificar en Leng. I, en minutos
Población 𝑋2 : Tiempo para codificar en Leng. II, en minutos
𝜇𝑑 = 0
𝑛1 = 𝑛2 = 12 programadores
ഥ : Diferencia de medias muestral del tiempo para codificar en minutos
𝐷
Muestra 𝑠𝑑 = 3.69 minutos
𝑃 −1 < 𝐷 ഥ < 1 =?

ഥ − 𝜇𝑑
𝐷 𝑣 = 12 − 1 = 11
CASO V: 𝑇= ; 𝑣 = 𝑛 − 1;
D. t de 𝑠𝑑 / 𝑛 −1 − 0
𝑡1 = = −0.94
Student ഥ = 𝑋ത1 − 𝑋ത2 ; 𝜇𝑑 = 𝜇1 − 𝜇2
𝐷 3.69/ 12
1−0
𝑡2 = = 0.94
3.69/ 12

𝑃 −0.94 < 𝑇11 < 0.94 = 𝑃 𝑇11 > −0.94 − 𝑃 𝑇11 > 0.94 = 0.825 − 0.175 = 0.65
La probabilidad de que la diferencia entre las medias muestrales del Lenguaje I y
Lenguaje II no supere 1 minuto es 65%
57
Estimadores para dos poblaciones
Diferencia de Medias Cociente de Varianzas Diferencia de proporciones
Se denotará como 𝑥ҧ para la Se denotará 𝑠 2 para la muestra y 𝜎 2 Se denotará 𝑝Ƹ para la muestra
muestra y 𝜇 para la población. para la población. y 𝑝 para la población.

σ𝑛𝑖=1 𝑥𝑖 σ 𝑛
(𝑥 − 𝑥)
ҧ 2 𝑥
𝑥ҧ = 𝑠2 =
𝑖=1 𝑖 𝑝Ƹ =
𝑛 𝑛−1 𝑛
𝑥
σ𝑁
𝑖=1 𝑥𝑖 𝑁
𝑝=
𝜇= σ (𝑥 − 𝜇) 2 𝑁
𝑁 𝑖=1 𝑖
𝜎2 =
𝑁
𝑥1ҧ − 𝑥ҧ2 𝑝Ƹ1 − 𝑝Ƹ 2
𝑠12 /𝑠22
𝜇1 − 𝜇2 𝑝1 − 𝑝2
𝜎12 /𝜎22

58
Distribución muestral del cociente de varianzas
𝑆12 y 𝑆22 representan las varianzas de muestras aleatorias de tamaño 𝑛1 y 𝑛2 de
dos poblaciones de varianzas 𝜎12 y 𝜎22 respectivamente. Las variables aleatorias
de las poblaciones son 𝑋1 y 𝑋2 .

Muestras Variables Tamaño de las Distribución de


Casos Estandarización
aleatorias aleatorias muestras 𝒏𝟏 y 𝒏𝟐 muestreo
𝑋1 y 𝑋2
I distribuyen No importa
𝜎22 ∙ 𝑆12
Indepen- normal 𝑆12 /𝑆22 distribuye 𝐹 = 2 2;
𝜎1 ∙ 𝑆2
dientes 𝑋1 y 𝑋2 no Fisher
𝑣1 = 𝑛1 − 1; 𝑣2 = 𝑛2 − 1
II distribuyen 𝑛1 ≥ 30 y 𝑛2 ≥ 30
normal

Usos: Calcular probabilidades asociadas a 𝑆12 y 𝑆22 o 𝑆1 y 𝑆2 . Realizar inferencias con respecto a 𝜎12 /𝜎22 .

59
60
Cociente de Varianzas

61
Si 𝑆12 y 𝑆22 representan las varianzas de muestras aleatorias
independientes de tamaños 𝑛1 = 25 y 𝑛2 = 31 tomadas de
poblaciones normales de varianzas 𝜎12 = 10 y 𝜎22 = 15 ,
respectivamente, encuentre 𝑃( 𝑆12 /𝑆22 > 1.26).
𝑋1 𝑦 𝑋2 : Variables aleatorias de la población → 𝑋1 𝑦 𝑋2 ~ 𝑁𝑜𝑟𝑚𝑎𝑙
Población
𝜎12 = 10; 𝜎22 = 15

𝑆12 /𝑆22 : Cociente de varianzas de muestras aleatorias independientes


Muestra 𝑛1 = 25; 𝑛2 = 31
𝑃( 𝑆12 /𝑆22 > 1.26) ?

¿muestras 𝑣1 = 25 − 1 = 24
𝜎22 ∙ 𝑆12
independientes? Sí CASO I: 𝐹 = 2 2; 𝑣2 = 31 − 1 = 30
𝜎1 ∙ 𝑆2
¿𝑋1 y 𝑋2 ~ D. Fisher 15
normal? Sí 𝑣1 = 𝑛1 − 1; 𝑣2 = 𝑛2 − 1 𝑓= ∙ 1.26 = 1.89
10

𝑃( 𝑆12 /𝑆22 > 1.26) = 𝑃 𝐹24,30 > 1.89 = 0.0496


62
Estimadores para dos poblaciones
Diferencia de Medias Cociente de Varianzas Diferencia de proporciones
Se denotará como 𝑥ҧ para la Se denotará 𝑠 2 para la muestra y 𝜎 2 Se denotará 𝑝Ƹ para la muestra
muestra y 𝜇 para la población. para la población. y 𝑝 para la población.

σ𝑛𝑖=1 𝑥𝑖 σ 𝑛
(𝑥 − 𝑥)
ҧ 2 𝑥
𝑥ҧ = 𝑠2 =
𝑖=1 𝑖 𝑝Ƹ =
𝑛 𝑛−1 𝑛
𝑥
σ𝑁
𝑖=1 𝑥𝑖 𝑁
𝑝=
𝜇= σ (𝑥 − 𝜇) 2 𝑁
𝑁 𝑖=1 𝑖
𝜎2 =
𝑁
𝑥1ҧ − 𝑥ҧ2 𝑝Ƹ1 − 𝑝Ƹ 2
𝑠12 /𝑠22
𝜇1 − 𝜇2 𝑝1 − 𝑝2
𝜎12 /𝜎22

63
Distribución muestral de la diferencia de proporciones
Se toman muestras aleatorias de tamaño 𝑛1 y 𝑛2 de poblaciones binomiales
con proporción de éxitos 𝑝1 y 𝑝2 . Las variables aleatorias de las poblaciones
son 𝑋1 y 𝑋2 .
Tamaño de las
Muestras Variables muestras 𝒏𝟏 y 𝒏𝟐 y Distribución de
Casos Estandarización
aleatorias aleatorias proporción de muestreo
éxitos 𝒑𝟏 y 𝒑𝟐

𝑛1 ∙ 𝑝1 ≥ 5;
𝑃෠1 − 𝑃෠2 − (𝑝1 − 𝑝2 )
𝑋1 y 𝑋2 𝑛1 ∙ (1 − 𝑝1 ) ≥ 5; 𝑍= ;
No importa 𝑃෠1 − 𝑃෠2 distribuye 𝑝1 ∙ 𝑞1 𝑝2 ∙ 𝑞2
I
como son
distribuyen
𝑛2 ∙ 𝑝2 ≥ 5; y normal estándar 𝑛1 + 𝑛2
binomial
𝑛2 ∙ (1 − 𝑝2 ) ≥ 5 𝑞1 = 1 − 𝑝1 ; 𝑞2 = 1 − 𝑝2

Usos: Calcular probabilidades asociadas a 𝑃෠1 − 𝑃෠2 . Realizar inferencias con respecto a 𝑝1 − 𝑝2 .

64
65
Los Medicamentos

66
Se desea determinar cuál de dos medicamentos A y B es más eficaz
respecto a su efecto calmante en pacientes postoperatorios. Se ha
encontrado que el 90% de las personas que utilizan el medicamento
A asegura 8 horas de alivio mientras que para B es el 92%. Se
tienen registros del número de horas de alivio para 130 pacientes
tratados con el medicamento A y 150 pacientes tratados con el
medicamento B. Hallar la probabilidad que el porcentaje de
personas en los registros que tienen más de 8 horas de alivio con el
medicamento A sea mayor que el porcentaje de personas que
tienen más de 8 horas de alivio con el medicamento B.

67
El 90% de las personas que utilizan el medicamento A asegura 8 horas de alivio mientras que para B es el 92%.
Se tienen registros del número de horas de alivio para 130 pacientes tratados con el medicamento A y 150
pacientes tratados con el medicamento B. Hallar la probabilidad que el porcentaje de personas en los registros
que tienen más de 8 horas de alivio con el medicamento A sea mayor que el porcentaje de personas que tienen
más de 8 horas de alivio con el medicamento B.
𝑋1 : No. personas que usaron medicamento A y aseguraron 8 h alivio → 𝑋1 ~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙
Población 𝑋2 : No. personas que usaron medicamento B y aseguraron 8 h alivio → 𝑋2 ~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙
𝑝1 = 0.90; 𝑝2 = 0.92 (proporción de éxito)

𝑃෠1 − 𝑃෠2 : Diferencia de proporciones de éxito muestral entre los medicamentos


Muestra 𝑛1 = 130; 𝑛2 = 150 pacientes → 𝑛1 ∙ 𝑝1 = 117; 𝑛1 ∙ (1 − 𝑝1 ) = 13;
𝑃 𝑃෠1 − 𝑃෠2 > 0 ? 𝑛2 ∙ 𝑝2 = 138; 𝑛2 ∙ (1 − 𝑝2 ) = 12

¿𝑋1 y 𝑋2 ~ 0 − (0.90 − 0.92)


binomial? Sí 𝑃෠1 − 𝑃෠2 − (𝑝1 − 𝑝2 ) 𝑧= = 0.58
¿𝑛1 ∙ 𝑝1 ≥ 5; CASO I: 𝑍= ; 0.90 ∙ 0.10 0.92 ∙ 0.08
𝑝1 ∙ 𝑞1 𝑝2 ∙ 𝑞2 +
𝑛1 ∙ (1 − 𝑝1 ) ≥ 5; D. Normal + 130 150
𝑛1 𝑛2
𝑛2 ∙ 𝑝2 ≥ 5 y Estándar
𝑞1 = 1 − 𝑝1 ; 𝑞2 = 1 − 𝑝2 𝑃 𝑃෠1 − 𝑃෠2 > 0 = 𝑃 𝑍 > 0.58 = 0.28
𝑛2 ∙ (1 − 𝑝2 ) ≥ 5? Sí
68

También podría gustarte