Sesion 3 - Estimación
Sesion 3 - Estimación
Sesion 3 - Estimación
APLICADA II
MSC. CYNTHIA LIZBETH OLIVERA LAZARO
No olvidar!!
𝝁
𝝈 𝑿
𝑺
𝝅 𝒑
Parámetros () Estadísticos
TIPOS DE ESTIMACIÓN
Métodos de estimación:
MÁXIMA
MOMENTOS
VEROSIMILITUD
MOMENTOS
La idea básica consiste en igualar ciertas características muestrales con las correspondientes
características poblacionales. Recordemos la siguiente definición.
Sea x una v.a. de una población determinada. Si {xi} i =1,n es una v.a. de “x” los primeros 'k'
momentos, muéstrales al rededor del origen se define como.
𝑛
1
𝑀𝑟 = 𝑥𝑖𝑟 𝑟 = 1, 𝐾
𝑛
𝑖=1
MOMENTOS – CASO DISCRETO Y CONTINUO
Discreto
Sea X una v.a. con función de probabilidad puntual px(x) en el caso discreto. El momento
K-ésimo (k ∈ N) poblacional centrada en el origen es.
𝑼′𝒓 = 𝑬 𝒙𝒓 = 𝒙𝒓 𝒑𝒙 (𝒙)
Continuo:
Sea X una v.a. con función de densidad fx(x) en el caso continuo. El momento K-ésimo (k ∈
N) poblacional centrada en el origen es.
𝑼′𝒓 = 𝑬 𝒙𝒓 = 𝒙𝒓 𝒇𝒙 𝒙 𝒅𝒙
𝑼′𝒓 = 𝑴′𝒓
EJERCICIO MOMENTOS
Ejercicio 1: Si X1, X2,......Xn una muestra aleatoria de una población con distribución gamma.
Hallar el estimador de momentos de α y β
1 𝑥
−
𝑓 𝑥, 𝛼, 𝛽 = 𝑒 𝛽𝑥𝛼, 𝑥>0
𝛽𝛼+1 𝛼!
Paso 1:
Como existen dos Parámetros, el valor de Paso 3:
K=2 Hallando los momentos poblacionales
𝑼′𝟏 = 𝑴′𝟏 discretos
𝑼′𝟐 = 𝑴′𝟐
Paso 2:
Sabemos que los momentos muestrales son
𝑥𝑖 𝑥𝑖2
𝑀1 = 𝑀2 =
𝑛 𝑛
EJERCICIO MOMENTOS
Ejercicio 1: Si X1, X2,......Xn una muestra aleatoria de una población con distribución gamma.
Hallar el estimador de momentos de α y β
1 𝑥
−
𝑓 𝑥, 𝛼, 𝛽 = 𝑒 𝛽𝑥𝛼, 𝑥>0
𝛽𝛼+1 𝛼!
Paso 3: Paso 4:
Hallando los momentos poblacionales Remplazando los valores calculados en el “Paso 1”,
discretos
MAXIMA VEROSIMILITUD
Este método fue introducido por Fisher en la década de 1920. Se basa en la idea de, dada una
muestra, hallar los valores de los parámetros que hacen que la probabilidad de obtener dicha
muestra sea máxima.
Sea, x una v.a. con fdp f(x,) y {xi} i =1,n una muestra aleatoria de x. La función de
verosimilitud se define como:
𝑛
L 𝜃 = 𝑓 𝑥1 , 𝑥2 , … , 𝑥𝑛 ; 𝜃 = 𝑓𝑥 (𝑥1 )𝑓𝑥 (𝑥2 )…𝑓𝑥 𝑥𝑛 = 𝑖=1 𝑓𝑥 (𝑥𝑖 )
El método de MV consiste en tomar como valor estimado de el valor que maximice L. Si
𝜃 hace máximo L también lo hará a Ln(L)
𝑛 𝑛
𝜇=5 𝑋 = 5.027
𝜎 = 0.1 𝑛 = 25
EJEMPLO INTERVALO DE CONFIANZA DE LA MEDIA CON
VARIANZA DESCONOCIDA
EJEMPLO INTERVALO DE CONFIANZA DE LA MEDIA CON
VARIANZA DESCONOCIDA
EJEMPLO INTERVALO DE CONFIANZA DE LA MEDIA CON
VARIANZA DESCONOCIDA
RESUMEN DE FORMULAS PARA EL CÁLCULO DEL INTERVALO
DE CONFIANZA DE LA MEDIA
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
MUESTRALES CON VARIANZA POBLACIONAL
Si 𝑋1 − 𝑋2 son las medias de dos muestras aleatorias independientes de tamaño 𝑛1 − 𝑛2 ,
tomadas de poblaciones que tiene varianzas conocidas 𝜎1 2 , 𝜎2 2 , respectivamente, entonces
el intervalo de confianza para 𝜇1 − 𝜇2 es:
𝜎1 2 𝜎2 2 𝜎1 2 𝜎2 2
(𝑋1 −𝑋2 ) − 𝑍 𝛼 + ≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝑋1 −𝑋2 ) + 𝑍 𝛼 +
1− 2 𝑛1 𝑛2 1− 2 𝑛1 𝑛2
𝑒𝑞𝑢𝑖𝑣𝑎𝑙𝑒𝑛𝑡𝑒:
𝜎1 2 𝜎2 2
𝐼𝐶(𝜇1 − 𝜇2 )= 𝑋1 − 𝑋2 ± 𝑍 𝛼
1− 2
⋅ +
𝑛1 𝑛2
𝝁 = 𝑿 − 𝒁𝝈
𝝈𝟏 𝟐 𝜎2 2
(𝝁𝟏 − 𝝁𝟐 ) − (𝑿𝟏 − 𝑿𝟐 ) = 𝒁 +
𝑛1 𝑛2
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
MUESTRALES CON VARIANZA POBLACIONAL
Usamos Z:
1. MUESTRAS GRANDES (n1 ≥ 30, n2 ≥ 30).
En un estudio para determinar el gasto medio mensual en arbitrios en las ciudades A y B con
desviaciones estándar de 15 y 10 soles respectivamente. Se toma una muestra al azar de 200 hogares
de A arrojando un gasto medio de S/250. Una muestra al azar de 180 hogares de la ciudad B da una
gasto medio de 235.
a) Determine un intervalo de confianza del 99 % para la diferencia del gasto medio en las ciudades A
y B.
b) ¿Es diferente el gasto medio mensual en arbitrios en las ciudades A y B?
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
MUESTRALES CON VARIANZA POBLACIONAL
Solución a:
Datos población Datos Muestra
𝑋𝑖:Gasto mensual en arbitrios en las ciudades.
1. A 2. B 1. A 2. B
σ1 2 σ2 2 𝜎1 = 15 𝜎2 = 10 𝑛1 = 200 𝑛2 = 180
IC 𝝁𝟏 − 𝝁𝟐 = (𝑿𝟏 −𝑿𝟐 ) ± 𝑍 𝛼 + 𝑋1 = 250 𝑋2 = 235
1− 2 𝑛1 𝑛2
𝑁𝐶 = 1 − 𝛼 = 0.99
152 102 𝛼 = 0.01
IC 𝝁𝟏 − 𝝁𝟐 = 𝟐𝟓𝟎 − 𝟐𝟑𝟓 ± 2.578 ∙ +
200 180
𝑍 0.01 →𝑍
11.66 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 18.34 1− 2 0.995 =2.578
11.66 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 18.34
𝑁𝐶 = 1 − 𝛼 = 0.95
12 1.52
IC 𝝁𝟏 − 𝝁𝟐 = 𝟖𝟕. 𝟔 − 74.5 ± 1.96 ∙ + 𝛼 = 0.05
10 12
𝑍 0.05 →𝑍 0.975 =1.96
1− 2
12.05 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 14.15
2 1 1 2 1 1
(𝑋1 −𝑋2 ) − 𝑇 𝛼 𝑆𝑃 + ≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝑋1 −𝑋2 ) + 𝑇 𝛼 𝑆𝑃 +
1− 2 , 𝑔𝑙 𝑛1 𝑛2 1− 2 ,𝑔𝑙 𝑛1 𝑛2
𝑛1 − 1 𝑆1 2 + (𝑛2 − 1)𝑆2 2
𝑆𝑃 2 =
𝑛1 + 𝑛2 − 2
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
MUESTRALES CON VARIANZA POBLACIONAL DESCONOCISA
PROBLEMA 1:
𝑛1 − 1 𝑆1 2 + (𝑛2 − 1)𝑆2 2
𝑆𝑃 2 = 1. Catalizador 1 2. Catalizador 2
𝑛1 + 𝑛2 − 2 𝑛1 = 12 𝑛2 = 10
𝑋1 =85 𝑋2 =81
𝑆1 = 4 𝑆2 = 5
42 (12 − 1) + 52 (10 − 1)
𝑆𝑃 2 = = 20.05
12 + 10 − 2
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
MUESTRALES CON VARIANZA POBLACIONAL DESCONOCISA
2 1 1 2 1 1
(𝑋1 −𝑋2 ) − 𝑇 𝛼 𝑆𝑃 + ≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝑋1 −𝑋2 ) + 𝑇 𝛼 𝑆𝑃 +
1− , 𝑔𝑙
2 𝑛1 𝑛2 1− ,𝑔𝑙
2 𝑛1 𝑛2
Reemplazando en la Fórmula:
1 1 1 1
85 − 81 − 1.725 20.05 + < 𝝁𝟏 − 𝝁𝟐 < 85 − 81 + 1.725 20.05 +
12 10 12 10
Interpretación:
Con un nivel de confianza del 90% la diferencia de medias del rendimiento del catalizador 1 y 2 está
comprendido de 0.69 a 7.31
Nota: tienen un rendimiento diferente.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
MUESTRALES CON VARIANZA POBLACIONAL DESCONOCISA
VARIANZA DESCONOCIDA
Muestras pequeñas (n1 < 30, n2 < 30).
Caso 2: Varianzas poblacionales desconocidas y diferentes. (12 ≠ 22)
Poblaciones normales
𝑠1 2 𝑆2 2 𝑆1 2 𝑆2 2
(𝑋1 −𝑋2 ) − 𝑇 𝛼 + ≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝑋1 −𝑋2 ) + 𝑇 𝛼 +
1− 2 ,𝑉 𝑛1 𝑛2 1− 2 ,𝑉 𝑛1 𝑛2
𝟐 𝟐 𝟐
𝒔𝟏 𝑺𝟐
𝒏𝟏 + 𝒏𝟐
Donde 𝑇 1−𝛼 es el valor de T con V grados de libertad. 𝑽=
2
𝟐 𝟐
𝒔𝟏𝟐 𝟐 𝑺 𝟐
𝒏𝟏 𝒏𝟐
𝒏𝟏 − 𝟏 + 𝒏𝟐 − 𝟏
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
MUESTRALES CON VARIANZA POBLACIONAL DESCONOCISA
PROBLEMA 2:
Se registraron los siguientes datos en días, que representan los tiempos de recuperación de
pacientes tratados aleatoriamente con dos medicamentos para aliviarlos de graves infecciones en la
vesícula:
Medicamento 1 Medicamento 2
𝑛1 = 14 𝑛2 = 14
𝑋1 =17 𝑋2 =19
𝑆1 2 = 1.5 𝑆2 2 = 1.8
2 2 2
1. Medicam 1
𝑠1 𝑆2
+ 1.5 1.8 2 𝑛1 = 14
𝑛1 𝑛2 14 + 14 𝑋1 =17
𝑉= 𝑣= 2 = 25.787 = 26
2 2 𝑆2 2 2 1.5 2
1.8 𝑆1 2 = 1.5
𝑠1
𝑛2 14 14
𝑛1 +
14 − 1 14 − 1
𝑛1 − 1 + 𝑛2 − 1
𝑠1 2 𝑆2 2 𝑆1 2 𝑆2 2
(𝑋1 −𝑋2 ) − 𝑇 𝛼 + ≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝑋1 −𝑋2 ) + 𝑇 𝛼 +
1− 2 ,𝑉 𝑛1 𝑛2 1− 2 ,𝑉 𝑛1 𝑛2
Reemplazando en la Fórmula:
1.5 1.8 1.5 1.8
19 − 17 − 2.779 + < 𝝁𝟐 − 𝝁𝟏 < 19 − 17 + 2.779 +
14 14 14 14
2 − 1.349 < 𝝁𝟐 − 𝝁𝟏 < 2 + 1.015
0.651 < 𝝁𝟐 − 𝝁𝟏 < 3.349
Con nivel de confianza del 99% la verdadera diferencia del tiempo medio de recuperación para los
medicamentos esta comprendido de 0.651 a 3.349
INTERVALO DE CONFIANZA PARA LA PROPORCIÓN
𝑝𝑞 𝑝𝑞
𝑝−𝑍 1−𝛼 . <𝜋 <𝑝+𝑍 𝛼 .
2 𝑛 1−
2 𝑛
Con un 95% de confianza la verdadera proporción (porcentaje) de compradores que están a favor de un horario
más amplio para las compras en el centro comercial, se encuentra entre 0.14 y 0.25 (14.4% y 25.5%).
INTERVALO DE CONFIANZA PARA LA VARIANZA Y LA
DESVIACIÓN ESTANDAR
2
< 𝜎 < 2
𝑋 (1−𝛼,𝑛−1) 𝑋 (𝛼,𝑛−1)
2 2
Intervalo de Confianza para desviación Estandar
(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
2
<𝜎<
𝑋 (1−𝛼,𝑛−1) 𝑋 2 (𝛼,𝑛−1)
2 2
INTERVALO DE CONFIANZA PARA LA VARIANZA Y LA
DESVIACIÓN ESTANDAR
Los siguientes datos representan las edades que tenían al momento de
morir por enfermedad de una muestra de 20 personas de un pueblo:
80 90 85 82 75 58 70 84 87 81
87 61 73 84 85 70 78 95 77 52
Tabla:
𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 = 1 − 𝛼
𝑋2 𝛼
1− 2 ,𝑛−1
= 𝑋 2 (0.975,19) = 32.8523 = 0.95 → 𝛼 = 0.05
𝑋2 𝛼
,𝑛−1
= 𝑋 2 (0.025,19) =8.9065
2
Reemplazando:
(19)11.05062 2 <
(19)11.0506 2
< 𝜎
𝑋 2 (0.975,19) 𝑋 2 (0.025,19)