Estadística Aplicada
Estadística Aplicada
Estadística Aplicada
CB - 412
ESTADISTICA
ESTADÍSTICA
Conceptos Básicos
Estadística
Población Descriptiva Muestra
Parámetro Estimador
PROBABILIDAD
Conceptos Básicos
INFERENCIA
Población
Inferencia Estadística: Proceso
Mediante el cual se utiliza la
Información de una muestra
Para extraer conclusiones
De la población
ESTIMACIÓN DE PRUEBAS DE
PARAMETROS HIPOTESIS
Areas de Estimación de
Parámetros
ESTIMACION POR PUNTOS
ESTIMACION
ESTIMACION DE INTERVALOS DE
CONFIANZA
PROCESO INFERENCIAL
POBLACIÓN
Parámetros
µ,σ 2 , p
Diseño
Muestral [ ]
P θˆ − θ < ε = 1 − α
TIPO DE MUESTREO
TAMAÑO DE MUESTRA Estimadores
x, S 2 , p MUESTRA
Ejemplo: Media
POBLACION
f(t) = N[µ, σ 2]
OBSERVACION
MUESTRA θ1= µ =?
σ 2=?
2,4,6,8,5,
) θ2=
θ =x
Definiciones
Muestra aleatoria de tamaño n de una
población X , es una sucesión de n variables
aleatorias, independientes, X1 , X2 ,..., Xn , con
idéntica ley de probabilidad que X .
Estimador: es una variable aleatoria, es una
función de las n variables aleatorias de la
muestra
θˆ = f ( X 1 , X 2 , X 3 .... X n )
Método de Máxima Verosimilitud
Distribución Bernoulli
(1− x )
P( X = x) = p q x
X : 0,1
¿parámetro que se estimará? Æp
Función de Probabilidad de la
muestra
n
L(p) = Π
i=1
p q i
x i 1-x
o bien
L(p)= p Σx (1-p)n- Σx
i i
df(p)
------- = D’=0 Σxi n- Σxi
dp -------- - ----------- =0
p 1-p
(1-p) Σxi - p [n- Σxi ]=0
Σxi
Σxi –p n = 0 p = --------
n
MÉTODOS DE ESTIMACIÓN PUNTUAL: MÁXIMA VEROSIMILITUD Y MÉTODO DE LOS
MOMENTOS
ESTIMADOR DE UN PARÁMETRO
INSESGADEZ. ERROR CUADRÁTICO MEDIO
CONSISTENCIA
EFICIENCIA
SUFICIENCIA
Intervalos de confianza
Estimadores puntuales comunes
Población Muestra
Media µ _
X
Varianza: σ2 S2
Proporción P
De objetos q’ pertenecen a p= X/n
una clase de interés X= No. Objetos en la muestra
q’ están en la clase
µ1 - µ2 _ _
X1 – X 2
P1-P2
p1 - p2
Estimación Puntual
• Una estimación puntual del valor de un
parámetro poblacional desconocido
(como puede ser la media , µ, o la
desviación estándar , σ), es un número
que se utiliza para aproximar el
verdadero valor de dicho parámetro
poblacional.
S σ
n
estima a la desviación típica de la
n
media
y se denomina error estándar de la media muestral,
por esta razón se dice que el error estándar de la
media mide la variabilidad de la media en el
muestreo.
Estimadores puntuales de los parámetros
de una población normal
i =1 ( n − 1)
Estimadores puntuales de los parámetros
de una población normal
∑ (x − x)
i =1
i
σ 2
(n − 1) S 2
σ 2
⎧ 2 .1 2.1 ⎫
⎨8.71 − 1.96 ≤ µ ≤ 8.71 + 1.96 ⎬
⎩ 25 25 ⎭
7.8868 ≤ µ ≤ 9.5332
Intervalo de confianza para la media
poblacional, σ desconocido
z 1-ε/2 σ
2 2
2
=n
E
Intervalo de confianza para la varianza
poblacional
Sea X una variable aleatoria con distribución
normal con µ y σ desconocidos y sea X1, X2, ...,
Xn una muestra aleatoria de tamaño n.
El intervalo de confianza se construye a partir de
la variable (n − 1) S 2
2
χ =
Que tiene una distribución
σ2
ji-cuadrado
con n-1 grados de
libertad y dos valores tales que delimiten el 100(1 - α)%
{ 2 2 2
}
Pr χ ( n−1);α / 2 ≤ χ ( n−1) ≤ χ ( n−1);1−α / 2 = 1 − α
Intervalo de confianza para la
varianza poblacional
Reemplazando la variable χ2 en el intervalo
⎧ 2 (n − 1) S 2
⎫
Pr ⎨ χ ( n−1);α / 2 ≤ ≤ χ ( n−1);1−α / 2 ⎬ = 1 − α
2
⎩ σ 2
⎭
Despejando el intervalo de confianza queda,
⎧⎪ (n − 1) S 2 (n − 1) S ⎪ 2⎫
Pr ⎨ 2 ≤σ ≤ 2
2
⎬ = 1−α
⎪⎩ χ ( n−1);1−α / 2 χ ( n−1);α / 2 ⎪⎭
Intervalo de confianza para la varianza poblacional
X = 715, S = 24.454
De los datos se tiene
⎧ (14)24.454 2 (14)24.454 ⎫
2
⎨ ≤σ ≤
2
⎬
⎩ 26.12 5.63 ⎭
{320.5196 ≤ σ 2 ≤ 1487.028 }
17.9 ≤ σ ≤ 38.562
Intervalo de confianza para la
Diferencia de Medias
Y se distribuye según N (µ 2 , σ 2 )
σ 12 σ 2
X 1 ≈ N (µ1, ) X 2 ≈ N (µ 2 , 2
)
n1 n2
σ 12 σ 2
X 1 − X 1 ≈ N (µ1 − µ 2 , + 2
)
n1 n2
σ12 σ 22 σ12 σ 22
X1 − X 2 − Z(1−α / 2) + ≤ µ1 − µ2 ≤ X1 − X 2 + Z(1−α / 2) +
n1 n2 n1 n2
Ejemplo: Un alto dirigente del emporio comercial Gamarra afirma que el
salario promedio por semana de los hombres supera en S/42 al salario
promedio de las mujeres. Para comprobar la afirmación un grupo de
trabajo escogió una muestra aleatoria de 20 hombres y otra de 25
mujeres encontrando los promedios S/ 356.4 y S/.324 respectivamente.
Aplicando un intervalo de confianza del 95% para la diferencia de
medias,¿es consistente la afirmación del dirigente? . El grupo supone
que los salarios en cada caso siguen el modelo de probabilidad normal
con varianzas 400 y 225 soles2 respectivamente.
XH = 356.4 XM = 324
⎡ 400 225⎤
µH − µH ∈⎢356.4 − 324±1.96 + ⎥
⎣ 20 25 ⎦
[32.4 ±10.55] 21.85≤ µH − µH ≤ 42.95
Cociente de varianzas
Y se distribuye según N (µ 2 , σ 22 )
Y se distribuye según N (µ 2 , σ 22 )
Y1 = y1 , Y2 = y2 , L , Yn 2 = yn 2
(n2 − 1) SY2
χ2 = se distribuye según una Ji - cuadrado con n 2 - 1 g.l.
σ 2
2
Intervalo de confianza para el
Cociente de Varianzas
(n1 − 1) S X2
χ1 = se distribuye según una Ji - cuadrado con n1 - 1 g.l.
σ 2
1
(n2 − 1) SY2
χ2 = se distribuye según una Ji - cuadrado con n 2 - 1 g.l.
σ 2
2
χ1 /(n1 − 1)
F=
χ 2 /(n2 − 1)
F( n −1, m −1)
1− α
0
0 5 10 15 20 25 30
F( n1−1, n 2 −1,α / 2 ) F( n1−1, n 2 −1,1−α / 2 )
⎧ S Xσ 2
2 2
⎫
Pr ⎨ F( n1−1,n 2−1,α / 2 ) ≤ 2 2 ≤ F( n1−1,n 2−1,1−α / 2 ) ⎬ = 1 − α
⎩ SY σ 1 ⎭
Intervalo de confianza para el
Cociente de Varianzas
F( n −1, m −1)
1− α
0
0 5 10 15 20 25 30
F( n1−1, n 2 −1,α / 2 ) F( n1−1, n 2 −1,1−α / 2 )
⎛ S 2
/ S 2
S 2
/ S 2 ⎞
⎜ X Y
, X Y ⎟
⎜F F ⎟
⎝ ( n1−1,n 2−1,1−α / 2 ) ( n1−1,n 2−1,α / 2 ) ⎠
σ12
Intervalo de confianza para la razón σ 22
Caso 2:Intervalo de confianza para la
Diferencia de Medias-Varianzas
Poblacionales Desconocidas
∑X i ∑(X − X ) i
2
X= i =1 S =
2 i =1
n1 − 1
X
n1
Y se distribuye según N (µ 2 , σ 2 )
Y1 = y1 , Y2 = y2 , L , Yn 2 = yn 2
m
∑Y i
m
∑ i
(Y − Y ) 2
Y= i =1
n2 SY2 = i =1
n2 − 1
Intervalo de confianza para la Diferencia de Medias:
Varianzas Desconocidas pero iguales
n1 + n2 − 2
Por otro lado, se demuestra que
X − Y se distribuye como N ( µ1 − µ 2 , σ 2 (1 / n1 + 1 / n2 ))
( X − Y ) − ( µ1 − µ 2 )
T=
S p 1 / n1 + 1 / n2
( X − Y ) ± t( n1 + n2 − 2 ) S p2 (1 / n1 + 1 / n2 )
⎢n + n ⎥
1 2
v = ⎣ 1 2 ⎦
2 2
⎡ S1 ⎤
2
⎡ S2 ⎤
2
⎢n ⎥ ⎢n ⎥
⎣ 1 ⎦ + ⎣ 2 ⎦
n1 − 1 n2 − 1
Percentil (1-α/2)100 de la distribución t-student con v grados de libertad
Intervalo de Confianza para la diferencia entre
dos medias de observaciones pareadas
( X 1 , Y1 ), ( X 2 , Y2 ),...( X n , Yn )
Una muestra aleatoria de n datos emparejados, escogida
de la población bivariada (X, Y) donde
Y se distribuye según N (µ 2 , σ 2 )
X 1 , X 2 ,.. X n 1 e Y 1 , Y 2 ,.. Y n 2
σ 2
D = σ 1
2
+ σ 2
2 − 2 Cov ( X ,Y )
d − µD
T = ≈ t ( n −1 )
Sd / n
SD SD
d − t ( n −1,1− α / 2 ) ≤ µ D ≤ d + t ( n −1,1− α / 2 )
n n