Apuntes Tema 2 Distibuciones Muestrales
Apuntes Tema 2 Distibuciones Muestrales
Apuntes Tema 2 Distibuciones Muestrales
Distribuciones Muestrales
2.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Distribuciones Muestrales . . . . . . . . . . . . . . . . . . . . . 9
2.2.1 Distribución de la Media Muestral (X̄) . . . . . . . . . . 10
2.2.2 Distribución de la Proporción Muestral (b p) . . . . . . . 13
2.2.3 Distribución de la Diferencia de Medias (X̄ − Ȳ ) . . . . 15
2.2.4 Distribución de la Diferencia de Proporciones (b p1 − pb2 ) 17
2.1. Introducción
7
8 CAPÍTULO 2. DISTRIBUCIONES MUESTRALES
Muestra Aleatoria
Sea X una caracterı́stica de la población en estudio con función de probabilidad fX (x) o pX (x) con media
E(X) = µ y varianza V (X) = σ 2 . Se dice que un conjunto de n variables aleatorias (v.a.) X1 , X2 , ..., Xn
es una muestra aleatoria (m.a.) de tamaño n seleccionada de la población en estudio, sii:
1. Las variables aleatorias X1 , X2 , ..., Xn son independientes.
2. Las distribuciones de probabilidad de Xi , i = 1, 2, ..., n es la misma que la de X, es decir:
Sea X una v.a. poblacional con función de probabilidad Bernoulli de parámetro p, y X1 , X2 , ..., Xn una
m.a. seleccionada de la población X, es decir
entonces:
1. la esperanza matemática de cada Xi es:
Estadı́stica o Estadı́grafo
Es una función real o vectorial de los elementos de una m.a. X1 , X2 , ..., Xn y no contiene parámetros
desconocidos, es decir:
T = t(X1 , X2 , ..., Xn )
son cantidades o vectores cuyos valores observados se calculan una vez que se ha tomado la muestra y
sirven para realizar inferencias con relación a la población.
2.2. DISTRIBUCIONES MUESTRALES 9
Algunas estadı́sticas:
n
P
Xi
i=1
1. T1 = t1 (X1 , X2 , ..., Xn ) = X̄ = 7→ Media Muestral
n
n
(Xi − X̄)2
P
i=1
2. T2 = t2 (X1 , X2 , ..., Xn ) = S 2 = 7→ Varianza Muestral
n−1
3. T3 = t3 (X1 , X2 , ..., Xn ) = X(1) = mı́n{X1 , X2 , ..., Xn } 7→ el Menor Valor de la Muestra
X n+1 ; si n es impar
( 2 )
7. T7 = t7 (X1 , X2 , ..., Xn ) = M e = 7→ Mediana Muestral
X n + X( n +1)
(2)
2
; si n es par
2
Distribución Muestral
Es la distribución de probabilidad de una estadı́stica calculada a partir de todas las posibles muestras
de tamaño n, elegidas al azar de una población determinada.
En general cuando estudiamos una distribución muestral, nos interesa de la estadı́stica muestral T :
2. Su media µT = E(T )
Para poder entender mejor el comportamiento de la estadı́stica media muestral (X̄), desarrollamos el siguiente
ejemplo.
3. Seleccionar con reemplazo (sin reemplazo) todas las muestras posibles de tamaño n = 2 (x1 , x2 ).
4. Determine la media muestral X̄ para cada una de las muestras posibles y construya la distribución
de probabilidad de la media muestral
n
P
Xi
X̄ = i=1
n
5. Calcular la media (esperanza matemática) de la media muestral
X
µX̄ = E(X̄) = x̄i · p(x̄i )
σ2 σ2
2 N −n 2
µ = µX̄ σX̄ = (sin reemplazo) σX̄ = (con reemplazo)
n N −1 n
Sea X una variable poblacional con media µ y varianza finita σ 2 , y sea X1 , X2 , ..., Xn una m.a. de la
población X. Entonces si
n
P
Xi
i=1
X̄ = (media muestral ), tenemos
n
2 σ2
µX̄ = E(X̄) = µ y σX̄ = V [X̄] =
n
2.2. DISTRIBUCIONES MUESTRALES 11
X̄ − µ
Z= σ ∼ N (0, 1)
√
n
Una máquina que empaqueta bolsas de café automáticamente está regulada para embalar bolsas cuyos
pesos se distribuyen normalmente con media 500 gramos y desviación estándar 10 gramos. Se sabe
también que, a veces, la máquina se desregula y, cuando esto ocurre, el único parámetro que se altera
es la media (500 gr.), permaneciendo la varianza la misma. Para mantener la producción bajo control se
selecciona una m.a. de 110 bolsas y luego se pesa. Calcular la probabilidad de que el promedio de las 110
bolsas difiere de 500 en menos de 2 gramos.
SOLUCIÓN.
Sea X: Peso de una bolsa de café, entonces X ∼ N (µ = 500, σ 2 = 100) con n = 110 (X1 , X2 , ..., Xn ). Ası́
σ2
2 100
X̄ ∼ N µX̄ = µ = 500, σX̄ = = = 0.91
n 110
Luego,
P (|X̄ − 500| < 2) = P −2 < X̄ − 500 < 2 = P −2 + 500 < X̄ < 2 + 500 = P 498 < X̄ < 502
498 − 500 X̄ − µ 502 − 500
=P < σ < = P (−2.1 < Z < 2.1) = 2ΦZ (2.1) − 1
10 √ 10
√ √
110 n 110
P (|X̄ − 500| < 2) = 2 · 0.98214 − 1 = 0.96428.
Sea X una variable poblacional con media µ y varianza finita σ 2 , y sea X1 , X2 , ..., Xn una m.a. sin
reemplazo de una población X finita de tamaño N . Entonces si
n
P
Xi
i=1
X̄ = (media muestral ), tenemos
n
σ2
2 N −n
µX̄ = E(X̄) = µ y σX̄ = V [X̄] =
n N −1
12 CAPÍTULO 2. DISTRIBUCIONES MUESTRALES
Corolario 2. Si X1 , X2 , ..., Xn es una m.a. extraida sin reemplazo de una población X ∼ N (µ, σ 2 ) y si
n
P
Xi
σ2 N − n
i=1
X̄ = . Entonces X̄ ∼ N µ,
n n N −1
X̄ − µ
Z= r ∼ N (0, 1)
σ N −n
√
n N −1
Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una media
de 174.5 centı́metros y una desviación estándar de 6.9 centı́metros. Si se extraen 200 muestras aleatorias
de tamaño 25 sin reemplazo de esta población, determine:
1. El número de las medias muestrales que caen entre 172.5 y 175.8 centı́metros.
2. El número de medias muestrales que caen por debajo de 172 centı́metros.
SOLUCIÓN.
Sea X: Estaturas (cms.) de N = 1000 estudiantes, entonces X ∼ N (µ = 174.5, σ 2 = 6.92 ). Ası́ con una
ma.a. de n = 25
σ2 N − n 6.92 1000 − 25
2
X̄ ∼ N µX̄ = µ = 174.5, σX̄ = = = 1.86
n N −1 25 1000 − 1
Luego,
1. El planteamiento y solución es:
172.5 − 174.5 X̄ − µ 175.8 − 174.5
P (172.5 ≤ X̄ ≤ 175.8) = P ≤ ≤
r r r
6.9 1000 − 25 σ N −n 6.9 1000 − 25
√ √ √
25 1000 − 1 n N −1 25 1000 − 1
= P (−1.47 ≤ Z ≤ 0.96) = ΦZ (0.96) − ΦZ (−1.47)
P (172.5 ≤ X̄ ≤ 175.8) = 0.83147 − 0.07078 = 0.76069. ⇒ (0.76069)(200) = 152 medias muestrales.
Si X1 , X2 , ..., Xn es una m.a. extraida de una población X con media µ y varianza finita σ 2 , entonces por
el TCL, tenemos que:
σ2 σ2 N − n
X̄ ∼ N µ, X̄ ∼ N µ,
n n N −1
En el último año, el peso de los recién nacidos tiene una media de 3000 gr. y desviación estándar de 140
gr. ¿Cuál será la probabilidad de que la media de una muestra aleatoria (m.a.) de 100 recién nacidos sea
superior a 3030 gr.?
SOLUCIÓN.
Sea X: Peso (grs.) de los recien nacidos, entonces X ∼?(µ = 3000, σ 2 = 1402 ). Ası́ con una m.a. de
n = 100 > 30 por el T.C.L. se tiene:
σ2 1402
2
X̄ ≈ N µX̄ = µ = 3000, σX̄ = = = 196
n 100
Una Proporción
Sea X1 , X2 , ..., Xn una m.a. extraida de la población X ∼ B(p). La proporción de elementos portadores
de la caracterı́stica de interés (éxito) en la muestra es dado por:
n
P
Xi
i=1 a
pb = =
n n
la distribución muestral de la estadı́stica pb se denomina distribución muestral de una proporción con:
pq
µpb = E(b
p) = p σp2b = V [b
p] =
n
14 CAPÍTULO 2. DISTRIBUCIONES MUESTRALES
Un encuestador polı́tico efectúa un análisis de los resultados de la muestra para hacer pronósticos para
la elección. Supóngase que se trata de una elección con dos candidatos; si un candidato especı́fico recibe,
cuando menos 52 % de los votos en la muestra, entonces se pronosticará que ese candidato será el ganador
de la elección. Si se selecciona una m.a. de 600 votantes, ¿cuál es la probabilidad de que se pronostique
como ganador a ese candidato cuando,
1. el porcentaje real de sus votos es 50.3 %
2. el porcentaje real de sus votos es 60 %
SOLUCIÓN.
pq 0.503 · 0.497
1. Tenemos p = 0.503, n = 600 y pb ≈ N p = 0.503, = . Luego la probabilidad
n 600
pedida es:
pb − p 0.52 − 0.503
P (b r pq ≥ r (0.503)(0.497) = P (Z ≥ 0.83) = 1 − P (Z < 0.83) = 1 − ΦZ (0.83)
p ≥ 0.52) = P
n 600
p ≥ 0.52) = 1 − 0.79673 = 0.20327.
P (b
pq 0.60 · 0.40
2. En este caso tenemos p = 0.60, n = 600 y pb ≈ N p = 0.60, = . Luego la probabili-
n 600
dad pedida es:
pb − p 0.52 − 0.60
p ≥ 0.52) = P
P (b r pq ≥ r (0.60)(0.40) = P (Z ≥ −4) = 1 − P (Z < −4) = 1 − ΦZ (−4)
n 600
p ≥ 0.52) = 1 − 0, 00003 = 0.99997.
P (b
2.2. DISTRIBUCIONES MUESTRALES 15
Un detallista compra jarras de cristal en grandes cantidades directamente de la fábrica. Tales jarras son
envueltos uno por uno. Algunas veces, el detallista inspecciona las remesas para determinar la proporción
de jarras rotos o defectuosos. Si un cargamento de 800 jarras contiene el 5 % de jarras rotos o defectuosos,
¿cuál es la probabilidad de que el detallista obtenga una m.a. de 200 jarras que presenta el 7 % o más de
defectuosos?
SOLUCIÓN.
pq N − n 0.05 · 0.95 800 − 200
Tenemos p = 0.05, N = 800, n = 200 y pb ≈ N p = 0.05, = .
n N −1 200 800 − 1
Luego la probabilidad pedida es:
pb − p 0.07 − 0.05
p ≥ 0.07) = P r r
P (b ≥r = P (Z ≥ 1.50) = 1 − P (Z < 1.50)
r
pq N − n (0.05)(0.95) 800 − 200
n N −1 200 800 − 1
p ≥ 0.52) = 1 − ΦZ (1.50) = 1 − 0.93319 = 0, 06681.
P (b
σ12 σ2
2
σX̄− 2 2
Ȳ = V [X̄ − Ȳ ] = V [X̄] + V [Ȳ ] = σX̄ + σȲ = + 2
n1 n2
Sean X1 , X2 , ..., Xn1 una m.a. extraida de una población normal X ∼ N (µ1 , σ12 ), y Y1 , Y2 , ..., Yn2 una
m.a. extraida de una población normal Y ∼ N (µ2 , σ22 ), donde σ12 y σ22 son conocidas. Supongamos que
las poblaciones X e Y son independientes. Entonces la distribución de la estadı́stica X̄ − Ȳ es dado por
σ12 σ22
X̄ − Ȳ ∼ N µ1 − µ2 , +
n1 n2
El consumo promedio diario de carne de pollo en una población determinada es de 500 gramos y en otra
de 400 gramos. Supongamos que los valores del consumo de carne de pollo en las dos poblaciones estan
distribuidos normalmente con una desviación estándar de 100 gramos. ¿Cuál es la probabilidad de que
dos muestras aleatorias e independientes de tamaño 25 extraida de cada población arrojen una diferencia
entre medias muestrales de 50 gramos o de menos?
SOLUCIÓN.
Tenemos X ∼ N (µ1 = 500, σ12 = 10000) con n1 = 25, también Y ∼ N (µ2 = 400, σ22 = 10000) con
n2 = 25. Luego la distribución de X̄ − Ȳ será:
σ12 σ22
10000 10000
X̄ − Ȳ ∼ N µ1 − µ2 = 500 − 400 = 100, + = + = 800
n1 n2 25 25
Corolario 3. Si las poblaciones X e Y no poseen distribuciones normales pero que n1 y n2 son m.a. lo
bastante grandes (por el TCL), entonces la distribución muestral de la estadı́stica X̄ − Ȳ será aproxi-
σ2 σ2
madamente normal con media µ1 − µ2 y varianza 1 + 2 .
n1 n2
Analizando los salarios de los trabajadores de dos Comunidades Autónomas se deduce que en la Comu-
nidad A el salario medio es de 129000 ptas. con una varianza de 2500 ptas2 ., y en la Comunidad B el
salario medio es de 128621 ptas. con una varianza de 3000 ptas2 . Si tomamos una muestra aleatoria de
36 personas en la Comunidad A y de 49 personas en la Comunidad B, determinar la probabilidad de que
la muestra procedente de la Comunidad A tenga un salario medio que sea al menos 400 ptas. superior al
salario medio de la Comunidad B.
SOLUCIÓN.
Observamos que no hemos dicho que las poblaciones, de partida son normales, pues no es necesario ya
que como los tamaños muestrales n1 = 36 y n2 = 49, son mayores o iguales que 30, la aproximación a
la distribución normal dada por el TCL es muy buena, sin necesidad de que las poblaciones de partida
sean normales.
La información que tenemos es:
Población A: µ1 = 129000 σ12 = 2500 n1 = 36
Población B: µ2 = 128621 σ22 = 3000 n2 = 49
2.2.4. p1 − pb2 )
Distribución de la Diferencia de Proporciones (b
p1 − pb2 ] = E[b
µpb1 −bp2 = E[b p1 ] − E[b
p2 ] = µpb1 − µpb2 = p1 − p2
p1 q1 p2 q2
σp2b1 −bp2 = V [b
p1 − pb2 ] = V [b p2 ] = σp2b1 + σp2b2 =
p1 ] + V [b +
n1 n2
Si n1 y n2 son bastante grandes, por el TCL la distribución muestral de pb1 − pb2 es aproximadamente
normal, es decir
p1 q1 p2 q2
pb1 − pb2 ≈ N p1 − p2 , +
n1 n2
Como consecuencia de este resultado, se tiene
p1 − pb2 ) − (p1 − p2 )
(b
Z= r ∼ N (0, 1)
p1 q1 p2 q2
+
n1 n2