Distribuciones en El Muestreo - Pdf-Proporcion
Distribuciones en El Muestreo - Pdf-Proporcion
Distribuciones en El Muestreo - Pdf-Proporcion
DISTRIBUCIONES MUESTRALES
1.1. Introducci
on.
individuos, una o varias caractersticas a ser analizadas en una investigacion. Ahora bien,
el analisis puede llevarse a cabo en base a toda o, a una parte de la poblacion. Si se hace
uso de toda la informacion, decimos que se ha hecho una investigacion exhaustiva o total
(censo). No siempre es posible realizar un censo, por razones como; costos, tiempo, poco
practico, etc. Es necesario entonces, en estos casos, llevar a cabo una investigacion parcial.
La misma consiste en realizar el analisis en base a la informacion correspondiente a un
subconjunto de los elementos o individuos, una muestra, de forma tal que a un costo y esfuerzo
razonable se logren obtener conclusiones tan validas como las que se obtendran realizando
1
2 Distribuciones Muestrales
(N
ucleo Merida), se debe ir a las oficinas de registros estudiantiles de todas las facultades
y solicitar all las notas de los estudiantes, dicha tarea no es facil por distintas razones,
entre las cuales se puede mencionar la confidencialidad de la informacion. Por tal razon,
promedio de dicho grupo, y a partir de ese resultado dar una conclusion sobre la
poblacion.
2. Si se quisiera conocer el sueldo promedio del venezolano, sera difcil tener acceso al
sueldo de todos los venezolanos, al igual que en el caso anterior solo se podra obtener
dicha informacion de una parte de los venezolanos.
1.2. Conceptos B
asicos
Definici
on 1.2.1 (Universo) Es el conjunto de individuos o elementos (Personas, Fabric-
Ejemplo 1.2.1 :
1.2 Conceptos Basicos 3
Definici
on 1.2.2 (Poblaci
on) Es el conjunto de todas las posibles mediciones que pueden
hacerse de una o mas caractersticas en estudio de los elementos del universo. Por lo tanto,
la poblaci
on esta constituida por valores o datos bien sea numericos o no.
Ejemplo 1.2.2 :
Observese que una Poblacion puede ser univariante o multivariante, dependiendo del n
umero
de caractersticas consideradas. De acuerdo al n
umero que la constituye, la poblacion puede
ser finita o infinita. En el caso de que la poblacion sea finita, se dice que esta tiene tama
no
N.
4 Distribuciones Muestrales
Definici
on 1.2.3 (Muestra) Es una parte de una poblaci
on, idealmente representativa de
la misma.
Ejemplo 1.2.3 :
4. La marca de los primeros 100 carros tipo sedan que entran en un estacionamiento un
determinado da.
Definici
on 1.2.4 (Par
ametro) Es una funcion de los valores de la poblaci
on que sirve
para sintetizar alguna caracterstica relevante de la misma. Es una medida resumen que se
calcula para describir una caracterstica de toda una poblaci
on. Ejemplos de par
ametros son:
La media poblacional, La proporci
on poblacional, la varianza poblacional, entre otros.
Definici
on 1.2.5 (Estadstico) Se denomina estadstico a toda funcion medible de los
elementos de una muestra en la que no intervienen par
ametros.
Supongase que tenemos una variable aleatoria, cuya distribucion es f (x) y supongamos,
Y = h(X1 , X2 , ...Xn )
La media muestral (X)
La varianza muestral (S 2 )
Formalmente, la caracterstica de estudio se define como una variable aleatoria X la cual tiene
Por ejemplo, para el caso de la nota de los estudiantes la variable aleatoria X representa la
nota de los estudiantes de la ULA la cual se distribuye normal con media 15 y varianza 4.
Existen dos posibilidades sobre la FD de X:
1. X tiene una FD F () con una forma funcional conocida, excepto quizas por el parametro
, el cual puede ser un vector. En este caso el trabajo de un estadstico es decidir sobre
de X.
2. X tiene una FD F de la cual no se sabe nada (excepto quizas que F es, digamos,
absolutamente continua). Este caso es mas difcil que el anterior y este tipo de problemas
curso.
6 Distribuciones Muestrales
1.2.1. Ejercicios
b) Parametro y Estadstico.
2. Identifique cuales simbolos definen los parametrso y cuales los estadsticos en el caso
b) Un granjero prueba con 100 de sus gallinas si un nuevo tipo de alimentacion mejora
el rendimiento.
1.3. Muestreo
4. Tiempo. Al considerar solo una parte del total, su recoleccion y resumen se hara con
mayor rapidez. Razon de peso cuando la informacion es requerida con urgencia.
Cuando se selecciona una muestra se deben tomar en cuenta las siguientes consideraciones:
Elegir el tama
no de la muestra, lo cual depende no solamente de la cantidad de informacion
que se quiere conseguir, y el grado de certeza deseada, sino tambien del costo del muestreo y
la seleccion de los elementos que la constituyen. Cualquiera sea el metodo elegido, el requisito
mas importante es que la muestra obtenida proporcione una imagen tan real como sea posible
de aquella poblacion que se ha sometido al muestreo.
Definici
on 1.3.1 (Muestreo) Proceso de medici
on de la informacion en solo una parte de
la poblaci
on estadstica. Se define como el proceso de seleccionar un n
umero de observaciones
(sujetos) de un grupo en particular de la poblaci
on (metodos para seleccionar muestras), que
se utiliza cuando no es posible contar o medir todos los elementos de la poblaci
on objeto de
estudio.
objeto de obtener informacion sin mucho costo. A este tipo de muestreo se le denomina
Muestreo no probabilstico, no aleatorio o de juicio.
muestreo se encuentran:
permite que cada muestra posible pueda ser elegida con la misma probabilidad.
incluido en la muestra.
es grande.
si misma.
1.3.2. M
etodos para seleccionar una muestra aleatoria.
Existen varios metodos para seleccionar una muestra, entre los cuales se pueden
mencionar: Metodo del bingo, Tabla de N
umeros aleatorios y generacion de n
umeros
pseudoaletorios.
1. Metodo del bingo. Consiste en etiquetar N papeles, bolas o cualquier otro objeto del 1 al
N e introducirlas en una urna o bolsa y agitarla hasta que queden bien mezcladas, luego
extraer una a la vez hasta que se hayan seleccionado n artculos donde n es el tama
no
deseado de la muestra. Los miembros de la poblacion que correspondan a los n
umeros
2. Tabla de N
umeros aleatorios. Las Tablas de N
umeros Aleatorios contienen los dgitos
0, 1, 2, ..., 7, 8, 9. Tales dgitos se pueden leer individualmente o en grupos y en cualquier
orden, en columnas hacia abajo, columnas hacia arriba, en fila, diagonalmente, etc.,
y es posible considerarlos como aleatorios. Las tablas se caracterizan por dos cosas
que las hacen particularmente u
tiles para el muestreo al azar. Una caracterstica es
que los dgitos estan ordenados de tal manera que la probabilidad de que aparezca
Estas dos condiciones satisfacen los requisitos necesarios para el muestreo aleatorio,
establecidos anteriormente. La primera condicion significa que en una secuencia de
n
umeros, la probabilidad de que aparezca cualquier dgito en cualquier punto de la
secuencia es 1/10. La segunda condicion significa que todas las combinaciones de dos
dgitos son igualmente probables, del mismo modo que todas las combinaciones de tres
b) Numerar consecutivamente los elementos de la lista, empezando con el cero (0, 00,
000, etc.).
c) Tomar los n
umeros de una Tabla de N
umeros Aleatorios, de manera que la
e) Utilizar dichos n
umeros aleatorios para identificar los elementos de la lista que se
habran de incluir en la muestra.
Ejemplo 1.3.1 Suponga que se tienen 40 latas de refrescos, y que se desea tomar una
muestra de tama
no n = 4 para estudiar su condici
on. El primer paso es numerar las
la poblaci
on de tama
no N = 40 es un n
umero de dos dgitos. Luego se selecciona
arbitrariamente una fila y una columna de la tabla. Suponga que la selecci
on es la
fila 6 y la columna 4. Se leen los pares de dgitos a partir de la fila 6 y la columna
cualquier n
umero repetido cuando aparezca una segunda vez. Se contin
ua leyendo pares
de dgitos hasta que cuatro unidades diferentes hayan sido seleccionadas, es decir lo
numeros 05, 20, 08 y 17. Por lo tanto, las latas con la etiqueta correspondiente a
dichos numeros constituyen la muestra.
3. Generacion de n
umeros pseudoaletorios. Existen metodos mas eficaces para generar
12 Distribuciones Muestrales
n
umeros aleatorios, en muchos de los cuales se utilizan calculadoras o computadoras.
La mayora de los paquetes estadsticos generan numeros pseudoaleatorios y en excel
usando la funcion aleatorio() se pueden generar dichos n
umeros.
Es el error que se comete debido al hecho de dar conclusiones sobre cierta realidad, a partir
importante, por tanto, la muestra ordenada (2,4) es distinta de la muestra ordenada (4,2).
En la muestra (4,2), se seleccion
o primero 4 y despues 2.
2+4+6+8+10
La media poblacional es igual a = 5
= 6.
La siguiente tabla contiene una lista de todas las muestras ordenadas de tama
no 2 que
es posible seleccionar con reemplazo y tambien contiene las medias muestrales y los
Muestras X Error Muestras
X Error Muestras
X Error
(4,4) 4 -2 (8,4) 6 0
(4,6) 5 -1 (8,6) 7 1
(4,8) 6 0 (8,8) 8 2
(4,10) 7 1 (8,10) 9 3
1.3.4. Ejercicios
a) Muestreo.
f ) Error de muestreo.
Se ha dicho que uno de los objetivos de la estadstica es saber acerca del comportamiento
de parametros poblacionales tales como: la media (), la varianza ( 2 ) o la proporcion
(). Para ello, se extrae una muestra aleatoria de la poblacion y se calcula el valor de un
la varianza muestral (S 2 ) o
estadstico correspondiente, por ejemplo, la media muestral (X),
Teorema 1.4.1
El teorema anterior establece que una funcion de una o mas variables aleatorias es tambien
una variable aleatoria,, y como un estadstico es una funcion de la muestra (las cuales son
1.4.1. Empricamente
de frecuencia relativa de los valores del estadstico, la cual es considerada como su distribucion
Distribuci
on muestral de la media
= 2) = P {(2, 2)} =
P (X 1
25
..
.
X 2 3 4 5 6 7 8 9 10
= x)
P (X 1 2 3 4 5 4 3 2 1
25 25 25 25 25 25 25 25 25
=2
E(X) 1
+3 2
+4 3
+ ... + 10 1
=6
25 25 25 25
2 ) = 22
E(X 1
+ 32 2
+ 42 3
+ ... + 102 1
= 40
25 25 25 25
= E(X
V ar(X) 2 ) [E(X)]
2 = 40 36 = 4
=
E(X)
=
V ar(X) 2
n
Teorema 1.4.2 Sea X1 , X2 , ..., Xn una muestra aleatoria extrada de una poblaci
on cuya
=
E(X)
18 Distribuciones Muestrales
=
V ar(X) 2
n
Empleado 1 2 3 4 5 6 7
Salario (BsF) 7 7 8 8 7 8 9
Como los datos anteriores son considerados la poblaci
on, la media y varianza poblacional son
De acuerdo con esta tabla la media muestral solo puede tomar los valores 7.0, 7.5, 8.0 y 8.5,
es decir x = {7,0, 7,5, 8,0, 8,5}, cuyas probabilidades son las que se muestran en la siguiente
tabla:
1.4 Distribuciones muestrales 19
X 7.0 7.5 8.0 8.5
= x)
P (X 1/7 3/7 2/7 1/7
= E(X
V ar(X) 2 ) [E(X)]
2 = 0,204082
=
E(X)
=
V ar(X) 2
N n
n N 1
Distribuci
on muestral de la proporci
on
Existen ocasiones en las cuales no se esta interesado en la media de la muestra, sino que se
quiere investigar la proporcion de artculos defectuosos o la proporcion de alumnos aprobados
X
P =
n
donde X es el n
umero de exitos u observaciones de interes y n el tama
no de la muestra.
20 Distribuciones Muestrales
Ejemplo 1.4.3 Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos
defectuosos. Se van a seleccionar 5 artculos al azar de ese lote sin reemplazo. Genere la
distribuci
on muestral de proporciones para el n
umero de piezas defectuosas.
est
an defectuosas.
Si X es el n
umero de artculos defectuosos en la muestra, entonces X puede tomar los
valores 0,1,2,3,4, lo cual es equivalente a que P tome los valores 0, 51 , 25 , 53 , 45 con las siguientes
probabilidades:
8 7 6 54 7
P (x = 0) = P (P = 0) = 12 11 10 9 8
= 99
5 8 7 6 54 35
P (x = 1) = P (P = 0,2) = 1 12 11 10 9 8
= 99
5 8 7 6 43 42
P (x = 2) = P (P = 0,4) = 2 12 11 10 9 8
= 99
5 8 7 4 32 14
P (x = 3) = P (P = 0,6) = 3 12 11 10 9 8
= 99
5 8 4 3 21 1
P (x = 4) = P (P = 0,8) = 4 12 11 10 9 8
= 99
7 35 42 14 1 1
E(P ) = 0 99
+ 0,2 99
+ 0,4 99
+ 0,6 99
+ 0,8 99
= 3
=
1.4 Distribuciones muestrales 21
Ejercicios
a) Distribucion muestral.
2. Una poblacion consiste en los cuatro valores siguientes: 12, 13, 14 y 16.
muestra.
listan los cinco representantes y el numero de autos que vendieron la semana pasada:
Ramon 8
Juan 6
Pedro 4
Luis 10
Victor 6
muestra.
por cada representante. Supongase que tales cifras son una poblacion de valores:
1.4 Distribuciones muestrales 23
2 3 2 3 3 4 2 4 3 2 2 7 3 4 5 3 3 3 3 5
Vendedor Cocinas
Pedro 54
Maria 50
Jose 52
Luis 48
Victor 50
Ana 52
a) Seleccione al azar 10 n
umeros adecuados utilizando la tabla de n
umeros aleatorios.
65, 80 y 72. Asumiendo que estos cinco meses constituyen la poblacion, determine la
distribucion muestral de la media para muestras de tama
no 3, realizando el muestreo
sin reposicion y sin importar el orden. Que ocurre con la media de la media muestral,
10. Que pasara con el error estandar del ejercicio anterior si n = 3?Por que hay
diferencia?.
15. La tabla de n
umeros aleatorios *******
16. En una poblacion se presenta una alteracion leve en una cierta proporcion de los
individuos que la componen. Definimos una variable aleatoria X que vale 1 para los
17. Una variable aleatoria puede tomar los valores 1, 2 y 3 con probabilidades 0,25 0,5
tama
no 3.
26 Distribuciones Muestrales
conocida.
de frecuencia relativa de los valores del estadstico. Otra manera de hallar la distribucion
muestral de un estadstico es basandose en el hecho de que como un estadstico es funcion
de variables aleatorias cuya distribucion es conocida, excepto quizas por sus parametros,
Distribuci
on muestral de la media
1. Distribuci
on muestral de la media para una poblaci
on normal con varianza
conocida.
variables aleatorias normales. As pues, sabemos que si x1 , ..., xn , son variables aleatorias
un una N (i , i2 ), para i = 1, ..., n y si a1 , ..., an , son
independientes distribuidas seg
n
umeros reales, entonces la variable aleatoria
n
X
Y = ai xi = a1 x1 + ... + an xn
i=1
1.4 Distribuciones muestrales 27
n n
!
X X
sigue una distribucion N ai i , a2i i2
i=1 i=1
Este resultado nos sera de bastante utilidad para obtener la distribucion de la media
Teorema 1.4.3 Sea X1 , X2 , ..., Xn una muestra aleatoria extrada de una poblaci
on
se distribuye normal con
que se distribuye N (, 2 ). Entonces la media muestral, X,
2
media X = y varianza X
=
2
, N (, 2 )
es decir, X
n n
Ejemplo 1.4.4 Sea X1 , X2 , ..., X8 una muestra aleatoria extrada de una poblacion que
se distribuye N (5, 16), entonces por el teorema (??) se tiene que
X = = 5
2 2 16
X
= n
= 8
=2
N (5, 2)
Por lo tanto, X
X = = 20
2 2 144
X
= n
= 100
= 1,44
N (20; 1,44)
Por lo tanto, X
El resultado del teorema (??), permite hallar probabilidades sobre la media muestral,
lo cual como se vera mas adelante ayudara a medir el error al estimar un parametro
usando un estadstico.
28 Distribuciones Muestrales
X
Z= (1.4.1)
/ n
Ejemplo 1.4.6 El precio de venta de una casa nueva en Merida se distribuye Normal
con media 450000 BsF y desviacion tpica de 64000 BsF. Si se toma una muestra
a) Cu
al es la probabilidad de que la media muestral de los precios de venta sea menor
de 440000 BsF.? Se sabe que:
X = = 450000
2 2 640002
X
= n
= 100
= 40960000
x 440000 450000
P (
x < 440000) = P <
X 6400
= P (Z < 1,56) = 0,0594
b) Cu
al es la probabilidad de que la media muestral se encuentre en menos de 12000
P (|
x | < 12000) = P (12000 < x < 12000)
12000 x 12000
= P < <
6400 X 6400
= P (1,88 < Z < 1,88)
2. Distribuci
on muestral de la media para una poblaci
on normal con varianza
desconocida.
X
Cuando 2 es desconocido, la distribucion muestral de Z =
/ n
depende del tama
no
a) El tama
no de la muestra es grande (n 30).
Cuando el tama
no de la muestra es grande, es decir,(n 30) la distribucion del
estadstico:
X
Z=
/ n
30 Distribuciones Muestrales
Normal con media 450000 BsF. De una muestra aleatoria de 100 casas nuevas
de esta ciudad se obtuvo que la desviacion estandar era de 60000.Cual es la
probabilidad de que la media muestral de los precios de venta sea menor de 460000
BsF.?
x 460000 450000
P (
x < 460000) = P <
S/ n 60000/ 100
= P (Z < 1,67) = 0,9525
b) El tama
no de la muestra es peque
no (n < 30).
Si el tama
no de la muestra es peque
no, n < 30, los valores de la varianza muestral
Este problema fue resuelto en 1908 por el estadstico Gosset a partir del siguiente
teorema.
tadstico
X
T =
S/ n
t-Student, la cual como se vio antes, es el cociente entre una normal estandar y la
raz cuadrada de una chi-cuadrado sobre sus grados de libertad.
x 460000 450000
P (
x < 460000) = P <
S/ n 60000/ 100
= P (T < 1,67) 0,95
Ejercicios
a) n = 36, = 10, 2 = 9.
b) n = 100, = 5, 2 = 4.
c) n = 8, = 120, 2 = 1.
32 Distribuciones Muestrales
3. Una muestra aleatoria de n observaciones se4 elige de una poblacion con desviacion
estandar = 1. Calcule el error estandar de la media para estos valores de n
a. n = 1 b. n = 2 c. n = 4 d. n = 9 e. n = 16
f. n = 25 g. n = 100
muestral n y una los puntos con una curva uniforme. Cual es el efecto de aumentar el
tama
no de la muestra en el error estandar?.
en no mas de 4.
7. La vida media de unas bateras para radio portatil es 35 horas. La distribucion de los
tiempos de vida de estas bateras sigue una distribucion normal con desviacion estandar
de 5.5 horas. Como parte del programa de pruebas de sus artculos el fabricante de radios
8. Seg
un algunos estudios la estatura de los meride
nos se distribuye normal con media
1.70. De 50 meride
nos seleccionados al azar se obtuvo que la desviacion estandar era
de 0.10, cual es la probabilidad de que la estatura media de los 50 meride
nos este por
encima de 1.75?
BsF?.
34 Distribuciones Muestrales
10. Seg
un algunos estudios la edad de los meride
nos se distribuye normal con media 35
a
nos. De 25 meride
nos seleccionados al azar se obtuvo que la desviacion estandar era
de 5 a
nos, cual es la probabilidad de que la edad media de los 25 meride
nos este por
debajo de 38 a
nos?
11. El precio de los perros calientes en cierta ciudad sigue una distribucion normal cuyo
precio promedio es de 10 BsF. Una regulacion del gobierno establece que el precio de
los perros calientes no debe ser mayor a 9 BsF. Un estudio realizado en varios negocios
Distribuci
on muestral de la proporci
on
x
La proporcion de la poblacion se define como = N
, en donde x es el n
umero de elementos
que poseen cierta caracterstica y N es el n
umero total de elementos de la poblacion. De igual
considerar una proporcion como una proporcion de exitos, lo cual se obtiene dividiendo el
n
umero de exitos entre el tama
no muestral n.
exitos, depende de si la muestra se selecciona con o sin reemplazo, en el caso en que se hace
con reemplazo el n
umero de exitos x es una variable aleatoria que se distribuye binomial con
E(p) =
(1 )
V ar(p) =
n
Sea X = {N
umero de estudiantes que reprobaron el examen}. Como la selecci
on se
hace con reemplazo, entonces X bin(10; 0,20). Ahora, p = 0,30 es equivalente a
X = 3, por lo tanto,
10
P (p = 0,30) = P (X = 3) = (0,2)3 (1 0,2)7 = 0,2013
3
E(p) =
(1 ) N n
V ar(p) =
n N 1
36 Distribuciones Muestrales
Sea X = {N
umero de estudiantes que reprobaron el examen}. Como la selecci
on se
624
3
P (p = 0,30) = P (X = 3) = 307 = 0,2304
10
excepto por el factor que esta a la derecha del segundo caso, el cual se conoce como
Ejercicios
a) n = 10, p = 0,3
b) n = 15, p = 0,1
c) n = 5, p = 0,7
Distribuci
on muestral de la varianza
2. El estadstico n
X
(xi x)2
2
(n 1)S i=1
=
2 2
Ejemplo 1.4.11 Supongamos que las onzas de lquido que vierte una maquina embotelladora
tiene una distribucion normal con 2 = 1. Si se elige una muestra aleatoria de 10 botellas y
se mide la cantidad de lquido que contiene cada una,
(n1)S 2
En esta parte debemos hallar P (S 2 > 1,2), para ello usamos el hecho de que 2
2
2 (n 1)S 2 (10 1)1,2
P (S > 1,2) = P >
2 1
2
= P > 10,8 0,25(0,2897)
ciones?. En esta parte debemos hallar dos valores digamos b1 y b2 tales que
P (b1 S 2 b2 ) = 0,90
1.4 Distribuciones muestrales 39
2 (10 1)b1 (n 1)S 2 (10 1)b2
P (b1 S b2 ) = P < 2
<
1 1
9b1 9b2
= P < 2 < = 0,90
1 1
Ejercicios
Distribuci
on muestral de la diferencia entre 2 medias
poblaciones. Por ejemplo, suponga que se esta interesado en comparar los tiempos medios de
por compa
nas distintas y con diferentes procesos de fabricacion. Por tanto, los artefactos
producidos por cada compa
na tendran una distribucion diferente, una de la otra, en los
tiempos de duracion.
va a estudiar por separado cuando las varianzas poblacionales son conocidas y cuando son
desconocidas.
Teorema 1.4.6 Sean X11 , X12 , ..., X1n1 una muestra aleatoria extrada de una
on que se distribuye N (1 , 12 ) y X21 , X22 , ..., X2n2 una muestra aleatoria ex-
poblaci
on que se distribuye N (2 , 22 ), independientes, y supongamos que
trada de una poblaci
se distribuye normal
12 y 22 son conocidas. Entonces la diferencias de medias, X,
2 12 22 2
N (, 1 + 22
con media = 1 2 y varianza =
X n1
+ n2
, es decir, X n1 n2
).
1.4 Distribuciones muestrales 41
X
Z= q 2 N (0, 1)
1 22
n1
+ n2
= E(
E(X) x1 x2 ) = E(
x1 ) E(
x 2 ) = 1 2
= V ar( 12 22
V ar(X) x1 x2 ) = V ar(
x1 ) + V ar(
x2 ) = n1
+ n2
Ejemplo 1.4.12 Sean X11 , X12 , ..., X18 una muestra aleatoria extrada de una
poblaci
on que se distribuye N (5, 16) y X21 , X22 , ..., X25 una muestra aleatoria extrada
de una poblaci
on que se distribuye N (8, 25), entonces por el teorema (??) se tiene que
X = 1 2 = 5 8 = 3
2 12 22 16 25
=
X n1
+ n2
= 8
+ 5
=7
N (3, 7)
Por lo tanto, X
Al igual que para una muestra, el resultado del teorema (??), permite hallar
probabilidades sobre la diferencia de medias muestrales, lo cual como se vera mas
adelante ayudara a medir el error al estimar un parametro usando un estadstico.
Ejemplo 1.4.13 El precio de venta de una casa nueva en Merida se distribuye Normal
con media 450000 BsF y desviacion tpica de 64000 BsF, en cambio en San Cristobal
se distribuye Normal con media 440000 BsF y desviacion tpica de 36000 BsF. Si se
toma una muestra aleatoria de 100 casas nuevas en Merida y 120 en San Cristobal .
42 Distribuciones Muestrales
Cual es la probabilidad de que el precio promedio de venta sea mayor en Merida que
en San Cristobal?
Consideremos a Merida la poblaci
on 1 y a San Cristobal la poblaci
on 2, entonces
2 12 22 640002 360002
=
X n1
+ n2
= 100
+ 120
= 51760000
= x1 x2 N (10000, 51760000).
por lo tanto, X
As,
P (
x1 > x2 ) = P (
x1 x2 > 0) = P (X > 0)
X 0 10000
= P >
X 51760000
= P (Z > 1,39) = 0,9177
a) Tama
no de las muestras son mayores que 30
Si el tama
no de cada muestra es mayor que 30, la distribucion muestral de la
2 2
diferencia de medias sigue siendo normal pero sustituyendo por SX
X =
1.4 Distribuciones muestrales 43
S12 S22
n1
+ n2
. Es decir,
N (, S 2 )
X X
era 25, y para 60 estudiantes de la UDO se obtuvo que la varianza era de 16. Si
se suponen que las poblaciones son normales.
2 S12 S22 25 16
= 1 2 = 22 24 = 2 S =
X + = + = 0,77
n1 n2 50 60
N (2; 0,77)
Es decir, X
44 Distribuciones Muestrales
P (|
x1 x2 | > 2) = P (
x1 x2 > 2) + P (
x1 x2 < 2)
X 2 (2)
= P >
SX 0,77
X 2 (2)
+ P <
SX 0,77
= P (Z > 4,55) + P (Z < 0) = 0 + 0,50 = 0,50
b) Tama
no de al menos una de las muestras es menor que 30
Cuando las varianzas poblacionales son desconocidas y al menos uno de los
tama
nos muestrales es menor que 30, al igual que en el caso de una poblacion, se
tiene que el estadstico
X
T =
SX
s r
(n1 1)S12 + (n2 1)S22 1 1
SX = +
n1 + n2 2 n1 n2
v = n1 + n2 2
1.4 Distribuciones muestrales 45
s
S12 S22
SX = +
n1 n2
2
S12 S22
n1
+ n2
v= (S12 /n1 )2 (S22 /n2 )2
n1 1
+ n2 1
ni
nos de primaria que se eligieron en forma aleatoria y se realiz
o una comparaci
on
con base en una prueba de comparaci
on de lectura al final del perodo de ense
nanza.
La siguiente tabla resume los valores de las medias muestrales y las varianzas
Metodo 1 Metodo 2
N
umero de ni
nos 11 14
Media 64 69
Varianza 52 71
que
= 1 2 = 264 69 = 5
46 Distribuciones Muestrales
s r
(n1 1)S12 + (n2 1)S22 1 1
SX = +
n1 + n2 2 n1 n2
r r
(11 1)52 + (14 1)71 1 1
= +
11 + 14 2 11 14
= 3,19
Por lo tanto,
P (
x1 x2 < 0) = P (X < 0)
X 0 (5)
= P <
SX 3,19
= P (T < 1,57) 0,95
Ejercicios
1. La duracion (en meses) de dos marcas de bateras se distribuyen normal con medias
2. Una tienda por departamentos tiene dos planes de cuentas de cargo disponibles para sus
1.4 Distribuciones muestrales 47
clientes con cuenta corriente de credito. Los saldos de cada plan se distribuyen normal
con medias 15000 BsF y 18000 Bs, respectivamente. La tienda selecciono una muestra
aleatoria de 40 cuentas del plan A y 40 cuentas del plan B, obteniendo que las medias
y las desviaciones estandar eran 12750 y 2550 para el plan A y 18700 y 2404 para el
plan B. cual es la probabilidad de que los saldos promedios del plan A sean menor que
3. Una tienda por departamentos tiene dos planes de cuentas de cargo disponibles para sus
clientes con cuenta corriente de credito. Los saldos de cada plan se distribuyen normal
con medias 15000 BsF y 18000 Bs, respectivamente. La tienda selecciono una muestra
aleatoria de 25 cuentas del plan A y 20 cuentas del plan B, obteniendo que las medias
y las desviaciones estandar eran 12750 y 2550 para el plan A y 18700 y 2404 para el
plan B. cual es la probabilidad de que los saldos promedios del plan A sean mayor que
que la diferencia entre las dos medias de poblacion correspondientes sea mayor de 40
horas?.
iguales.
la del plan B.
Distribuci
on muestral del cociente de varianzas
1. 1 y 2 son conocidas
2. 1 y 2 son desconocidas
utilizar para el calculo de las varianzas muestrales S12 y S22 ; y como las muestras son
n
1 X
S12 = (x1i 1 )2
n1 i=1
n
1 X
S22 = (x2i 2 )2
n2 i=1
Xn n 2
n1 S12 X x1i 1
n1 S12 = 2
(x1i 1 ) 2
= 2n1
i=1
1 i=1
1
1.4 Distribuciones muestrales 49
Xn n 2
n2 S22 X x2i 2
n2 S22 = 2
(x2i 2 ) 2
= 2n2
i=1
2 i=1
2
independientes divididas cada una de ellas por sus grados de libertad, se tiene que:
n1 S12
12
/n1 S12 22
F = = Fn1 ,n2
n2 S22
/n2 S22 12
22
2. 1 y 2 son desconocidas
Al ser desconocidas las medias poblacionales, que sera lo que casi siempre ocurra, y ser
las muestras independientes y ademas procedentes de distintas poblaciones, entonces
los estadsticos:
n
1 X
S12 = (x1i x1 )2
n1 1 i=1
n
1 X
S22 = (x2i x2 )2
n2 1 i=1
n
X n 2
(n1 1)S12 X x1i x1
(n1 1)S12 = 2
(x1i x1 ) = 2n1 1
i=1
12 i=1
1
n
X n 2
(n2 1)S22 X x2i x2
(n2 1)S22 = 2
(x2i x2 ) = 2n2 1
i=1
22 i=1
2
50 Distribuciones Muestrales
(n1 1)S12
12
/n1 1 S12 22
F = = Fn1 1,n2 1
(n2 1)S22
/n2 1 S22 12
22
resultados de la prueba. Si se supone que las puntuaciones obtenidas por cada metodo
son normales cuyas varianzas poblacionales son 60 y 75 respectivamente, calcule la
Metodo 1 Metodo 2
N
umero de ni
nos 11 14
Media 64 69
Varianza 52 71
El segundo metodo presente mayor variabilidad que el primero, esta representado por
el evento S12 < S22 . Como la medias poblacionales son desconocidas, se tiene que:
S12
P (S12 < S22 ) = P <1
S22
2 2
S1 2 75
= P <1
S22 12 60
= P (F < 1,25) 0,3466
1.4 Distribuciones muestrales 51
Ejercicios
Distribuci
on muestral de la Diferencia de Proporciones
tama
no de la muestra es grande comparado con el tama
no de la poblacion, podemos usar
Teorema 1.4.7 Sea X1 , X2 , ..., Xn una muestra aleatoria de una distribucion con media y
n
X
Y = Xi
i=1
52 Distribuciones Muestrales
Distribuci
on muestral de la media
tales casos la distribucion muestral del estadstico media muestral x, sera aproximadamente
normal. Dicho resultado se ve en el siguiente corolario
Corolario 1.4.7.1 Sea x1 , x2 , ..., xn una muestra aleatoria extrada de una poblaci
on cuya
on no es normal, pero que se sabe que tiene media y varianza 2 , esta u
distribuci ltima
n
X
Xi
= i=1 2
X N ;
n n
n
X
Xi
= i=1 S2
X N ;
n n
Ejemplo 1.4.17 Cierta fabrica produce alambres de acero que tiene una media de resistencia
a la tracci
on de 500 libras y una desviacion estandar de 20 libras. Si se extrae una muestra
1.4 Distribuciones muestrales 53
Ejercicios
profesores de una base de datos del personal para estas instituciones en Venezuela.
b) Dentro de que lmites esperara usted que se ubicara el promedio muestral con
probabilidad 0.95?
c) Calcule la probabilidad de que la media muestral sea mayor que 67000 BsF.?
y enviar una determinada forma fiscal. Una agencia de investigacion encuentra en una
3. En Venezuela la edad promedia en la que los hombres se casan por primera vez es 24.8
a
nos. No se conoce ni la forma ni la desviacion estandar de la poblacion. Cual es la
b) Cual es la probabilidad de que la media muestral sea mayor que 22.5 y menor
que 25 BsF?.
5. La media de una poblacion de forma desconocida es 75. Se toma una muestra de 40.
muestral
1.4 Distribuciones muestrales 55
Distribuci
on muestral de la varianza
Distribuci
on muestral de la proporci
on
p N (p ; p2 )
donde
x 1 1
p = E(p) = E = E(x) = n =
n n n
x 1 1 (1 )
p2 = V ar(p) = V ar = 2
V ar(x) = 2 n(1 ) =
n n n n
Distribuci
on muestral de la diferencia de medias
Si las poblaciones de donde se extraen las muestras no son normales, pero los tama
nos de
Corolario 1.4.7.2 Sean x11 , x12 , ..., x1n y x21 , x22 , ..., x2n muestras aleatorias extradas de
poblaciones cuya distribucion no es normal, pero que se sabe que tienen medias 1 y 2 y
varianza 12 y 22 , respectivamente, estas u
ltimas puede ser o no conocidas. De acuerdo con
donde
2 12 22
= 1 2 =
X +
n1 n2
N (; S 2 )
X X
donde
2 S12 S22
= 1 2 S =
X +
n1 n2
Ejercicios
a) la marca A tendra una media de vida de por lo menos 160 horas mas que B
b) La marca A tendra una media de vida de por lo menos 250 hora mas que B
3. El sueldo anual de los profesores en cierta ciudad es de 120000 BsF como promedio,
con una desviacion estandar de 10000 BsF. En la misma ciudad, el salario anual de los
medicos es de 150000 BsF como promedio, con una desviacion estandar de 15000 BsF.
60000 BsF?.
Distribuci
on muestral del cociente de varianzas
Distribuci
on muestral de la Diferencia de Proporciones
p = p1 p2
p = 1 2
y varianza
2 1 (1 1 ) 2 (1 2 )
p = +
n1 n2
es decir,
2
p N (p ; p )
Ejercicios
1. Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en
sus opiniones sobre la promulgacion de la pena de muerte para personas culpables de
asesinato. Se cree que el 12 % de los hombres adultos estan a favor de la pena de muerte,
mientras que solo 10 % de las mujeres adultas lo estan. Si se pregunta a dos muestras
2. Una encuesta del Boston College consto de 320 trabajadores de Michigan que fueron
despedidos entre 1979 y 1984, encontro que 20 % haban estado sin trabajo durante por
lo menos dos a
nos. Supongase que tuviera que seleccionar otra muestra aleatoria de 320
1.5 Ejercicios Varios 59
trabajadores de entre todos los empleados despedidos entre 1979 y 1984. Cual sera la
probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo
menos dos a
nos, difiera del porcentaje obtenido en la encuesta de Boston College, en
5 % o mas?
3. Se sabe que 3 de cada 6 productos fabricados por la maquina 1 son defectuosos y que 2
en una poblacion una distribucion Normal de media 100 y desviacion tpica 16. Si
extraemos de esa poblacion una muestra aleatoria simple de 25 individuos
102?
d ) Que valores debera tomar la media aritmetica para que exista una probabilidad
e) Que tama
no tendra que tener la muestra para que la probabilidad de encontrar
3. Se sabe que 5 de cada 8 productos fabricados por la maquina 1 son no defectuosos y que
3 de cada 5 objetos fabricados por la maquina 2 son defectuosos; se toman muestras de
100 objetos de cada maquina:
b) Cual es la probabilidad de que la media muestral sea mayor que 32.5 y menor
que 35 BsF?.
6. Un partido poltico cree que el 60 % del electorado esta a favor de su programa. Como
su lder encuentra que esta prediccion es demasiado optimista decide hacer un sondeo
con una muestra de 90 personas. Cual sera la probabilidad de que como maximo 60
personas esten a favor de su partido?
7. Disponemos de los datos del I.N.E. (Instituto Nacional de Estadstica) sobre el aumento
del empleo durante el a
no 98, el cual se encuentra en un 45 %. Si tomamos una muestra
aleatoria de 200 ciudadanos. Cual es la probabilidad de que mas del 50 % tenga empleo?
exceda de 3.7.
b) Calcular la probabilidad de que X?
9. Las puntuaciones obtenidas en la escala de Locus de Control de James por los sujetos
depresivos, siguen una distribucion Normal de media 90 y desviacion tpica 12. Si
10. Un economista piensa que el incremento salarial de los empleados del sector bancario
sigue una distribucion normal con desviacion tpica 3.37. Se toma una muestra aleatoria
a) Hallar la probabilidad de que la desviacion tpica muestral sea menor que 1.99.
b) Hallar la probabilidad de que la desviacion tpica muestral sea mayor que 2.89.
todas las ni
nas de sexto grado de esa escuela es de 85 libras y su desviacion estandar
es de 12.247 libras. Cual es la probabilidad de que el promedio de los pesos de los 20
ni
nos sea al menos 20 libras mas grande que el de las 25 ni
nas?.
13. El encargado de una sala de cine esta interesado en conocer la edad de su clientela.
Para ello, decide preguntar las edades a 10 clientes seleccionados al azar. Suponiendo
a) Deducir las expresiones del valor esperado y la varianza de la media de las edades
personas. Determinar:
inferior a 25 a
nos?
14. Sean S12 y S22 las varianzas muestrales de dos muestras independientes de tama
no 5 y
15. En Merida la edad promedio en la que las mujeres se casan por primera vez es 18
a
nos. No se conoce ni la forma ni la desviacion estandar de la poblacion. Cual es la
probabilidad de encontrar en una muestra de 50 mujeres que la edad promedio a la que
16. La media de una poblacion de forma desconocida es 75. Se toma una muestra de 40.
La desviacion estandar de la muestra es 5. Calcule la probabilidad de que la media
muestral
17. El tiempo que un trabajador necesita para completar cierta tarea tiene media de 50
minutos y desviacion tpica de 8 minutos. Un supervisor registra los tiempos empleados
de donde se obtiene que las varianza son 10,000 horas2 para la marca A y 40,000 horas2
para la marca B; determine la probabilidad de que
a) la marca A tendra una media de vida de por lo menos 160 horas mas que B
b) La marca A tendra una media de vida de por lo menos 250 hora mas que B