Distribuciones en El Muestreo - Pdf-Proporcion

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 65

CAPITULO 1

DISTRIBUCIONES MUESTRALES

1.1. Introducci
on.

Para el estudio de un fenomeno, se requiere contar con informacion relacionada con el


mismo. Esta informacion obtenida bien sea experimentalmente o, mediante la observacion,
esta dada por datos. Estos datos son el resultado de medir en un conjunto de elementos o

individuos, una o varias caractersticas a ser analizadas en una investigacion. Ahora bien,

el analisis puede llevarse a cabo en base a toda o, a una parte de la poblacion. Si se hace

uso de toda la informacion, decimos que se ha hecho una investigacion exhaustiva o total
(censo). No siempre es posible realizar un censo, por razones como; costos, tiempo, poco

practico, etc. Es necesario entonces, en estos casos, llevar a cabo una investigacion parcial.
La misma consiste en realizar el analisis en base a la informacion correspondiente a un

subconjunto de los elementos o individuos, una muestra, de forma tal que a un costo y esfuerzo

razonable se logren obtener conclusiones tan validas como las que se obtendran realizando

1
2 Distribuciones Muestrales

una investigacion exhaustiva o total, un censo. Consideremos los siguientes ejemplos:

1. Para conocer la nota promedio de los estudiantes de la Universidad de Los Andes

(N
ucleo Merida), se debe ir a las oficinas de registros estudiantiles de todas las facultades

y solicitar all las notas de los estudiantes, dicha tarea no es facil por distintas razones,
entre las cuales se puede mencionar la confidencialidad de la informacion. Por tal razon,

a traves de una encuesta a cierto n


umero de estudiantes se puede determinar la nota

promedio de dicho grupo, y a partir de ese resultado dar una conclusion sobre la

poblacion.

2. Si se quisiera conocer el sueldo promedio del venezolano, sera difcil tener acceso al
sueldo de todos los venezolanos, al igual que en el caso anterior solo se podra obtener
dicha informacion de una parte de los venezolanos.

3. Para determinar el nivel de aceptacion o rechazo que tiene un candidato a gobernador,


no es necesario realizar el sondeo de opinion sobre todos los habitantes del Estado,
a
un queriendo recoger dicha opinion sera muy costosa. Es por ello que las empresas

encuestadoras realizan el sondeo sobre una parte de la poblacion y a partir de ella se

interpreta como esta el candidato en dicho Estado.

1.2. Conceptos B
asicos

Definici
on 1.2.1 (Universo) Es el conjunto de individuos o elementos (Personas, Fabric-

as, Familias, etc) que poseen caractersticas en com


un que se desean investigar.

Ejemplo 1.2.1 :
1.2 Conceptos Basicos 3

1. Los habitantes de la ciudad de Merida

2. Los estudiantes de la Facultad de Ciencias Econ


omicas y Sociales.

3. Trabajadores de una empresa.

4. Los animales en un bosque.

5. Los carros que entran en un estacionamiento al da.

Definici
on 1.2.2 (Poblaci
on) Es el conjunto de todas las posibles mediciones que pueden

hacerse de una o mas caractersticas en estudio de los elementos del universo. Por lo tanto,
la poblaci
on esta constituida por valores o datos bien sea numericos o no.

Ejemplo 1.2.2 :

1. El sexo de los habitantes de la ciudad de Merida

2. La edad de los estudiantes de la Facultad de Ciencias Econ


omicas y Sociales.

3. El sueldo de los trabajadores de una empresa.

4. El color de ojos de los animales en un bosque.

5. La marca de los carros que entran en un estacionamiento al da.

Observese que una Poblacion puede ser univariante o multivariante, dependiendo del n
umero
de caractersticas consideradas. De acuerdo al n
umero que la constituye, la poblacion puede

ser finita o infinita. En el caso de que la poblacion sea finita, se dice que esta tiene tama
no

N.
4 Distribuciones Muestrales

Definici
on 1.2.3 (Muestra) Es una parte de una poblaci
on, idealmente representativa de
la misma.

Ejemplo 1.2.3 :

1. El sexo de 2000 habitantes de la ciudad de Merida mayores a 60 a


nos.

2. La edad de 150 estudiantes de la Facultad de Ciencias Econ


omicas y Sociales que tienen

un promedio mayor a 15 puntos.

3. El sueldo de 25 trabajadores de una empresa.

4. La marca de los primeros 100 carros tipo sedan que entran en un estacionamiento un
determinado da.

Definici
on 1.2.4 (Par
ametro) Es una funcion de los valores de la poblaci
on que sirve

para sintetizar alguna caracterstica relevante de la misma. Es una medida resumen que se
calcula para describir una caracterstica de toda una poblaci
on. Ejemplos de par
ametros son:
La media poblacional, La proporci
on poblacional, la varianza poblacional, entre otros.

Definici
on 1.2.5 (Estadstico) Se denomina estadstico a toda funcion medible de los
elementos de una muestra en la que no intervienen par
ametros.

Supongase que tenemos una variable aleatoria, cuya distribucion es f (x) y supongamos,

por simplicidad, que obtenemos una muestra aleatoria simple de tama


no n, X1 , X2 , ...Xn .

Entonces, un estadstico es cualquier funcion h definida sobre X1 , X2 , ...Xn y que no incluye

parametro desconocido alguno:

Y = h(X1 , X2 , ...Xn )

Entre los estadsticos mas usados se pueden mencionar:


1.2 Conceptos Basicos 5


La media muestral (X)

La varianza muestral (S 2 )

La proporcion muestral (p).

El mnimo, el maximo y el rango.

Formalmente, la caracterstica de estudio se define como una variable aleatoria X la cual tiene

una funcion de distribucion (FD) F , que define el comportamiento de dicha caracterstica.

Por ejemplo, para el caso de la nota de los estudiantes la variable aleatoria X representa la
nota de los estudiantes de la ULA la cual se distribuye normal con media 15 y varianza 4.
Existen dos posibilidades sobre la FD de X:

1. X tiene una FD F () con una forma funcional conocida, excepto quizas por el parametro
, el cual puede ser un vector. En este caso el trabajo de un estadstico es decidir sobre

la base de una muestra seleccionada cual es el valor de que representa la FD de X. Por


ejemplo, para el caso de la nota promedio se sabe que X N (, 2 ) con 2 conocida,
por lo tanto basandose en una muestra se puede determinar cual debe ser el valor de

y de esta manera queda determinada completamente la distribucion de probabilidad

de X.

2. X tiene una FD F de la cual no se sabe nada (excepto quizas que F es, digamos,
absolutamente continua). Este caso es mas difcil que el anterior y este tipo de problemas

entran en el dominio de la estadstica no parametrica, la cual no sera estudiada en este

curso.
6 Distribuciones Muestrales

1.2.1. Ejercicios

1. Defina los siguientes terminos en su propio lenguaje. De ejemplos de cada uno

a) Universo, poblacion y muestra.

b) Parametro y Estadstico.

2. Identifique cuales simbolos definen los parametrso y cuales los estadsticos en el caso

de la media, la varianza y la proporcion.

3. Explique si en los casos siguientes manejamos una poblacion o una muestra:

a) Un campesino tiene 87 gallinas. Para determinar si un nuevo alimento es eficaz,


las pesa a todas antes y despues de los 55 das durante los cuales las alimenta.

b) Un granjero prueba con 100 de sus gallinas si un nuevo tipo de alimentacion mejora

el rendimiento.

1.3. Muestreo

En las Ciencias Sociales, las investigaciones consideran, en su mayora, muestras y no


poblaciones. Por lo tanto, la seleccion de muestras es un problema crucial en Estadstica.

Algunas razones que justifican el uso del muestreo son:

1. Naturaleza destructiva del proceso de investigacion.

2. Imposibilidad de revisar todos los elementos de la poblacion.

3. Costo. Al obtener los datos de una peque


na porcion del total, los gastos son menores a

los que se tendran si se llevara a cabo un censo.


1.3 Muestreo 7

4. Tiempo. Al considerar solo una parte del total, su recoleccion y resumen se hara con
mayor rapidez. Razon de peso cuando la informacion es requerida con urgencia.

5. Precision. Las posibilidades de usar personal mas capacitado y supervisar cuidadosa-


mente el trabajo de campo y el procesamiento de al informacion, inciden en la obtencion
de resultados mas exactos.

Cuando se selecciona una muestra se deben tomar en cuenta las siguientes consideraciones:

Elegir el tama
no de la muestra, lo cual depende no solamente de la cantidad de informacion

que se quiere conseguir, y el grado de certeza deseada, sino tambien del costo del muestreo y

la seleccion de los elementos que la constituyen. Cualquiera sea el metodo elegido, el requisito
mas importante es que la muestra obtenida proporcione una imagen tan real como sea posible
de aquella poblacion que se ha sometido al muestreo.

Definici
on 1.3.1 (Muestreo) Proceso de medici
on de la informacion en solo una parte de

la poblaci
on estadstica. Se define como el proceso de seleccionar un n
umero de observaciones
(sujetos) de un grupo en particular de la poblaci
on (metodos para seleccionar muestras), que
se utiliza cuando no es posible contar o medir todos los elementos de la poblaci
on objeto de
estudio.

1.3.1. Tipos de Muestreo

Existen dos metodos para seleccionar muestras de poblaciones:

1. Muestreo no aleatorio o de juicio: Es practica com


un seleccionar una muestra en forma

intencional, de acuerdo a opiniones o criterios personales, fundamentalmente con el


8 Distribuciones Muestrales

objeto de obtener informacion sin mucho costo. A este tipo de muestreo se le denomina
Muestreo no probabilstico, no aleatorio o de juicio.

Este tipo de muestreo como puede observarse, no involucra ning


un elemento aleatorio
en el procedimiento de seleccion. Sin embargo, es importante resaltar que en condiciones

apropiadas estos metodos pueden ofrecer resultados u


tiles, por ejemplo, cuando solo se
necesitan estimaciones gruesas, las cuales no van a ser utilizadas para tomar decisiones
importantes. Son ejemplos de muestreos no probabilsticos:

a) La muestra es restringida a la parte de la poblacion que es facilmente accesible.

b) La muestra consiste de los elementos que esten mas a la mano

c) Se selecciona un grupo de unidades tipo.

d ) La muestra esta compuesta por voluntarios.

2. Muestreo aleatorio o probabilstico: En el cual todos los elementos de la poblacion


tienen la oportunidad de ser escogidos para la muestra. Este procedimiento da a cada
elemento de la poblacion una probabilidad de ser seleccionado. Dentro de este tipo de

muestreo se encuentran:

a) Muestreo aleatorio simple: el cual es un metodo de seleccion de muestras que

permite que cada muestra posible pueda ser elegida con la misma probabilidad.

Por su parte cada elemento de la poblacion tiene la misma oportunidad de ser

incluido en la muestra.

b) Muestreo sistematico: metodo en el cual los elementos que se muestrearan se

seleccionan de la poblacion en un intervalo uniforme que se mide con respecto

al tiempo, al orden o al espacio.


1.3 Muestreo 9

c) Muestreo estratificado: metodo en el que la poblacion se divide en grupos


homogeneos, o estratos, y despues se toma una muestra aleatoria simple de cada
estrato. Aqu la variabilidad dentro de cada grupo es peque
na y entre los grupos

es grande.

d ) Muestreo por conglomerados: metodo en el que la poblacion se divide en grupos o


racimos de elementos, y luego se selecciona una muestra aleatoria de estos racimos.

La variabilidad dentro de cada grupo es grande y entre los grupos es peque


na; es

como si cada conglomerado fuese una peque


na representacion de la poblacion en

si misma.

1.3.2. M
etodos para seleccionar una muestra aleatoria.

Al seleccionar una muestra aleatoria se debe tomar en cuenta si la extraccion se va realizar


con reemplazo o sin reemplazo, en el primer caso, una vez extrada el elemento de la poblacion
este puede ser devuelto a la misma, en el segundo caso esto no es posible.

Existen varios metodos para seleccionar una muestra, entre los cuales se pueden
mencionar: Metodo del bingo, Tabla de N
umeros aleatorios y generacion de n
umeros
pseudoaletorios.

1. Metodo del bingo. Consiste en etiquetar N papeles, bolas o cualquier otro objeto del 1 al

N e introducirlas en una urna o bolsa y agitarla hasta que queden bien mezcladas, luego

extraer una a la vez hasta que se hayan seleccionado n artculos donde n es el tama
no
deseado de la muestra. Los miembros de la poblacion que correspondan a los n
umeros

de los artculos extrados son incluidos en la muestra, y las caractersticas de estas

unidades se miden u observan. Si la poblacion es bastante grande, este metodo mecanico


10 Distribuciones Muestrales

de seleccion aleatoria puede ser difcil o practicamente imposible de implementar. Esto


nos lleva a la consideracion de la tabla de n
umeros aleatorios.

2. Tabla de N
umeros aleatorios. Las Tablas de N
umeros Aleatorios contienen los dgitos
0, 1, 2, ..., 7, 8, 9. Tales dgitos se pueden leer individualmente o en grupos y en cualquier

orden, en columnas hacia abajo, columnas hacia arriba, en fila, diagonalmente, etc.,

y es posible considerarlos como aleatorios. Las tablas se caracterizan por dos cosas
que las hacen particularmente u
tiles para el muestreo al azar. Una caracterstica es

que los dgitos estan ordenados de tal manera que la probabilidad de que aparezca

cualquiera en un punto dado de una secuencia es igual a la probabilidad de que


ocurra cualquier otro. La otra es que las combinaciones de dgitos tienen la misma
probabilidad de ocurrir que las otras combinaciones de un n
umero igual de dgitos.

Estas dos condiciones satisfacen los requisitos necesarios para el muestreo aleatorio,
establecidos anteriormente. La primera condicion significa que en una secuencia de
n
umeros, la probabilidad de que aparezca cualquier dgito en cualquier punto de la

secuencia es 1/10. La segunda condicion significa que todas las combinaciones de dos
dgitos son igualmente probables, del mismo modo que todas las combinaciones de tres

dgitos, y as sucesivamente. Para utilizar una Tabla de N


umeros Aleatorios:

a) Hacer una lista de los elementos de la poblacion.

b) Numerar consecutivamente los elementos de la lista, empezando con el cero (0, 00,

000, etc.).

c) Tomar los n
umeros de una Tabla de N
umeros Aleatorios, de manera que la

cantidad de dgitos de cada uno sea igual a la del u


ltimo elemento numerado
1.3 Muestreo 11

de su lista. De ese modo, si el u


ltimo n
umero fue 18, 56 o 72, se debera tomar un
n
umero de dos digitos.

d ) Omitir cualquier dgito que no corresponda con los n


umeros de la lista o que repita
cifras seleccionadas anteriormente de la tabla. Continuar hasta obtener el n
umero
de observaciones deseado.

e) Utilizar dichos n
umeros aleatorios para identificar los elementos de la lista que se
habran de incluir en la muestra.

La tabla ?? es un fragmento de una tabla de n


umeros aleatorios.

Para ilustrar el uso de la tabla de n


umeros aleatorios se dara el siguiente ejemplo:

Ejemplo 1.3.1 Suponga que se tienen 40 latas de refrescos, y que se desea tomar una
muestra de tama
no n = 4 para estudiar su condici
on. El primer paso es numerar las

latas de 1 a 40 o apilarlas en alg


un orden de tal forma que puedan ser identificadas.
En la tabla de n
umeros aleatorios, los numeros deben escogerse de dos dgitos porque

la poblaci
on de tama
no N = 40 es un n
umero de dos dgitos. Luego se selecciona
arbitrariamente una fila y una columna de la tabla. Suponga que la selecci
on es la
fila 6 y la columna 4. Se leen los pares de dgitos a partir de la fila 6 y la columna

4 y moviendonos hacia la derecha, ignorando los n


umeros mayores que 40 y tambien

cualquier n
umero repetido cuando aparezca una segunda vez. Se contin
ua leyendo pares
de dgitos hasta que cuatro unidades diferentes hayan sido seleccionadas, es decir lo

numeros 05, 20, 08 y 17. Por lo tanto, las latas con la etiqueta correspondiente a
dichos numeros constituyen la muestra.

3. Generacion de n
umeros pseudoaletorios. Existen metodos mas eficaces para generar
12 Distribuciones Muestrales

Tabla 1.1: Tabla de Numeros Aleatorios


6017 2438 3828 2161 6601 8762 8166 3756 6483 7405 6595 8695
3268 5788 5965 4427 9227 8468 1298 4343 1346 0861 5400 5286
0632 5878 0726 5624 7813 7905 9611 3839 6226 3452 7352 9818
0372 1222 1781 0216 5798 5805 3719 3155 6336 4710 7311 5553
3132 3375 7801 2782 1500 4249 4702 1799 9587 2788 7421 3631
3213 0670 1158 0562 6208 6641 5057 1747 7559 0548 9614 6265
6075 7161 6505 0599 1398 2947 7797 0038 4414 3904 8021 5093
2009 3799 8336 8189 8441 5748 3587 9128 2088 8840 6838 5810
8964 8261 1914 4651 9081 3202 9692 5605 7902 9525 4932 9719
7080 9448 848 8331 9069 4214 3824 2350 4986 8556 5394 1971
4098 6758 9526 6559 5435 6428 6362 7876 7746 3562 1567 7828
3328 3604 7368 9744 8842 0456 6317 0218 3826 6603 4549 2501
9976 8845 6219 2593 8337 2222 7455 1587 2778 6178 6670 4229
6420 0204 3168 5283 6869 1675 0408 7816 9054 1931 1771 3513
6523 7018 0413 5606 2869 5234 5344 5181 2457 9569 6402 9317
7475 2647 8714 6275 9693 5937 0516 1304 1156 4133 3926 1961
4928 3235 0889 1701 3778 4803 3637 6609 1152 6832 9422 8956
8355 2702 0780 5091 6964 6693 7576 9651 3543 2515 6981 4808
0084 7215 6568 4753 0215 4797 2589 2416 4746 2469 2613 7049
6319 5007 4973 3050 7658 6044 3277 2416 5823 0871 2378 0150
7335 6191 6314 2974 2783 6280 8045 6139 1575 7728 4264 4703
0164 0416 8561 4309 6759 1658 1085 6807 4425 7435 5645 4685
8751 7452 7483 5945 2360 3542 7421 9632 5936 9718 3034 7107
6070 4807 2681 1311 2724 4979 6886 2426 4486 2350 1654 4411
8094 4307 6627 6067 2654 2265 9557 4753 3174 2253 1168 2303
2778 6633 6219 4301 5528 2485 3996 5792 1741 4351 5324 4159
7672 7480 2976 3952 3061 8719 4613 2271 8921 0848 8062 1366
1449 3173 4095 2528 6684 9596 4762 1133 1784 9004 9366 1677
2984 3961 0226 3491 5758 6907 6856 1359 2532 8928 2850 3798
7555 6049 9829 9473 2554 3600 7892 5033 3341 9106 1410 8797
3396 2295 4353 3021 2301 2286 3185 3869 8153 4610 1727 7306
3918 7558 0051 2230 4406 3649 3782 904 9778 665 1244 7495
6409 0063 7009 8758 165 6838 8588 5394 3374 5671 1602 7046
8988 1154 5907 4063 5507 4041 9653 4945 7381 3262 0685 9314
2707 4234 8884 2974 2233 1364 7361 3152 7014 2511 1262 8569
9142 2225 5394 5404 8837 5374 1564 7192 8456 8702 1522 0684
4761 7781 7083 3070 5232 1600 3057 8561 7477 6097 0544 3517
4826 4927 7133 9985 3409 8105 989 2252 2316 8041 0427 0619
8877 9409 3631 3490 5633 5940 5279 1804 1161 5940 4524 0521
1704 4912 6705 872 8505 7423 2394 5924 9999 2517 5588 9043
2082 1149 1280 6903 8462 362 947 9180 8758 4187 8528 9004
1.3 Muestreo 13

n
umeros aleatorios, en muchos de los cuales se utilizan calculadoras o computadoras.
La mayora de los paquetes estadsticos generan numeros pseudoaleatorios y en excel
usando la funcion aleatorio() se pueden generar dichos n
umeros.

1.3.3. Error de Muestreo.

Es el error que se comete debido al hecho de dar conclusiones sobre cierta realidad, a partir

de la observacion de solo una parte de ella, es decir, es la diferencia entre el parametro de la


poblacion y el estadstico de la muestra utilizado para estimar el parametro.

Ejemplo 1.3.2 Se toman muestras de tama


no 2 de una poblaci
on consistente en tres valores,
2, 4, 6, 8 y 10 para simular una poblaci
on grandede manera que el muestreo pueda realizarse
un gran n
umero de veces, supondremos que este se hace con reemplazo, es decir, el n
umero

elegido se reemplaza antes de seleccionar el siguiente, ademas, se seleccionan muestras

ordenadas. En una muestra ordenada, el orden en que se seleccionan las observaciones es

importante, por tanto, la muestra ordenada (2,4) es distinta de la muestra ordenada (4,2).
En la muestra (4,2), se seleccion
o primero 4 y despues 2.
2+4+6+8+10
La media poblacional es igual a = 5
= 6.
La siguiente tabla contiene una lista de todas las muestras ordenadas de tama
no 2 que

es posible seleccionar con reemplazo y tambien contiene las medias muestrales y los

correspondientes errores muestrales.


14 Distribuciones Muestrales


Muestras X Error Muestras
X Error Muestras
X Error

(2,2) 2 -4 (6,2) 4 -2 (10,2) 6 0


(2,4) 3 -3 (6,4) 5 -1 (10,4) 7 1

(2,6) 4 -2 (6,6) 6 0 (10,6) 8 2


(2,8) 5 -1 (6,8) 7 1 (10,8) 9 3

(2,10) 6 0 (6,10) 8 2 (10,10) 10 4


(4,2) 3 -3 (8,2) 5 -1

(4,4) 4 -2 (8,4) 6 0
(4,6) 5 -1 (8,6) 7 1

(4,8) 6 0 (8,8) 8 2
(4,10) 7 1 (8,10) 9 3

Se puede observar que la suma de los errores muestrales es cero

1.3.4. Ejercicios

1. Defina los siguientes terminos en su propio lenguaje. De ejemplos de cada uno

a) Muestreo.

b) Muestreo aleatorio simple.

c) Muestreo aleatorio estratificado.

d ) Muestreo aleatorio sistematico.

e) Muestreo aleatorio por conglomerados.

f ) Error de muestreo.

2. Identifique y analice las diferencias entre los distintos tipos de muestreo.


1.4 Distribuciones muestrales 15

3. Usando la tabla de numeros aleatorio seleccione una muestra aleatoria de 20 elementos


comenzando en la cuarta fila y tercera columna de una poblacion de 900 individuos.

4. De un colectivo de 500 personas, elige una muestra de 20 mediante:

a) Un muestreo aleatorio sistematico.

b) Un muestreo aleatorio simple.

1.4. Distribuciones muestrales

Se ha dicho que uno de los objetivos de la estadstica es saber acerca del comportamiento
de parametros poblacionales tales como: la media (), la varianza ( 2 ) o la proporcion
(). Para ello, se extrae una muestra aleatoria de la poblacion y se calcula el valor de un
la varianza muestral (S 2 ) o
estadstico correspondiente, por ejemplo, la media muestral (X),

la proporcion muestral (p).


Un estadstico es una variable aleatoria, informalmente esto es cierto, ya que su valor depende
de los elementos elegidos en la muestra seleccionada. La veracidad formal de esta declaracion
se da en el siguiente teorema (sin demostracion).

Teorema 1.4.1

Sean X1 , X2 , ..., Xn n variables aleatorias. Definamos Y = f (X1 , X2 , ..., Xn ), entonces Y


es tambien una variable aleatoria.

El teorema anterior establece que una funcion de una o mas variables aleatorias es tambien

una variable aleatoria,, y como un estadstico es una funcion de la muestra (las cuales son

variables aleatorias), entonces un estadstico es una variable aleatoria, y en consecuencia tiene


16 Distribuciones Muestrales

asociada una distribucion de probabilidad la cual es llamada la Distribuci


on Muestral del
Estadstico.
Veamos a continuacion el calculo de la distribucion muestral de los estadsticos mas usados.

1.4.1. Empricamente

Para hallar empricamente la distribucion muestral de un estadstico es necesario seleccionar


todas las muestras de dicha poblacion y a partir de dicha informacion construir la distribucion

de frecuencia relativa de los valores del estadstico, la cual es considerada como su distribucion

muestral. Veamos a continuacion el calculo de la distribucion muestral de dos estadsticos

muy importantes, la media muestral y la proporcion.

Distribuci
on muestral de la media

Para hallar la distribucion muestral de la media se procede de la siguiente manera:

1. Se seleccionan desde la poblacion todas las muestras posibles de tama


no n,

2. En cada muestra se calcula la media muestral.

3. A partir de dicha informacion se construye la distribucion de frecuencias relativas de

las medias muestrales, la cual se define como su distribucion muestral.

toma los valores


Ejemplo 1.4.1 A partir de la tabla del ejemplo anterior se tiene que X
= {2, 3, 4, 5, 6, 7, 8, 9, 10} con las siguientes probabilidades:
X

= 2) = P {(2, 2)} =
P (X 1
25

= 3) = P {(2, 4)o(4, 2)} =


P (X 2
25
1.4 Distribuciones muestrales 17

= 4) = P {(2, 6)o(4, 4)o(6, 2)} =


P (X 3
25

..
.

= 10) = P {(10, 10)} =


P (X 1
25

Por lo tanto, la distribucion muestral de la media esta dada en la siguiente tabla:


X 2 3 4 5 6 7 8 9 10
= x)
P (X 1 2 3 4 5 4 3 2 1
25 25 25 25 25 25 25 25 25

Ahora bien, como la poblaci


on es conocida podemos determinar su media y varianza las cuales
son = 6 y 2 = 8 (comprobar dichos resultados). Y a partir de los datos muestrales se tiene
que:

=2
E(X) 1
+3 2
+4 3
+ ... + 10 1
=6
25 25 25 25

2 ) = 22
E(X 1
+ 32 2
+ 42 3
+ ... + 102 1
= 40
25 25 25 25

= E(X
V ar(X) 2 ) [E(X)]
2 = 40 36 = 4

Por lo tanto, se cumple que

=
E(X)

=
V ar(X) 2
n

Este resultado siempre se cumple y en el siguiente teorema se enuncia sin demostracion.

Teorema 1.4.2 Sea X1 , X2 , ..., Xn una muestra aleatoria extrada de una poblaci
on cuya

media es y varianza 2 . Entonces

=
E(X)
18 Distribuciones Muestrales

=
V ar(X) 2
n

Veamos otro ejemplo:

Ejemplo 1.4.2 Cierta empresa tiene 7 empleados en el area de producci


on (considerados
como la poblaci
on). El salario por hora de cada trabajador se presenta en la siguiente tabla

Empleado 1 2 3 4 5 6 7

Salario (BsF) 7 7 8 8 7 8 9
Como los datos anteriores son considerados la poblaci
on, la media y varianza poblacional son

= 7,714286 y 2 = 0,489796. Ahora, para determinar la distribucion de la media muestral,


se seleccionaron todas las muestras posibles de tama
no 2 sin reposici
on en la poblaci
on, y se
7
calcularon sus medias. Hay 21 posibles muestras de tama no 2 2 . Las 21 medias de todas

las muestras de tama


no 2 que pueden tomarse de la poblaci
on, se indican en la siguiente
tabla:
Muestra Emp Salarios Suma X Muestra Emp Salarios Suma X
1 1,2 7,7 14 7.0 12 3,4 8,8 16 8.0
2 1,3 7,8 15 7.5 13 3,5 8,7 15 7.5
3 1,4 7,8 15 7.5 14 3,6 8,8 16 8.0
4 1,5 7,7 14 7.0 15 3,7 8,9 17 8.5
5 1,6 7,8 15 7.5 16 4,5 8,7 15 7.5
6 1,7 7,9 16 8.0 17 4,6 8,8 16 8.0
7 2,3 7,8 15 7.5 18 4,7 8,9 17 8.5
8 2,4 7,8 15 7.5 19 5,6 7,8 15 7.5
9 2,5 7,7 14 7.0 20 5,7 7,9 16 8.0
10 2,6 7,8 15 7.5 21 6,7 8,9 17 8.5
11 2,7 7,9 16 8.0

De acuerdo con esta tabla la media muestral solo puede tomar los valores 7.0, 7.5, 8.0 y 8.5,

es decir x = {7,0, 7,5, 8,0, 8,5}, cuyas probabilidades son las que se muestran en la siguiente

tabla:
1.4 Distribuciones muestrales 19


X 7.0 7.5 8.0 8.5
= x)
P (X 1/7 3/7 2/7 1/7

A partir de los datos muestrales se tiene que:

= 7,0 1/7 + 7,5 3/7 + 8,0 2/7 + 8,5 1/7 = 7,714286


E(X)

2 ) = 7,02 1/7 + 7,52 3/7 + 8,02 2/7 + 8,52 1/7 = 59,714286


E(X

= E(X
V ar(X) 2 ) [E(X)]
2 = 0,204082

Por lo tanto, se cumple que

=
E(X)

=
V ar(X) 2
N n
n N 1

Distribuci
on muestral de la proporci
on

Existen ocasiones en las cuales no se esta interesado en la media de la muestra, sino que se
quiere investigar la proporcion de artculos defectuosos o la proporcion de alumnos aprobados

en la muestra. La distribucion muestral de proporciones es la adecuada para dar respuesta


a estas situaciones. Esta distribucion se genera de igual manera que la distribucion muestral

de medias, a excepcion de que al extraer las muestras de la poblacion se calcula en vez de la

media muestral, el estadstico proporcion el cual esta dado por:

X
P =
n

donde X es el n
umero de exitos u observaciones de interes y n el tama
no de la muestra.
20 Distribuciones Muestrales

Ejemplo 1.4.3 Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos
defectuosos. Se van a seleccionar 5 artculos al azar de ese lote sin reemplazo. Genere la
distribuci
on muestral de proporciones para el n
umero de piezas defectuosas.

Como se puede observar en este ejercicio la proporci


on de artculos defectuosos de esta
4
poblaci
on es = 12
= 13 . Por lo que podemos decir que el 33 % de las piezas de este lote

est
an defectuosas.
Si X es el n
umero de artculos defectuosos en la muestra, entonces X puede tomar los

valores 0,1,2,3,4, lo cual es equivalente a que P tome los valores 0, 51 , 25 , 53 , 45 con las siguientes

probabilidades:

8 7 6 54 7
P (x = 0) = P (P = 0) = 12 11 10 9 8
= 99

5 8 7 6 54 35
P (x = 1) = P (P = 0,2) = 1 12 11 10 9 8
= 99

5 8 7 6 43 42
P (x = 2) = P (P = 0,4) = 2 12 11 10 9 8
= 99

5 8 7 4 32 14
P (x = 3) = P (P = 0,6) = 3 12 11 10 9 8
= 99

5 8 4 3 21 1
P (x = 4) = P (P = 0,8) = 4 12 11 10 9 8
= 99

Por lo tanto, la distribucion muestral de la proporci


on esta dada en la siguiente tabla:

P 0 0.2 0.4 0.6 0.8 1


7 35 42 14 1
P (P = p) 99 99 99 99 99
0

Al igual que para la media se tiene que

7 35 42 14 1 1
E(P ) = 0 99
+ 0,2 99
+ 0,4 99
+ 0,6 99
+ 0,8 99
= 3
=
1.4 Distribuciones muestrales 21

Ejercicios

1. Defina los siguientes terminos en su propio lenguaje. De ejemplos de cada uno

a) Distribucion muestral.

b) Media de las medias.

c) Error estandar de la distribucion muestral.

2. Una poblacion consiste en los cuatro valores siguientes: 12, 13, 14 y 16.

a) Enumere todas las muestras posibles de tama


no 2 y calcule la media de cada
muestra.

b) Determine la distribucion muestral de la media.

c) Determine el valor medio de la distribucion muestral de la media, y la media de

la poblacion. Compare los dos valores.

d ) Determine el valor de la varianza de la distribucion muestral de la media, y la

varianza de la poblacion. Compare los dos valores.

3. Una poblacion esta compuesta de los siguientes cinco valores: 2, 3, 4, 5 y 8

a) Enumere todas las muestras posibles de tama


no 2 y calcule la media de cada

muestra.

b) Determine la distribucion muestral de la media.

c) Determine el valor medio de la distribucion muestral de la media, y la media de

la poblacion. Compare los dos valores.


22 Distribuciones Muestrales

d ) Determine el valor de la varianza de la distribucion muestral de la media, y la


varianza de la poblacion. Compare los dos valores.

4. Hay cinco representantes de ventas en la agencia Escalante Motors. A continuacion se

listan los cinco representantes y el numero de autos que vendieron la semana pasada:

Empleado Salario (BsF)

Ramon 8

Juan 6
Pedro 4

Luis 10
Victor 6

a) Cuantas muestras de tama


no 2 son posibles?.

b) Enumere todas las muestras posibles de tama


no 2 y calcule la media de cada

muestra.

c) Determine la distribucion muestral de la media.

d ) Determine el valor medio de la distribucion muestral de la media, y la media de


la poblacion. Compare los dos valores.

e) Determine el valor de la varianza de la distribucion muestral de la media, y la

varianza de la poblacion. Compare los dos valores.

5. Empresas POLAR tiene 20 representantes de ventas que venden su producto en Merida.

A continuacion se enlistan los n


umeros de unidades vendidas (en miles) durante un mes

por cada representante. Supongase que tales cifras son una poblacion de valores:
1.4 Distribuciones muestrales 23

2 3 2 3 3 4 2 4 3 2 2 7 3 4 5 3 3 3 3 5

a) Elabore un grafico de la distribucion de la poblacion.

b) Calcule la media poblacional

c) Seleccione al azar cinco muestras de 5 elementos cada una, y calcule la media de


cada muestra.

d ) Calcule la distribucion de la media muestral.

e) Compare la media de la distribucion de medias muestrales, con la media de la


poblacion. Se esperara que fueran iguales?.

f ) Elabore un grafico de las medias muestrales. Observa alguna diferencia entre la

forma de la distribucion de dichas medias y la distribucion de la poblacion.

6. Una empresa tiene seis representantes de ventas. En la tabla siguiente se indica la

cantidad de cocinas que cada uno vendio el mes pasado.

Vendedor Cocinas

Pedro 54

Maria 50

Jose 52
Luis 48

Victor 50

Ana 52

a) Cuantas muestras de tama


no dos se pueden hacer?.
24 Distribuciones Muestrales

b) Seleccione todas las muestras posibles de dos elementos y calcule la media de


unidades vendidas.

c) Organice la media muestral en una distribucion de frecuencia.

d ) Cual es la media de la poblacion?, cual es la media de la media muestral?

e) Cual es la forma de la distribucion de la media muestral?.

f ) Cual es la forma de la distribucion de la poblacion?.

7. Como parte de su servicio al cliente, una empresa aerea selecciona aleatoriamente 10

pasajeros de uno de sus vuelos nacionales de las 9 de la ma


nana. A cada uno de

los pasajeros seleccionados se le pregunta acerca de los servicios en el aeropuerto, las


comidas, los servicios a bordo, etc. Para tomar la muestra, a cada pasajero se le dio un
n
umero conforme abordaba el avion. Los n
umeros empiezan en 001 y terminan en 250.

a) Seleccione al azar 10 n
umeros adecuados utilizando la tabla de n
umeros aleatorios.

b) Otra manera de seleccionar los individuos sera a traves de una muestra


sistematica. Seleccione una muestra sistematica usando la tabla de numeros
aleatorios para seleccionar el primer individuo.

c) Para ambas muestras determine la distribucion de probabilidad de la media

muestral, la media y la varianza.

8. Las ventas en miles de Bs.F de cierta empresa durante los u


ltimos 5 a
nos fuero 68, 73,

65, 80 y 72. Asumiendo que estos cinco meses constituyen la poblacion, determine la
distribucion muestral de la media para muestras de tama
no 3, realizando el muestreo

sin reposicion y sin importar el orden. Que ocurre con la media de la media muestral,

con la desviacion estandar de la media y con el error de muestreo?.


1.4 Distribuciones muestrales 25

9. Una poblacion de las producciones semanales de una fabrica en miles de toneladas es


200, 250, 150, 200 y 300. Realice una distribucion muestral de la media, calcule la media
de las medias y el error estandar para las muestras de tama
no n = 2.

10. Que pasara con el error estandar del ejercicio anterior si n = 3?Por que hay
diferencia?.

11. Muestras de tama


no n = 40 se toman de una poblacion grande con una media de 100
y una desviacion estandar de 25. Calcule e interprete el error estandar.

12. Repita el ejercicio anterior con n = 100. Discuta la diferencia.

13. Por que el error estandar de la media disminuye cuando el tama


no de la muestra
aumenta?

14. Cual es la diferencia entre distribucion de probabilidad y distribucion muestral?

15. La tabla de n
umeros aleatorios *******

16. En una poblacion se presenta una alteracion leve en una cierta proporcion de los
individuos que la componen. Definimos una variable aleatoria X que vale 1 para los

individuos alterados y 0 para los no alterados. Si p es la proporcion de veces que

aparece el valor 1 en muestras aleatorias simples de tama


no 3. Calcule la distribucion

en el muestreo de p, suponiendo que = 0,2 es igual a 0,2.

17. Una variable aleatoria puede tomar los valores 1, 2 y 3 con probabilidades 0,25 0,5

y 0,25 respectivamente. Halle la distribucion muestral de la media para muestras de

tama
no 3.
26 Distribuciones Muestrales

1.4.2. Distribuciones muestrales de poblaciones con distribuci


on

conocida.

Se ha visto que para hallar la distribucion muestral de un estadstico es necesario seleccionar


todas las muestras de dicha poblacion y a partir de dicha informacion construir la distribucion

de frecuencia relativa de los valores del estadstico. Otra manera de hallar la distribucion
muestral de un estadstico es basandose en el hecho de que como un estadstico es funcion

de variables aleatorias cuya distribucion es conocida, excepto quizas por sus parametros,

entonces podemos hallar su distribucion de probabilidad.

Distribuci
on muestral de la media

En esta seccion vamos a determinar la distribucion muestral de la media solo en el caso


en que la poblacion sea normal, y se tomara en consideracion los casos en que la varianza es
conocida y la varianza es desconocida.

1. Distribuci
on muestral de la media para una poblaci
on normal con varianza
conocida.

Al estudiar la distribucion normal se consideraron algunas propiedades que posee dicha

distribucion, una de ellas era referente a la distribucion de una combinacion lineal de

variables aleatorias normales. As pues, sabemos que si x1 , ..., xn , son variables aleatorias
un una N (i , i2 ), para i = 1, ..., n y si a1 , ..., an , son
independientes distribuidas seg
n
umeros reales, entonces la variable aleatoria

n
X
Y = ai xi = a1 x1 + ... + an xn
i=1
1.4 Distribuciones muestrales 27

n n
!
X X
sigue una distribucion N ai i , a2i i2
i=1 i=1
Este resultado nos sera de bastante utilidad para obtener la distribucion de la media

muestral, como veremos en el Teorema ??

Teorema 1.4.3 Sea X1 , X2 , ..., Xn una muestra aleatoria extrada de una poblaci
on
se distribuye normal con
que se distribuye N (, 2 ). Entonces la media muestral, X,
2
media X = y varianza X
=
2
, N (, 2 )
es decir, X
n n

Ejemplo 1.4.4 Sea X1 , X2 , ..., X8 una muestra aleatoria extrada de una poblacion que
se distribuye N (5, 16), entonces por el teorema (??) se tiene que

X = = 5

2 2 16
X
= n
= 8
=2

N (5, 2)
Por lo tanto, X

Ejemplo 1.4.5 Considere una muestra aleatoria de tama


no 100 extrada de una
poblaci
on que se distribuye N (20, 144), entonces por el teorema (??) se tiene que

X = = 20

2 2 144
X
= n
= 100
= 1,44

N (20; 1,44)
Por lo tanto, X

El resultado del teorema (??), permite hallar probabilidades sobre la media muestral,

lo cual como se vera mas adelante ayudara a medir el error al estimar un parametro

usando un estadstico.
28 Distribuciones Muestrales

N (, 2 ), entonces se define una nueva variable aleatoria Z, dada por


Como X


X
Z= (1.4.1)
/ n

La cual se distribuye Normal Estandar, es decir, Z N (0, 1).

Ejemplo 1.4.6 El precio de venta de una casa nueva en Merida se distribuye Normal
con media 450000 BsF y desviacion tpica de 64000 BsF. Si se toma una muestra

aleatoria de 100 casas nuevas de esta ciudad.

a) Cu
al es la probabilidad de que la media muestral de los precios de venta sea menor
de 440000 BsF.? Se sabe que:

X = = 450000

2 2 640002
X
= n
= 100
= 40960000

N (450000, 40960000). As,


Entonces, X


x 440000 450000
P (
x < 440000) = P <
X 6400
= P (Z < 1,56) = 0,0594

b) Cu
al es la probabilidad de que la media muestral se encuentre en menos de 12000

BsF de la media poblacional?


1.4 Distribuciones muestrales 29

N (450000, 40960000), entonces


Como X

P (|
x | < 12000) = P (12000 < x < 12000)

12000 x 12000
= P < <
6400 X 6400
= P (1,88 < Z < 1,88)

= P (Z < 1,88) P (Z < 1,88)

= 0,9700 0,0300 = 0,9400

2. Distribuci
on muestral de la media para una poblaci
on normal con varianza
desconocida.

Hasta ahora estabamos admitiendo que se conoce la varianza de la poblacion de la que


se extrae la muestra, pero esta no sera la situacion general, sino que la mayora de
las veces no conocemos la varianza de la poblacion, entonces como se dispone de una
no n, podemos, calcular la varianza muestral S 2 y utilizarla
muestra aleatoria de tama

en lugar de la varianza poblacional 2 desconocida, pues S 2 es, como veremos despues,


un buen estimador de 2 .


X
Cuando 2 es desconocido, la distribucion muestral de Z =
/ n
depende del tama
no

de la muestra. Veamos los siguientes dos casos:

a) El tama
no de la muestra es grande (n 30).

Cuando el tama
no de la muestra es grande, es decir,(n 30) la distribucion del

estadstico:

X
Z=
/ n
30 Distribuciones Muestrales

sigue siendo aproximadamente N (0, 1).

Ejemplo 1.4.7 El precio de venta de una casa nueva en Merida se distribuye

Normal con media 450000 BsF. De una muestra aleatoria de 100 casas nuevas
de esta ciudad se obtuvo que la desviacion estandar era de 60000.Cual es la

probabilidad de que la media muestral de los precios de venta sea menor de 460000
BsF.?

Se puede notar que la varianza de la poblaci


on no es conocida, pero como el tama
no

de la muestra es mayor que 30 (n = 100), podemos usar la varianza muestral en



X
lugar de la varianza poblacional, con lo cual el estadstico Z =
S/ n
se distribuye

N (0, 1). Por lo tanto,


x 460000 450000
P (
x < 460000) = P <
S/ n 60000/ 100
= P (Z < 1,67) = 0,9525

b) El tama
no de la muestra es peque
no (n < 30).

Si el tama
no de la muestra es peque
no, n < 30, los valores de la varianza muestral

S 2 varan considerablemente de muestra en muestra, pues S 2 disminuye a medida


que n aumenta, y la distribucion del estadstico ya no sera una distribucion normal.

Este problema fue resuelto en 1908 por el estadstico Gosset a partir del siguiente

teorema.

Teorema 1.4.4 Sea X1 , X2 , ..., Xn una muestra aleatoria extrada de una

on que se distribuye N (, 2 ) donde 2 es desconocido. Entonces el es-


poblaci
1.4 Distribuciones muestrales 31

tadstico

X
T =
S/ n

se distribuye t-Student con n 1 grados de libertad.

La demostracion de este teorema se basa en la definicion de una variable aleatoria

t-Student, la cual como se vio antes, es el cociente entre una normal estandar y la
raz cuadrada de una chi-cuadrado sobre sus grados de libertad.

Ejemplo 1.4.8 Consideremos el ejemplo anterior, pero supongamos que la


muestra fue de 20 casas. Entonces, como la varianza poblacional es desconocida

X
y el tama
no de la muestra es menor que 30, el estadstico T =
S/ n
se distribuye
t-Student con 19 grados de libertad. Por lo tanto,


x 460000 450000
P (
x < 460000) = P <
S/ n 60000/ 100
= P (T < 1,67) 0,95

Ejercicios

no n de poblaciones con las medias y varianzas dadas


1. De las muestras aleatorias de tama
a continuacion. Encuentre la media y la desviacion estandar de la distribucion muestral

de la media en cada caso.

a) n = 36, = 10, 2 = 9.

b) n = 100, = 5, 2 = 4.

c) n = 8, = 120, 2 = 1.
32 Distribuciones Muestrales

2. Remtase al ejercicio anterior.

a) Si las poblaciones muestredas son normales, cual es la distribucion muestral de


la media para los incisos a, b, c?

b) Si las poblaciones muestredas no son normales, cual es la distribucion muestral

de la media para los incisos a, b, c?, En que se basa?.

3. Una muestra aleatoria de n observaciones se4 elige de una poblacion con desviacion
estandar = 1. Calcule el error estandar de la media para estos valores de n

a. n = 1 b. n = 2 c. n = 4 d. n = 9 e. n = 16

f. n = 25 g. n = 100

4. Remtase al ejercicio anterior. Grafique el error estandar de la media contra el tama


no

muestral n y una los puntos con una curva uniforme. Cual es el efecto de aumentar el
tama
no de la muestra en el error estandar?.

5. Suponga que se selecciona una muestra aleatoria de n = 25 observaciones de una


poblacion que tiene distribucion normal, con media igual a 106 y desviacion estandar
igual a 12.

a) De la media y la desviacion estandar de la distribucion muestral de la media.

b) Encuentre la probabilidad de que la media muestral sea mayor que 110.

c) Estime la posibilidad de que la media muestral se desve de la media de la poblacion

en no mas de 4.

6. La media de una poblacion normal es 60 y la desviacion estandar es 12. Se toma una

muestra aleatoria de 9. Calcule la probabilidad de que la media muestral


1.4 Distribuciones muestrales 33

a) sea mayor que 63.

b) menor que 56.

c) este entre 56 y 63.

7. La vida media de unas bateras para radio portatil es 35 horas. La distribucion de los
tiempos de vida de estas bateras sigue una distribucion normal con desviacion estandar

de 5.5 horas. Como parte del programa de pruebas de sus artculos el fabricante de radios

portatiles prueba una muestra de 25 bateras.

a) Que se puede decir acerca de la forma de la distribucion de la media muestral?.

b) Cual es el error estandar de la distribucion de la media muestral?.

c) Que fraccion de todas las muestras tendra una vida u


til mayor que 36 horas?.

d ) Que fraccion de todas las muestras tendra una vida u


til mayor que 34.5 horas?.

e) Que fraccion de todas las muestras tendra una vida u


til entre 34.5 y 36 horas?.

8. Seg
un algunos estudios la estatura de los meride
nos se distribuye normal con media
1.70. De 50 meride
nos seleccionados al azar se obtuvo que la desviacion estandar era
de 0.10, cual es la probabilidad de que la estatura media de los 50 meride
nos este por

encima de 1.75?

9. El precio de las hamburguesas en la ciudad de Merida sigue una distribucion normal

cuyo precio promedio es de 20 BsF. Un viernes en la tarde se realizo un estudio en

varios negocios de hamburguesas de donde se registraron el precio de 35 hamburguesas,


encontrandose que las mismas presentaban una desviacion estandar de 2 BsF. Cual

es la probabilidad de que el precio promedio de las 35 hamburguesas sea menor que 21

BsF?.
34 Distribuciones Muestrales

10. Seg
un algunos estudios la edad de los meride
nos se distribuye normal con media 35
a
nos. De 25 meride
nos seleccionados al azar se obtuvo que la desviacion estandar era
de 5 a
nos, cual es la probabilidad de que la edad media de los 25 meride
nos este por

debajo de 38 a
nos?

11. El precio de los perros calientes en cierta ciudad sigue una distribucion normal cuyo

precio promedio es de 10 BsF. Una regulacion del gobierno establece que el precio de

los perros calientes no debe ser mayor a 9 BsF. Un estudio realizado en varios negocios

de comida informal se registro el precio de 22 perros calientes encontrandose que los


mismas presentaban una desviacion estandar de 2 BsF. Cual es la probabilidad de que
el precio promedio de los 10 perros calientes no viole la regulacion?.

Distribuci
on muestral de la proporci
on

x
La proporcion de la poblacion se define como = N
, en donde x es el n
umero de elementos
que poseen cierta caracterstica y N es el n
umero total de elementos de la poblacion. De igual

manera la proporcion muestral se define como P = nx , en donde x es el n


umero de elementos
de la muestra que poseen cierta caracterstica y n es el tama
no de la muestra. As, se puede

considerar una proporcion como una proporcion de exitos, lo cual se obtiene dividiendo el
n
umero de exitos entre el tama
no muestral n.

Hemos visto que la distribucion de probabilidad de la variable aleatoria x, n


umero de

exitos, depende de si la muestra se selecciona con o sin reemplazo, en el caso en que se hace
con reemplazo el n
umero de exitos x es una variable aleatoria que se distribuye binomial con

parametros n y , en cambio si el muestreo se hace sin reemplazo el n


umero de exitos se

distribuye hipergeometrica. Veamos cada caso por separado.


1.4 Distribuciones muestrales 35

1. Muestreo con reemplazo Sea x el n


umero de exitos al seleccionar con reemplazo n
elementos de una poblacion de tama
no N , en la que se sabe que el % son exitos. La
proporcion muestral se distribuye binomial, cuyas esperanzas y varianzas son:

E(p) =

(1 )
V ar(p) =
n

Ejemplo 1.4.9 En un salon de clases hay 30 estudiantes de los cuales el 20 %


reprobaron un examen. Si se seleccionan aleatoriamente 10 estudiantes con reemplazo,
cual es la probabilidad de que el 30 % hayan reprobado el examen?

Sea X = {N
umero de estudiantes que reprobaron el examen}. Como la selecci
on se
hace con reemplazo, entonces X bin(10; 0,20). Ahora, p = 0,30 es equivalente a

X = 3, por lo tanto,


10
P (p = 0,30) = P (X = 3) = (0,2)3 (1 0,2)7 = 0,2013
3

2. Muestreo sin reemplazo Sea x el n


umero de exitos al seleccionar sin reemplazo n

elementos de una poblacion en la que se sabe que el % son exitos. La proporcion

muestral se distribuye hipergeometrica, cuyas esperanzas y varianzas son:

E(p) =

(1 ) N n
V ar(p) =
n N 1
36 Distribuciones Muestrales

Ejemplo 1.4.10 Supongamos el ejemplo anterior, pero la selecci


on se hace sin
reemplazo

Sea X = {N
umero de estudiantes que reprobaron el examen}. Como la selecci
on se

hace sin reemplazo, entonces X Hiperg(30; 6; 10). Por lo tanto,

624
3
P (p = 0,30) = P (X = 3) = 307 = 0,2304
10

Se puede notar que la esperanza en ambos caso es la misma y la varianza es la misma

excepto por el factor que esta a la derecha del segundo caso, el cual se conoce como

factor de correccion por poblacion finita.

Ejercicios

1. Se eligen muestras aleatorias de tama


no n de poblaciones binomiales con los parametros
de poblacion dados a continuacion. Encuentre la media y la desviacion estandar de
la distribucion muestral de la proporcion p en cada caso si el muestreo se hace sin
reemplazo.

a) n = 10, p = 0,3

b) n = 15, p = 0,1

c) n = 5, p = 0,7

2. Realice el ejercicio anterior si el muestreo se hace con reemplazo.

3. Determine la distribucion muestral del ejercicio ??

4. Determine la distribucion muestral del ejercicio ??


1.4 Distribuciones muestrales 37

5. La mayora de los venezolanos alivian el estres comiendo dulces. Seg


un un estudio el
46 % de los venezolanos comen en exceso comidas dulces cuando estan estresados. Si se
selecciona una muestra aleatoria sin reemplazo de 10 venezolanos

a) Determine la distribucion de la proporcion muestral.

b) Cual es la probabilidad de que la proporcion muestral sea mayor que 0.5?

c) Cual es la probabilidad de que la proporcion muestral este entre 0.3 y 0.4?

6. Resuelva el ejercicio ?? suponiendo que el muestreo se hace con reemplazo.

7. En una asamblea de deportes hay 4 personas que juegan f


utbol, 3 beisbol y 3 domino.

Si se seleccionan 4 personas al azar sin reemplazo

a) Cual es la distribucion muestral de la proporcion de personas que juegan f


utbol?

b) Cual es la probabilidad de que dicha proporcion sea menor que 0.5?

8. Resuelva el ejercicio ?? suponiendo que el muestreo se hace con reemplazo.

Distribuci
on muestral de la varianza

La distribucion muestral de la varianza, S 2 tiene pocas aplicaciones practicas en estadstica,


sin embargo, una funcion de dicho estadstico, el cual sigue siendo un estadstico, si tiene
(n1)S 2
importancia en estadstica. Dicha funcion es 2
cuya distribucion se establece en el
siguiente teorema.

Teorema 1.4.5 Sea (x1 , ..., xn ) una muestra aleatoria de tama


no n, procedente de una

on N (, 2 ). Entonces se verifica que:


poblaci
38 Distribuciones Muestrales

1. Los estadsticos x y S 2 son independientes.

2. El estadstico n
X
(xi x)2
2
(n 1)S i=1
=
2 2

sigue una distribucion 2 con n 1 grados de libertad.

Ejemplo 1.4.11 Supongamos que las onzas de lquido que vierte una maquina embotelladora
tiene una distribucion normal con 2 = 1. Si se elige una muestra aleatoria de 10 botellas y
se mide la cantidad de lquido que contiene cada una,

1. cual es la probabilidad de que la varianza muestral sea mayor que 1.2?

(n1)S 2
En esta parte debemos hallar P (S 2 > 1,2), para ello usamos el hecho de que 2
2

con n 1 grados de libertad. Entonces


2 (n 1)S 2 (10 1)1,2
P (S > 1,2) = P >
2 1
2
= P > 10,8 0,25(0,2897)

2. Entre que valores simetricos de la varianza se encuentran el 90 % de las observa-

ciones?. En esta parte debemos hallar dos valores digamos b1 y b2 tales que

P (b1 S 2 b2 ) = 0,90
1.4 Distribuciones muestrales 39

Siguiendo el mismo procedimiento que en el inciso 1. se tiene que


2 (10 1)b1 (n 1)S 2 (10 1)b2
P (b1 S b2 ) = P < 2
<
1 1

9b1 9b2
= P < 2 < = 0,90
1 1

lo cual se cumple si,


9b1 9b2
= 3,325 y = 16,919
1 1

Por lo tanto, b1 = 0,369 y b2 = 1,88.

Ejercicios

1. La produccion de leche de la compa


na LACTOSA se distribuye normal con una
desviacion estandar de 0.1 litros. De una muestra de 60 litros de leche, cual es la
probabilidad de que la varianza sea mayor a 0.0144 litros2 ?

ucar presenta una variabilidad mayor a 10000 gramos2


2. Si cierto proceso productivo de az

es necesario hacer un ajuste en la maquina. Se sabe por estudios anteriores que la


ucar se distribuye normal con una varianza de 2500 gramos2 . Si se
produccion de az
selecciona una muestra de 30 paquetes de az
ucar, Cual es la probabilidad de que sea

necesario reajustar la maquina?.

Distribuci
on muestral de la diferencia entre 2 medias

En muchas situaciones surge la necesidad de comparar las medias muestrales de dos

poblaciones. Por ejemplo, suponga que se esta interesado en comparar los tiempos medios de

duracion de dos artefactos electricos. La fabricacion de ambos marcas de artefactos se realiza


40 Distribuciones Muestrales

por compa
nas distintas y con diferentes procesos de fabricacion. Por tanto, los artefactos
producidos por cada compa
na tendran una distribucion diferente, una de la otra, en los
tiempos de duracion.

Sea X1 la variable aleatoria que representa el tiempo de duracion de la primera marca


de artefacto y se admite que sigue una distribucion N (1 , 12 ). Analogamente la variable

aleatoria X2 representa el tiempo de duracion de la segunda marca de artefacto que sigue


una distribucion N (2 , 22 ). Se selecciona una muestra aleatoria de tama
no n1 , de la primera

marca de artefacto y una muestra aleatoria de tama


no n2 , de la segunda marca de artefacto,

ambas muestras independientes. Entonces si se definen por x1 y x2 los estadsticos medias

muestrales de ambas muestras, se esta interesado en conocer la distribucion muestral de la


diferencia
x = x1 x2 para las muestras respectivas de tama
no n1 y n2 procedentes de
dos poblaciones normales e independientes. Al igual que para el caso de una poblacion se

va a estudiar por separado cuando las varianzas poblacionales son conocidas y cuando son
desconocidas.

1. Varianzas Poblacionales conocidas.

De manera analoga al Teorema ?? que que se establecio para la distribucion muestral de

la media, se puede enunciar el siguiente teorema para la diferencia de medias muestrales.

Teorema 1.4.6 Sean X11 , X12 , ..., X1n1 una muestra aleatoria extrada de una

on que se distribuye N (1 , 12 ) y X21 , X22 , ..., X2n2 una muestra aleatoria ex-
poblaci
on que se distribuye N (2 , 22 ), independientes, y supongamos que
trada de una poblaci
se distribuye normal
12 y 22 son conocidas. Entonces la diferencias de medias, X,
2 12 22 2
N (, 1 + 22
con media = 1 2 y varianza =
X n1
+ n2
, es decir, X n1 n2
).
1.4 Distribuciones muestrales 41

Por lo tanto, el estadstico


X
Z= q 2 N (0, 1)
1 22
n1
+ n2

Aunque no se demostrara el teorema, es facil ver que

= E(
E(X) x1 x2 ) = E(
x1 ) E(
x 2 ) = 1 2

= V ar( 12 22
V ar(X) x1 x2 ) = V ar(
x1 ) + V ar(
x2 ) = n1
+ n2

Ejemplo 1.4.12 Sean X11 , X12 , ..., X18 una muestra aleatoria extrada de una

poblaci
on que se distribuye N (5, 16) y X21 , X22 , ..., X25 una muestra aleatoria extrada
de una poblaci
on que se distribuye N (8, 25), entonces por el teorema (??) se tiene que

X = 1 2 = 5 8 = 3

2 12 22 16 25
=
X n1
+ n2
= 8
+ 5
=7

N (3, 7)
Por lo tanto, X

Al igual que para una muestra, el resultado del teorema (??), permite hallar
probabilidades sobre la diferencia de medias muestrales, lo cual como se vera mas
adelante ayudara a medir el error al estimar un parametro usando un estadstico.

Ejemplo 1.4.13 El precio de venta de una casa nueva en Merida se distribuye Normal
con media 450000 BsF y desviacion tpica de 64000 BsF, en cambio en San Cristobal

se distribuye Normal con media 440000 BsF y desviacion tpica de 36000 BsF. Si se

toma una muestra aleatoria de 100 casas nuevas en Merida y 120 en San Cristobal .
42 Distribuciones Muestrales

Cual es la probabilidad de que el precio promedio de venta sea mayor en Merida que
en San Cristobal?
Consideremos a Merida la poblaci
on 1 y a San Cristobal la poblaci
on 2, entonces

X = 1 2 = 450000 440000 = 10000

2 12 22 640002 360002
=
X n1
+ n2
= 100
+ 120
= 51760000

= x1 x2 N (10000, 51760000).
por lo tanto, X

As,

P (
x1 > x2 ) = P (
x1 x2 > 0) = P (X > 0)

X 0 10000
= P >
X 51760000
= P (Z > 1,39) = 0,9177

2. Varianzas Poblacionales desconocidas.

En general, las varianzas poblacionales no suelen ser conocidas. As pues, ahora se

quiere obtener la distribucion de la diferencia de medias muestrales x1 x2 cuando

el muestro se realiza sobre dos poblaciones normales, independientes y con varianzas


desconocidas. En estas situaciones, se debe tomar en cuenta el tama
no de la muestra.

a) Tama
no de las muestras son mayores que 30

Si el tama
no de cada muestra es mayor que 30, la distribucion muestral de la
2 2
diferencia de medias sigue siendo normal pero sustituyendo por SX
X =
1.4 Distribuciones muestrales 43

S12 S22
n1
+ n2
. Es decir,
N (, S 2 )
X X

Ejemplo 1.4.14 La edad promedio de los estudiantes de la Universidad de los


Andes es 22 a
nos y la de los estudiantes de la Universidad de Oriente es 24 a
nos.

Dada una muestra aleatoria de 50 estudiantes de la ULA se obtuvo que la varianza

era 25, y para 60 estudiantes de la UDO se obtuvo que la varianza era de 16. Si
se suponen que las poblaciones son normales.

1) Cual es la distribucion muestral de la diferencia de las edades de los

estudiantes de la ULA con respecto a los de la UDO?


1 = La edad promedio de los estudiantes de la ULA X
Sea X 1 = 22
2 = La edad promedio de los estudiantes de la UDO X
Sea X 2 = 24

Como las varianzas poblacionales son desconocidas usamos las varianzas


muestrales, las cuales son S12 = 25 y S22 = 16. Debido a que los tama
nos

de muestras seleccionados son mayores que 30 (n1 = 50, n2 = 60), entonces


=X
X 1 X
2 N (; S 2 ), donde
X

2 S12 S22 25 16
= 1 2 = 22 24 = 2 S =
X + = + = 0,77
n1 n2 50 60

N (2; 0,77)
Es decir, X
44 Distribuciones Muestrales

2) Cual es la probabilidad de que dicha diferencia sea mayor que 2?

P (|
x1 x2 | > 2) = P (
x1 x2 > 2) + P (
x1 x2 < 2)

X 2 (2)
= P >
SX 0,77

X 2 (2)
+ P <
SX 0,77
= P (Z > 4,55) + P (Z < 0) = 0 + 0,50 = 0,50

b) Tama
no de al menos una de las muestras es menor que 30
Cuando las varianzas poblacionales son desconocidas y al menos uno de los

tama
nos muestrales es menor que 30, al igual que en el caso de una poblacion, se
tiene que el estadstico

X
T =
SX

se distribuye t-student con v grados de libertad. Donde los valores de SX y v


depende de si las varianzas poblacionales se consideran iguales o diferentes.

1) Si la varianzas se suponen iguales, se tiene que

s r
(n1 1)S12 + (n2 1)S22 1 1
SX = +
n1 + n2 2 n1 n2

v = n1 + n2 2
1.4 Distribuciones muestrales 45

2) Si la varianzas se suponen diferentes, se tiene que

s
S12 S22
SX = +
n1 n2

2
S12 S22
n1
+ n2
v= (S12 /n1 )2 (S22 /n2 )2
n1 1
+ n2 1

Ejemplo 1.4.15 Se aplicaron dos metodos para ense


nar a leer a dos grupos de

ni
nos de primaria que se eligieron en forma aleatoria y se realiz
o una comparaci
on
con base en una prueba de comparaci
on de lectura al final del perodo de ense
nanza.
La siguiente tabla resume los valores de las medias muestrales y las varianzas

calculadas con los resultados de la prueba. Si se supone que las puntuaciones


obtenidas por cada metodos son normales con media 60 y 65 respectivamente y que

las varianzas poblacionales son iguales, calcule la probabilidad de que el segundo


metodo de ense
nanza asegure en promedio una mayor puntuacion que el primero.

Metodo 1 Metodo 2

N
umero de ni
nos 11 14

Media 64 69

Varianza 52 71

El segundo metodo de ense


nanza asegure en promedio una mayor puntuacion que
el primero, esta representado por el evento x1 x2 < 0. De esta manera se tiene

que

= 1 2 = 264 69 = 5
46 Distribuciones Muestrales

s r
(n1 1)S12 + (n2 1)S22 1 1
SX = +
n1 + n2 2 n1 n2
r r
(11 1)52 + (14 1)71 1 1
= +
11 + 14 2 11 14
= 3,19

Por lo tanto,

P (
x1 x2 < 0) = P (X < 0)

X 0 (5)
= P <
SX 3,19
= P (T < 1,57) 0,95

Nota: Hacer el mismo ejemplo suponiendo varianzas diferentes.

Ejercicios

1. La duracion (en meses) de dos marcas de bateras se distribuyen normal con medias

38 y 35 respectivamente y desviaciones estandar 8 y 6 respectivamente. Si se selecciona


una muestra aleatoria de 36 bateras de cada marca, cual es la probabilidad de que la

duracion promedio de la marca A sea:

a) Superior a la de la marca B en dos meses o mas?

b) Inferior a la de la marca B en 2 meses o menos?.

2. Una tienda por departamentos tiene dos planes de cuentas de cargo disponibles para sus
1.4 Distribuciones muestrales 47

clientes con cuenta corriente de credito. Los saldos de cada plan se distribuyen normal
con medias 15000 BsF y 18000 Bs, respectivamente. La tienda selecciono una muestra
aleatoria de 40 cuentas del plan A y 40 cuentas del plan B, obteniendo que las medias

y las desviaciones estandar eran 12750 y 2550 para el plan A y 18700 y 2404 para el
plan B. cual es la probabilidad de que los saldos promedios del plan A sean menor que

los del plan B?.

3. Una tienda por departamentos tiene dos planes de cuentas de cargo disponibles para sus

clientes con cuenta corriente de credito. Los saldos de cada plan se distribuyen normal

con medias 15000 BsF y 18000 Bs, respectivamente. La tienda selecciono una muestra
aleatoria de 25 cuentas del plan A y 20 cuentas del plan B, obteniendo que las medias

y las desviaciones estandar eran 12750 y 2550 para el plan A y 18700 y 2404 para el
plan B. cual es la probabilidad de que los saldos promedios del plan A sean mayor que

los del plan B, si las varianzas poblacionales son diferentes?.

4. El alcalde de la ciudad de Merida compra 25 bombillos de luz de la marca A y otros


15 de la marca B. Al probar estos bombillos, hallo que xA = 1300 horas, SA = 90
horas, xB = 1250 horas y SB = 100 horas. Suponiendo que la poblacion se distribuye

normal y que las varianzas poblacionales son diferentes Cual es la probabilidad de

que la diferencia entre las dos medias de poblacion correspondientes sea mayor de 40

horas?.

5. Resuelva los dos u


ltimos ejercicios suponiendo que las varianzas poblacionales son

iguales.

6. En el ejercicio ?? calcule la probabilidad de que la varianza en el plan A sea mayor que


48 Distribuciones Muestrales

la del plan B.

7. En el ejercicio ?? calcule la probabilidad de que la la marca B presente mayor


variabilidad que la marca A.

Distribuci
on muestral del cociente de varianzas

Sean dos poblaciones X1 y X2 , N (1 , 12 ), N (2 , 22 ) e independientes, de las cuales selec-


cionamos dos muestras aleatorias simples e independientes, de tama
nos n1 y n2 , (x11 , ..., x1n1 , )

y (x21 , ..., x2n2 ), entonces pueden presentarse fundamentalmente dos situaciones:

1. 1 y 2 son conocidas

2. 1 y 2 son desconocidas

1. 1 y 2 son conocidas Al ser conocidas las medias poblacionales 1 y 2 las podemos

utilizar para el calculo de las varianzas muestrales S12 y S22 ; y como las muestras son

independientes y ademas proceden de distintas poblaciones, entonces los estadsticos:

n
1 X
S12 = (x1i 1 )2
n1 i=1

n
1 X
S22 = (x2i 2 )2
n2 i=1

son independientes y podemos expresarlos como:

Xn n 2
n1 S12 X x1i 1
n1 S12 = 2
(x1i 1 ) 2
= 2n1
i=1
1 i=1
1
1.4 Distribuciones muestrales 49

Xn n 2
n2 S22 X x2i 2
n2 S22 = 2
(x2i 2 ) 2
= 2n2
i=1
2 i=1
2

pues la suma de n variables aleatorias N (0, 1), independientes y elevadas al cuadrado


siguen una 2n . Y recordando que la variable aleatoria F de Snedecor con n1 y n2
grados de libertad, Fn1 ,n2 , se define como el cociente entre dos variables aleatorias 2

independientes divididas cada una de ellas por sus grados de libertad, se tiene que:

n1 S12
12
/n1 S12 22
F = = Fn1 ,n2
n2 S22
/n2 S22 12
22

2. 1 y 2 son desconocidas

Al ser desconocidas las medias poblacionales, que sera lo que casi siempre ocurra, y ser
las muestras independientes y ademas procedentes de distintas poblaciones, entonces

los estadsticos:
n
1 X
S12 = (x1i x1 )2
n1 1 i=1
n
1 X
S22 = (x2i x2 )2
n2 1 i=1

son independientes y ademas

n
X n 2
(n1 1)S12 X x1i x1
(n1 1)S12 = 2
(x1i x1 ) = 2n1 1
i=1
12 i=1
1

n
X n 2
(n2 1)S22 X x2i x2
(n2 1)S22 = 2
(x2i x2 ) = 2n2 1
i=1
22 i=1
2
50 Distribuciones Muestrales

Analogamente a como ocurra en la situacion anterior, se llega a una F-Snedecor con


n1 1 y n2 1 grados de libertad, en efecto:

(n1 1)S12
12
/n1 1 S12 22
F = = Fn1 1,n2 1
(n2 1)S22
/n2 1 S22 12
22

Ejemplo 1.4.16 Se aplicaron dos metodos para ense


nar a leer a dos grupos de ni
nos

de primaria que se eligieron en forma aleatoria y se realiz


o una comparaci
on con base

en una prueba de comparaci


on de lectura al final del perodo de ense
nanza. La siguiente
tabla resume los valores de las medias muestrales y las varianzas calculadas con los

resultados de la prueba. Si se supone que las puntuaciones obtenidas por cada metodo
son normales cuyas varianzas poblacionales son 60 y 75 respectivamente, calcule la

probabilidad de que el segundo metodo presente mayor variabilidad que el primero.

Metodo 1 Metodo 2

N
umero de ni
nos 11 14
Media 64 69

Varianza 52 71

El segundo metodo presente mayor variabilidad que el primero, esta representado por
el evento S12 < S22 . Como la medias poblacionales son desconocidas, se tiene que:


S12
P (S12 < S22 ) = P <1
S22
2 2
S1 2 75
= P <1
S22 12 60
= P (F < 1,25) 0,3466
1.4 Distribuciones muestrales 51

Ejercicios

1. Para el ejemplo, determine la probabilidad de que la varianza muestral de la primera


muestra sea mayor que la segunda.

Distribuci
on muestral de la Diferencia de Proporciones

Otro problema que se suele presentar es el de comparar las proporciones p1 y p2 , de dos

poblaciones binomiales (si el muestreo es con reemplazo) o hipergeometricas (si el muestreo es


sin reemplazo), basandose en muestras aleatorias simples de tama
no n1 y n2 , respectivamente,

extradas de ambas poblaciones. La comparacion de dichas proporciones se obtienen a traves

del estadstico p = p1 p2 , cuya distribucion no es conocida, ya que en teora no se conoce

cual es la distribucion de la resta de dos binomiales o de dos hipergeometricas. Por lo tanto,


la distribucion de este estadstico se definira mas adelante.

1.4.3. Distribuciones asint


oticas

Existen situaciones en las que la distribucion de la poblacion no es conocida, pero si el

tama
no de la muestra es grande comparado con el tama
no de la poblacion, podemos usar

la distribucion normal como la distribucion del estadstico de manera aproximada. Dicho


resultado se basa en lo que se conoce como el Teorema Central del Limite, el cual se enuncia
a continuacion sin demostracion:

Teorema 1.4.7 Sea X1 , X2 , ..., Xn una muestra aleatoria de una distribucion con media y

varianza 2 . Entonces, si n es suficientemente grande, la variable aleatoria

n
X
Y = Xi
i=1
52 Distribuciones Muestrales

tiene aproximadamente una distribucion normal con media n y varianza n 2 , lo cual se


denota como
n
X
Xi N (n; n 2 )
i=1

Una muestra es suficientemente grande si n 30.

Distribuci
on muestral de la media

En muchas situaciones la poblacion de partida de la cual se extrae la muestra no es normal. En

tales casos la distribucion muestral del estadstico media muestral x, sera aproximadamente
normal. Dicho resultado se ve en el siguiente corolario

Corolario 1.4.7.1 Sea x1 , x2 , ..., xn una muestra aleatoria extrada de una poblaci
on cuya
on no es normal, pero que se sabe que tiene media y varianza 2 , esta u
distribuci ltima

puede ser o no conocida. De acuerdo con el teorema central

n
X
Xi
= i=1 2
X N ;
n n

cuando la varianza es conocida, o

n
X
Xi
= i=1 S2
X N ;
n n

cuando la varianza es desconocida.

Ejemplo 1.4.17 Cierta fabrica produce alambres de acero que tiene una media de resistencia

a la tracci
on de 500 libras y una desviacion estandar de 20 libras. Si se extrae una muestra
1.4 Distribuciones muestrales 53

aleatoria de 100 alambres de la lnea de producci


on durante cierta semana,

1. cual es la probabilidad de que la media muestral difiera de 500 libras en 4 libras?

2. cual es la probabilidad de que la media muestral sea menor de 496 libras?

Se puede notar que no se dice nada sobre la normalidad de la poblaci


on, pero como el tama
no
de la muestra es mayor que 30 (n = 100) se puede utilizar la distribucion normal de manera

aproximada. Se deja como ejercicio.

Ejercicios

1. Suponga que el profesor universitario en instituciones con carreras de dos a


nos gana
un promedio de 65608 BsF. por a
no con una desviacion estandar de 4000 BsF. En un
esfuerzo por verificar este nivel del sueldo, se elige al azar una muestra aleatoria de 60

profesores de una base de datos del personal para estas instituciones en Venezuela.

a) Describa la distribucion muestral de la media.

b) Dentro de que lmites esperara usted que se ubicara el promedio muestral con

probabilidad 0.95?

c) Calcule la probabilidad de que la media muestral sea mayor que 67000 BsF.?

d ) Si su muestra aleatoria produjera en realidad una media muestral de 67000,

considerara esto poco com


un?.

2. De acuerdo con un estudio, un contribuyente necesita 30 minutos para llenar, copiar

y enviar una determinada forma fiscal. Una agencia de investigacion encuentra en una

muestra de 40 contribuyentes una desviacion estandar de 8 minutos.


54 Distribuciones Muestrales

a) Que se debe suponer acerca de la forma de la distribucion?.

b) En este ejemplo, cual es el error estandar de la media?.

c) Cual es la probabilidad de tener una media muestral superior a 32 minutos?.

d ) Cual es la probabilidad de tener una media muestral que este entre 32 y 35


minutos?.

e) Cual es la probabilidad de tener una media muestral mayor que 35 minutos?.

3. En Venezuela la edad promedia en la que los hombres se casan por primera vez es 24.8

a
nos. No se conoce ni la forma ni la desviacion estandar de la poblacion. Cual es la

probabilidad de encontrar en una muestra de 60 hombres que la edad promedio a la


que se casaron sea 25.1 a
nos?. Supongase que la desviacion estandar muestral es 2.5
a
nos.

4. En un supermercado, la cantidad media de una compra es 23,50 BsF. No se conoce ni la


forma ni la desviacion estandar de la poblacion. Se toma una muestra de 50 clientes,Si

la desviacion estandar de la muestra es 5 BsF, entonces:

a) Cual es la probabilidad de que la media muestral sea inferior a 25 BsF?.

b) Cual es la probabilidad de que la media muestral sea mayor que 22.5 y menor
que 25 BsF?.

c) Entre que limites se encuentra el 90 % de las medias muestrales?.

5. La media de una poblacion de forma desconocida es 75. Se toma una muestra de 40.

La desviacion estandar de la muestra es 5. Calcule la probabilidad de que la media

muestral
1.4 Distribuciones muestrales 55

a) sea menor que 74.

b) este entre 74 y 74.

c) este entre 76 y 77.

d ) sea mayor que 77.

Distribuci
on muestral de la varianza

Si la distribucion de la poblacion no es conocida, pero el tama


no de la muestra es

suficientemente grande se mantiene el resultado obtenido cuando la poblacion es normal

Distribuci
on muestral de la proporci
on

Sea x el numero de exitos en una muestra de tama


no n, extrada de una poblacion cuya
proporcion de exitos es . Por el teorema central del limite, si n 30, se cumple que

p N (p ; p2 )

donde
x 1 1
p = E(p) = E = E(x) = n =
n n n
x 1 1 (1 )
p2 = V ar(p) = V ar = 2
V ar(x) = 2 n(1 ) =
n n n n

Distribuci
on muestral de la diferencia de medias

Si las poblaciones de donde se extraen las muestras no son normales, pero los tama
nos de

ambas muestras son grandes, entonces podemos aplicar el siguiente resultado


56 Distribuciones Muestrales

Corolario 1.4.7.2 Sean x11 , x12 , ..., x1n y x21 , x22 , ..., x2n muestras aleatorias extradas de
poblaciones cuya distribucion no es normal, pero que se sabe que tienen medias 1 y 2 y
varianza 12 y 22 , respectivamente, estas u
ltimas puede ser o no conocidas. De acuerdo con

el teorema central del limite


N (; 2 )
X X

donde
2 12 22
= 1 2 =
X +
n1 n2

cuando las varianzas son conocidas, o

N (; S 2 )
X X

donde
2 S12 S22
= 1 2 S =
X +
n1 n2

cuando la varianzas son desconocidas.

Ejercicios

1. Cierta marca de almohadas tienen un peso medio de 15 gramos y una desviacion

estandar de 0.006 gramos. Se toman dos muestras aleatorias incondicionales en forma


independiente de cierto da de produccion, con n1 = 500 y n2 =800. Cual es la

probabilidad de que las medias muestrales difieran en mas de 0.0006 gramos?, de

que difieran en menos de 0.0003 gramos?.

2. Dos marcas de tubos de television, A y B, poseen los siguientes parametros: A = 1,400


1.4 Distribuciones muestrales 57

horas, A2 = 40,000 horas2 , B = 1,200 horas y B2 = 10,000 horas2 . Se extrae una


muestra aleatoria de 125 tubos de cada marca; determine la probabilidad de que

a) la marca A tendra una media de vida de por lo menos 160 horas mas que B

b) La marca A tendra una media de vida de por lo menos 250 hora mas que B

3. El sueldo anual de los profesores en cierta ciudad es de 120000 BsF como promedio,

con una desviacion estandar de 10000 BsF. En la misma ciudad, el salario anual de los
medicos es de 150000 BsF como promedio, con una desviacion estandar de 15000 BsF.

Se toma una muestra aleatoria de 100 de cada poblacion; cual es la probabilidad de


que las medias muestrales difieran en menos de 50000BsF; de que difieran en mas de

60000 BsF?.

4. El alcalde de la ciudad de Merida compra 100 bombillos de luz de la marca A y otros


100 de la marca B. Al probar estos bombillos, hallo que xA = 1300 horas, SA = 90

horas, xB = 1250 horas y SA = 100 horas. Cual es la probabilidad de que la diferencia


entre las dos medias de poblacion correspondientes sea mayor de 40 horas?

Distribuci
on muestral del cociente de varianzas

Se mantienen los resultados vistos en el caso de normalidad.

Distribuci
on muestral de la Diferencia de Proporciones

Consideremos dos muestras aleatorias simples e independientes de tama


no n1 y n2 ,

procedentes de poblaciones binomiales con parametros 1 y 2 , respectivamente, entonces


58 Distribuciones Muestrales

la distribucion muestral de la diferencia de proporciones muestrales

p = p1 p2

tendra aproximadamente (para n1 y n2 , grandes) una distribucion normal con media

p = 1 2

y varianza
2 1 (1 1 ) 2 (1 2 )
p = +
n1 n2

es decir,
2
p N (p ; p )

Ejercicios

1. Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en
sus opiniones sobre la promulgacion de la pena de muerte para personas culpables de

asesinato. Se cree que el 12 % de los hombres adultos estan a favor de la pena de muerte,
mientras que solo 10 % de las mujeres adultas lo estan. Si se pregunta a dos muestras

aleatorias de 100 hombres y 100 mujeres su opinion sobre la promulgacion de la pena

de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al

menos 3 % mayor que el de las mujeres.

2. Una encuesta del Boston College consto de 320 trabajadores de Michigan que fueron

despedidos entre 1979 y 1984, encontro que 20 % haban estado sin trabajo durante por

lo menos dos a
nos. Supongase que tuviera que seleccionar otra muestra aleatoria de 320
1.5 Ejercicios Varios 59

trabajadores de entre todos los empleados despedidos entre 1979 y 1984. Cual sera la
probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo
menos dos a
nos, difiera del porcentaje obtenido en la encuesta de Boston College, en

5 % o mas?

3. Se sabe que 3 de cada 6 productos fabricados por la maquina 1 son defectuosos y que 2

de cada 5 objetos fabricados por la maquina 2 son defectuosos; se toman muestras de


120 objetos de cada maquina:

a) cual es la probabilidad de que la proporcion de artculos defectuosos de la maquina


2 rebase a la maquina 1 en por lo menos 0.10?

b) cual es la probabilidad de que la proporcion de artculos defectuosos de la maquina


1 rebase a la maquina 2 en por lo menos 0.15?

1.5. Ejercicios Varios

1. Las puntuaciones en la Escala de Inteligencia para Adultos de Wechsler (WAIS) siguen

en una poblacion una distribucion Normal de media 100 y desviacion tpica 16. Si
extraemos de esa poblacion una muestra aleatoria simple de 25 individuos

a) Cual es la probabilidad de que la media de esos 25 individuos sea inferior a 95?

b) Cual es la probabilidad de que esa misma media este comprendida entre 98 y

102?

2. La variable X se distribuye normalmente con media 50 y desviacion tpica 12. Si

extraemos una muestra aleatoria simple de 16 alumnos:


60 Distribuciones Muestrales

a) Si se extrae un sujeto al azar, Cual es la probabilidad de que obtenga al menos


una puntuacion de 45?

b) Cual es la probabilidad de que su media aritmetica sea menor de 58?

c) Cual es la probabilidad de que su media aritmetica sea como mnimo 45?

d ) Que valores debera tomar la media aritmetica para que exista una probabilidad

de 0,38 de encontrar valores entre ellos?

e) Que tama
no tendra que tener la muestra para que la probabilidad de encontrar

medias superiores a 52 fuese 0,2578?

3. Se sabe que 5 de cada 8 productos fabricados por la maquina 1 son no defectuosos y que
3 de cada 5 objetos fabricados por la maquina 2 son defectuosos; se toman muestras de
100 objetos de cada maquina:

a) cual es la probabilidad de que la proporcion de artculos defectuosos de la maquina


2 no rebase a la maquina 1 en por lo menos 0.10?

b) cual es la probabilidad de que la proporcion de artculos defectuosos de la maquina


1 rebase a la maquina 2 en por lo menos 0.15?

4. Supongamos que la desviacion tpica de la cantidad de dinero que un estudiante gasta


en un semestre en libros es 3000 bolvares. Se toma una muestra aleatoria de 100

estudiantes para estimar el gasto medio de toda la poblacion.

a) Cual es el desviacion tpica de la media muestral?.

b) Cual es la probabilidad de que la media muestral exceda de la media poblacional

en mas de 200 bolvares?.


1.5 Ejercicios Varios 61

c) Cual es la probabilidad de que la media muestral resulte al menos 300 bolvares


menor que la media poblacional?.

d ) Cual es la probabilidad de que la media muestral difiera de la media poblacional

en mas de 400 bolvares?

5. En un hipermercado, la cantidad media de una compra es 33,50 BsF. No se conoce ni la

forma ni la desviacion estandar de la poblacion. Se toma una muestra de 60 clientes,Si

la desviacion estandar de la muestra es 7 BsF, entonces:

a) Cual es la probabilidad de que la media muestral sea superior a 35 BsF?.

b) Cual es la probabilidad de que la media muestral sea mayor que 32.5 y menor
que 35 BsF?.

c) Entre que limites se encuentra el 95 % de las medias muestrales?.

6. Un partido poltico cree que el 60 % del electorado esta a favor de su programa. Como
su lder encuentra que esta prediccion es demasiado optimista decide hacer un sondeo

con una muestra de 90 personas. Cual sera la probabilidad de que como maximo 60
personas esten a favor de su partido?

7. Disponemos de los datos del I.N.E. (Instituto Nacional de Estadstica) sobre el aumento
del empleo durante el a
no 98, el cual se encuentra en un 45 %. Si tomamos una muestra

aleatoria de 200 ciudadanos. Cual es la probabilidad de que mas del 50 % tenga empleo?

8. En ciertas unidades monetarias, el ahorro de un estudiante de Economa es una variable

aleatoria normal de media 3.5 y desviacion tpica 0.5. Se seleccionan 16 estudiantes al

azar. Sea la media muestral de los ahorros observados.


62 Distribuciones Muestrales

Razonar si se trata de una distribucion exacta o


a) Cual es la distribucion de X?.
aproximada.

exceda de 3.7.
b) Calcular la probabilidad de que X?

este entre 3.34 y 3.36.


c) Calcular la probabilidad de que X?

9. Las puntuaciones obtenidas en la escala de Locus de Control de James por los sujetos
depresivos, siguen una distribucion Normal de media 90 y desviacion tpica 12. Si

se extraen muestras aleatorias simples de 30 sujetos depresivos Por debajo de que

cantidad se encontrara el 90 % de las veces el valor de la varianza de la muestra?

10. Un economista piensa que el incremento salarial de los empleados del sector bancario
sigue una distribucion normal con desviacion tpica 3.37. Se toma una muestra aleatoria

de 16 empleados del sector.

a) Hallar la probabilidad de que la desviacion tpica muestral sea menor que 1.99.

b) Hallar la probabilidad de que la desviacion tpica muestral sea mayor que 2.89.

11. Previo a una eleccion la diputada X contrata los servicios de la compa


na Y para f ijar
la contienda establecida con los electores. Ella percibe con respecto a este punto que

si tiene el 45 % de los votos sera nominada de cuerdo con su estrategia de campa


na.
Suponiendo que la compa
na contratada selecciona una muestra aleatoria simple de

1600 electores registrados. Cual es la probabilidad de que la muestra pueda producir


una proporcion de 45 % mas dado que la verdadera proporcion es del 40 %?

12. En un estudio para comparar los pesos promedios de ni


nos y ni
nas de sexto grado en

una escuela primaria se usara una muestra aleatoria de 20 ni


nos y otra de 25ni
nas. Se
1.5 Ejercicios Varios 63

sabe que tanto para ni


nos como para ni
nas los pesos siguen una distribucion normal. El
promedio de los pesos de todos los ni
nos de sexto grado de esa escuela es de 100 libras
y su desviacion estandar es de 14.142 libras, mientras que el promedio de los pesos de

todas las ni
nas de sexto grado de esa escuela es de 85 libras y su desviacion estandar
es de 12.247 libras. Cual es la probabilidad de que el promedio de los pesos de los 20

ni
nos sea al menos 20 libras mas grande que el de las 25 ni
nas?.

13. El encargado de una sala de cine esta interesado en conocer la edad de su clientela.

Para ello, decide preguntar las edades a 10 clientes seleccionados al azar. Suponiendo

que la muestra es aleatoria simple y que la edad de los clientes (expresada en a


nos) es
una variable aleatoria, X, Normal, con media 22 y desviacion tpica 3, se pide:

a) Deducir las expresiones del valor esperado y la varianza de la media de las edades

de los 10 clientes de la muestra.

b) Supongamos que el encargado decide aumentar el tama


no de la muestra a 100

personas. Determinar:

1) La distribucion de probabilidad de la media de las edades de los 100 clientes,


razonando la respuesta. Cual es la probabilidad de que dicha media sea

inferior a 25 a
nos?

2) La probabilidad de que la edad de un determinado cliente no llegue a 25 a


nos.

3) La probabilidad de que la desviacion estandar supere los 4 a


nos.

14. Sean S12 y S22 las varianzas muestrales de dos muestras independientes de tama
no 5 y

4 de dos poblaciones normales con varianzas iguales. Determine:


64 Distribuciones Muestrales

a) La probabilidad de que la varianza muestral de la muestra 1 sea mayor que la


varianza muestral de la muestra 2.

b) La probabilidad de que la varianza muestral de la muestra 1 sea menor que la


varianza muestral de la muestra 2.

15. En Merida la edad promedio en la que las mujeres se casan por primera vez es 18

a
nos. No se conoce ni la forma ni la desviacion estandar de la poblacion. Cual es la
probabilidad de encontrar en una muestra de 50 mujeres que la edad promedio a la que

se casaron sea mayor 19.3 a


nos?. Supongase que la desviacion estandar muestral es 1.5
a
nos.

16. La media de una poblacion de forma desconocida es 75. Se toma una muestra de 40.
La desviacion estandar de la muestra es 5. Calcule la probabilidad de que la media
muestral

a) sea menor que 74.

b) este entre 74 y 74.

c) este entre 76 y 77.

d ) sea mayor que 77.

17. El tiempo que un trabajador necesita para completar cierta tarea tiene media de 50
minutos y desviacion tpica de 8 minutos. Un supervisor registra los tiempos empleados

por 60 trabajadores para completar la tarea.

a) Calcular la probabilidad de que el tiempo muestral medio sea mayor de 52 minutos.


1.5 Ejercicios Varios 65

b) El tiempo muestral medio obtenido es 53 minutos. Tiene el supervisor razones


para pensar que el tiempo necesario para completar la tarea esta aumentando ?

18. Dos marcas de computadoras, A y B, poseen los siguientes parametros: A = 1,400


horas, , B = 1,200 horas. Se extrae una muestra aleatoria de 120 tubos de cada marca

de donde se obtiene que las varianza son 10,000 horas2 para la marca A y 40,000 horas2
para la marca B; determine la probabilidad de que

a) la marca A tendra una media de vida de por lo menos 160 horas mas que B

b) La marca A tendra una media de vida de por lo menos 250 hora mas que B

También podría gustarte