Distribuciones Muestrales
Distribuciones Muestrales
Distribuciones Muestrales
muestrales
GENERALIDADES
Teoría del muestreo consiste en un conjunto de procedimientos y técnicas
desarrolladas para estudiar relaciones entre poblaciones y parte de ellas con el
objeto de obtener conclusiones para toda la población
A esta parte de la estadística se la conoce como estadística inferencial, que es
conjunto de métodos o el proceso de utilización de datos muestrales que hacen
posible la estimación o verificación de alguna característica de la población.
o Mayor exactitud
o Costo
o Tiempo
o Pruebas destructivas
PROPIEDADES DE UN ESTIMADOR
INSESGADO O CENTRADO: Si la media de su distribución muestral coincide con la media del parámetro
EFICIENTE: De todo estimador insesgado, el más eficiente es el que tenga una menor varianza
CONSISTENTE: A medida que aumente el tamaño de la muestra, el estadístico tiende a parecerse más al
parámetro
SUFICIENTE: El que puede proporcionar la mayor cantidad de información del parámetro de la población.
DISTRIBUCIÓN EN EL MUESTREO DE LA MEDIA
Si a cada una de las M muestras de igual tamaño “n”, que podemos seleccionar
de una población “N”, le calculamos su respectivos estimadores (medias
aritméticas, proporción), la variable aleatoria así obtenida, la denominamos
“distribución en el muestreo de la media”.
Términos a utilizar
N: tamaño de la población.
n: tamaño de la muestra.
M: número posible de muestras de tamaño ”n”, que pueden ser obtenidas de una
población de tamaño “N”. Entonces M = NCn
μ: media aritmética de la población.
σ: desviación estándar de la población.
media aritmética de las medias muestrales, que se lee x doble raya.
desviación estándar de las medias muestrales, que se le da el nombre de
error estándar.
EJEMPLO 1
Supongamos una población finita de seis (6) elementos, referida al tiempo
necesario para ensamblar un artículo producido por los seis obreros de una
compañía ( A, B, C, D, E, F) durante un día determinado y consideremos además,
que utilizaremos una muestra de tamaño (2), para estimar el promedio de la
compañía y su desviación estándar.
TOTALES 318
A 51
B 52
C 53
D 53
E 54
F 55
DISTRIBUCIÓN DE LAS MEDIAS MUESTRALES
Tenemos que:
N=6
n=2
M =15 Elementos BC Elementos
muestrales muestrales
AB BC CE
AC BD CF
AD BE DE
AE BF DF
AF CD EF
DISTRIBUCIÓN DE LAS MEDIAS MUESTRALES
En la tabla se muestran los cálculos necesarios para obtener la media aritmética de las medias
muestrales y el error estándar que equivale a la desviación estándar de las medias muestrales.
Medias f f*
Totales 15
51.5 1
52.0 2
52.5 3
53.0 3
53.5 3
54.0 2
54.5 1
2
Ejercicio 1
Un supervisor tiene bajo su cargo seis empleados cuyas años de experiencia son: 2, 4,
6, 6, 7 y 8. Hay que elegir aleatoriamente dos de estos empleados para formar un
grupo de trabajo. Se quiere estimar las medias muestrales y la desviación estándar de
la muestra poblacional
DISTRIBUCIÓN MUESTRAL DE EN UNA POBLACIÓN NORMAL CON
MEDIA Y DESVIACIÓN ESTÁNDAR CONOCIDAS
Sin importar el tamaño de la muestra “n”, si se tiene una población normal de tamaño “N”, con
media μ y desviación estándar σ, las medias de todas las muestras de tamaño “n”, que se
pueden tomar de esa población, también se distribuirán normalmente. En este caso el valor Z
lo hallamos con la fórmula:
El valor para Z = - 4.70 no se encuentra en las tablas, luego – 4.70 se encuentra a la izquierda
de la curva y fuera de la misma. Esto quiere decir que todo el área bajo la curva que es
precisamente el área que está a la derecha de “-4.70, será la probabilidad pedida. Por lo tanto:
P(X> 0.98) = 1.
LEY t-STUDENT Y DISTRIBUCIÓN EN EL MUESTREO DE LA MEDIA
¿Qué pasará si el tamaño de la muestra es pequeño(n<30) y no se conoce la
desviación estándar poblacional σ? A éste respecto, el descubridor de la ley t-student,
William S Gosset, encontró que en lugar del valor de “Z” utilizado para la distribución
normal, se puede utilizar el estadístico “t”, similar a “Z”, que denominó ley t-Student y
que podemos escribir de manera similar al estadístico “Z”
Si se trata de una cola el valor de α se localiza en la tabla en la primera fila “Q”, pero si
es de dos colas dicho valor se localiza en la tabla en la segunda fila de la tabla “2Q”.
Los valores de t en el gráfico, se obtuvieron en la tabla teniendo en cuenta 16 grados
de libertad y un área en cada una de las colas de 0.005, puesto que la distribución es
simétrica.
Ejemplo 1
Un fabricante de una determinada droga, afirma que la misma tiene una vida media
útil de 1.000 horas. Un distribuidor pone en duda ésta afirmación y para probarlo toma
una muestra de 25 frascos de la droga y encuentra que la vida media útil de dicha
muestra es de 970 horas con desviación estándar de 24 horas. El distribuidor aceptará
la afirmación del fabricante si el valor de “t” calculado fluctúa entre –t 0.025 y +t0.025. ¿Que
deberá concluir el distribuidor? Se supone que la duración de la droga se distribuye
normalmente.
Observemos que la muestra es de tamaño 25 (n< 30) y además no se conoce la
desviación estándar de la población “σ”. Por otra parte, la población está normalmente
distribuida. Por lo tanto, concluimos que las medias muestrales se distribuirán de
acuerdo a la ley t-Student.
Ejercicios
1. En un banco los saldos de cuenta siguen una distribución normal, el saldo medio
es µ = $150.000 y la desviación estándar es σ = $ 35.000 ¿ cuál es la probabilidad
de que una cuenta que se tome al azar tenga un saldo mayor que $ 160.000?
2. Una empresa de material eléctrico fabrica bombillas que tienen una duración que
se distribuye aproximadamente en forma normal, con media de 800 horas y
desviación estándar de 40 horas. Calcule la probabilidad de que una muestra
aleatoria de 16 bombillas tenga una vida promedio de menos de 775 horas.
3. Las notas de cierto examen se distribuyen según una normal de media 5,8 y
desviación típica 2,4. Hallar la probabilidad de que la media de una muestra tomada
al azar de 16 estudiantes esté comprendida entre 5 y 7
4. Si la estatura media de los alumnos de una universidad es de 165 cm, con
desviación típica de 8 cm. Cuál es la probabilidad de que en una muestra de 36
alumnos se tenga una media mayor a 167 cm?
5. Un supervisor de planta en una compañía de acuerdo con sus registros, sabe
que los trabajadores inician labores en promedio 4.5 minutos después de firmar la
planilla de asistencia. El superintendente quiere comprobar tal afirmación, para lo
cual toma una muestra aleatoria de los registros de 12 trabajadores, con media
igual 3.2 y desviación estándar igual a 0.8. El superintendente acepta la afirmación
del supervisor, si el valor de t calculado se encuentra según la tabla entre –t 0.025 y
+t0.025.
DISTRIBUCIÓN EN EL MUESTREO DE LA DIFERENCIA DE MEDIAS EN
POBLACIONES NORMALES INDEPENDIENTES
Con mucha frecuencia estamos interesados en conocer las diferencias entre
dos medias de dos poblaciones independientes; así por ejemplo podríamos
estar interesados en comparar los ingresos promedios que presentan dos
regiones dadas, un científico o un ingeniero se podrian interesar en un
experimento donde se comparan dos metodos de produccion: el 1 y el 2. La
base para tal comparacion es μ1 – μ2, la diferencia entre las medias de
poblaciòn
DISTRIBUCIÓN EN EL MUESTREO DE LA DIFERENCIA DE MEDIAS EN
POBLACIONES NORMALES INDEPENDIENTES
El denominador , equivale a los grados de libertad, puesto que en éste caso, para obtener dicho
valor (v), se restan 2 unidades a la suma de las dos muestras ya que a través de S1 y S2, se deben
estimar los dos parámetros poblacionales σ1 y σ2
Ejemplo 1
Supongamos que se ha recibido información de parte de un vendedor, en el sentido de que
cierto producto fabricado por una empresa A, tiene una duración media que supera en 60
horas al mismo producto producido por una empresa B de la competencia. Un analista quiere
poner a prueba dicha afirmación, para lo cual toma una muestra de 9 piezas en dichas
empresas encontrado que para la empresa A, la duración promedio es de 1.000 horas con
una desviación estándar de 60 horas, mientras que para la empresa B, la duración media es
de 925 horas con desviación estándar de 50 horas. El analista aceptará la afirmación del
vendedor, si el valor de “t”, de la diferencia de medias, está en el intervalo –t 0.05 y +t0.05 Se
sabe que la duración de las piezas se comporta normalmente en ambas empresas.
Gráfica
Como el valor de “t” calculado (+0.58), se encuentra dentro del intervalo, entonces,
podríamos concluir que la afirmación del vendedor es correcta, es decir, que las
medias muestrales pertenecen a las dos poblaciones señaladas.
Ejercicios
1. Las compañías A y B fabrican dos tipos de cables que tienen una resistencia media a la rotura
de 4.000 y 4.500 libras y desviaciones estándar de 300 y 200 libras respectivamente. Si se
comprueban 100 cables de A y 50 cables de B; ¿cual es la probabilidad de que la media a la
rotura de B sea mayor que la de A en 400 libras o más?
2. Supongamos dos poblaciones normales, referidas al consumo promedio mensual de energía
eléctrica de los hogares de dos barrios de una ciudad, de los cuales tomamos muestras de
tamaños 9 y 16 respectivamente. Se pide calcular el error estándar de las diferencias de
medias muestrales, si las desviaciones estándar de dichas muestras son 130 y 180
respectivamente
3. El tiempo promedio para realizar una tarea por parte de los empleados del turno 1 de una
compañía es de 20 minutos con una desviación estándar de 6 minutos. Dichos valores para los
empleados del turno 2 son 25 minutos y 5.5 minutos respectivamente. ¿Cuàl es la
probabilidad de que en un concurso que se ha programado, el promedio para 10 empleados
del turno 1, sea mayor que el rendimiento medio de 9 empleados del turno 2? Se supone que
el tiempo empleado por los empleados en ambos turnos, se distribuyen normalmente.
Respuesta: 0.0298.
4. En cierta región los salarios diarios de los mineros del carbón están normalmente distribuidos,
con una media de $ 1.650.00 US y una desviación estándar de $ 150.00 US. La población de
mineros es superior a 1500. Cual es la probabilidad de que en una muestra representativa de
25 de esos mineros, el salario medio sea inferior a $1.575.00 US. Respuesta: 0.0062.
DISTRIBUCIÓN EN EL MUESTREO DE LA PROPORCIÓN
Frecuentemente en estadística es importante conocer la proporción de una cosa con respecto al todo, como la proporción de piezas
defectuosas en un lote de producción dado, proporción de electores a favor de un cierto candidato, etc. La distribución en el
muestreo de la proporción, consiste en la distribución de las proporciones de todas las posibles muestras que pueden ser
seleccionadas de una población. .
Términos:
Propiedades:
a.
b.
c. Se debe usar el factor de corrección para el cálculo de σp, cuando n < 0.05N
Fórmula para Z
Ejemplo 1
Se ha demostrado por reclamos que se han hecho, que el 20% de las cajas de medicamentos
llegan averiadas al utilizar una compañía intermunicipal de transporte. ¿Cual es la probabilidad
de que al enviar 100, cajas la proporción de averiadas sea menor que el 25%?
Ejemplo 2
En una gran compañía, el 18% de los trabajadores están de acuerdo con un proyecto de ley que modifica el
código laboral Colombiano. La gerencia de la compañía desea conocer la probabilidad de que en una muestra
aleatoria de 120 trabajadores, el 30% o más estén de acuerdo con dicho proyecto de ley.
Luego el Gerente de la compañía puede concluir, que en la mencionada muestra no es posible que el 30% o
más estén de acuerdo con el proyecto de ley.
DISTRIBUCIÓN EN EL MUESTREO DE LA DIFERENCIA DE
PROPORCIONES
Podríamos estar interesados en conocer las diferencia entre dos proporciones de dos poblaciones
independientes; así por ejemplo, supongamos que se sabe por experiencia que la proporción de la población
empleada respecto a la población económicamente activa de una región es el 60%, mientras que para otra
región vecina es el 66%. Podríamos estar interesados en conocer la probabilidad de que para un año dado, las
diferencias entre las proporciones no sobrepase el 5%, con muestras de tamaño 150.
Ejemplo 1
Dos máquinas A y B, producen un mismo artículo. La máquina A produce como término medio una
proporción de 14% de artículos defectuosos, mientras que la máquina B, produce en término medio una
proporción de 20% de artículos defectuosos. Si se obtiene una muestra aleatoria de 200 unidades del
artículo que provengan de la máquina A y una muestra aleatoria de 100 unidades provenientes de la
máquina B, calcular la probabilidad de que B tenga una proporción de defectuosos 8% o más que A.. Se
supone que la población es infinita.
Como ambas muestras son mayores que 30, entonces, según el teorema central del límite, las
diferencias de las proporciones muestrales se distribuirán normalmente.
Ejercicio
Los hombres y mujeres adultos de cierta ciudad difieren en sus opiniones sobre la pena de muerte para
personas culpables de violación de niños. Se cree que el 12% de los hombres están a favor de la pena de
muerte, mientras que sólo 10% de las mujeres lo están. Si se pregunta a dos muestras aleatorias de 100
hombres y 100 mujeres su opinión sobre la pena de muerte, determine la probabilidad de que el porcentaje
de hombres a favor sea al menos 3% mayor que el de las mujeres.
DISTRIBUCIÓN JI-CUADRADA
Se deriva de la distribución normal
Son la base de metodologías inferenciales como intervalos de confianza y prueba de hipótesis
Es la suma de las diferencias cuadráticas relativas entre valores experimentales (observados) y valores
teóricos (esperados)
Sólo puede tomar valores positivos
Es la distribución muestral de la varianza muestral. O sea que si se extraen todas las muestras posibles de
una población normal y a cada muestra se le calcula su varianza, se obtendrá la distribución muestral de
varianzas.
El cálculo de probabilidad en una distribución muestral de varianzas nos sirve para saber como se va a
comportar la varianza o desviación estándar en una muestra que proviene de una distribución normal.
Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el estadístico X^2
Propiedades:
Los valores de son mayores o iguales que 0.
La forma de una distribución depende del gl= n-1. En consecuencia, hay un número infinito de
distribuciones
El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
Las distribucionesno son simétricas. Tienen colas estrechas que se extienden a la derecha; esto es, están
sesgadas a la derecha.
Ejemplo 1
Un fabricante X concluye que su producto tendrá una vida útil en promedio de 10 años. Se elige una muestra
de 12 productos con una desviación de 2.53. Teniendo en cuenta una desviación poblacional de 1.2 años. ¿se
puede corroborar que la desviación poblacional es de 1.2 años con 95% de confianza?
Ejercicio
Un fabricante de baterías para automóvil garantiza que sus baterías duran en
promedio 3 años con desviación estándar de 1 año. ¿Si 5 de dichas baterías presentan
una varianza de 0,815, está el fabricante aún convencido de que la duración de sus
baterías tienen una desviación estándar de un año? Se sabe que la duración de las
baterías se distribuye normalmente.
• Es una herramienta muy valiosa para efectuar inferencias respecto de las varianzas
de dos poblaciones.
• Es una función continua, sólo tiene valores positivos.
• La curva que genera dicha distribución es similar a la distribución Ji-cuadrada, es
decir, sesgada a la derecha. (asimétrica)
• Nos sirve para comparar varianzas entre dos poblaciones diferentes
• Es la distribución más importante en experimentación. Determina si las
diferencias entre las poblaciones son significativas y si se le pueden atribuir
cambios importantes al comportamientos de las poblaciones en estudio
Varianza de muestras aleatorias independientes de tamaño n1 y n2 respectivamente,
tomadas de dos poblaciones normales que tienen igual varianza,
a) la probabilidad 0.01 (probabilidad de la cola derecha), el valor de F pedida es: F(0.01, 20, 24) =
2.74.
F = = 2,5
F = 10 𝑥 16 = 2,2
8𝑥 9
https://www.youtube.com/watch?v=RbCYBqxmvwQ
https://www.youtube.com/watch?v=46DgBP9VwtE
https://www.youtube.com/watch?v=cnrpYAsM9kI
https://www.youtube.com/watch?v=lHbVuAhSCJE
https://www.youtube.com/watch?v=M-pqSOptFOY
https://www.youtube.com/watch?v=V8ZJR9girko
https://www.youtube.com/watch?v=LuGG3XNy6aQ
https://www.youtube.com/watch?v=lOCXF9pjv8s
https://www.youtube.com/watch?v=4uzowtesHds