Distribuciones Muestrales 2023 - 02 PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 71

Distribuciones

de Muestreo
Fundamentales
Principales conceptos en inferencia estadística

Idea básica: Hacer inferencias sobre la


población a partir de la muestra que hemos
extraído de la misma.

La muestra habrá de ser representativa de la población, para


que podamos efectuar inferencias que tengan sentido.
Principales conceptos en inferencia estadística
• Población: Es la totalidad de las observaciones en la que
estamos interesados
• Muestra: Es un subconjunto de una población
• Muestra Aleatoria: Las observaciones son elegidas de
manera independiente y al azar
• Para seleccionar una muestra aleatoria de tamaño 𝑛 de
una población con distribución 𝑓(𝑥), definimos la variable
aleatoria 𝑋𝑖 , 𝑖 = 1, 2, . . . , 𝑛 que represente la 𝑖 −
é𝑠𝑖𝑚𝑎 medición. Las variables aleatorias
𝑋1 , 𝑋2 , . . . , constituyen una muestra aleatoria de la
población con valores numéricos 𝑥1 , 𝑥2 , . . . , 𝑥𝑛 si las
mediciones se obtienen al repetir el experimento 𝑛 veces
independientes y bajo las mismas condiciones.
Distribución
Muestral de un
Estadístico
Distribución Muestral de un Estadístico
Supongamos que tenemos una variable aleatoria, cuya
distribución es 𝒇(𝒙).
Supongamos, por simplicidad, que obtenemos una muestra
aleatoria de tamaño 𝒏
𝑋1 , 𝑋2 , . . . , 𝑋𝑛
Entonces, un estadístico es cualquier función 𝒉 definida sobre
𝒙𝟏 , 𝒙𝟐 , . . . , 𝒙𝒏 y que no incluye parámetro desconocido alguno:
𝒀 = 𝒉(𝒙𝟏 , 𝒙𝟐 , . . . , 𝒙𝒏 )
Un parámetro es una caracterización numérica de la distribución de la población de
manera que describe, parcial o completamente, la función de densidad de
probabilidad de la característica de interés.

Cualquier función de las variables aleatorias que forman una


muestra aleatoria se llama estadística.
La distribución de dicho estadístico 𝒀 la vamos a denominar 𝒈(𝒚)
Distribución Muestral de un Estadístico
Entonces:
𝒇(𝒙) es la distribución de la variable aleatoria bajo estudio
𝒈(𝒚) es la distribución del estadístico que tenemos
Es vital conocer la distribución muestral del estadístico de
interés para poder efectuar inferencias sobre el parámetro
correspondiente.
Esto es, para efectuar inferencias sobre la media poblacional
𝝁, necesitamos conocer la distribución muestral de 𝑿ഥ.

Muestra A 0,97 1,00 0,94 1,03 1,11


Muestra B 1,06 1,01 0,88 0,91 1,14
Algunas estadísticas Importantes
Si 𝑋1 , 𝑋2 , … , 𝑋𝑛 no necesariamente diferentes, representan una
muestra aleatoria de tamaño 𝑛
Media Muestral:

Mediana Muestral:
Algunas estadísticas Importantes
Moda:
• Si 𝑋1 , 𝑋2 , … , 𝑋𝑛 no necesariamente diferentes, representan
una muestra aleatoria de tamaño 𝑛 , entonces la moda M es
aquel valor de la muestra que ocurre más a menudo o con la
mayor frecuencia. La moda puede no existir, y cuando existe no
necesariamente es única.

Rango: 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛


Varianza Muestral:
Algunas estadísticas Importantes

Varianza Muestral:

Ejemplo
Distribución
Muestral de
Medias
Distribuciones Muestral de Medias

La distribución de probabilidad de una estadística se llama


Distribución Muestral.

ഥ se llama
Por ejemplo, la distribución muestral de 𝑿
Distribución Muestral de la Media.
Distribución Muestral de Medias

Suponga que una muestra aleatoria de 𝑛 observaciones se


toma de una población normal con media 𝜇 y varianza 𝜎 2

Cada observación 𝑋𝑖 , 𝑖 = 1, 2, . . . , 𝑛 de la muestra aleatoria


tendrá la misma distribución normal que la población que se
muestrea, entonces
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑋ത =
𝑛
𝜇+𝜇+⋯+𝜇
Tiene distribución normal con media 𝜇𝑋ത = =𝝁
𝑛
𝜎 2 +𝜎 2 +⋯+𝜎 2 𝝈𝟐
y Varianza 𝜎𝑋2ത = 𝑛2
= 𝒏
Combinaciones lineales de variables
aleatorias
Combinaciones lineales de variables
aleatorias
Combinaciones lineales de variables
aleatorias
Teorema del Límite Central
ഥ es la media de una muestra aleatoria de tamaño 𝑛 tomada de una
• Si 𝑿
población con media 𝜇 y varianza finita 𝜎 2 , entonces la forma límite
ഥ −𝝁
𝑿
de la distribución de 𝒁 = 𝝈 conforme 𝑛 → ∞, es la Distribución
ൗ 𝒏
Normal Estándar N(0, 1).
• La aproximación normal para 𝑿 ഥ por lo general será buena si 𝒏 ≥
𝟑𝟎 sin importar la forma de la población. Si 𝒏 < 𝟑𝟎 la aproximación es
buena sólo si la población no es muy diferente de una distribución
normal. Si la población es normal, la distribución muestral de
ഥ seguirá una distribución normal exacta sin importar el tamaño de las
𝑿
muestras.

Ejemplo del teorema del limite central


ഥ para n = 1, n moderada y n
(distribución de 𝑿
grande).
Distribución Muestral de Medias

Ejercicio

Se tiene una máquina de llenado para vaciar 500 gr de


cereal en una caja de cartón. Supóngase que la cantidad
de cereal que se coloca en cada caja es una variable
aleatoria normalmente distribuida con media 500 gr y
desviación estándar 20 gr. Para verificar que el peso
promedio de cada caja se mantiene en 500 gr se toma una
muestra aleatoria de 25 de éstas en forma periódica y se
pesa el contenido de cada caja. El gerente de la planta ha
decidido detener el proceso y encontrar la falla cada vez
que el valor promedio de la muestra sea mayor de 510 gr
o menor de 490 gr. Obtener la probabilidad de detener el
proceso.

ഥ < 𝟓𝟏𝟎)
𝑷 𝑫𝒆𝒕𝒆𝒏𝒆𝒓 𝒆𝒍 𝒑𝒓𝒐𝒄𝒆𝒔𝒐 = 𝟏 − 𝑷(𝟒𝟗𝟎 < 𝑿
Distribución Muestral de Medias

Ejercicio

Una máquina de refrescos se ajusta para que la cantidad


de bebida que sirve promedie 240 mililitros con una
desviación estándar de 15 mililitros. La máquina se
verifica periódicamente tomando una muestra de 40
bebidas y se calcula el contenido promedio. Si la media
de las 40 bebidas es un valor dentro del intervalo 𝜇𝑋ത ±
2𝜎𝑋ത , se piensa que la máquina opera satisfactoriamente;
de otra forma, debe ser ajustada. Un funcionario de la
compañía encuentra que la media de 40 bebidas es 𝑥ҧ =
236 mililitros y concluye que la máquina no necesita
ajuste. ¿Esta fue una decisión razonable?
Distribución Muestral de Medias

Ejercicio

Un fabricante de aspirina llena los frascos por peso en


lugar de por conteo. Como cada frasco debe contener
100 tabletas, el peso promedio por tableta deberá ser
de 5 gramos. Cada una de las 100 tabletas tomadas de
un lote muy grande es pesada y el resultado es un
peso promedio muestral por tableta de 4.87 gramos y
una desviación estándar muestral de 0.35 gramos.
¿Proporciona esta información una fuerte evidencia
para concluir que la compañía no está llenando sus
frascos como lo anuncia?
Distribución Muestral de Medias

Ejercicio

La contaminación de los suelos de minas en China es un grave


problema ambiental. Una reciente investigación informó que,
para una muestra de 3 especímenes de suelo de cierta área
restaurada de minería, la media de la concentración total de la
muestra de Cu fue 45.31 mg/kg, con una desviación estándar de
5.26.
Se dijo también que el valor histórico en China de esta
concentración fue de 20. Los resultados de diversas pruebas
estadísticas descritas en la investigación se basan en el supuesto
de normalidad.
¿Los datos proporcionan una fuerte evidencia para concluir que
la concentración real promedio en la región de la muestra
supera el valor histórico planteado? Explique.
Distribución
Muestral de la
diferencia de dos
promedios
(Varianzas
Conocidas)
Distribución Muestral de la diferencia de dos promedios
(Varianzas Conocidas)

Si se extraen al azar muestras independientes de tamaños 𝒏𝟏 y 𝒏𝟐 de


dos poblaciones, discretas o continuas, con media 𝝁𝟏 y 𝝁𝟐 y varianza
𝝈𝟐𝟏 y 𝝈𝟐𝟐 , respectivamente, entonces la Distribución Muestral de las
diferencias de las medias 𝑋ത1 − 𝑋ത2 , está distribuida aproximadamente
de forma normal con media y varianza dadas por
𝝈𝟐𝟏 𝝈𝟐𝟐
𝝁𝑿ഥ 𝟏 −𝑿ഥ 𝟐 = 𝝁𝟏 − 𝝁𝟐 y 𝝈𝟐𝑿ഥ 𝟏 −𝑿ഥ 𝟐 = +𝒏
𝒏𝟏 𝟐
De aquí
ഥ 𝟏 −𝑿
𝑿 ഥ 𝟐 − 𝝁𝟏 −𝝁𝟐
𝒁= ~ 𝑵(𝟎, 𝟏).
𝝈𝟐
𝟏 𝝈𝟐
𝒏𝟏
+ 𝒏𝟐
𝟐
Distribución Muestral de la diferencia de dos promedios
(Varianzas Conocidas)

Ejercicio

Se toma una muestra aleatoria de tamaño 25 de una


población normal que tiene una media de 80 y una
desviación estándar de 5. Una segunda muestra
aleatoria de tamaño 36 se toma de una población
normal diferente que tiene una media 75 y una
desviación estándar 3. Encuentre la probabilidad de
que la media muestral calculada de las 25 mediciones
exceda la media muestral calculada de las 36
mediciones por al menos 3,4 pero menos de 5,9.
Distribución Muestral de la diferencia de dos promedios
(Varianzas Conocidas)

Ejercicio

El peso de los huevos de gallina producidos por una granja sigue


una distribución normal de media 67 gramos y desviación
estándar 6 gramos. En otra granja con otro tipo de alimentación
se ha comprobado que el peso de los huevos corresponde a otra
distribución normal de media 65 gramos y desviación estándar 1
gramo.
a) Si se tomara al azar muestras de 200 huevos de cada granja,
determinar la distribución para la diferencia de medias
muestrales. ¿Cuál es la probabilidad de que la diferencia en los
pesos de los huevos sea menor a 3 gramos?
b) Si se toma una muestra de 120 huevos de la primera granja
y 150 de la segunda, ¿cuál es la probabilidad de que la diferencia
en los pesos de los huevos sea mayor a 3 gramos?
Distribución Muestral de la diferencia de dos promedios
(Varianzas Conocidas)

Ejercicio

Las pruebas de control de calidad para un modelo A de


bombilla han determinado que la duración se distribuye
como una normal de media 3300 horas y desviación
estándar 180 horas; mientras que para otro modelo B la
duración media es de 3200 horas y desviación estándar 155
horas.
Si se toman muestras aleatorias de 100 bombillas de cada
modelo:
¿Cuáles son los parámetros de media y desviación típica de
la diferencia de las medias muestrales?
Halla la probabilidad de que la diferencia de las medias de
las duraciones de las bombillas de cada modelo sea inferior
a 40 horas.
Distribución de la
Proporción de la
Muestra
Distribución de la Proporción de la Muestra
 Frecuentemente se tiene interés en la distribución muestral de estadísticas, como la
proporción de muestras, que resultan de los datos de conteos o frecuencias.
 Si se extrae una muestra aleatoria de tamaño 𝒏 de una población de variable
dicotómica, donde la proporción de las observaciones con la característica de
ෝ,
interés en la población es 𝒑, la distribución de la proporción de la muestra, 𝒑
𝒑 𝟏−𝒑
es aproximadamente normal con media 𝝁𝒑ෝ = 𝒑 y varianza 𝜎𝒑ෝ2 =
𝒏
 Muestra grandes → Teorema del Límite Central
 𝒏𝒑 y 𝒏(1 − 𝒑) deben ser mayores que 5
ෝ−𝒑
𝒑
𝒁= ~𝑵(𝟎, 𝟏)
𝒑 𝟏−𝒑
𝒏

Ejemplo: Se sabe que un medicamento utilizado para tratar cierta enfermedad es eficaz
en un lapso de 3 días en 75% de los casos. Para evaluar la eficacia de un nuevo
medicamento para tratar la misma enfermedad, éste se administró a 150 personas que
la padecían. Al término de tres días, sanaron 97 personas. Si este nuevo medicamento es
tan eficaz como el primero. ¿cuál es la probabilidad de obtener una proporción de
pacientes que se recuperan tan pequeña?
Distribución de la Proporción de la Muestra

Ejercicio

Un estudio realizado por una compañía de seguros de automóviles


establece que una de cada cinco personas accidentadas es mujer. Si
se contabilizan, por término medio, 169 accidentes cada fin de
semana:
a) ¿Cuál es la probabilidad de que, en un fin de semana, la
proporción de mujeres accidentadas supere el 24 %?
b) ¿Cuál es la probabilidad de que, en un fin de semana, la
proporción de hombres accidentados supere el 85 %?
c) ¿Cuál es, por término medio, el número esperado de hombres
accidentados cada fin de semana?
Distribución de la Proporción de la Muestra

Ejercicio

Se sabe que el 40 % de las mujeres embarazadas dan a luz antes de


la fecha prevista. En un hospital, han dado a luz 125 mujeres en una
semana.
a) ¿Cuál es el número esperado de mujeres a las que se les
adelantó el parto?
b) ¿Cuál es la probabilidad de que entre 45 y 60 mujeres se les
haya adelantado el parto?
Distribución de la Proporción de la Muestra

Ejercicio

Una muestra aleatoria de 150 donaciones recientes en


un banco de sangre revela que 82 fueron de sangre tipo
A. ¿Sugiere esto que el porcentaje real de donaciones
tipo A difiere de 40%, el porcentaje de la población que
tiene sangre tipo A?
Distribución de la
diferencia entre las
proporciones de dos
muestras
Distribución de la diferencia entre las proporciones de dos
muestras
Frecuentemente es de interés las proporciones de dos poblaciones y se
desea determinar la probabilidad asociada con la diferencia de las
proporciones calculadas a partir de muestras extraídas de cada una de dichas
poblaciones.
Si se extraen muestras aleatorias independientes de tamaño 𝒏𝟏 y 𝒏𝟐 de dos
poblaciones de variables dicotómicas, donde las proporciones de las
observaciones con la característica de interés en ambas poblaciones son 𝒑𝟏 y
𝒑𝟐 , respectivamente, la distribución de la diferencia entre las proporciones
ෝ𝟏 − 𝒑
de las muestras, 𝒑 ෝ 𝟐 , es aproximadamente normal con media
𝝁𝒑ෝ𝟏 −ෝ𝒑𝟐 = 𝒑𝟏 − 𝒑𝟐
y varianza
𝟐 𝒑𝟏 (𝟏 − 𝒑𝟏 ) 𝒑𝟐 (𝟏 − 𝒑𝟐 )
𝝈𝒑ෝ𝟏 −ෝ𝒑𝟐 = +
𝒏𝟏 𝒏𝟐
Cuando 𝒏𝟏 y 𝒏𝟐 son grandes.
Se considera que 𝒏𝟏 y 𝒏𝟐 son grandes cuando 𝒏𝟏 𝒑𝟏 , 𝒏𝟐 𝒑𝟐 , 𝒏𝟏 (𝟏 − 𝒑𝟏 ) y
𝒏𝟐 (𝟏 − 𝒑𝟐 ) son mayores que 5
ෝ𝟏 − 𝒑
𝒑 ෝ𝟐 − 𝒑𝟏 − 𝒑𝟐
𝒁= ~𝑵(𝟎, 𝟏)
𝒑𝟏 (𝟏 − 𝒑𝟏 ) 𝒑𝟐 (𝟏 − 𝒑𝟐 )
𝒏𝟏 + 𝒏𝟐
Distribución Muestral de la diferencia de dos promedios
(Varianzas Conocidas)

Ejercicio

Se sabe que en una población de adolescentes 10% de los


varones son obesos. Si la misma proporción de mujeres en
esa población son obesas, ¿cuál es la probabilidad de que
una muestra al azar de 250 varones y 200 mujeres
ෝ𝟏 − 𝒑
proporcione un valor de 𝒑 ෝ𝟐 ≥ 𝟎, 𝟎𝟔 ?
Distribución de la diferencia entre las proporciones de dos muestras

Ejercicio

Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son


defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2
son defectuosos; se toman muestras de 120 objetos de cada
máquina:
a) ¿Cuál es la probabilidad de que la proporción de artículos
defectuosos de la máquina 2 rebase a la máquina 1 en por lo
menos 0.10?
b) ¿Cuál es la probabilidad de que la proporción de artículos
defectuosos de la máquina 1 rebase a la máquina 2 en por lo
menos 0.15?
Distribución de 𝑺𝟐
Distribución χ²
La Distribución χ² (de Pearson) es una distribución de
probabilidad continua con un parámetro 𝑘 que representa los
grados de libertad de la variable aleatoria:
𝑋 = 𝑍12 + 𝑍22 + ∙∙∙ +𝑍𝑘2
donde 𝑍𝑖 son variables aleatorias de distribución normal,
de media cero y varianza uno.
El que la variable aleatoria 𝑋 tenga esta distribución se
representa habitualmente así: 𝑋~𝜒 2 .
Es conveniente tener en cuenta que la letra griega χ se transcribe
al latín como chi y se pronuncia en castellano como ji.
La distribución χ² tiene muchas aplicaciones en inferencia
estadística, por ejemplo en la denominada prueba χ² utilizada
como prueba de independencia y como prueba de bondad de
ajuste y en la estimación de varianzas.
Distribución χ²
Distribución χ²
Teorema de aditividad de la distribución ji-cuadrada
Sean Y1, Y2, . . . , Yp variables aleatorias ji-cuadrada independientes
con k1, k2, . . . , kp grados de libertad, respectivamente. Entonces, la
cantidad
𝒀 = 𝒀𝟏 + 𝒀𝟐 + ⋯ + 𝒀𝒑
sigue una distribución ji-cuadrada con grados de libertad igual a
𝒑
σ
𝒌 = 𝒊=𝟏 𝒌𝒊
Distribución χ²
Si se extrae una muestra aleatoria de tamaño 𝑛 de una población
normal con media 𝜇 y varianza 𝜎 2 , y se calcula la varianza muestral
obtenemos un valor de la estadística 𝑆 2 . Procederemos a considerar la
𝑺𝟐
distribución de la estadística 𝒏 − 𝟏
𝝈𝟐
𝑆 2 es la varianza muestral, 𝜎 2 es la varianza poblacional.
La varianza muestral se calcula como:

𝒏 ഥ 𝟐
σ 𝒊=𝟏 𝑿 𝒊 − 𝑿
𝑺𝟐 = →
𝒏−𝒏 𝟏

𝒏 − 𝟏 𝑺𝟐 = ෍ 𝑿𝒊 − 𝑿 𝟐

𝒊=𝟏
Distribución χ²
Teorema
Si 𝑺𝟐 es la varianza de una muestra aleatoria de tamaño n que se toma
de una población normal que tiene varianza 𝝈𝟐 , entonces la estadística
𝒏
𝒏−𝟏 𝑺 𝟐
𝑿𝒊 − 𝑿ഥ 𝟐
𝟐
𝝌 = 𝟐
=෍
𝝈 𝝈𝟐
𝒊=𝟏
tiene distribución ji-cuadrada con 𝝑 = 𝒏 − 𝟏 grados de libertad.

𝛼
𝜒𝛼2
La distribución ji cuadrada.
Distribución χ²

𝜒𝛼2
𝛼
Distribución χ²
A considerar
Exactamente 95% de una distribución ji cuadrada está entre
2 2 2 2
𝜒0,975 y 𝜒0,025 . Un valor 𝜒 que cae a la derecha de 𝜒 0,025
no es probable que ocurra a menos que nuestro valor
supuesto de 𝜎 2 sea demasiado pequeño. De manera similar,
2
un valor 𝜒 2 que cae a la izquierda de 𝜒0,975 es improbable a
menos que nuestro valor supuesto de 𝜎 2 sea demasiado
grande.
En otras palabras, es posible tener un valor 𝜒 2 a la izquierda
2 2
de 𝜒0,975 o a la derecha de 𝜒0,025 cuando 𝜎 2 es correcta,
pero si esto debe ocurrir, es más probable que el valor
supuesto de 𝜎 2 sea un error.
Distribución χ²

Ejercicio

Ejemplos
 Se toma una muestra aleatoria de 𝑛 = 25
observaciones de una población normal que tiene
una varianza 𝜎 2 = 10. Encuentre la probabilidad de
que la varianza de la muestra sea mayor que 16,4
Distribución χ²

Ejercicio

 Las calificaciones de un examen de colocación que se


aplicó a estudiantes de primer año de una universidad
durante los últimos cinco años tienen una distribución
aproximadamente normal con una media 𝜇 = 74 y una
varianza 𝜎 2 = 8. ¿Seguiría considerando que 𝜎 2 = 8 es
un valor válido de la varianza si una muestra aleatoria
de 20 estudiantes, a los que se les aplica el examen de
colocación este año, obtienen un valor de 𝑠 2 = 20?
Distribución T de
Student
Distribución T de Student
La Distribución 𝒕 de Student es una distribución de
probabilidad que surge del problema de estimar la media de
una población normalmente distribuida cuando el tamaño
de la muestra es pequeño.

Aparece de manera natural al realizar la Prueba t de


Student para la determinación de las diferencias entre dos
medias muestrales y para la construcción del intervalo de
confianza para la diferencia entre las medias de dos
poblaciones cuando se desconoce la desviación típica de
una población y ésta debe ser estimada a partir de los datos
de una muestra.
Distribución T
Distribución T
La Distribución 𝒕 de Student (con 𝝊 grados de libertad) es la
distribución de probabilidad del cociente
𝒁
𝑽
𝒗
donde
𝑍 tiene una distribución normal de media cero y varianza 1
𝑉 tiene una distribución chi-cuadrado con 𝜐 grados de
libertad
Z y V son independientes
Distribución T
Sea 𝑋1 , 𝑋2 , . . . , 𝑋𝑛 variables aleatorias independientes que son todas
normales con media 𝜇 y desviación estándar 𝜎. Sea
𝑛 𝑋𝑖 𝑛 𝑋𝑖 −𝑋ത 2
𝑋ത = σ𝑖=1 y 𝑠 = 2 σ𝑖=1
𝑛 𝑛−1
Entonces la variable aleatoria
ഥ −𝝁
𝑿
𝑻= 𝑺
ൗ 𝒏
tiene una distribución 𝒕 con 𝝑 = 𝒏 − 𝟏 grados de libertad

Propiedad de simetría de la distribución t


Distribución T
A considerar
Distribución T

Ejercicio
Distribución T
Distribución T

Ejercicio

Una empresa que fabrica juguetes electrónicos afirma que las baterías que
utiliza en sus productos duran un promedio de 30 horas. Para mantener este
promedio se prueban 16 baterías cada mes. Si el valor t calculado cae entre
−𝒕𝟎,𝟎𝟐𝟓 y 𝒕𝟎,𝟎𝟐𝟓 , la empresa queda satisfecha con su afirmación. ¿Que
conclusiones debería sacar la empresa a partir de una muestra que tiene
una media de 𝒙 ഥ = 𝟐𝟕, 𝟓 horas y una desviación estándar de 𝒔 = 𝟓 horas?
Suponga que la distribución de las duraciones de las baterías es
aproximadamente normal.
Distribución T

Ejercicio
Distribución T

Ejercicio
Distribución de la diferencia entre dos
medias muestrales
(Varianzas Iguales y Desconocidas)
ഥ𝟏 − 𝑿
𝑿 ഥ 𝟐 − 𝝁𝟏 − 𝝁𝟐
𝑻=
𝟏 𝟏
𝑺𝒑 ∗ 𝒏 + 𝒏
𝟏 𝟐
𝒏𝟏 −𝟏 𝑺𝟐𝟏 + 𝒏𝟐 −𝟏 𝑺𝟐𝟐
𝑺𝒑𝟐 =
𝒏𝟏 +𝒏𝟐 −𝟐

Se Distribuye 𝒕 de Student con 𝝑 = 𝒏𝟏 + 𝒏𝟐 − 𝟐 grados


de libertad grados de libertad.
Distribución de la diferencia entre dos medias muestrales
(Varianzas Iguales y Desconocidas)
ഥ𝟏 − 𝑿
𝑿 ഥ 𝟐 − 𝝁𝟏 − 𝝁𝟐
𝐓=
𝟏 𝟏
𝑺𝒑 ∗ +
𝒏𝟏 𝒏𝟐

𝒏𝟏 − 𝟏 𝑺𝟐𝟏 + 𝒏𝟐 − 𝟏 𝑺𝟐𝟐
𝑺𝒑𝟐 =
𝒏𝟏 + 𝒏𝟐 − 𝟐

 Se Distribuye 𝒕 de Student con 𝝑 = 𝒏𝟏 + 𝒏𝟐 − 𝟐 grados de libertad grados de


libertad.

EJERCICIO:
Un fabricante afirma que la resistencia promedio a la tensión del hilo A es igual
a la resistencia promedio a la tensión del hilo B. Para probar esta afirmación se
pusieron a prueba 50 pedazos de cada tipo de hilo en condiciones similares. El
hilo A tuvo una resistencia a la tensión promedio de 86,7 kilogramos con una
desviación estándar de 6,28 kilogramos; mientras que el hilo B tuvo una
resistencia a la tensión promedio de 77,8 kilogramos con una desviación
estándar de 6,60 kilogramos. Está Ud. de acuerdo con la afirmación del
fabricante. Asuma que ambas poblaciones son normales con varianzas iguales.
Distribución F
Distribución F
La Distribución 𝑭 es una distribución de probabilidad continua. También
se la conoce como distribución F de Snedecor (por George Snedecor) o
como distribución F de Fisher-Snedecor.

La distribución F tiene una amplia aplicación en la comparación de


varianzas muestrales y también es aplicable en problemas que implican
dos o más muestras.
El estadístico F se define como el cociente de dos variables aleatorias chi
cuadrada independientes, dividida cada una entre su número de grados
de libertad. Por lo tanto, podemos escribir
𝑼ൗ
𝒗𝟏
𝐹=
𝑽ൗ
𝒗𝟐
Donde 𝑼 y 𝑽son variables aleatorias independientes con distribuciones
chi-cuadrada con𝒗𝟏 y 𝒗𝟐 grados de libertad, respectivamente.
La distribución F
Distribuciones F típicas

𝒇𝟎,𝟗𝟓(𝟏𝟎, 𝟐𝟓) =0,36633


𝒇𝟎,𝟎𝟓(𝟐𝟓,𝟏𝟎) =2,72978
La distribución F

𝒇𝜶(𝒗𝟏,𝒗𝟐)
Ilustración de 𝒇𝜶(𝒗𝟏,𝒗𝟐) para la distribución F

Por consiguiente, el valor 𝑓 con 10 y 25 grados de libertad, que deja un área de 0,95 a la
derecha, es
𝟏 𝟏
𝒇𝟎,𝟗𝟓(𝟏𝟎,𝟐𝟓) = = = 𝟎, 𝟑𝟔𝟔𝟑𝟑
𝒇𝟎,𝟎𝟓(𝟐𝟓,𝟏𝟎) 𝟐, 𝟕𝟐𝟗𝟕𝟖
La distribución F
Ilustración de la 𝒇𝜶 para la distribución F

Por consiguiente, el valor 𝑓 con 10 y 25 grados de libertad, que deja un área de 0,95 a la
derecha, es

𝟏 𝟏
𝒇𝟎,𝟗𝟓(𝟏𝟎,𝟐𝟓) = = = 𝟎, 𝟑𝟔𝟔𝟑𝟑
𝒇𝟎,𝟎𝟓(𝟐𝟓,𝟏𝟎) 𝟐, 𝟕𝟐𝟗𝟕𝟖

https://homepage.divms.uiowa.edu/~mbognar/applets/f.html
La distribución F
Ilustración de la 𝒇𝜶 para la distribución F

𝒇𝟎,𝟎𝟓(𝟐𝟒,𝟏𝟎) =2,74 𝒇𝟎,𝟗𝟓(𝟏𝟎, 𝟐𝟒) =0,365

Por consiguiente, el valor 𝑓 con 10 y 25 grados de libertad, que deja un área de 0,95 a la
derecha, es

𝟏 𝟏
𝒇𝟎,𝟗𝟓(𝟏𝟎,𝟐𝟒) = = = 𝟎, 𝟑𝟔𝟓
𝒇𝟎,𝟎𝟓(𝟐𝟒,𝟏𝟎) 𝟐, 𝟕𝟒

https://homepage.divms.uiowa.edu/~mbognar/applets/f.html
La distribución F
La distribución F
La distribución F
La distribución F con dos varianzas muestrales
Suponga que se seleccionan al azar dos muestras de tamaños 𝒏𝟏 y 𝒏𝟐 de dos
poblaciones normales con varianzas 𝝈𝟐𝟏 y 𝝈𝟐𝟐 , respectivamente. Sabemos que
𝒏𝟏 − 𝟏 𝑺𝟐𝟏 𝒏𝟐 − 𝟏 𝑺𝟐𝟐
𝝌𝟐𝟏 = y 𝝌𝟐𝟐 =
𝝈𝟐𝟏 𝝈𝟐𝟐
son variables aleatorias que tienen distribuciones chi cuadrada con 𝒗𝟏 = 𝒏𝟏 − 𝟏 y
𝒗𝟐 = 𝒏𝟐 − 𝟏 grados de libertad. Además, como las muestras se seleccionan al azar,
tratamos con variables aleatorias independientes. De manera que

Si 𝑺𝟐𝟏 y 𝑺𝟐𝟐 son las varianzas de muestras aleatorias independientes de tamaño 𝒏𝟏 y


𝒏𝟐 tomadas de poblaciones normales con varianzas 𝝈𝟐𝟏 y 𝝈𝟐𝟐 , respectivamente,
entonces, el estadístico
𝒏𝟏 − 𝟏 𝑺𝟐𝟏
𝟐 𝟐
𝟐 𝝈 𝑺 𝟏
𝝌𝟏ൗ 𝟏
𝒗𝟏 𝒏𝟏 − 𝟏 𝝈𝟐𝟏 𝝈𝟐𝟐 𝑺𝟐𝟏
𝑭= 𝟐 = = 𝟐 = 𝟐 𝟐
𝝌𝟐ൗ 𝒏𝟐 − 𝟏 𝑺𝟐𝟐 𝑺𝟐 𝝈𝟏 𝑺𝟐
𝒗𝟐
𝝈𝟐𝟐 𝝈𝟐𝟐
𝒏𝟐 − 𝟏
tiene una distribución 𝐹 con 𝒗𝟏 = 𝒏𝟏 − 𝟏 y 𝒗𝟐 = 𝒏𝟐 − 𝟏 grados de libertad.
Distribución T

Ejercicio
Distribución T

Ejercicio
Distribución T

Ejercicio

También podría gustarte