Intervalos de Confianza - Varianza y Razón de Varianzas
Intervalos de Confianza - Varianza y Razón de Varianzas
Intervalos de Confianza - Varianza y Razón de Varianzas
Varianza: La varianza es una medida de dispersión que representa la variabilidad de una serie de datos
respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado divididos entre
el total de observaciones.
Supongamos que se extrae una muestra de n observaciones de una población con media desconocida 𝜇 y
varianza poblacional desconcida 𝜎 2 . Representaremos las observaciones muestrales por
𝑋1 , 𝑋2 , … . . , 𝑋𝑛 . La varianza poblacional es la esperanza de:
𝝈𝟐 = 𝐸[(𝑋 − 𝜇)2 ]
Ahora bien la media que nos interesa es la de los (𝑋𝑖 − 𝜇)2 ; 𝑖 = 1,2, … , 𝑛 y como 𝜇 es
d e s c o n o c i d a , e n t o n c e s t r a b a j a m o s c o n l a m e d i a muestral
𝝈𝟐 = 𝐸[(𝑋𝑖 − 𝑋̅)2 ]
El supuesto de que la distribución de la población es normal resulta razonable. En tal caso, puede
probarse que la variable aleatoria:
(𝑛 − 1)𝒔𝟐 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
=
𝝈𝟐 𝝈𝟐
Sigue una distribución conocida con el nombre de distribución"ji-cuadrada"(o çhi-cuadrada") 𝜒 2 (𝑛 −
1) grados de libertad
1
ESTADISTICA II ECO
Valor Esperado (o promedio) de la varianza de la muestra
Si 𝑥̅ denota la media muestral, se tiene que
1
1 𝑛−1 2
𝑬[𝑠 2 ] = 𝐸 [ ∑(𝑥𝑖 − 𝑥̅ )2 ] = 𝜎
𝑛 𝑛
𝑖=1
Como
𝒏 𝑛 𝑛 𝑛 𝑛
𝟏 1 1
̅)𝟐 = 𝑠 2 =
∑(𝒙𝒊 − 𝒙 ∑(𝑥𝑖 2 − 2𝑥𝑖 𝑥̅ + 𝑥̅ 2 ) = [∑ 𝑥𝑖 2 − 2𝑥̅ ∑ 𝑥𝑖 + ∑ 𝑥̅ 2 ]
𝒏−𝟏 𝑛−1 𝑛−1
𝒊=𝟏 𝑖=1 𝑖=1 𝑖=1 𝑖=1
𝒏 𝑛 𝑛
𝟏 1 1
̅)𝟐 =
∑(𝒙𝒊 − 𝒙 [∑ 𝑥𝑖 2 − 2𝑥̅ (𝑛𝑥̅ ) + 𝑛𝑥̅ 2 ] = [∑ 𝑥𝑖 2 − 2𝑛𝑥̅ 2 + 𝑛𝑥̅ 2 ]
𝒏−𝟏 𝑛−1 𝑛−1
𝒊=𝟏 𝑖=1 𝑖=1
𝒏 𝑛
𝟏 1
̅)𝟐 =
∑(𝒙𝒊 − 𝒙 [∑ 𝑥𝑖 2 − 𝑛𝑥̅ 2 ]
𝒏−𝟏 𝑛−1
𝒊=𝟏 𝑖=1
Entonces
𝑛 𝑛 𝑛
1 1 1
𝑬[𝑠 2 ] = 𝑬 [ ∑(𝑥𝑖 − 𝑥̅ )2 ] = 𝑬 [ ∑(𝑥𝑖 2 − 𝑛𝑥̅ 2 )] = 𝑬 [ ∑(𝑥𝑖 2 − 𝑛𝑥̅ 2 )]
𝑛−1 𝑛−1 𝑛−1
𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛−1
𝑬[𝑠 2 ] = ( 𝑉𝑎𝑟(𝑥)) = 𝑉𝑎𝑟(𝑥) = 𝜎 2
𝑛−1 𝑛
Con esta definición, tenemos 𝐸[𝑠 2 ] = 𝜎 2
El valor esperado de 𝑠 2 coincide con el valor deseado (varianza de la población)
𝑠 2 es un estimador insesgado de 𝜎 2
Propiedades
1. Los valores de 𝜒 2 son mayores o iguales que 0.
2. La forma de una distribución 𝜒 2 depende del grado de libertad 𝑔. 𝑙 = 𝑛 − 1. En consecuencia, hay
un número infinito de distribuciones 𝜒 2 .
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones 𝜒 2 no son simétricas. Tienen colas estrechas que se extienden a la derecha; esto
es, están sesgadas a la derecha.
5. Cuando 𝑛 > 2, la media de una distribución 𝜒 2 es 𝑛 − 1 y la varianza es 2(𝑛 − 1).
6. El valor modal de una distribución 𝜒 2 se da en el valor (𝑛 − 3).
2
ESTADISTICA II ECO
La siguiente figura ilustra algunas distribuciones chi cuadrado 𝜒 2 .
Ejemplo 1. Se considera una medición física realizada con un instrumento de precisión, donde el interés
se centra en la variabilidad de la lectura. Se sabe que la medición es una variable aleatoria con
distribución Normal y desviación típica 4 unidades. Se toma una muestra aleatoria simple de tamaño
25. Obtener la probabilidad de que el valor de la varianza muestral sea mayor de 12.16 unidades
cuadradas.
Solución
𝑿: Medición
(𝑛−1)𝒔𝟐
𝑿~𝑁𝑜𝑟𝑚𝑎𝑙(𝜇; 𝜎 = 4) ; 𝒏 = 𝟐𝟓 ; 𝜒 2 = 𝝈𝟐
(24)(1𝟐. 𝟏𝟔)
= 𝑃 (𝜒 2 (25−1) ≥ ) = 𝑃 (𝜒 2 (24) ≥ 18.24) = 0.7912
𝟏𝟔
Usando tabla (Interpelación)
Ejemplo 2. Suponga que los tiempos requeridos por un cierto autobús para alcanzar a uno de sus
destinos en una ciudad grande forman una distribución normal con una desviación estándar 𝜎 = 1
minuto. Si se elige al azar una muestra de 17 tiempos, calcule la probabilidad de que la varianza
muestral es mayor que 2.
Solución
(𝑛−1)𝒔𝟐
𝑿: Tiempo 𝑿~𝑁𝑜𝑟𝑚𝑎𝑙(𝜇; 𝜎 = 1) ; 𝑛 = 17 ; 𝜒 2 = 𝝈𝟐
3
ESTADISTICA II ECO
INTERVALOS DE CONFIANZA PARA LA VARIANZA DE LA POBLACION 𝝈 𝟐
Dada una variable aleatoria con distribución Normal N(μ; σ), el objetivo es la construcción de un
intervalo de confianza para el parámetro σ, basado en una muestra de tamaño n (muestra seleccionada
de la una población Normal) de la variable. A partir del estadístico
(𝑛 − 1)𝒔𝟐
𝜒2 =
𝝈𝟐
𝛼 𝛼
Por tanto si 𝜒 2 𝛼 y 𝜒2 𝛼 son los cuantiles superiores (1 − 2 ) y 2
de una distribución
(𝑛−1;1− ) (𝑛−1; )
2 2
𝑃 (𝜒 2 𝛼 ≤ 𝜒 2 (𝑛−1) ≤ 𝜒 2 𝛼 ) =1−𝛼
(𝑛−1;1− ) (𝑛−1; )
2 2
𝜒2 𝛼 𝜒2 𝛼
(𝑛 − 1)𝒔𝟐 (𝑛−1;1− )
2 1 (𝑛−1; )
2
𝑃 (𝜒 2 𝛼 ≤ ≤ 𝜒 2
𝛼 ) = 𝑃 ( ≤ ≤ )
(𝑛−1;1− )
2 𝝈𝟐 (𝑛−1; )
2 (𝑛 − 1)𝒔 𝟐 𝝈 𝟐 (𝑛 − 1)𝒔 𝟐
(𝑛 − 1)𝒔𝟐 (𝑛 − 1)𝒔𝟐
= 𝑃( ≤ 𝝈𝟐 ≤ )
𝜒2 𝛼 𝜒2 𝛼
(𝑛−1;1− ) (𝑛−1; )
2 2
(𝑛 − 1)𝒔𝟐 (𝑛 − 1)𝒔𝟐
( ≤ 𝝈𝟐 ≤ )
𝜒2 𝛼 𝜒2 𝛼
(𝑛−1; ) (𝑛−1;1− )
2 2
(𝑛 − 1)𝒔𝟐 (𝑛 − 1)𝒔𝟐
𝐼𝐶(𝝈𝟐 ): ( ≤ 𝝈𝟐 ≤ )
𝜒2 𝛼 𝜒2 𝛼
(𝑛−1; ) (𝑛−1;1− )
2 2
Ejemplo 3. (Newbold) Una muestra aleatoria de quince pastillas para el dolor de cabeza tiene una
desviación estándar muestral de 0.8 % en la concentración del ingrediente activo. Calcule un IC al 90 %
para la varianza de la población para estas pastillas. Obtenga también un IC para la desviación típica
de la población.
𝑋: Concentración del ingrediente activo en una pastilla
𝑿~𝑵𝒐𝒓𝒎𝒂𝒍(𝝁; 𝝈)
4
ESTADISTICA II ECO
𝑠 2 = (0.8)2 = 0.64 𝑛 = 15
1 − 𝛼 = 90% = 0.90 𝛼 = 0.10
𝜒2 𝛼 = 𝜒2 0.10
2
= 𝜒(14;1−0.05) 2
= 𝜒(14; 0.95)
(𝑛−1;1− ) (15−1;1− )
2 2
2
𝜒(14; 0.95) = 6.570631 = 6.57
𝜒2 𝛼 = 𝜒2 0.10
2
= 𝜒(14;0.05) 2
= 𝜒(14; 0.05)
(𝑛−1; ) (15−1; )
2 2
2
𝜒(14; 0.05) = 23.684791 = 23.68
2 ):
(𝑛 − 1)𝑠 2 2
(𝑛 − 1)𝑠 2 (15 − 1)(0.64) (15 − 1)(0.64)
𝐼𝐶(𝜎 ( ≤𝜎 ≤ ) =( ≤ 𝜎2 ≤ )
𝜒2 𝛼 𝜒2 𝛼 𝜒2 0.10 𝜒2 0.10
(𝑛−1; ) (𝑛−1;1− ) (15−1;1− ) (15−1; )
2 2 2 2
Ejemplo 4. Sospechamos que nuestro cromatógrafo está estropeado, y queremos determinar si los
resultados que nos proporciona son lo suficientemente precisos. Para ello, realizamos una serie de 8
mediciones del contenido de una solución de referencia que, sabemos, contiene 90% de un determinado
compuesto. Los resultados que obtenemos son: 93.3, 86.8, 90.4, 90.1, 94.9, 91.6, 92.3, 96.5 Construir un
intervalo de confianza al nivel de 95% para la varianza poblacional.
Ejemplo 5. Se sabe que la longitud de los diámetros de los tornillos fabricados por una máquina sigue
una distribución normal y se busca un intervalo en el cual se encuentre la variabilidad de las longitudes
de los tornillos fabricados por la máquina con una probabilidad del 80%. Construir dicho intervalo
sabiendo que una muestra de 16 tornillos presenta una varianza de 30.
5
ESTADISTICA II ECO
Intervalo de confianza para el cociente o razón de varianzas de distribuciones normales
independientes
Hay muchas situaciones en que se desea saber si las varianzas de dos poblaciones son iguales o no
lo son.
Si las varianzas de dos poblaciones son iguales, su razón es igual a 1. Si la razón entre dos varianzas
muestrales es muy distinta de 1, ponemos en tela de juicio la igualdad de las varianzas poblacionales.
𝝈𝟐𝟏
Podemos construir el IC para 𝝈𝟐𝟐
cuando las poblaciones se distribuyen normalmente, utilizando la
distribución F.
Sabemos que si 𝑺𝟐𝟏 y 𝑺𝟐𝟐 son las varianzas calculadas a partir de muestra aleatoria simple y de tamaño
𝑛1 y 𝑛2 tomadas de poblaciones que se distribuyen normalmente con varianzas 𝝈𝟐𝟏 y 𝝈𝟐𝟐 , entonces la
razón
𝑺𝟐𝟏
𝝈𝟐𝟏 𝑺𝟐𝟏 𝝈𝟐𝟐
𝑭 = ⁄ 𝟐 = ( 𝟐 ) ( 𝟐 ) ~𝑭(𝑛1 −1,𝑛2 −1)
𝑺𝟐 𝑺𝟐 𝝈𝟏
𝝈𝟐𝟐
(𝑛1 −1)𝑆12 2
Donde 𝑺𝟐𝟏 es un estimador puntual de 𝜎12 y 𝜎12
~𝜒(𝑛 1 −1)
y de manera similar 𝑆22 es un estimador
(𝑛2 −1)𝑆22 2
puntual de 𝜎22 y 𝜎22
~𝜒(𝑛 2 −1)
.
𝒗 +𝒗 𝒗𝟏 +𝒗𝟐
ɼ ( 𝟏 𝟐 𝟐 ) 𝒗𝟏 𝒗𝟐𝟏 (𝒗𝟏−𝟏) 𝟏𝒙 − 𝟐
𝒇(𝒙) = [ 𝒗 𝒗 ]( ) 𝒙
𝟐 [𝟏 + ]
ɼ ( 𝟐𝟏 ) ɼ ( 𝟐𝟐 ) 𝒗𝟐 𝒗𝟐
6
ESTADISTICA II ECO
𝑷 (𝑭(𝟏−𝜶; 𝒏 ≤ 𝑭 ≤ 𝑭 ( 𝜶; 𝒏 )=𝟏−𝜶
𝟐 𝟏 −𝟏,𝒏𝟐 −𝟏) 𝟐 𝟏 −𝟏,𝒏𝟐 −𝟏)
𝑺𝟐𝟏
𝝈𝟐
𝑷 𝑭(𝟏−𝜶; 𝒏 ≤ 𝟏⁄ 𝟐 ≤ 𝑭(𝜶; 𝒏 −𝟏,𝒏 −𝟏) =𝟏−𝜶
𝟐 𝟏 −𝟏,𝒏𝟐 −𝟏) 𝑺𝟐 𝟐 𝟏 𝟐
𝟐
𝝈𝟐
( )
𝑺𝟐𝟏 𝝈𝟐𝟐
𝑷 (𝑭(𝟏−𝜶; 𝒏 ≤ ( 𝟐 ) ( 𝟐 ) ≤ 𝑭(𝜶; 𝒏 −𝟏,𝒏 −𝟏) ) = 𝟏 − 𝜶
𝟐 𝟏 −𝟏,𝒏𝟐 −𝟏) 𝑺𝟐 𝝈𝟏 𝟐 𝟏 𝟐
𝑺𝟐𝟏 𝑺𝟐𝟏
𝝈𝟐𝟏 𝑺𝟐𝟐 𝝈𝟐𝟏 𝑺𝟐𝟐
𝑰. 𝑪. ( 𝟐 ): ≤ ≤
𝝈𝟐 𝑭(𝜶; 𝒏 𝝈𝟐𝟐 𝑭(𝟏−𝜶; 𝒏
𝟐 𝟏 −𝟏,𝒏𝟐 −𝟏) 𝟐 𝟏 −𝟏,𝒏𝟐 −𝟏)
( )
Similarmente
TEOREMA: Si 𝑺𝟐𝟏 y 𝑺𝟐𝟐 son las varianzas de muestras independientes de tamaño n1 y n2,
respectivamente, tomadas de poblaciones normales, entonces un intervalo de confianza del 100(1 – α)%
𝝈𝟐𝟏
para 𝝈𝟐𝟐
es:
𝑺𝟐𝟏 𝑺𝟐𝟏
𝝈𝟐𝟏 𝑺𝟐𝟐 𝝈𝟐𝟏 𝑺𝟐𝟐
𝑰. 𝑪. ( 𝟐 ): ≤ ≤
𝝈𝟐 𝑭(𝜶; 𝒏 𝝈𝟐𝟐 𝑭(𝟏−𝜶; 𝒏
𝟐 𝟏 −𝟏,𝒏𝟐 −𝟏) 𝟐 𝟏 −𝟏,𝒏𝟐 −𝟏)
( )
7
ESTADISTICA II ECO
donde 𝑭(𝜶; 𝒏 −𝟏,𝒏 es un valor f con 𝒗𝟏 = 𝒏𝟏 − 𝟏 y 𝒗𝟐 = 𝒏𝟐 − 𝟏 grados de libertad que deja una área de
𝟐 𝟏 𝟐 −𝟏)
Ejemplo 1: Para una muestra de 17 bonos industriales emitidos recientemente con calificación AAA, la
cuasi varianza (varianza muestral) de sus vencimientos (en años al cuadrado) fue de 123.35. Para otra
muestra independiente de 11 bonos industriales emitidos con calificación CCC, la cuasi varianza
(varianza muestral) de sus vencimientos fue de 8.02. Si se denotan las correspondientes varianzas
poblacionales como 𝝈𝟐𝟏 y 𝝈𝟐𝟐 . Construya un intervalo de confianza al 90% para el cociente de las varianzas.
𝑺𝟐𝟏 𝑺𝟐𝟏
𝝈𝟐𝟏 𝑺𝟐𝟐 𝝈𝟐𝟏 𝑺𝟐𝟐
𝑰. 𝑪. ( 𝟐 ):
≤ ≤
𝝈𝟐 𝑭(𝜶; 𝒏 𝝈𝟐𝟐 𝑭(𝟏−𝜶; 𝒏
𝟐 𝟏 −𝟏,𝒏𝟐 −𝟏) 𝟐 𝟏 −𝟏,𝒏𝟐 −𝟏)
( )
𝟏𝟐𝟑. 𝟑𝟓 𝟏𝟐𝟑. 𝟑𝟓
𝝈𝟐𝟏 𝟖. 𝟎𝟐 𝝈𝟐𝟏 𝟏𝟓. 𝟑𝟖𝟎𝟐 𝝈𝟐𝟏 𝟏𝟓. 𝟑𝟖𝟎𝟐 𝝈𝟐𝟏
𝑰. 𝑪. ( 𝟐 ): ( ≤ 𝟐 ≤ 𝟖. 𝟎𝟐 ) = ( ≤ 𝟐≤ ) = (𝟓. 𝟒𝟑𝟒𝟕 ≤ 𝟐 ≤ 𝟑𝟖. 𝟒𝟓𝟎𝟕)
𝝈𝟐 𝟐. 𝟖𝟑 𝝈𝟐 𝟎. 𝟒𝟎 𝟐. 𝟖𝟑 𝝈𝟐 𝟎. 𝟒𝟎 𝝈𝟐
8
ESTADISTICA II ECO
Como se observa, el valor 1 no pertenece a este intervalo por lo que las dos varianzas poblacionales son
diferentes, para un nivel de significación α = 0.1.
( )
𝝈𝟐𝟏 𝝈𝟐𝟏
𝑰. 𝑪. ( ): (𝟑. 𝟒𝟑𝟐𝟕 ≤ ≤ 𝟓𝟔. 𝟔𝟒𝟎𝟎)
𝝈𝟐𝟐 𝝈𝟐𝟐