Estadística y Probabilidad - Intervalos
Estadística y Probabilidad - Intervalos
Estadística y Probabilidad - Intervalos
P( ˆ i
ˆ ) 1
s
Definición 10.4
El intervalo anterior en el que se localiza el parámetro , ˆ ˆ
i s, se llama intervalo de
de (1 – )100%; mientras que la fracción 1– se le llama o grado
y los extremos ˆ yˆ, son los inferior y superior,
i s
respectivamente.
Por ejemplo, se tiene una muestra de 20 focos cuya duración promedio en horas
es x 750 y con base en este valor se estima que el parámetro puede encontrarse con
una probabilidad 1 – , establecida de antemano en el intervalo de confianza (740, 760),
es decir
P(740 760) 1
Establecidas las bases generales de los intervalos de confianza y utilizando el teorema del
límite central, losconceptossobre estimadorespuntuales ylasdistribuciones determinadas
en la unidad 9, se presentan métodos para el cálculo de intervalos de confianza. Uno de
estos métodos se refiere a la media, y se divide en tres casos:
x z x z
2
n 2
n
Ejemplo 3 Una máquina de refrescos está ajustada de tal manera que la cantidad de líquido
suministrado se distribuye en forma normal con desviación estándar de 0.15 dl. Se
calcula 95% de intervalo de confianza para la media de refrescosservidosde una muestra
de 36 vasos tomada al azar con un contenido promedio de 2.25 dl.
Se toman los datos: = 0.15 dl, el tamaño de la muestra es 36 con media muestral
de x 2.25 dl. Para calcular el intervalo de confianza del parámetro media se emplea la
fórmula anterior.
Primero se calcula el valor de z / 2, con 1 – = 0.95. De las tablasporcentuales para
la distribución normal estándar se tiene z / 2 = 1.96. Por tanto,
0.15 0.15
2.25 1.96 2.25 1.96
36 36
2.201 2.299
Es decir, con 95% de probabilidad se afirma que el parámetro media del líquido
suministrado por la máquina de refrescos se encuentra entre 2.201 y 2.299 dl.
Es decir, con 99% de probabilidad se afirma que el parámetro media del líquido
suministrado por la máquina de refrescos se encuentra entre 232.72 y 247.28 ml.
Dada x la media de una muestra de tamaño n (n 30) tomada al azar de una población
con distribución normal de la cual se conoce s2, y se desconoce 2, el intervalo de con-
fianza (1 – ) de 100% para está dado por
s s
x t x t
2
n 2
n
4.19 4.19
246.27 4.14 246.27 4.14
15 15
241.79 250.75
Ejercicio 2
13 19 14 12 21 14 17 20 17
Ejemplo 6 Se comparan dos tipos de rosca de tornillos para determinar su resistencia a la tensión. Se
prueban doce piezas de cada tipo de cuerda bajo condiciones similares, obteniéndose los
siguientes resultados (en kg)
Tipo
de rosca 1 2 3 4 5 6 7 8 9 10 11 12
1 68 70 72 69 71 72 70 69 75 69 70 71
2 75 73 73 68 68 67 69 75 74 68 73 74
5 10 5 10
(70.5 71.4) 1.645 1 2 (70.5 71.4) 1.645
12 12 12 12
2.74 1 2 0.94
2 2
2. Intervalo de confianza para 1
– 2
de poblacionescuando se desconocen 1 y 2
en muestrasgrandes.
Ejemplo 7 Retomando el ejemplo 6, se prueban 40 tornillosde cada tipo de cuerda bajo condiciones
similares y se obtienen los siguientes resultados (en kg).
1
– 2
(1.78, 3.62) indica que 1
– 2
0, es decir 1 2
1 1 1 1
( x1 x2 ) t (sp ) 1 2 ( x1 x2 ) t (sp )
n1 n2 n1 n2
2 2
295
esla estimación común de la desviación estándar poblacional y s12 y s22 son lasvarianzas
insesgadas respectivas de las muestras 1 y 2.
Ejemplo 8 Las pruebas de tracción en diez puntos de soldadura para un dispositivo semiconductor
produjeron los siguientes resultados en libras requeridas para romper la soldadura
15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5
donde t /2
es el valor de la distribución t-Student con
2
s12 s22
n1 n2
2 2
s12 1 s22 1
n1 n1 1 n2 n2 1
grados de libertad, el cual tiene un área de / 2, y s12 y s22 son las varianzas insesgadas
respectivas de las muestras.
De la fórmula anterior se puede estimar que el resultado del cálculo de los
gradosde libertad generalmente será una cantidad no entera, por lo que siempre sedebe
redondear al entero más próximo (no al siguiente), por ejemplo, si v = 14.3 14; v =
14.7 15; v = 14.5 15.
2 2
Ejemplo 9 Se retoman los datos del ejemplo 8, considerando que 1 2 y son ambas desco-
nocidas. Se supone normalidad; se calcula 90% de intervalo de confianza para 1 – 2; se
determina qué tipo de semiconductor sin recubrimiento (1) o con recubrimiento (2) tiene
más resistencia a la tracción.
Las medias y varianzas muestrales se calcularon anteriormente
n1 n2 10 8
2 2 2 2
14.99 15
s12 1 s22 1 7.50 1 2.68 1
n1 n1 1 n2 n2 1 10 10 1 8 8 1
2 2
donde se desconoce 1 y 2, el intervalo de confianza (1 – ) de 100% para
d
= 1 – 2 está dado por
sd sd
xd t d xd t
2
n 2
n
L 0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92
M 0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86
L 0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92
M 0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86
L–M 0.04 0.50 0.28 0.08 0.01 0.05 0.23 0.11 0.18 0.06
Ejercicio 3
Estudiante: 1 2 3 4 5 6 7 8 9 10
Prueba 1: 90 90 90 80 90 92 88 90 63 70
Prueba 2: 84 84 82 94 90 85 89 62 65 52
3.0 3.5 4.0 8.1 7.2 8.9 8.2 10.0 10.0 9.0
A otro grupo se le aplicó un examen de álgebra lineal con las siguientes calificaciones
2.0 3.0 3.7 8.0 5.0 4.0 3.0 8.0 9.0 10.0 7.0 7.0 6.0
Mujer 1 2 3 4 5 6 7
Peso anterior 58.5 60.3 61.7 69.0 64.0 62.6 56.7
Peso posterior 60.0 54.9 58.1 62.1 58.5 59.9 54.4
Cuando se trata de intervalos de confianza para la varianza, se consideran dos casos, uno
para las varianzas poblacionales y el otro para una razón entre varianzas.
2
1. Intervalo de confianza para de poblaciones normalesen muestraspequeñas.
Ejemplo 11 Un antropólogo midió el ancho (en centímetros) de una muestra tomada al azar de nueve
cráneos de miembros de cierta tribu, y obtuvo los siguientes resultados
13.3 14.2 13.5 16.7 11.1 13.1 13.0 12.2 13.0
2 2
2. Intervalo de confianza para 1 2 de poblacionesnormalesen muestraspequeñas.
2 2
Dadas s1 y s2 las varianzas de muestras aleatorias independientes de tamaños n1 y
n2 (n1 30 y n2 30), respectivamente, de poblaciones normales, el intervalo de
confianza (1 – ) de 100% para la razón de las varianzas 12 22 está dado por
s12 1 2
1 s12
f 2( 2, 1)
s22 f 2( 1, 2)
2
2 s22
2 2
Ejemplo 12 Retomando los datos del ejemplo 8 se hizo la suposición de que 1 2 y se calculó
un intervalo de confianza para la razón de varianzas y se determinó si fue válida la
suposición, con 90% de confianza.
Los resultados del conjunto 1 fueron
15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5
Al calcular las varianzas muestrales, del conjunto 1 se obtuvo s12 7.50, n1 = 10, y
del conjunto dos s22 2.68, n2 = 8.
Falta determinar usando las tablas porcentuales de la distribución F los valores
de f 2 ( 1, 2 ) y f 2 ( 2 , 1 ) con 90% de confianza ( = 0.10 es decir, / 2 = 0.05) y v1
= n1 – 1 = 10 – 1 = 9 y v2 = n2 – 1 = 8 – 1 = 7 grados de libertad. Se busca en las tablas
de la distribución F y se obtiene
f 2( 1, 2) f 0.05 (9, 7) 3.677 y f 2 ( 2, 1) f 0.05(7, 9) 3.293
2
7.50 1 1 7.50
2
3.293
2.68 3.677 2 2.68
2
1
0.76 2
9.22
2
Del intervalo de confianza para la razón entre varianzas se determina que el valor 1
está contenido en el intervalo. Por tanto, con 90% de confianza se justifica la suposición de
2 2
que 12 2
2 , ya que 1
2
2 1 (0.76, 9.22) y si se multiplican por 2 ambos miembros
2 2
de la igualdad se obtiene 1 2.
Ejercicio 4
L 0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92
M 0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86
301
Considera 99% de intervalo de confianza para razón entre varianzas de los rendi-
mientos de los catalizadores; supón que los datos están distribuidos normalmente.
3. El espesor de las paredes de 25 botellas de vidrio de dos litros fue medido por un
ingeniero de control de calidad. La media muestral fue de 4.02 mm y la desviación
estándar muestral de 0.09. Considera 95% de intervalo de confianza con respecto
de la varianza del espesor de las paredes de las botellas.
4. Se realizan cinco mediciones en un medidor de volumen en la bomba de una
estación de gasolina (10.5, 10.0, 9.90, 9.95 y 10.15), supón normalidad y calcula un
intervalo de confianza para la varianza con = 0.05.
ˆ yq
Si p ˆ 1 ˆp son las proporciones respectivas de éxitos y fracasos en una muestra
aleatoria de tamaño n (n 30), el intervalo de confianza (1 – ) de 100% para el
parámetro binomial p está dado por
ˆpq
ˆ ˆpq
ˆ
ˆp z p ˆp z
n n
2 2
donde z / 2 es el valor de la distribución normal estándar, el cual tiene un área de / 2.
Ejemplo 13 En una muestra aleatoria de cien posibles clientes, 70 prefieren determinado producto.
Se considera 95% de intervalo de confianza para la proporción de todos los posibles
clientes que prefieren tal producto.
Para el intervalo de confianza de la proporción primero se determina el valor de
ésta de personas que prefieren el producto
ˆp 70 30
0.70 y ˆq 0.30
100 100
En este caso se tiene 95% de confianza, por tanto, 1 – = 0.95, y usando las tablas
porcentuales de la distribución normal se tiene z / 2 = 1.96. Por último
Ejemplo 14 Una firma manufacturera de cigarros distribuye dos marcas. Si se encuentra que 56 de
200 fumadores prefieren la marca A y que 29 de 150 fumadores prefieren la marca B, se
considera 95% de intervalo de confianza para pA – pB; se determina si es válido suponer
que la población de fumadores prefiere la marca B, sobre la marca A.
Dada pA la probabilidad de que 56 de 200 fumadores prefieran la marca A, su
estadístico resulta
ˆpA 56
0.28
200
de tal forma que qˆ A 0.72 con n1 = 200. Asimismo la probabilidad de que 29 de 150
prefieran la marca B resulta
ˆpB 29
0.19
150
de tal formaque ˆqB 0.81 con n2 = 150. Por último parael intervalo de 95% de confianza,
de las tablas porcentuales para la distribución normal resultaque z / 2 = 1.96, empleando
la fórmula correspondiente para pA – pB
0.28 0.72 0.19 0.81 0.28 0.72 0.19 0.81
(0.28 0.19) 1.96 pA pB (0.28 0.19) 1.96
200 150 200 150
0.0018 pA pB 0.1782
Ejercicio 5
Ejemplo Dada Z una variable aleatoria continua con distribución normal estándar, se calculan las
probabilidades indicadas en el ejemplo 4 de la sección 8.3.3:
Tabla t-Student
336
Bibliografía básica
Walpole, Ronald E., y Raymond H. Myers, Probabilidad y estadística, Pearson Educación, 1998.
Este texto es propicio para ampliar los conocimientos sobre estadística inferencial
(unidad 10) y modelos continuos y discretos (unidades 5 a 8).
Bibliografía complementaria
Devore, Jay L., Estadística matemática con aplicaciones, Thomson Editores, 1998.