UNIDAD No. 2 - ESTIMACIÓN POR INTERVALOS
UNIDAD No. 2 - ESTIMACIÓN POR INTERVALOS
UNIDAD No. 2 - ESTIMACIÓN POR INTERVALOS
La inferencia estadı́stica tiene que ver con el procedimiento que permite sacar conclusiones acerca de una
población, basándose en la información aportada por una muestra.
Las conclusiones a las que se llega en este procedimiento, conllevan un grado de incertidumbre que puede ser
cuantificado mediante la teorı́a de la probabilidad.
1. Intervalos de Confianza
Definición 1.(Intervalo bilateral)
Si θ es un parámetro de interés, una estimación de éste puede hacerse consiguiendo un intervalo de la forma
Li ≤ θ ≤ Ls (1)
1 − α es denominado coeficiente de confianza, los valores más usados de α son 0.1, 0.05, 0.01
Li ≤ θ (2)
Definición 3.(Intervalo unilateral superior) Un intervalo de confianza unilateral superior del (1 − α)100 % para
θ está dado por el intervalo
θ ≤ Ls (3)
Ejemplo 1 Se desea un intervalo de confianza para la pérdida por carga parásita promedio verdadera µ (watts)
de cierto tipo de motor de inducción cuando la corriente a través de la lı́nea se mantiene a 10 amps a una
velocidad de 1500 rpm. Suponga que la pérdida por carga parásita está normalmente distribuida con σ = 3.0.
Calcule un intervalo de confianza para µ de 95 % cuando n = 25 y x̄ = 58.3.
Solución
Sea X : la pérdida por carga parásita.
Parámetro de interés: µ pérdida promedio por carga parásita.
Datos:
n = 25 x̄ = 58.3 σ = 3.0 α = 0.05 Z(a/2) = Z(0.05/2) = Z0.025 = 1.96
Procedemos a construir el intervalo de confianza al 95 %
σ σ
(x̄) − Z(a/2) √ 6 µ 6 (x̄) + Z(α/2) √
n n
remplazando los datos,
3.0 3.0
(58.3) − Z(0.05/2) √ 6 µ 6 (58.3) + Z(0.05/2) √
25 25
3.0 3.0
(58.3) − (1.96) √ 6 µ 6 (58.3) + (1.96) √
25 25
(58.3) − (1.96)(0.6) 6 µ 6 (58.3) + (1.96)(0.6)
(58.3) − (1.18) 6 µ 6 (58.3) + (1.18)
(57.1 6 µ 6 59.5)95 %
Con una confianza del 95 % podemos establecer que el verdadero valor para la media para la pérdida por carga
parásita promedio verdadera µ (watts) de cierto tipo de motor de inducción cuando la corriente a través de la
lı́nea se mantiene a 10 amps a una velocidad de 1500 rpm oscila entre 57.1 y 59.5.
(Volver a la tabla resumen de procedimientos: Cuadro 1)
Aplicación en R:
library(PASWR)
zsum.test(mean.x=58.3,sigma.x=3.0,n.x=25)
One-sample z-Test
data: Summarized x
z = 97.167, p-value <
2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
57.12402 59.47598
sample estimates:
mean of x
58.3
Ejemplo 2 Para realizar un estudio de nutrición nacional, se toma el peso de 147 hombres obteniendo como
resultado una media muestral de 174 libras y desviación estandar mmuestral de 6 libras. Encuentre un intervalo
de confianza de 95 % para el peso promedio de los hombres en el estudio.
Solución
Datos:
Parámetro de interés µ, peso promedio de los hombres en un estudio de nutrición nacional.
n = 147 tamaño de muestra
x = 174 libras, s = 6 libras
α = 0.05 nivel de confianza −→ Z( α/2) = Z0 .025 = 1.96
Un intervalo de confianza de 95 % para el peso promedio de los hombres en el estudio de nutrición nacional es:
s s
x − zα/2 √ ≤ µ ≤ x + zα/2 √
n n
6 6
174 − 1.96 √ ≤ µ ≤ 174 + 1.96 √
147 147
173.03 ≤ µ ≤ 174.97
Por tanto, con una confianza del 95 % el valor real del peso promedio de los hombres en el estudio de nutrición
nacional, se encuentras entre 173.03 y 174.97 libras.
Aplicación en R:
library(PASWR)
zsum.test(mean.x=174,sigma.x=6,n.x=147)
One-sample z-Test
data: Summarized x
z = 351.61, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
173.0301 174.9699
sample estimates:
mean of x
174
Ejemplo 3 El contenido de ácido sulfúrico de 7 contenedores similares es de 9.8, 10.2, 10.4, 9.8,10.0, 10.2,
y 9.6 litros. Calcule un intervalo de confianza del 95 % para el contenido promedio de todos los contenedores
suponiendo una distribución aproximadamente normal.
Solución:
La media muestral y la desviación estándar para los datos dados son
x = 10.0 y s = 0.283.
Recuerde que: Pn Pn
xi x2i − nx2
x= i=1
y s2 = i=1
.
n n−1
Si usamos la tabla A.4, encontramos t0.025 = 2.447 para v = 6 grados de libertad. En consecuencia, el intervalo
de confianza del 95 % para µ es
s s
x − t(α/2) √ ≤ µ ≤ x + t(α/2) √
n n
0.283 0.283
10.0 − (2.447) √ ≤ µ ≤ 10.0 + (2.447) √
7 7
que se reduce a 9.74 ≤ µ ≤ 10.26.
Aplicación en R:
library(stats)
x<-c(9.8, 10.2, 10.4, 9.8,10.0, 10.2, 9.6)
Ejemplo 4 Se estudia la velocidad de combustión de dos cargas propulsoras sólidas diferentes usadas en el
sistema de expulsión de la tripulación de un avión. Se sabe que ambas cargas propulsoras solidas tienen apro-
ximadamente una desviación estándar σ1 = 3.03cm/s y σ2 = 3.0cm/s se prueban dos muestras aleatorias
de n1 = n2 = 35 ejemplares, las medias muestrales de las velocidades de combustión son X̄1 = 18cm/s y
X̄1 = 24cm/s.
Construya un intervalo de confianza al 95 % para la diferencias de las medias µ1 − µ2 . ¿Cuál es el significado
practico para este intervalo?
Solución
Datos:
X̄1 = 18 σ1 = 3.03
X̄2 = 24 σ2 = 3.00
nivel de significancia: α = 0.05, ası́
Z(1−a/2) = Z(1−0.05/2) = Z0.975 = 1.96
(−7.4132 6 µ1 − µ2 6 −4.587)95 %
Como los dos limites del intervalos son negativos podemos inferir gue el promedio de la velocidad de combustión
la carga propulsora de la población 2 es mayor que la velocidad promedio de combustión de la carga propulsora
de la población 1.
(Volver a la tabla resumen de procedimientos: Cuadro 1)
Aplicación en R:
library(PASWR)
zsum.test(mean.x=18, sigma.x =3.03, n.x = 35, mean.y = 24,
sigma.y =3.00, n.y =35, alternative = "two.sided",
conf.level = 0.95)
Two-sample z-Test
Ejemplo 5 Pueden usarse dos catalizadores en un proceso quı́mico por lotes. Se preparan 12 lotes usando el
catalizador 1, obteniéndose un rendimiento promedio X̄1 = 86, y una desviación estándar muestral S1 = 3 Se
prepararon 15 lotes usando el catalizador 2, obteniéndose un rendimiento promedio X̄2 = 89 y una desviación
estándar S2 = 2. Suponga σ12 = σ22 y que los datos se extraen de una distribución normal.
Construya un intervalo de confianza al 95 % para la diferencia en los rendimientos promedios. Interprete este
intervalo.
Solución
Datos:
X̄1 = 86 S12 = 9
X̄2 = 89 S22 = 4
t(α/2,n1 +n2 −2) = t(0.05/2,25) = t(0.025,25) = 2.0595
(−4.9861 6 µ1 − µ2 6 −1.0139)95 %
Como los limites del intervalo son negativos se infiere que el rendimiento promedio del catalizador 2 es mayor
al del catalizador 1.
Ejemplo 6 El Departamento de zoologı́a de Virginia Tech llevó a cabo un estudio para estimar la diferencia
en la cantidad de ortofósforo quı́mico medido en dos estaciones diferentes del rı́o James. El ortofósforo se mide
en miligramos por litro. Se reunieron 15 muestras de la estación 1 y 12 muestras de la estación 2. Las 15
muestras de la estación 1 tuvieron un contenido promedio de ortofósforo de 3.84 miligramos por litro y una
desviación estándar de 3.07 miligramos por litro; en tanto que las 12 muestras de la estación 2 tuvieron un
contenido promedio de 1.49 miligramos por litro y una desviación estándar de 0.80 miligramos por litro. Cal-
cule un intervalo de confianza de 95 % para la diferencia en el contenido promedio verdadero de ortofósforo en
estas dos estaciones. Suponga que las observaciones provienen de poblaciones normales con varianzas diferentes.
Solución:
Para la estación 1: x1 = 3.84, s1 = 3.07 y n1 = 15.
Para la estación 2: x2 = 1.49, s2 = 0.80 y n2 = 12.
Si usamos α = 0.05, en la tabla A.4 encontramos que t0.025 = 2.120 para v = 16 grados de libertad. Por lo
tanto, el intervalo de confianza del 95 % para µ1 − µ2 es
r r
3.072 0.802 3.072 0.802
2.35 − 2.120 + ≤ µ1 − µ2 ≤ 2.35 + 2.120 +
15 12 15 12
que se simplifica a 0.60 ≤ µ1 − µ2 ≤ 4.10. En consecuencia, tenemos un 95 % de confianza en que el intervalo
de 0.60 a 4.10 miligramos por litro contiene la diferencia del promedio verdadero del ortofósforo que contienen
estos dos lugares.
Aplicación en R
Ejemplo 7 Los siguientes datos representan el tiempo de duración de pelı́culas producidas por dos empresas
cinematográficas.
Calcule un intervalo de confianza del 90 % para la diferencia entre la duración promedio de las pelı́culas que
producen las dos empresas. Suponga que las diferencias en la duración se distribuyen de forma aproximadamente
normal y que tienen varianzas distintas.
Solución
library(stats)
> I<-c(103, 94 ,110, 87, 98)
> II<-c( 97, 82, 123, 92, 175, 88, 118)
> t.test(I, II, alternative = c("two.sided"),
var.equal = FALSE,
conf.level= 0.90)
Por tanto, con una confianza del 90 % la diferencia entre la duración promedio de las pelı́culas que producen
las dos empresas se encuentra entre -36.42670 y 11.79813 minutos, luego como el intervalo contiene al cero, se
infiere que la duración promedio de las pelı́culas que producen las dos empresas es igual.
Ejemplo 8 Un producto dietético liquido afirma es su publicidad que el empleo del mismo durante un mes
produce una perdida promedio de 3 libras peso. Ocho sujetos utilizan el producto por un mes, y los datos sobre
pérdida de peso son los siguientes:
Solución
Datos: d¯ = 3.375 sd = 1.6850 t(α/2,n−1) = t(0.025,7) = 2.3646
Procedemos a construir el intervalo de confianza al 95 %
sd sd
d¯ − t(α/2,n−1) √ 6 µd 6 d¯ + t(α/2,n−1) √
n n
remplazando los datos,
(1.9664 6 µd 6 4.7836)95 %
Del intervalo resultante se puede concluir que la publicidad está en lo cierto porque el intervalo de confianza
contiene a 3.
Aplicación en R:
PI<-c(170,203,171,176,171,162,193,147)
PF<-c(168,197,168,175,166,160,189,143)
t.test(PI, PF,
alternative = c("two.sided"),
paired = TRUE, conf.level = 0.95)
Paired t-test
data: PI and PF
t = 5.6652, df = 7, p-value = 0.0007624
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
1.96629 4.78371
sample estimates:
mean of the differences
3.375
Ejemplo 9 Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por
cierta empresa: 46.4, 46.1, 45.8, 47.0, 46.1.45.9, 45.8, 46.9, 45.2 y 46.0 . Calcule un intervalo de confianza del 95 %
para la varianza de todos los pesos de este tipo de paquetes de semillas de pasto distribuidos por la empresa.
Suponga una población normal.
Solución:
Primero calculamos Pn Pn 2
2 n x2i − ( i=1 xi )
i=1
s =
n(n − 1)
(10)(21, 273.12) − (461.2)2
= = 0.286
(10)(9)
Para obtener un intervalo de confianza del 95 % elegimos α = 0.05. Después, usando la tabla A.5 con v = 9
grados de libertad, encontramos χ20.025 = 19.023 y χ20.975 = 2.700 Por lo tanto, el intervalo de confianza del 95 %
para σ 2 es
(9)(0.286) (9)(0.286)
≤ σ2 ≤
19.023 2.700
o simplemente 0.135 ≤ σ 2 ≤ 0.953
Aplicación en R:
Nota: R no incluye una función especı́fica para el cálculo de intervalos de confianza en este tipo de situaciones.
Por lo tanto calcularemos el intervalo de la siguiente forma
datos<-c(46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2, 46.0)
n <- length(datos)
alfa <- 0.05
varianza<-var(datos)
Li <- (n-1) * varianza / qchisq(1-alfa / 2,n-1)
Ls <- (n-1) * varianza / qchisq(alfa /2,n-1)
IC <- c(Li,Ls)
IC
[1] 0.1354167 0.9539365
Solución:
Del ejemplo 6 tenemos n1 = 15, n2 = 12, s1 = 3.07 y s2 = 0.80. Para un intervalo de confianza del 98 %, α = 0.02.
Al interpolar en la tabla A.6 encontramos f0.01 (14, 11) ≈ 4.30yf0.01 (11, 14) ≈ 3.87. Por lo tanto, el intervalo de
confianza del 98 % para σ12 /σ22 es
σ12
que se simplifica a 3.425 ≤ ≤ 56.991. Al calcular las raı́ces cuadradas de los lı́mites de confianza encontramos
σ22
que un intervalo de confianza del 98 % para σ1 /σ2 es
σ1
1.851 ≤ ≤ 7.549
σ2
Como este intervalo no permite la posibilidad de que σ1 /σ2 sea igual a 1, es correcto suponer que σ1 6= σ2 o
σ12 6= σ22 en el ejemplo 6.
Aplicación en R:
Ejemplo 11 En el ejemplo 7 se construyó un intervalo de confianza suponiendo que las varianzas de la pobla-
ción son diferentes. Justifique esta suposición construyendo intervalo de confianza del 90 % para σI2 /σII
2
.
Solución:
library(stats)
I<-c(103, 94 ,110, 87, 98)
II<-c( 97, 82, 123, 92, 175, 88, 118)
var.test(I, II, alternative = c("two.sided"), conf.level = 0.90)
data: I and II
F = 0.073655, num df = 4, denom df = 6,
p-value = 0.02468
alternative hypothesis: true ratio of variances is not equal to 1
90 percent confidence interval:
0.01624629 0.45394809
sample estimates:
ratio of variances
0.07365542
Por tanto como el intervalo no contiene al 1, con una confianza del 90 % se confirma el supuesto de que varianzas
de la población son diferentes.
Ejemplo 12 En una muestra aleatoria de n = 500 familias que tienen televisores en la ciudad de Hamilton,
Canadá, se encuentra que x = 340 están suscritas a HBO. Calcule un intervalo de confianza del 95 % para la
proporción real de familias que tienen televisores en esta ciudad y están suscritas a HBO.
340
La estimación puntual de p es p̂ = = 0.68. Si usamos la tabla A.3, encontramos que z0.025 = 1.96. Por lo
500
tanto, si utilizamos el método 1, el intervalo de confianza del 95 % para π es
r r
(0.68)(0.32) (0.68)(0.32)
0.68 − 1.96 ≤ π ≤ 0.68 + 1.96
500 500
que se simplifica a 0.6391 ≤ π ≤ 0.7209
Aplicación en R:
library(stats)
prop.test(x=340, n=500,
alternative = c("two.sided"),
conf.level = 0.95)
Ejemplo 13 Se considera hacer un cierto cambio en el proceso de fabricación de partes componentes. Para de-
terminar si el cambio en el proceso da como resultado una mejora, se toman muestras de partes fabricadas con
el proceso nuevo y con el actual. Si se encuentra que 75 de 1500 artı́culos manufacturados con el proceso actual
están defectuosos y 80 de 2000 manufacturados con el proceso nuevo también lo están, calcule un intervalo de
confianza del 90 % para la diferencia verdadera en la proporción de partes defectuosas entre el proceso actual y
el nuevo.
Solución Suponga que p1 y p2 son las proporciones verdaderas de partes defectuosas para los procesos actual y
nuevo, respectivamente. En consecuencia, p̂1 = 75/1500 = 0.05 y p̂2 = 80/2000 = 0.04, y la estimación puntual
de p1 − p2 es
p̂1 − p̂2 = 0.05 − 0.04 = 0.01
Si utilizamos la tabla A.3, encontramos z0.05 = 1.645. Por lo tanto, al sustituir en la fórmula
r
(0.05)(0.95) (0.04)(0.96)
1.645 + = 0.0117
1500 2000
encontramos que el intervalo de confianza del 90 % es −0.0017 ≤ p1 − p2 ≤ 0.0217 Como el intervalo contiene el
valor 0, no hay razón para creer que el nuevo proceso, comparado con el actual, disminuye en forma significativa
la proporción de artı́culos.
Aplicación en R:
library(stats)
x<-c(75,80) ; n<-c(1500,2000)
prop.test(x, n,
alternative = c("two.sided"),
conf.level = 0.90)
data: x out of n
X-squared = 1.7958, df =
1, p-value = 0.1802
alternative hypothesis: two.sided
90 percent confidence interval:
-0.002314573 0.022314573
sample estimates:
prop 1 prop 2
0.05 0.04
σ
d = zα/2 ∗ √
n
La cual cuando se resuelve para n queda de la siguiente forma
2
zα/2 σ2
n=
d2
Cuando el muestreo se hace sin reemplazos a partir de una población finita y pequeña, se requiere de la corrección
para la población finita y la ecuación anterior queda de la siguiente forma
r
σ N −n
d = zα/2 ∗ √ ∗
n N −1
r
p∗q
d = zα/2 ∗
n
La cual cuando se resuelve para n queda de la siguiente forma
2
zα/2 ∗p∗q
n=
d2
Cuando el muestreo se hace sin reemplazos a partir de una población finita y pequeña, se requiere de la corrección
para la población finita y la ecuación anterior queda de la siguiente forma
r r
p∗q N −n
d = zα/2 ∗ ∗
n N −1
Que al resolverse para n queda de la siguiente forma
2
N ∗ zα/2 ∗p∗q
n= 2
d2 (N − 1) + zα/2 ∗p∗q
Referencias
[1] Montgomery, & Runger Probabilidad y Estadı́stica Aplicadas a La Ingenierı́a, McGRAW-Hill, Segunda edi-
ción, Cap 7.
[2] Ronald E. Walpole, et al 2012. Probabilidad y estadı́stica para ingenierı́a y ciencias, Pearson, novena edición,
Cap 9.