UNIDAD No. 2 - ESTIMACIÓN POR INTERVALOS

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

UNIVERSIDAD DE CÓRDOBA

DEPARTAMENTO DE MATEMÁTICAS Y ESTADÍSTICA


CURSO: ESTADÍSTICA INFERENCIAL
UNIDAD No. 2 - ESTIMACIÓN POR INTERVALOS
Prof. Bautista Arellano, Lili

La inferencia estadı́stica tiene que ver con el procedimiento que permite sacar conclusiones acerca de una
población, basándose en la información aportada por una muestra.
Las conclusiones a las que se llega en este procedimiento, conllevan un grado de incertidumbre que puede ser
cuantificado mediante la teorı́a de la probabilidad.

1. Intervalos de Confianza
Definición 1.(Intervalo bilateral)
Si θ es un parámetro de interés, una estimación de éste puede hacerse consiguiendo un intervalo de la forma

Li ≤ θ ≤ Ls (1)

tal que P (Li ≤ θ ≤ Ls ) = 1 − α


donde 0 < α < 1.

Li y Ls son llamados lı́mites de confianza inferior y superior respectivamente.

1 − α es denominado coeficiente de confianza, los valores más usados de α son 0.1, 0.05, 0.01

La expresión dada en (1) se denomina intervalo bilateral.

Definición 2.(Intervalo unilateral inferior)


Un intervalo de confianza unilateral inferior del (1 − α)100 % para θ está dado por el intervalo

Li ≤ θ (2)

donde el lı́mite inferior de confianza se elige de tal forma que P (Li ≤ θ) = 1 − α


donde 0 < α < 1.

Definición 3.(Intervalo unilateral superior) Un intervalo de confianza unilateral superior del (1 − α)100 % para
θ está dado por el intervalo
θ ≤ Ls (3)

donde el lı́mite inferior de confianza se elige de tal forma que P (θ ≤ Ls ) = 1 − α


donde 0 < α < 1.

A continuación en el cuadro 1 se enuncian el resumen de procedimientos para el calculo de algunos intervalos


de confianza.
Observación: Para calcular intervalos bilaterales de trabaja con valores crı́ticos asociados a las probabilidades
α/2. Mientras que para intervalos unilaterales de trabaja con valores crı́ticos asociados a las probabilidades α.
Cuadro 1: Resumen de procedimientos para el cálculo de intervalos
de confianza.

Tipo de problema Estimación Intervalo de confianza bilateral del 100(1 − α) % Ejemplo


puntual
2 σ σ
Media µ,varianza σ conocida x x − zα/2 √ ≤ µ ≤ x + zα/2 √ 1
n n
donde zα/2 es el valor z que deja una área de α/2
a la derecha.
2 s s
Media µ,varianza σ desconocida x x − zα/2 √ ≤ µ ≤ x + zα/2 √ 2
n n
y la muestra es grande (n > 30)
s s
Media µ,varianza σ 2 desconocida x x − t(α/2) √ ≤ µ ≤ x + t(α/2) √ 3
n n
y la muestra es pequeña (n ≤ 30)
donde t(α/2) es el valor t con v = n–1 grados de
libertad que deja una área de α/2 a la derecha.
s
σ12 σ2
Diferencia entre dos medias µ1 y x1 − x2 x̄1 − x̄2 ± zα/2 + 2 4
n1 n2
µ2 , varianzas σ12 y σ22 conocidas
r
1 1
Diferencia entre dos medias µ1 y x1 − x2 x̄1 − x̄2 ± t(α/2) sp + 5
n1 n2
µ2 , varianzas σ12 = σ22 y descono-
cidas
s
(n1 − 1) s21 + (n2 − 1) s22
donde sp =
n1 + n2 − 2
donde t(α/2) es el valor t con v = n1 +n2 −2 grados
de libertad que deja una área de α/2 a la derecha.
s
s21 s2
Diferencia entre dos medias µ1 y x1 − x2 x̄11 − x̄2 ± tα/2,v + 2 6
n1 n2
µ2 , varianzas σ12 6= σ22 y descono-
cidas
2
s21 /n1 + s22 /n2
donde v = 2 2 − 2
s21 /n1 s22 /n2
+
n1 + 1 n2 + 1
donde t(α/2) es el valor t con v grados de libertad
que deja una área de α/2 a la derecha.
√ √
Diferencia entre medias de d d¯ − t(α/2) sd / n ≤ µD ≤ d¯ + t(α/2) sd / n 8
dos distribuciones normales para
muestras pareadas, µ0 = µ1 −µ2 ;
varianza σ 2 de una distribución
normal
donde t(α/2) es el valor t con v = n–1 grados de
libertad que deja una área de α/2 a la derecha.
(n − 1)s2 (n − 1)s2
Varianza σ 2 de una distribución s2 ≤ σ 2
≤ 10
χ2(α/2 ) χ2(1−α/2 )
normal
Sigue en la página siguiente.
Tipo de problema Estimación Intervalo de confianza bilateral del 100(1 − α) % Ejemplo
puntual
donde χ( α/2) y χ( 1 − α/2) son valores χ2 con v =
n–1 grados de libertad, que dejan áreas de α/2 y
1 − α/2, respectivamente, a la derecha.
σ2 s21 s21 1 σ12 s21
Cociente de las varianzas 12 < < fα/2 (v2 , v1 ) 9
σ2 s22 s22 fα/2 (v1 , v2 ) σ22 s22

donde fα/2 (v1 , v2 ) es un valor f con v1 = n1 − 1 y


v2 = n2 − 1 grados de libertad que deja una área
de α/2 a la derecha, yfα/2 (v2 , v1 ) es un valor f
similar con v2 = n2 − 1 y v1 = n1 − 1 grados de
libertad.
r r
p̂(1 − p̂) p̂(1 − p̂)
Proporción o parámetro de una p̂ p̂ − zα/2 ≤ π ≤ p̂ + zα/2 12
n n
distribución binomial π
r
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
Diferencia entre dos proporcio- pˆ1 − pˆ2 p̂1 − p̂2 ± zα/2 + 13
n1 n2
nes o dos parámetros binomiales
π1 − π2

Ejemplo 1 Se desea un intervalo de confianza para la pérdida por carga parásita promedio verdadera µ (watts)
de cierto tipo de motor de inducción cuando la corriente a través de la lı́nea se mantiene a 10 amps a una
velocidad de 1500 rpm. Suponga que la pérdida por carga parásita está normalmente distribuida con σ = 3.0.
Calcule un intervalo de confianza para µ de 95 % cuando n = 25 y x̄ = 58.3.

Solución
Sea X : la pérdida por carga parásita.
Parámetro de interés: µ pérdida promedio por carga parásita.

Datos:
n = 25 x̄ = 58.3 σ = 3.0 α = 0.05 Z(a/2) = Z(0.05/2) = Z0.025 = 1.96
Procedemos a construir el intervalo de confianza al 95 %
σ σ
(x̄) − Z(a/2) √ 6 µ 6 (x̄) + Z(α/2) √
n n
remplazando los datos,
3.0 3.0
(58.3) − Z(0.05/2) √ 6 µ 6 (58.3) + Z(0.05/2) √
25 25
3.0 3.0
(58.3) − (1.96) √ 6 µ 6 (58.3) + (1.96) √
25 25
(58.3) − (1.96)(0.6) 6 µ 6 (58.3) + (1.96)(0.6)
(58.3) − (1.18) 6 µ 6 (58.3) + (1.18)
(57.1 6 µ 6 59.5)95 %
Con una confianza del 95 % podemos establecer que el verdadero valor para la media para la pérdida por carga
parásita promedio verdadera µ (watts) de cierto tipo de motor de inducción cuando la corriente a través de la
lı́nea se mantiene a 10 amps a una velocidad de 1500 rpm oscila entre 57.1 y 59.5.
(Volver a la tabla resumen de procedimientos: Cuadro 1)

Aplicación en R:

library(PASWR)

zsum.test(mean.x=58.3,sigma.x=3.0,n.x=25)

One-sample z-Test

data: Summarized x
z = 97.167, p-value <
2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
57.12402 59.47598
sample estimates:
mean of x
58.3

Ejemplo 2 Para realizar un estudio de nutrición nacional, se toma el peso de 147 hombres obteniendo como
resultado una media muestral de 174 libras y desviación estandar mmuestral de 6 libras. Encuentre un intervalo
de confianza de 95 % para el peso promedio de los hombres en el estudio.

Solución
Datos:
Parámetro de interés µ, peso promedio de los hombres en un estudio de nutrición nacional.
n = 147 tamaño de muestra
x = 174 libras, s = 6 libras
α = 0.05 nivel de confianza −→ Z( α/2) = Z0 .025 = 1.96

Un intervalo de confianza de 95 % para el peso promedio de los hombres en el estudio de nutrición nacional es:
s s
x − zα/2 √ ≤ µ ≤ x + zα/2 √
n n
6 6
174 − 1.96 √ ≤ µ ≤ 174 + 1.96 √
147 147
173.03 ≤ µ ≤ 174.97

Por tanto, con una confianza del 95 % el valor real del peso promedio de los hombres en el estudio de nutrición
nacional, se encuentras entre 173.03 y 174.97 libras.

(Volver a la tabla resumen de procedimientos: Cuadro 1)

Aplicación en R:
library(PASWR)
zsum.test(mean.x=174,sigma.x=6,n.x=147)

One-sample z-Test

data: Summarized x
z = 351.61, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
173.0301 174.9699
sample estimates:
mean of x
174

Ejemplo 3 El contenido de ácido sulfúrico de 7 contenedores similares es de 9.8, 10.2, 10.4, 9.8,10.0, 10.2,
y 9.6 litros. Calcule un intervalo de confianza del 95 % para el contenido promedio de todos los contenedores
suponiendo una distribución aproximadamente normal.

Solución:
La media muestral y la desviación estándar para los datos dados son

x = 10.0 y s = 0.283.

Recuerde que: Pn Pn
xi x2i − nx2
x= i=1
y s2 = i=1
.
n n−1
Si usamos la tabla A.4, encontramos t0.025 = 2.447 para v = 6 grados de libertad. En consecuencia, el intervalo
de confianza del 95 % para µ es

s s
x − t(α/2) √ ≤ µ ≤ x + t(α/2) √
n n
   
0.283 0.283
10.0 − (2.447) √ ≤ µ ≤ 10.0 + (2.447) √
7 7
que se reduce a 9.74 ≤ µ ≤ 10.26.

(Volver a la tabla resumen de procedimientos: Cuadro 1)

Aplicación en R:

library(stats)
x<-c(9.8, 10.2, 10.4, 9.8,10.0, 10.2, 9.6)

t.test (x, alternative = c("two.sided"), conf.level= 0.95)

One Sample t-test


data: x
t = 93.541, df = 6,
p-value = 1.006e-10
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
9.738414 10.261586
sample estimates:
mean of x
10

Ejemplo 4 Se estudia la velocidad de combustión de dos cargas propulsoras sólidas diferentes usadas en el
sistema de expulsión de la tripulación de un avión. Se sabe que ambas cargas propulsoras solidas tienen apro-
ximadamente una desviación estándar σ1 = 3.03cm/s y σ2 = 3.0cm/s se prueban dos muestras aleatorias
de n1 = n2 = 35 ejemplares, las medias muestrales de las velocidades de combustión son X̄1 = 18cm/s y
X̄1 = 24cm/s.
Construya un intervalo de confianza al 95 % para la diferencias de las medias µ1 − µ2 . ¿Cuál es el significado
practico para este intervalo?

Solución
Datos:
X̄1 = 18 σ1 = 3.03
X̄2 = 24 σ2 = 3.00
nivel de significancia: α = 0.05, ası́
Z(1−a/2) = Z(1−0.05/2) = Z0.975 = 1.96

Procedemos a construir el intervalo de confianza al 95 %


s s
σ12 σ2 σ12 σ2
x̄1 − x̄2 − zα/2 + 2 ≤ µ1 − µ2 ≤ x̄1 − x̄2 + zα/2 + 2
n1 n2 n1 n2
remplazando los datos,
r r
(3.03)2 (3.00)2 (3.03)2 (3.00)2
(18 − 24) − (1.96) + 6 µ1 − µ2 6 (18 − 24) + (1.96) +
35 r 35 r 35 35
9.18 9 9.18 9
(−6) − (1.96) + 6 µ1 − µ2 6 (−6) − (1.96) +
35
√ 35 √ 35 35
(−6) − (1.96) 0.5194 6 µ1 − µ2 6 (−6) + (1.96) 0.5194
(−6) − (1.96)(0.721) 6 µ1 − µ2 6 (−6) + (1.96)(0.721)
(−6) − 1.4132 6 µ1 − µ2 6 (−6) + 1.4132

Por tanto el intervalo de confianza al 95 % estaria dado:

(−7.4132 6 µ1 − µ2 6 −4.587)95 %

Como los dos limites del intervalos son negativos podemos inferir gue el promedio de la velocidad de combustión
la carga propulsora de la población 2 es mayor que la velocidad promedio de combustión de la carga propulsora
de la población 1.
(Volver a la tabla resumen de procedimientos: Cuadro 1)

Aplicación en R:

library(PASWR)
zsum.test(mean.x=18, sigma.x =3.03, n.x = 35, mean.y = 24,
sigma.y =3.00, n.y =35, alternative = "two.sided",
conf.level = 0.95)

Two-sample z-Test

data: Summarized x and y


z = -8.3249, p-value <
2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-7.412608 -4.587392
sample estimates:
mean of x mean of y
18 24

Ejemplo 5 Pueden usarse dos catalizadores en un proceso quı́mico por lotes. Se preparan 12 lotes usando el
catalizador 1, obteniéndose un rendimiento promedio X̄1 = 86, y una desviación estándar muestral S1 = 3 Se
prepararon 15 lotes usando el catalizador 2, obteniéndose un rendimiento promedio X̄2 = 89 y una desviación
estándar S2 = 2. Suponga σ12 = σ22 y que los datos se extraen de una distribución normal.
Construya un intervalo de confianza al 95 % para la diferencia en los rendimientos promedios. Interprete este
intervalo.

Solución
Datos:
X̄1 = 86 S12 = 9
X̄2 = 89 S22 = 4
t(α/2,n1 +n2 −2) = t(0.05/2,25) = t(0.025,25) = 2.0595

Procedemos a construir el intervalo de confianza al 95 %


r r
 1 1  1 1
X̄1 − X̄2 − t(α/2,n1 +n2 −2) Sp + 6 µ1 − µ2 6 X̄1 − X̄2 + t(α/2,n1 +n2 −2) Sp +
n1 n2 n1 n2
con s
(n1 − 1) S12 + (n2 − 1) S22
Sp =
n1 + n2 − 2
r
(12 − 1)(9) + (15 − 1)(4)
=
r 12 + 15 − 2
(11)(9) + (14)(4)
=
r 25
99 + 56
=
r 25
155
=
25

= 6.2
= 2.4899
remplazado los datos
r r
1 1 1 1
(86 − 89) − t(0.025,25) Sp + 6 µ1 − µ2 6 (86 − 89) + t(0.025,25) Sp +
r 12 15 12r 15
1 1 1 1
(86 − 89) − (2.0595)(2.4899) + 6 µ1 − µ2 6 (86 − 89) + (2.0595)(2.4899) +
12 r 15 r 12 15
3 3
(86 − 89) − (2.0595)(2.4899) 6 µ1 − µ2 6 (86 − 89) + (2.0595)(2.4899)
20 20
(86 − 89) − (2.0595)(2.4899)(0.3873) 6 µ1 − µ2 6 (86 − 89) + (2.0595)(2.4899)(0.3873)
(−3) − (1.9861) 6 µ1 − µ2 6 (−3) + (1.9861)
−4.9861 6 µ1 − µ2 6 −1.0139
Por tanto el intervalo de confianza al 95 % estarı́a dado:

(−4.9861 6 µ1 − µ2 6 −1.0139)95 %

Como los limites del intervalo son negativos se infiere que el rendimiento promedio del catalizador 2 es mayor
al del catalizador 1.

(Volver a la tabla resumen de procedimientos: Cuadro 1)

Ejemplo 6 El Departamento de zoologı́a de Virginia Tech llevó a cabo un estudio para estimar la diferencia
en la cantidad de ortofósforo quı́mico medido en dos estaciones diferentes del rı́o James. El ortofósforo se mide
en miligramos por litro. Se reunieron 15 muestras de la estación 1 y 12 muestras de la estación 2. Las 15
muestras de la estación 1 tuvieron un contenido promedio de ortofósforo de 3.84 miligramos por litro y una
desviación estándar de 3.07 miligramos por litro; en tanto que las 12 muestras de la estación 2 tuvieron un
contenido promedio de 1.49 miligramos por litro y una desviación estándar de 0.80 miligramos por litro. Cal-
cule un intervalo de confianza de 95 % para la diferencia en el contenido promedio verdadero de ortofósforo en
estas dos estaciones. Suponga que las observaciones provienen de poblaciones normales con varianzas diferentes.

Solución:
Para la estación 1: x1 = 3.84, s1 = 3.07 y n1 = 15.
Para la estación 2: x2 = 1.49, s2 = 0.80 y n2 = 12.

Queremos obtener un intervalo de confianza del 95 % para µ1 − µ2 .


Como se supone varianzas diferentes, sólo podemos calcular un intervalo de confianza aproximado del 95 %
basado en la distribución t con v grados de libertad, donde

(s21 /n1 + s22 /n2 )2 (3.072 /15 + 0.802 /12)2


v= (s21 /n1 )2 (s22 /n2 )2
= (3.072 /n1 )2 (0.802 /n2 )2
= 16.3 ≈ 16
n1 −1 + n2 −1 14 + 11

por otro lado, la estimación puntual de µ1 − µ2 es

x1 − x2 = 3.84 − 1.49 = 2.35

Si usamos α = 0.05, en la tabla A.4 encontramos que t0.025 = 2.120 para v = 16 grados de libertad. Por lo
tanto, el intervalo de confianza del 95 % para µ1 − µ2 es
r r
3.072 0.802 3.072 0.802
2.35 − 2.120 + ≤ µ1 − µ2 ≤ 2.35 + 2.120 +
15 12 15 12
que se simplifica a 0.60 ≤ µ1 − µ2 ≤ 4.10. En consecuencia, tenemos un 95 % de confianza en que el intervalo
de 0.60 a 4.10 miligramos por litro contiene la diferencia del promedio verdadero del ortofósforo que contienen
estos dos lugares.

(Volver a la tabla resumen de procedimientos: Cuadro 1)

Aplicación en R

Ejemplo 7 Los siguientes datos representan el tiempo de duración de pelı́culas producidas por dos empresas
cinematográficas.

Empresa Tiempo (minutos)


I 103 94 110 87 98
II 97 82 123 92 175 88 118

Calcule un intervalo de confianza del 90 % para la diferencia entre la duración promedio de las pelı́culas que
producen las dos empresas. Suponga que las diferencias en la duración se distribuyen de forma aproximadamente
normal y que tienen varianzas distintas.

Solución

library(stats)
> I<-c(103, 94 ,110, 87, 98)
> II<-c( 97, 82, 123, 92, 175, 88, 118)
> t.test(I, II, alternative = c("two.sided"),
var.equal = FALSE,
conf.level= 0.90)

Welch Two Sample t-test


data: I and II
t = -0.9638, df = 7.1866, p-value = 0.3664
alternative hypothesis: true difference in means is not equal to 0
90 percent confidence interval:
-36.42670 11.79813
sample estimates:
mean of x mean of y
98.4000 110.7143

Por tanto, con una confianza del 90 % la diferencia entre la duración promedio de las pelı́culas que producen
las dos empresas se encuentra entre -36.42670 y 11.79813 minutos, luego como el intervalo contiene al cero, se
infiere que la duración promedio de las pelı́culas que producen las dos empresas es igual.

(Volver a la tabla resumen de procedimientos: Cuadro 1)

Ejemplo 8 Un producto dietético liquido afirma es su publicidad que el empleo del mismo durante un mes
produce una perdida promedio de 3 libras peso. Ocho sujetos utilizan el producto por un mes, y los datos sobre
pérdida de peso son los siguientes:

Peso Inicial Peso Final


170 168
203 197
171 168
176 175
171 166
162 160
193 189
147 143

Determinar un intervalo de confianza al 99 % para la diferencia de los pesos.

Solución
Datos: d¯ = 3.375 sd = 1.6850 t(α/2,n−1) = t(0.025,7) = 2.3646
Procedemos a construir el intervalo de confianza al 95 %
sd sd
d¯ − t(α/2,n−1) √ 6 µd 6 d¯ + t(α/2,n−1) √
n n
remplazando los datos,

3.375 − t(0.025,7) 1.6850



8
6 µd 6 3.375 + t(0.025,7) 1.6850

8
3.375 − (2.3646) 1.6850

8
6 µd 6 3.375 + (2.3646) 1.6850

8
3.375 − (2.3646)(0.5957) 6 µd 6 3.375 + (2.3646)(0.5957)
3.375 − 1.4086 6 µd 6 3.375 + 1.4086
1.9664 6 µd 6 4.7836
Por tanto el intervalo de confianza al 95 % estarı́a dado:

(1.9664 6 µd 6 4.7836)95 %

Del intervalo resultante se puede concluir que la publicidad está en lo cierto porque el intervalo de confianza
contiene a 3.

(Volver a la tabla resumen de procedimientos: Cuadro 1)

Aplicación en R:
PI<-c(170,203,171,176,171,162,193,147)
PF<-c(168,197,168,175,166,160,189,143)
t.test(PI, PF,
alternative = c("two.sided"),
paired = TRUE, conf.level = 0.95)

Paired t-test

data: PI and PF
t = 5.6652, df = 7, p-value = 0.0007624
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
1.96629 4.78371
sample estimates:
mean of the differences
3.375

Ejemplo 9 Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por
cierta empresa: 46.4, 46.1, 45.8, 47.0, 46.1.45.9, 45.8, 46.9, 45.2 y 46.0 . Calcule un intervalo de confianza del 95 %
para la varianza de todos los pesos de este tipo de paquetes de semillas de pasto distribuidos por la empresa.
Suponga una población normal.

Solución:
Primero calculamos Pn Pn 2
2 n x2i − ( i=1 xi )
i=1
s =
n(n − 1)
(10)(21, 273.12) − (461.2)2
= = 0.286
(10)(9)
Para obtener un intervalo de confianza del 95 % elegimos α = 0.05. Después, usando la tabla A.5 con v = 9
grados de libertad, encontramos χ20.025 = 19.023 y χ20.975 = 2.700 Por lo tanto, el intervalo de confianza del 95 %
para σ 2 es
(9)(0.286) (9)(0.286)
≤ σ2 ≤
19.023 2.700
o simplemente 0.135 ≤ σ 2 ≤ 0.953

(Volver a la tabla resumen de procedimientos: Cuadro 1)

Aplicación en R:
Nota: R no incluye una función especı́fica para el cálculo de intervalos de confianza en este tipo de situaciones.
Por lo tanto calcularemos el intervalo de la siguiente forma

datos<-c(46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2, 46.0)
n <- length(datos)
alfa <- 0.05
varianza<-var(datos)
Li <- (n-1) * varianza / qchisq(1-alfa / 2,n-1)
Ls <- (n-1) * varianza / qchisq(alfa /2,n-1)
IC <- c(Li,Ls)
IC
[1] 0.1354167 0.9539365

Ejemplo 10 En el ejemplo 6 se construyó un intervalo de confianza para la diferencia en el contenido medio


de ortofósforo de dos estaciones ubicadas sobre el rı́o James, medido en miligramos por litro, suponiendo que
las varianzas normales de la población son diferentes. Justifique esta suposición construyendo intervalos de
confianza del 98 % para σ12 /σ22 y para σ1 /σ2 , donde σ12 y σ22 son las varianzas de la población del contenido de
ortofósforo en la estación 1 y en la estación 2 respectivamente.

Solución:
Del ejemplo 6 tenemos n1 = 15, n2 = 12, s1 = 3.07 y s2 = 0.80. Para un intervalo de confianza del 98 %, α = 0.02.
Al interpolar en la tabla A.6 encontramos f0.01 (14, 11) ≈ 4.30yf0.01 (11, 14) ≈ 3.87. Por lo tanto, el intervalo de
confianza del 98 % para σ12 /σ22 es

3.072 σ12 3.072


    
1
≤ ≤ (3.87)
0.802 4.30 σ22 0.802

σ12
que se simplifica a 3.425 ≤ ≤ 56.991. Al calcular las raı́ces cuadradas de los lı́mites de confianza encontramos
σ22
que un intervalo de confianza del 98 % para σ1 /σ2 es
σ1
1.851 ≤ ≤ 7.549
σ2
Como este intervalo no permite la posibilidad de que σ1 /σ2 sea igual a 1, es correcto suponer que σ1 6= σ2 o
σ12 6= σ22 en el ejemplo 6.

(Volver a la tabla resumen de procedimientos: Cuadro 1)

Aplicación en R:

Ejemplo 11 En el ejemplo 7 se construyó un intervalo de confianza suponiendo que las varianzas de la pobla-
ción son diferentes. Justifique esta suposición construyendo intervalo de confianza del 90 % para σI2 /σII
2
.

Solución:

library(stats)
I<-c(103, 94 ,110, 87, 98)
II<-c( 97, 82, 123, 92, 175, 88, 118)
var.test(I, II, alternative = c("two.sided"), conf.level = 0.90)

F test to compare two variances

data: I and II
F = 0.073655, num df = 4, denom df = 6,
p-value = 0.02468
alternative hypothesis: true ratio of variances is not equal to 1
90 percent confidence interval:
0.01624629 0.45394809
sample estimates:
ratio of variances
0.07365542

Por tanto como el intervalo no contiene al 1, con una confianza del 90 % se confirma el supuesto de que varianzas
de la población son diferentes.

Ejemplo 12 En una muestra aleatoria de n = 500 familias que tienen televisores en la ciudad de Hamilton,
Canadá, se encuentra que x = 340 están suscritas a HBO. Calcule un intervalo de confianza del 95 % para la
proporción real de familias que tienen televisores en esta ciudad y están suscritas a HBO.

340
La estimación puntual de p es p̂ = = 0.68. Si usamos la tabla A.3, encontramos que z0.025 = 1.96. Por lo
500
tanto, si utilizamos el método 1, el intervalo de confianza del 95 % para π es
r r
(0.68)(0.32) (0.68)(0.32)
0.68 − 1.96 ≤ π ≤ 0.68 + 1.96
500 500
que se simplifica a 0.6391 ≤ π ≤ 0.7209

(Volver a la tabla resumen de procedimientos: Cuadro 1)

Aplicación en R:

library(stats)
prop.test(x=340, n=500,
alternative = c("two.sided"),
conf.level = 0.95)

1-sample proportions test


with continuity correction

data: 340 out of 500, null probability 0.5


X-squared = 64.082, df = 1,
p-value = 1.193e-15
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.6368473 0.7203411
sample estimates:
p
0.68

Ejemplo 13 Se considera hacer un cierto cambio en el proceso de fabricación de partes componentes. Para de-
terminar si el cambio en el proceso da como resultado una mejora, se toman muestras de partes fabricadas con
el proceso nuevo y con el actual. Si se encuentra que 75 de 1500 artı́culos manufacturados con el proceso actual
están defectuosos y 80 de 2000 manufacturados con el proceso nuevo también lo están, calcule un intervalo de
confianza del 90 % para la diferencia verdadera en la proporción de partes defectuosas entre el proceso actual y
el nuevo.

Solución Suponga que p1 y p2 son las proporciones verdaderas de partes defectuosas para los procesos actual y
nuevo, respectivamente. En consecuencia, p̂1 = 75/1500 = 0.05 y p̂2 = 80/2000 = 0.04, y la estimación puntual
de p1 − p2 es
p̂1 − p̂2 = 0.05 − 0.04 = 0.01

Si utilizamos la tabla A.3, encontramos z0.05 = 1.645. Por lo tanto, al sustituir en la fórmula
r
(0.05)(0.95) (0.04)(0.96)
1.645 + = 0.0117
1500 2000
encontramos que el intervalo de confianza del 90 % es −0.0017 ≤ p1 − p2 ≤ 0.0217 Como el intervalo contiene el
valor 0, no hay razón para creer que el nuevo proceso, comparado con el actual, disminuye en forma significativa
la proporción de artı́culos.

(Volver a la tabla resumen de procedimientos: Cuadro 1)

Aplicación en R:

library(stats)
x<-c(75,80) ; n<-c(1500,2000)
prop.test(x, n,
alternative = c("two.sided"),
conf.level = 0.90)

2-sample test for equality of proportions

data: x out of n
X-squared = 1.7958, df =
1, p-value = 0.1802
alternative hypothesis: two.sided
90 percent confidence interval:
-0.002314573 0.022314573
sample estimates:
prop 1 prop 2
0.05 0.04

2. Determinación del tamaño de la muestra para la estimación de


la media

d = (coeficiente de confianzal)x(error estándar)

σ
d = zα/2 ∗ √
n
La cual cuando se resuelve para n queda de la siguiente forma
2
zα/2 σ2
n=
d2
Cuando el muestreo se hace sin reemplazos a partir de una población finita y pequeña, se requiere de la corrección
para la población finita y la ecuación anterior queda de la siguiente forma
r
σ N −n
d = zα/2 ∗ √ ∗
n N −1

Que al resolverse para n queda de la siguiente forma


2
N zα/2 σ2
n= 2 σ2
d2 (N − 1) + zα/2

3. Determinación del tamaño de la muestra para la estimación de


proporciones

d = ( coeficiente de confianza ) × ( error estándar )

r
p∗q
d = zα/2 ∗
n
La cual cuando se resuelve para n queda de la siguiente forma

2
zα/2 ∗p∗q
n=
d2
Cuando el muestreo se hace sin reemplazos a partir de una población finita y pequeña, se requiere de la corrección
para la población finita y la ecuación anterior queda de la siguiente forma
r r
p∗q N −n
d = zα/2 ∗ ∗
n N −1
Que al resolverse para n queda de la siguiente forma
2
N ∗ zα/2 ∗p∗q
n= 2
d2 (N − 1) + zα/2 ∗p∗q

Referencias
[1] Montgomery, & Runger Probabilidad y Estadı́stica Aplicadas a La Ingenierı́a, McGRAW-Hill, Segunda edi-
ción, Cap 7.

[2] Ronald E. Walpole, et al 2012. Probabilidad y estadı́stica para ingenierı́a y ciencias, Pearson, novena edición,
Cap 9.

También podría gustarte