Pruebas de Hipotesis

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 32

Departamento de Ciencias Exactas

Kevin Torres, María José Tapia, Rubén Zhispón


Trabajo de Estadística
Tema: Intervalos de Confianza y Pruebas de Hipótesis
August 5, 2018

1
Estadística

INTERVALOS DE CONFIANZA

INTERVALOS DE CONFIANZA PARA MEDIA CON VARIANZA POBLACIONAL CONOCIDA

1.- Se toma una muestra de 49 observaciones de una población normal con una desviación estándar de 10. La
media de la muestra es de 55. Determine el intervalo de confianza de 99% de la media poblacional.
(Tomado de Lind Ejercicio 1, pag 305)
Datos:
n=49 σx = 10 x̄ = 55 I.C=99% α = 1% ∴ z α = 2.58
2

P[55 − 2.58 ∗ ( p10 ) ≤ µ ≤ 55 + 2.58 ∗ ( p10 )]


49 49
P[51.31 ≤ µ ≤ 56.69]

Con una confianza del 99% la media poblacional se encuentra en el intervalo de (51.31,56.69).

2.- Se toma una muestra de 81 observaciones de una población normal con una desviaciń estńdar de 5. La media
de la muestra es de 40. Determine el intervalo de confianza a cola superior de 95% de la media poblacional.
(Tomado de Lind Ejercicio 2, pag 305)
Datos:
n=81 σx = 5 x̄ = 40 I.C=95% α = 5% ∴ z α = 1.65

P[µ ≤ 40 + 1, 65 ∗ ( p5 )]
81
P[µ ≤ 40.92]

2
Estadística

Con una confianza del 95% la media poblacional debe ser menor o igual que 40.92.

3.- El número medio de horas de vuelo de los pilotos de Continental Airlines es 49 horas por mes (The Wall Street
Journal, 25 de febrero de 2003). Suponga que esta media se basó en las horas de vuelo de una muestra de 100 pilotos
de esa empresa y que la desviación estándar muestral haya sido 8.5 horas
Dé el intervalo inferior de estimación de 95% para la media poblacional de las horas de vuelo de los pilotos.
(Tomado de Andersson Ejercicio 16, pag 315)
Datos:
n=100 σx = 8.5 x̄ = 49 I.C=95% α = 5% ∴ z α = 1.65

P[49 − 1.65 ∗ ( p8.5 ) ≤ µ]


100
P[47.6 ≤ µ]

Con una confianza del 95% el numero medio de horas de vuelo de los pilotos de Continental Airlines es mayot o igual
a 47.6

INTERVALOS DE CONFIANZA PARA LA MEIDA CON VARIANZA POBLACIONAL DESCONOCIDA

4.- La International Air Transport Association realiza encuestas entre los viajeros de negocios en las que se cali-
fica la calidad de los aeropuertos de salida internacional. La calificación máxima es 10. Se seleccionó una muestra
aleatoria simple de 50 viajeros de negocios y a cada uno se le pidió su calificación para el aeropuerto internacional de
Miami. Las calificaciones que dieron estos 50 viajeros fueron las que se muestran a continuación.

6 4 6 8 7 7 6 3 3 8 10 4 8
7 8 7 5 9 5 8 4 3 8 5 5 4
4 4 8 4 5 6 2 5 9 9 8 4 8
9 9 5 9 7 8 3 10 8 9 6

Calcule el Intervalo de Confianza del 95% para la media poblacional de las calificaciones al aeropuerto de Miami.
(Tomado de Andersson Ejercicio 17, pag 315)
xi
x̄ = Σ50
i =1 n
6+4+6+8+7+7+6+3+3+8+10+4+.......+7+8+3+10+8+9+6
x̄ = 50
x̄ = 6.34
(x i −x̄)2
S 2x = Σ50
i =1 n

3
Estadística

(6−6.32)2 +(4−6.32)2 +(6−6.34)2 +......(8−6.34)2 +(9−6.34)2 +(6−6.34)2


S 2x = 50
S 2x = 4.677
S x = 2.16

Datos:
n=50 S x = 2.16 x̄ = 6.34 I.C=95% α = 5% ∴ t α , 49 = 2.0096
2

2.16 2.16
P[6.34 − 2.0096 ∗ ( p ) ≤ µ ≤ 6.34 − 2.0096 ∗ ( p )]
50 50
P[5.73 ≤ µ ≤ 6.95]

Con una confianza del 95% la media de calidad del aeropuerto de Miami se encuentra entre (5.73 - 6.95)

5.- Durante el verano de 2000 fueron visitados 30 restaurantes de comida rápida entre los que se encontraban
Wendyś, McDonaldś y Burger King (The Cincinnati Enquirer, 9 de julio de 2000). Se registró el tiempo que transcurría
entre que el cliente hiciera su pedido y la recepción del mismo. Los tiempos en los 30 restaurantes visitados fueron
los siguientes:

0.9 1.0 1.2 2.2 1.9 3.6 2.8 5.2 1.8 2.1
6.8 1.3 3.0 4.5 2.8 2.3 2.7 5.7 4.8 3.5
2.6 3.3 5.0 4.0 7.2 9.1 2.8 3.6 7.3 9.0

Calcule el intervalo de confianza superior del 99% para la media poblacional del tiempo.
(Tomado de Andersson Ejercicio 18, pag 315)

xi
x̄ = Σ50
n
i =1
0.9+1.0+1.2+2.2+1.9+3.6+2.8+5.2+1.8+......+1.2+3.6+7.3+9.0
x̄ = 30
x̄ = 3.8
(x i −x̄)2
S 2x = Σ50
i =1 n
(0.9−3.8)2 +(1−3.8)2 +(1.2−3.8)2 +......(3.6−3.8)2 +(7.3−3.8)2 +(9−3.8)2
S 2x = 30
S 2x = 5.09
S x = 2.26

Datos:
n=30 S x = 2.26 x̄ = 3.8 I.C=99% α = 1% ∴ t α , 29 = 2.462

4
Estadística

2.26
P[µ ≤ 3.8 + 2.462 ∗ ( p )]
30
P[µ ≤ 4.82]

Con una confianza del 99% el tiempo medio de espera está sobre los 4.82 segundos

6.- En un estudio de National Retail Foundation se encontró que las familias estaban dispuestas a gastar en prome-
dio $649 durante las vacaciones decembrinas (The Wall Street Journal, 2 de diciembre de 2002). Suponga que en el
estudio participaron 600 familias y que la desviación estándar muestral fue $175.
Calcule el intervalo de confianza inferior del 95% para la media poblacional.
(Tomado de Andersson Ejercicio 19, pag 315)
Datos:
n=600 S x = 175 x̄ = 649 I.C=95% α = 5% ∴ z α = 1.65

P[649 − 1.65 ∗ ( p175 ) ≤ µ]


600
P[637.21 ≤ µ]

Con una confianza del 95% la media de gasto se encuentra sobre los $637.21

5
Estadística

INTERVALOS DE CONFIANZA PARA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES CONOCI-


DAS

7.-Durante el 2003 los precios de la gasolina alcanzaron record de precios altos en 16 estados de Estados Unidos
(The Wall Street Journal, 7 de marzo de 2003). Dos de los estados afectados fueron California y Florida. La Ameri-
can Automobile Association encontró como precio medio muestral por galón $2.04 en California y $1.72 por galón en
Florida. Use 40 como tamaño de la muestra de California y 35 como tamaño de la muestra en Florida. Suponga que
estudios anteriores indican que la desviación estándar poblacional en California es 0.10 y en Florida 0.08.
Calcule un intervalo de confianza del 95% para a diferencia de medias poblacionales.
(Tomado de Andersson Ejercicio 4, pag 400)
Datos:
n 1 = 40 σx1 = 0.10 x¯1 = 2.04 n 2 = 35 σx2 = 0.08 x¯2 = 1.72 I.C=95% α = 5% ∴ z α = 1.96
2

q q
0.102 2 0.102 2
P[(2.04 − 1.72) − 1.96 ∗ ( 40 + 0.08
35 ) ≤ µ1 − µ2 ≤ (2.04 − 1.72) + 1.96 ∗ ( 40 + 0.08
35 )]
P[0.279 ≤ µ1 − µ2 ≤ 0.361]

Con una confianza del 95% se sabe que la diferencia de medias sobre el costo de combustible se encuentra entre
(0.279 - 0.361).

8.-Se esperaba que el día de San Valentín el desembolso promedio fuera $100.89 (USA Today, 13 de febrero de
2006). ¿ Hay diferencia en las cantidades que gastan los hombres y las mujeres? El gasto promedio en una muestra de
40 hombres fue de $135.67 y el gasto promedio en una muestra de 30 mujeres fue de $68.64. Por estudios anteriores
se sabe que la desviación estándar poblacional en el gasto de los hombres es de $35 y en el gasto de las mujeres es de
$20.
Elabore un Intervalo de Confianza a cola inferior del 99% para la diferncia de medias poblacionales.
(Tomado de Andersson Ejercicio 5, pag 400)
n 1 = 40 σx1 = 35 x¯1 = 135.67 n 2 = 30 σx2 = 20 x¯2 = 68.64 I.C=99% α = 1% ∴ z α = 2.33

q
2 202
P[(135.67 − 68.64) − 2.33 ∗ ( 35
40 + 30 ) ≤ µ1 − µ2 ]
P[51.58 ≤ µ1 − µ2 ]

6
Estadística

Con una confianza del 99% la diferencia de medias sobre el gasto de hombres y mujeres el día de San Valentín se en-
cuentra sobre $51.58.

9.-Considere una muestra de 40 observaciones de una población con una desviación estándar de la población de
5. La media muestral es 102. Otra muestra de 50 observaciones de una segunda población tiene una desviación es-
tándar de la población de 6. La media muestral es 99. Elabore un Intervalo de Confianza cola superior del 95% de la
diferencias de medias poblacionales
(Tomado de Lind, Ejercicio 1, pag.378)
Datos:
n 1 = 40 σx1 = 5 x¯1 = 102 n 2 = 50 σx2 = 6 x¯2 = 99 I.C=95% α = 5% ∴ z α = 1.65

q
52 62
P[µ1 − µ2 ≤ (102 − 99) − 1.65 ∗ ( 40 + 50 )]
P[µ1 − µ2 ≤ 4.91]

Con una confianza del 95% la diferencia de medias poblacionales está por debajo de 4.91.

INTERVALOS DE CONFIANZA PARA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES DESCONO-


CIDAS PERO IGUALES

10.- A continuación se enlistan los salarios en miles de dólares de los 25 jugadores de la jornada inicial del equipo
de los Yanquis de Nueva York, de las Ligas Mayores de Béisbol.

7
Estadística

Jugador Salario($) Posición


Acevedes, Alfredo 435.7 Pitcher
Burnett, A.J 16 500.0 Pitcher
Cano, Robinson 9 000 Segunda base
Cervelli, Francisco 410.8 Catcher
Chamberlain, Joba 488.0 Pitcher
Gardner, Brett 452.5 Jardinero
Granderson, Curtis 5 500.0 Jardinero
Hughes, Phil 447.0 Pitcher
Jeter, Derek 22 600.0 Receptor de pase corto
Johnson, Nick 5 500.0 Primera base
Marte, Damaso 4 000.0 Pitcher
Mitre, Sergio 850.0 Pitcher
Park, Chan Ho 1 200.0 Pitcher
Pena, Ramiro 412.1 Defensa
Pettitte, Andy 11 750.0 Pitcher
Posada, Jorge 13 100.0 Catcher
Rivera, Mariano 15 000.0 Pitcher
Robertson, David 426.7 Pitcher
Rodriguez, Alex 33 000.0 Tercera base
Sabathia, CC 24 285.7 Pitcher
Swisher, Nick 6 850.0 Jardinero
Teixeira, Maik 20 625.0 Primera base
Thames, Marcus 900.0 Jardinero
Vazquez, Javier 11 500.0 Pitcher
Winn, Randy 1 100.0 Jardinero

Divida a los jugadores en dos grupos: pitchers y no pitchers (jugadores de posición). Asuma que existen varianzas
poblacionales iguales para ambos. Calcule un Intercalo de Confianza del 95% para la diferencia de medias de salarios.
(Tomado de Lind, Ejercicio15. pag 387)
Pitchers:
n 1 = 12

xi
x¯1 = Σ12
i =1 n
435.7+16500+488+447+....+24285.7+11500
x¯1 = 12
x¯1 = 7240.26
(x i −x¯1 )2
S 2x1 = Σ12
i =1 n
(435.7−7240.26)2 +(1−3.8)2 +(16500−7240.26)2 +......(20625−7240.26)2 +(11500−7240.26)2
S 2x1 = 12
S 2x1 = 67933999.64
S x1 = 8242.2

Jugadores de posición:
n 2 = 13

xi
x¯2 = Σ13
i =1 n
9000+410.8+452.5+5500+......+6850+900+1100
x¯2 = 13
x¯2 = 9188.42
(x i −x¯2 )2
S 2x2 = Σ13
i =1 n
(90000 −9188.42)2 +(410.8−9188.42)2 +(452,5−9188.42)2 +......(900−9188.24)2 +(1100−9188.42)2
S 2x2 = 13
S 2x = 107514781.9
S x = 10368.93

8
Estadística

(12−1)(67933999.64)+(13−1)(107514781.9)
S 2p = 12+13−2
S 2p = 88584842.56
S p = 9411.95

I.C=95% ∴ α = 5% t α , 23 = 2.069
2 q q
1 1 1 1
P[(7240.26 − 9188.42) − 2.069(9411.95 12 + 13 ) ≤ µ1 − µ2 ≤ (7240.26 − 9188.42) + 2.069(9411.95 12 + 13 )]

P[−9743.73 ≤ µ1 − µ2 ≤ 5847.41]

Con una confianza del 95% la diferencia de media de salarios entre Pitchers y jugadores de posición está entre (-
9743.73 - 5847.41).

11.- Los resultados siguientes se obtuvieron de muestras aleatorias independientes tomadas de dos poblaciones.Supomga
que las desviaciones estándar son iguales.
Calcule un intervalo de confianza del 95% a cola superior para la diferencia de medias.

Muestra 1 Muestra 2
n 1 = 20 n 2 = 30
x¯1 = 22.5 x¯2 = 20.1
S 1 = 2.5 S 2 = 4.8

(Tomado de Anderson, Ejercicio 9, pag. 407)

2 2
S 2p = (20−1)(2.5) +(30−1)(4.8)
20+30−2
S 2p = 88584842.56
S p = 9411.95

I.C=95% ∴ α = 5% t α , 23 = 1.714 q
1 1
P[µ1 − µ2 ≤ (7240.26 − 9188.42) + 1.714(9411.95 20 + 30 )]

P[µ1 − µ2 ≤ 2708.77]

Con una confianza del 95% la diferencia de medias se encuentra hasta 2708.77.

9
Estadística

12.- El U.S Departament of Transportation informa sobre la cantidad de millas que recorren en automóvil los
habitantes de 75 principales ŕeas metropolitanas de ese país. Suponga que en una muestra aleatoria simple de 50
habitantes de Buffalo, la media es 22.5 millas por día y la desviación estándar es de 8.4 millas por día y que en una
muestra aleatoria simple independiente de 40 habitantes de Boston la media es 18.6 millas por día y la desviación es-
tándar es 7.4 millas por día. Suponga que las desviaciones poblacionales son iguales. Halle un intervalo de confianza
a cola inferior del 95% para la diferencia de medias.
(Tomado de Anderson, Ejercicio 12, pag. 407)
Datos:
n 1 = 50 S x1 = 8.4 x¯1 = 22.5 n 2 = 40 S x2 = 7.4 x¯2 = 18.6 I.C=95% α = 5% ∴ t α , 88 = 1.6624

(50−1)(8.4)2 +(40−1)(7.4)2
S 2p = 50+40−2
S 2p = 63.55
S p = 7.97
q
1 1
P[(22.5 − 18.6) − 1.6624(7.97 50 + 20 ) ≤ µ1 − µ2 ]
P[1.09 ≤ µ1 − µ2 ]

Con una confianza del 95% la diferencia de medias con respecto a las millas que recorren los habitantes de distintas

10
Estadística

poblaciones está sobre 1.09 millas por día.

INTERVALOS DE CONFIANZA PARA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES DESCONO-


CIDAS Y DIFERENTES
13.- Una muestra aleatoria de 20 elementos de la primera población reveló una media de 100 y una desviación
estándar de 15. Una muestra de 16 elementos de la segunda población reveló una media de 94 y una desviación es-
tándar de 8.
Utilice un nivel de significancia de 0.05 para hallar un Intervalo de confianza para la diferencia de medias.
(Tomado de Lind, Ejercicio 20, pag 391)
Datos:
n 1 = 20 σx1 = 15 x¯1 = 100 n 2 = 16 σx2 = 8 x¯2 = 94

2 2
( 15 8 2
20 + 16 )
v= 2 2 2 v = 30.09 → v = 30
( 15
20 ) ( 816 )2
19 + 15

I.C=95% α = 5% t α , 30 = 2.0423
2

q q
225 64 225
P[(100 − 46) − 2.0423 20+ 16 ≤ µ1 − µ2 ≤ (100 − 46) + 2.0423 20 + 62
16 ]
P[−1.96 ≤ µ1 − µ2 ≤ 13.96]

Con una confianza del 95% se concluye que la diferencia de medias poblacionales está en el intervalo de (-1.97 - 13.97)

14.- En un artículo reciente de The Wall Street Journal se comparó el costo de adopción de niños de China con el
de Rusia. En una muestra de 16 adopciones de China, el costo medio fue $11 045, con una desviación estándar de
$835. En una muestra de 18 adopciones de niños de Rusia, el costo medio fue $12 840, con una desviación estándar
de $1 545.
Encuentre un intervalo de confianza del 99% a cola superior.
(Tomado de Lind, Ejercicio 21, pag 391)
n c = 16 σxc = 835 x¯c = 11045 n r = 18 σxr = 1545 x¯2 = 12840

2 2
( 835 1545 2
16 + 18 )
v= 2 2 2 2 v = 26.73 → v = 26
( 835
16 ) ( 1545
18 )
15 + 17

I.C=99% α = 1% t α , 26 = 2.479

11
Estadística

q
2 15452
P[µ1 − µ2 ≤ (11045 − 12840) + 2.479 835
16 + 18 ]
P[µ1 − µ2 ≤ −745.44]

La diferencia de medias está por debajo de -745.44.

15.- Suponga que usted es un experto en la industria de la moda y desea reunir información para comparar la
cantidad mensual qe ganan las modelos que vistieron ropa de Liz Claiborne con respecto a las que modelaron ropa
de Calvin Klein. La siguiente es la cantidad (en miles de dólares) que gana al mes por una muestra de modelos de Liz
Claiborne:

$5.0 $4.5 $3.4 $3.4 $6.0 $3.3 $4.5 $4.6 $3.5 $5.2
$4.8 $4.4 $4.6 $3.6 $5.0

La siguiente es la cantidad (en miles de dólares) que gana una muestra de modelos de Calvin Klein.

$3.1 $3.7 $3.6 $4.0 $3.8 $3.8 $5.9 $4.9 $3.6 $3.6
$2.3 $4.0

xi
x¯l = Σ50
i =1 n
5+4.5+3.4+3.4+.......+4.6+3.6+5.0
x¯l = 15
x̄ = 4.38
(x i −x̄)2
S 2xl = Σ50
i =1 n
(5−4.38)2 +(4.5−4,38)2 +(3.4−4,8)2 +......(4.6−4.38)2 +(3.6−4.38)2 +(5−4.38)2
S 2xl = 15
S 2xl = 0.63
S xl = 0.79
xi
x¯c = Σ50
i =1 n
3.1+3.7+3.6+4.0+.......+3.6+2.3+4.0
x¯c = 12
x̄ = 3.85

12
Estadística

2
2 50 (x i −x̄)
S
xc =Σ i =1 n
(3.1−3.85) +3.7−3.85) +(3.6−3.85) +......(3.6−3.85)2 +(2.3−3.85)2 +(4−3.85)2
2 2 2
S 2xc = 50
S 2xc = 0.77
S xc = 0.88

Encuentre un intervalo de confianza del 95% a cola inferior para la diferencia de medias de ganancias en miles de
dólares.

v = 22.52 → v = 22

I.C=95% α = 5% t α , 22 = 1.717

q
P[(4.38 − 3.85) − 1.717 0.63 0.77
15 + 12 ≤ µ1 − µ2 ]
P[−0.03 ≤ µ1 − µ2 ]

Con una confianza del 95% la diferencia de medias de ganancias en dólares de las modelos de las diferentes marcas
está sobre -0.03.

INTERVALOS DE CONFIANZA PARA PROPORCIONES


16.- Se hizo un estudio con 611 oficinistas para investigar su atención al teléfono, el estudio registraba la frecuen-
cia con la contestaban el teléfono y la frecuencia con que dejaban que la llamada pase al buzón de voz (USA Today, 21
de abril 2002). De estos, 281 indicaron constatar siempre las llamadas y no utilizar el buzón de voz.
Dé un intervalo de confianza de 90% de confianza para la proporción de la población de oficinistas que siempre con-
testan el teléfono.
(Tomado de Anderson, Ejercicio 35, pag.323)
Datos:
n = 611 x = 281 I.C=90% α = 5% z α = 1.65
2
p̂ = 281
611 ∴ p̂ = 0.45
n ∗ p̂ ≥ 5 X

q q
0.45(1−0.45) 0.45(1−0.45)
P[0.45 − 1.65 611 ≤ p ≤ 0.45 + 1.65 611 ]
P[0.42 ≤ p ≤ 0.48]

De los resultados se puede concluir que con una confianza del 90% que entre el 42 y 48 % de los oficinistas contestan
el teléfono.

13
Estadística

17.- De acuerdo con estadísticas publicadas por la CNBC, la cantidad de vehículos que no están asegurados es
sorprendente (CNBC, 23 de febrero de 2006). Los resultados muestrales de la CNBC indica que 46 de 200 vehículos no
estaban asegurados.
Dé un intervalo de confianza a cola superior del 95% para la proporción poblacional.
(Tomado de Anderson, Ejercicio 36, pag.323)
Datos:
n = 200 x = 46 I.C=95% α = 5% z α = 1.65
46
p̂ = 200 ∴ p̂ = 0.23
n ∗ p̂ ≥ 5 X

q
P[p ≤ 0.23 + 1.65 0.23(1−0.23)
200 ]
P[p ≤ 0.28]

De los resultados se puede concluir que con una confianza del 95% los vehículos no asegurados no superan el 28% de
la proporción poblacional.

18.- El propietario de West End Kwick Fill Gas Station desea determinar la proporción de clientes que utilizan tar-
jeta de crédito o débito para pagar gasolina en el área de las bombas. Entrevisto a 100 clientes y descubre que 80
pagaron con ella.
Constuya un intervalo de confianza a cola inferior del 95% para la proporción poblacional.
(Tomado de Lind, Ejercicio 15, pag. 316)

14
Estadística

Datos:
n = 100 x = 80 I.C=95% α = 5% z α = 1.65
80
p̂ = 100 ∴ p̂ = 0.8
n ∗ p̂ ≥ 5 X

q
P[0.8 − 1.65 0.8(1−0.8)
100 ≤ p]
P[p ≤ 0.73]

Con los resultados obtenidos se puede concluir con una confianza del 95% que el 73% de los clientes pagan con tarjeta
de crédito o débito.

INTERVALOS DE CONFIANZA PARA DIFERENCIA DE PROPORCIONES


19.- Una muestra de 100 observaciones de la primera población indicó que x 1 es 70. Una muestra de 150 obser-
vaciones de la segunda población reveló que x 2 es 90. Utilice un nivel de significancia de 0.05 para determinar el
intervalo de confianza.
(Tomado de Lind, Ejercicio 7, pag.381)
Datos:
n 1 = 100 x 1 = 70 n 2 = 150 x 2 = 90 α = 5% z α = 1.96
2
70
pˆ1 = 100 ∴ pˆ1 = 0.7
90
pˆ2 = 150 ∴ pˆ2 = 0.6

q q
0.7(1−0.7)
P[(0.7 − 0.6) − 1.96 100 + 0.6(1−0.6)
150 ≤ p 1 − p 2 ≤ (0.7 − 0.6) + 1.96 0.7(1−0.7)
100 + 0.6(1−0.6)
150 ]
P[−0.02 ≤ p 1 − p 2 ≤ 0.2]

Con una confianza del 95% se puede decir que la diferencia entre proporciones poblacionales está entre -0.02 a 0.2.

15
Estadística

20.- Una muestra de 200 observaciones de la primera población indicó que x 1 es 170; otra, de 150 observaciones
de la segunda población reveloó que x 2 es 110. Utilice un nivel de significancia del 0.05 para calcular un intervalo de
confianza a cola superior.
(Tomado de Lind, Ejercicio 8, pag.382)
n 1 = 200 x 1 = 170 n 2 = 150 x 2 = 110 α = 5% z α = 1.65
170
pˆ1 = 200 ∴ pˆ1 = 0.85
110
pˆ2 = 150 ∴ pˆ2 = 0.73

q
P[p 1 − p 2 ≤ (0.85 − 0.73) + 1.65 0.85(1−0.85)
200 + 0.73(1−0.73)
150 ]
P[p 1 − p 2 ≤ 0.19]

Con una confianza del 95% la diferencia entre proporciones poblacionales se encuentra hasta 0.19.

21.- Considere los resultados siguientes obtenidos de dos muestras independientes tomadas de dos poblaciones.
De un intervalo de confianza a cola inferior del 90% para la diferencia de medias poblacionales.

Muestra 1 Muestra 2
pˆ1 = 400 pˆ2 = 300
x¯1 = 0.48 x¯2 = 0.36

(Tomado de Anderson, Ejercicio 28, pag. 420)

16
Estadística

α = 10% ∴ z α = 1.29

q
P[(0.48 − 0.36) − 1.29 0.48(1−0.48)
400 + 0.36(1−0.36)
300 ≤ p1 − p2]
P[0.07 ≤ p 1 − p 2 ]

Con una confianza del 90% la diferencia de proporciones poblacionales esta sobre 0.07.

PRUEBA DE HIPOTESIS
HIPÓTESIS DE DIFERENCIA DE MEDIAS CON VARIANZA POBLACIONAL CONOCIDA
BILATERAL

Jamestown Steel Company fabrica y arma escritorios y otros muebles para oficina en diferentes plantas en el oeste
del estado de Nueva York. La producción semanal del escritorio modelo A325 en la planta de Fredonia tiene una dis-
tribución normal, con una media de 200 y una desviación estándar de 16. Hace poco, con motivo de la expansión
del mercado, se introdujeron nuevos métodos de producción y se contrató a más empleados. El vicepresidente de
fabricación pretende investigar si hubo algún cambio en la producción semanal del escritorio modelo A325. En otras
palabras.
a)¿La cantidad media de escritorios que se produjeron en la planta de Fredonia es diferente de 200 escritorios se-
manales con un nivel de significancia de 0.01?

Ho : µ = 200
H1 : µ 6= 200
α = 0.01
n = 50
Vx = 16
x = 203.5

203.5 − 200
z ob =
p15
50
z ob = 1.546
Según la tabla de distribución normal estándar:
α = 0.005

17
Estadística

z = −2.58y2.58

Conclusión:La media de la población no es distinta de 200. Por lo tanto, se informa al vicepresidente de fabri-
cación que la evidencia de la muestra no indica que la tasa de producción en la planta de Fredonia haya cambiado de
200 semanales.

LATERAL SUPERIOR

b)Que pasara cuando la producción excede los 200 escritorios suponga un α = 0.05

Ho : µ ≤ 200
H1 : µ < 200
α = 0.05
n = 50
Vx = 16
x = 203.5

203.5 − 200
z ob =
p15
50
z ob = 1.546
Según la tabla de distribución normal estándar:
α = 0.05
z = 1.64

Conclusión:La media de la población no es distinta de 200. Por lo tanto, se informa al vicepresidente de fabri-
cación que la evidencia de la muestra no indica que la tasa de producción en la planta de Fredonia haya excedido más
de 200 semanales.

LATERAL INFERIOR

c)Que pasara cuando la producción decaiga a menos de 200 escritorios suponga un α = 0.05.

Ho : µ ≥ 200

18
Estadística

H1 : µ > 200
α = 0.05
n = 50
Vx = 16
x = 203.5

203.5 − 200
z ob =
p15
50
z ob = 1.546
Según la tabla de distribución normal estándar:
α = 0.05
z = −1.64

Conclusión:la media de la población no es distinta de 200. Por lo tanto, se informa al vicepresidente de fabricación
que la evidencia de la muestra no indica que la tasa de producción en la planta de Fredonia haya decaído a menos de

19
Estadística

200 semanales.

(Tomado de Lind, Ejemplo, pag, 342)

PRUEBA DE HIPOTESIS DE DIFERENCIA DE MEDIAS CON VARIANZA POBLACIONAL DESCONO-


CIDA PERO IGUALES
Dos profesores en una escuela desean comparar el rendimiento de los alumnos de octavo año que han sido móviles
(población 1) con los puntajes de los alumnos que no lo han sido (población 2). ¿Se puede concluir con los datos de
las muestras si el puntaje de rendimiento promedio es diferente en los dos grupos?
Grupo1 n= 15 Promedio= 85 S 2 = 30
Grupo2 n= 22 Promedio= 87 S 2 = 25
Móviles= estudiantes que asistieron a dos o más escuelas
No móviles= estudiantes que permanecen en la misma escuela.

Ho : 85 = 87
H1 : 85 6= 87
α = 0.05

Según la tabla t de Student

t α ,(n1+n2−2) = t 0.025,30 = 2.031


2

(n 1 − 1)S 12 + (n 2 − 1)S 22
Sp 2 =
n1 + n2 − 2
14(30) + 21(25)
Sp 2 = = 27
35
Sp = 5.196
x1 − x2
t ob = q
Sp ∗ n11 + n12
85 − 87
t ob = q
1 1
5.196 ∗ 15 + 22
t ob = −1.14
Conclusión:El rendimiento promedio entre los alumnos moviles y no moviles no tienen ninguna diferecia .

(Tomado de ht t ps : //w w w.u−cur sos.cl / f ac so/2011/1/P SI −E 2/1/mat er i al d ocent e/ba j ar %3F i d m at er i al %3D58224

PRUEBA DE HIPOTESIS DE DIFERENCIA DE MEDIAS CON VARIANZA POBLACIONAL DESCONO-


CIDA PERO DISTINTAS
Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un análisis químico de
laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro. Cada muestra se divide en dos submues-
tras y se aplican los dos tipos de análisis. A continuación, se presentan los datos codificados que muestran los análisis
de contenido de hierro:

Analisis 1 2 3 4 5
Rayos X 2.0 2.0 2.3 2.1 2.4
Químico 2.2 1.9 2.5 2.3 2.4
Ho : 2.16 = 2.26

20
Estadística

H1 : 2.26 6= 2.26
Pruebe con un nivel de significancia de 0,05.
x 1 = 2.16S x1 = 0.18165
x 2 = 2.26S x2 = 0.23021
n1 = n2 = 5
α = 0.05

x2 − x1 0.10
t ob = r = = 0.7624
S 12 S 22 0.01311
n1 + n2
¡ 0.00659 ¢2
5 + 0.0529
5
υ = µ ¡ 0.00659 ¢2 ¡ 0.0529 ¢2 ¶ =8
5 5
4 + 4

Según la tabla t de Student

t α ,v = t 0.025,8 = 2.306
2

Conclusión:No se encuentra ninguna diferncia entre el análisi químico y el análisi de fluorescencia de rayos x
entonces ambos anásisis son aptos para hallar el contenido de hierro.
(Tomado de ht t ps : // f cl ad . f i l es.wor d pr ess.com/2010/04/est t ecn.pd f )

PRUEBA DE HIPOTESIS DE PROPORCIONES, BILATERAL, LATERAL SUPERIOR, LATERAL IN-


FERIOR
BILATERAL

Se desea probar si a habido una variación en la proporción de 0.4 de mujeres en las carreras de Ingeniería.En el ultimo
examen de admision realizado se selecciona una muestra de 200 ingresantes y se obtiene una proporción de mujeres
de 0.45. Utilice el nivel de significancia del 0.01.

H0 : P = 0.4
H1 : p 6= 0.4

21
Estadística

p = 0.45

n = 200

α = 0.01

Según la tabla de distribución normal estandar

α = 0.01

α
2 = 0.005

z 0.005 = −2.575

q = 1−p

q = 1 − 0.4 = 0.6

0.45 − 0.4
z ob = q = 1.4213
0.4∗0.6
200

Conclusión:La proporción de mujeres en las carreras de ingeniería no es diferente de 0.4.

(Tomado de ht t ps : //es.sl i d eshar e.net /wi l l i aml eon20/pr ueba − d e − hi pot esi s − par a − pr opor ci ones −
est − i nd − cl ase02)

LATERAL SUPERIOR

Una cadena de comida rápida acaba de desarrollar un novedoso proceso para asegurarse de que los pedidos de ser-
vicio en el automovil se entreguen de manera correcta. Con el proceso anterior, los pedidos se entregaban correc-
tamente el 88% de las veces. Se selecciono una muestra de 100 pedidos despachados utilizando el nuevo proceso ,
de los cuales 92 se entregaron en forma correcta. Utilizando nivel de significancia de 0.01,¿se puede concluir que el
nuevo proceso ha aumentado la proporción de pedidos entregados correctamente?

22
Estadística

H0 : p ≤ 0.88
H1 : p > 0.88
92
p= = 0.92
100
q = 1−p

q = 1 − 0.92 = 0.08

Según la tabla de distribución normal estandar

α = 0.01

z 0.01 = 2.33
p −q
z ob = q
p 0 ∗q 0
n
0.92 − 0.88
z ob = q = 1.414214
0.92∗0.88
100

Conclusión:No hay evidencia suficiente de que el nuevo proceso haya aumentado la producción de pedidos cor-
rectos por encima de 0.88

(Tomado de ht t ps : //es.scr i bd .com/d oc/59262678/P r ueba − d e − Hi pot esi s −Una − Sol a − P r opor ci on)

LATERAL INFERIOR

En una muestra de 105 comercios seleccionados al azar de una zona,se observa que 27 de ellos han tenido pérdidas
en este mes. Un analista económico de la zona establece que la proporción de comercios en la zona con pérdidas es
igual o superior a 0.35. Contraste dicha hipótesis a un nivel de significancia del 5%.

Ho : p ≥ 0.35

23
Estadística

H1 : p < 0.35
27
p= = 0.26
105
q = 1 − p = 0.74

Segun la tabla de distribución normal estandar

α = 0.05

z 0.05 = −1.65
p − po
z ob = q
p 0 ∗q 0
n
0.26 − 0.35
z ob = q
0.35∗0.65
105

z ob = −1.104

Conclusión: La proporcion de perdidad de comercio en toda la zona es menor al 0.35.

(Tomado de ht t p : //w w w.ug r.es/ mv ar g as/I n f e2.pd f )

PRUEBA DE HIPOTESIS DE DIFERENCIA DE PROPORCIONES, BILATERAL, LATERAL SUPE-


RIOR, LATERAL INFERIOR
BILATERAL

Una muestra de 50 hogares de una comunidad revela que 10 de ellos vieronun programa especial de televisión sobre
la economía nacional. En unasegunda comunidad, 15 hogares de una muestra aleatoria de 50 vieron eseprograma
especial de televisión. Probamos la hipótesis de que la proporción global de espectadores de las dos comunidades no
difiere, con un nivel designificancia de 1% de la siguiente manera:

24
Estadística

H0 : 0.2 = 0.3
H1 : 0.2 6= 0.3
10
p1 = = 0.2
50
15
p2 = = 0.3
50
Proporción combinada de las muetras.

x 1 + x 2 10 + 15
pc = = = 0.25
n1 + n2 100
0.2 − 0.3
z ob = q ¡1 1
¢
0.25(0.75) ∗ 50 + 50
z ob = −1.15

Según la tabla de ditribución uniforme

α = 0.005

z 0.005 = −2.58y2.58

Conclusión: Por lo tanto la hipótesis de que no existe diferencia en la proporción de espectadores de las dos zonas
no puede rechazarse.

(Tomado de ht t ps : //es.scr i bd .com/d oc/59166730/P r ueba−d e−La−Di f er enci a−Ent r e−2−P r opor ci ones−
Pobl aci onal es)

LATERAL SUPERIOR

El dueño de un cafe desea saber si la proporción de mujeres que entran a su negocio es igual o menor al 60%. Para
confirmar lo anterior se realiza un muestreo de 40 personas dando una proporción de mujeres del 58%. Realizar la

25
Estadística

prueba de hipotesis con un nivel de significancia de 0.1.

H0 : 0.58 ≤ 0.6
H1 : 0.58 > 0.6
Según la tabla de distribución normal estandar:

Para: α = 0.1

z 0.1 = −1.28

Proporción combinada de las muestras:

24 + 23.2
pc = = 0.59
40 + 40
0.58 − 0.6
z ob = q ¡1 1
¢
0.6 ∗ 0.4 ∗ 40 + 40
z ob = −0.1818558

Conclusión: Concluimos sabiendo que las mujeres que entran en el cafe son mayo al 60%.

(Tomado de ht t ps : //w w w.yout ube.com/w at ch?v = 8kP i d g 4QB b8)

LATERAL INFERIOR

A las personas que sufren de tensión alta, se les recomienda seguir una dieta libre de sal. Queremos realizar un estudio
para comprobar si esta dieta es efectivamente ventajosa. Para el estudio se estudio una muestra de 8 personas y se
tomó la tensión antes de empezar la dieta y dos semanas después. Los resultados obtenidos fueron:

Antes 93 106 87 92 102 95 88 110


Despues 92 102 89 92 101 96 88 105
H0 : 96.62 = 95.62
H1 : 96.62 < 95.62

26
Estadística

Según la tabla t de Student

d − ud
t=
Sd
d = −1

S d = 2.390

t = −1.18
Conclusión: No tenemos evidencias significativas que realmente hacer dieta en productos bajos de sal sea ventajoso
para las personas que tienen alta tensión.

(Tomado de ht t ps : //yout u.be/8kP i d g 4QB b8)

P-VALOR BILATERAL, LATERAL SUPERIOR, LATERAL INFERIOR


BILATERAL

Un banco quiere analizar si las comisiones que cobra a sus clientes por operaciones en el mercado bursátil difieren
significativamente de las que cobra la competencia, cuya media es de 12 euros mensuales con una desviación están-
dar de 4.3 euros. Este banco toma una muestra de 64 operaciones bursátiles y observa que la comisión promedio es
de 13.6 euros. Contrastar, al nivel de significación del 0.05 que este banco no difiere significativamente en el cobro de
comisiones por operaciones en la bolsa con respecto a la competencia. Encuentre el p-valor.

H0 : µ = 12
H1 : µ 6= 12
x = 13.6

V x = 4.3

n = 64

27
Estadística

13.6 − 12
z ob = 4.3
p
64
z ob = 2.97

p v al or = 2[1 − P (z ≤ 2.97)]

Según la tabla de distribución normal estandar:

P (z ≤ 2.97) = 0.998511

p − v al or = 2(1 − 0.998511)

p − v al or = 0.298%

p − v al or ≺ α

Conclusión: Existe evidencia estadística de que la comisión que cobra este banco difiere significativamente de la
competencia.

(Tomado deht t ps : //w w w.uoc.ed u/i n3/emat h/d oc s/C H1 Pob.pd f )

LATERAL SUPERIOR

El propietario de un automovil sospecha que su vehiculo tienen un consumo medio de combustible en carretera
superior a los 5,6 litros/100km, que es lo que el fabricante indica en su publicidad. Para apoyar empíricamente su
sospecha observa el consumo medio en 11 viajes seleccionados aleatoriamente entre todos los que realiza en el año,
obteniendo los siguientes resultados.

6.1 ; 6.5 ; 5.1 ; 6 ; 5.9 ; 5.2 ; 5.8 ; 5.3 ; 6.2 ; 5.9 ; 6.3

¿Calcular el p-valor con un nivel de significancia de 0.01?

H0 : µ = 5.6

28
Estadística

H1 : µ > 5.6
x = 5.845

Sx = 0.4612

n = 11

5.845 − 5.6
t ob = 0.4612
p
11
t ob = 1.76

p − v al or = P (t ≥ 1.76)

Segun la tabla t de Student

P (t ≥ 1.76) = 0.05

p-valor=0.05

p − v al or ÂÂ α

Conclusión: Se acepta que el consumo medio de combustible en carretera superior es de 5,6 litros/100km.

(Tomado de ht t p : //w w w.est ad i st i c a.net /p − v al or.pd f )

LATERAL INFERIOR

Una empresa de neumáticos afirma que una nueva gama en promedio dura menos de 28000 km. Las pruebas con 64
neumaticos dan como resultado una duración media de 27800 km, con una desviación estándar de 1000 km. Bajo la
normalidad de los neumáticos, se pide: ¿Cual es el p-valor con un nivel de significancia del 5%?

H0 : µ0 ≥ 28000
H1 : µ1 < 28000
x = 27800

n = 64

Sx = 1000

27800 − 28000
z ob = 1000
p
64
z ob = −1.6

p − v al or = P (z ≤ −1.6)

Según la tabla de distribucion normal estandar

P (z ≤ −1.6) = 0.054799

p − v al or = 5.48%

29
Estadística

Conclusión:Con una fiabilidad del 95% se acepta que la duración media de los neumáticos es de 28000 km.

(Tomado de ht t p : //w w w.est ad i st i c a.net /Al g or i t mos2/g ui a − pv al or.pd f )

REGRESIONES
Regresión Lineal
Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44 kilos.

a) Hallar la ecuación de la recta de regresión de la edad sobre el peso.

xi yi x i2 y i2 xi · y i
2 14 4 196 28
3 20 9 400 60
5 32 25 1024 160
7 42 49 1764 294
8 44 64 1936 352
25 152 151 5320 894

25
ux = =5
5
152
yx = = 30.4
5

152
σ2x = − 52 = 5.2
5
5320
σ2y = − 30.42 = 139.84
5

894
σx y = − (5) ∗ (30.4) = 26.8
5

x − 5 = 0.192(y − 30) −→ x = 0.192y − 0.76

y − 30.4 = 5.15(x − 5) −→ y = 5.15x + 4.65

b) ¿Cuál sería el peso aproximado de un niño de seis años?

y = 5.15(6) + 4.65

y = 35.55[kg ]
(Tomado de ht t ps : //w w w.vi t ut or.com/est ad i st i c a/bi /1.ht ml )

Regresión Exponencial
Miles de millas recorridas 1 2 5 15 25 30 35 40
Porcentaje útil 99 95 85 55 30 24 20 15

30
Estadística

x y l og (y) x2 x · l og (y)
1 99 1.996 1 1.996
2 95 1.978 4 3.955
5 85 1.929 25 9.647
15 55 1.740 225 26.105
25 30 1.477 625 36.928
30 24 1.380 900 41.406
35 20 1.301 1225 45.536
40 15 1.176 1600 47.044
153 • 12.97759 46005 212.61769

l og Y = l og α · N + l og β · X
P P

X · l og Y = l og α · X + l og β · X 2
P P P

12.97759 = l og α · 8 + l og β · 153
212.61769 = l og α · 153 + l og β · 4605
8l og α + 153l og β = 12.97759
153l og α + 4605l og β = 212.61769

Al resolver el sistema se obtiene :


l og α = ∆∆α = 59761.80195−32530.50657
36840−23409 =27231.295389
13431 = 2.027495747
∆β
l og β = ∆ = 1700.944152−1985.57127
13431 = −284.627118
13431 = −0, 02119180389
Reemplazando los valores se obtiene:

l og Y = l og α + X · l og β
l og Y = 2.027496 − 0.02119X
Reemplazando en la ecuación predictoria se obtiene:

Y = α · βX
Y = 106.536 · 0.952 X
(Tomado de ht t ps : //w w w.monog r a f i as.com/t r aba j os89/r eg r esi on−exponenci al −met od o−mi ni mos−
cuad r ad os/r eg r esi on − exponenci al − met od o − mi ni mos − cuad r ad os.sht ml )

Regresión Logarítmica
Se realizó un estudio comparativo del nivel de ruido (en decibeles) producido por discotecas rodantes, se procedió a
evaluar diferentes niveles de potencia (en vatios). Los datos finales fueron:

Potencia Decibeles
100 60
500 80
1000 90
5000 99
10000 120

x y Ln(x) Ln(y) (l n(x))2 (l n(y))2 ln(x)*ln(y)


100 60 4.6052 4.0943 21.2076 16.7637 18.8552
500 80 6.2146 4.3820 38.6214 19.2022 27.2326
1000 90 6.9078 4.4998 47.7171 20.2483 31.0836
5000 99 8.5172 4.5951 72.5426 21.1151 39.1375
10000 120 9.2103 4.7875 84.8304 22.9201 44.0944
Suma 35.4551 22.3588 264.9190 100.2493 160.4033

31
Estadística

160.4033− 35.4551∗22.3588
5
b= 2 = 0.1374
264.919− (35.4551)
5
22.3588−0.1374∗35.4551
5 = 3.497
(
a = e 3.497) = 33.0164

Ecuación final : y = 33.0164 ∗ x 0 .1374


(Tomado de ht t p : //r e yesest ad i st i c a.bl og spot .com/2011/07/anal i si s − d e − r eg r esi on − l og ar i t mi c a.ht ml )

32

También podría gustarte