Estimacion y Prueba de Hipotesis
Estimacion y Prueba de Hipotesis
Estimacion y Prueba de Hipotesis
1
Estimación puntual
Es la estimación del valor del parámetro por
medio de un único valor obtenido mediante
el cálculo o evaluación de un estimador para
una muestra específica.
El estimador se expresa mediante una
fórmula. Por ejemplo, la media de la muestra:
1 n
X Xi
n i 1
2
Estimación por intervalos
La estimación por intervalo establece un
intervalo dentro del cual es muy probable
que se encuentre el parámetro poblacional.
El coeficiente de confianza se usa para
indicar la probabilidad de que una
estimación por intervalo contenga al
parámetro poblacional. El nivel de
confianza es el coeficiente de confianza
expresado como un porcentaje.
3
Intervalo de confianza para la
media (con varianza conocida)
Si X es la media de una muestra aleatoria de
tamaño n de una población con varianza 2,
conocida, un intervalo de confianza de
(1-)x100% para está dado por:
X z1 / 2 X z1 / 2
n n
4
Si el muestreo es sin reemplazo, o población
Finita los límites de confianza se calculan con
la siguiente fórmula.
N n N n
X z1 / 2 X z1 / 2
n N 1 n N 1
5
Ejemplo 1
Una muestra aleatoria de los archivos de una
compañía que contienen información detallada,
indican las órdenes de compras para cierta pieza
fueron complementadas en 10, 12, 19,14, 15, 18,
11 y 13 días. Suponiendo que el tiempo de
cumplimiento de la orden de compra (medido en
días) es una v.a. Normal con desviación estándar 3
días,
a) Obtenga un intervalo con un nivel de confianza del
99% para el tiempo medio de cumplimiento de una
orden de compra para la pieza considerada.
6
Ejemplo 2
Una empresa eléctrica fabrica focos que
tienen una duración aproximadamente normal
con desviación estándar de 40 horas. Si una
muestra de 50 focos tiene una duración
promedio de 785 horas, encuentre un intervalo
de confianza de 95% para la media de la
población de todos los focos que produce esta
empresa.
7
Intervalo de confianza para la media con
varianza poblacional desconocida
(muestra pequeña )
S S Infinita
X t1 / 2 , n 1 X t1 / 2 , n 1
n n
S N n S N n Finita
X t1 / 2,n 1 X t1 / 2,n 1
n N 1 n N 1
8
Ejemplo 3
En un estudio de costos del seguro de choques
automovilísticos, una muestra aleatoria de 80
costos de reparación de carrocerías para una
clase particular de daños tiene una media de
$472 y una desviación estándar de $62.
Obtenga un intervalo con un 90% de nivel de
confianza para el costo medio de reparación del
tipo de daño considerado
9
Ejercicio4
Una máquina produce piezas metálicas de
forma cilíndrica. Se toma una muestra de las
piezas y los diámetros son 1.01, 0.97, 1.03,
1.04, 0.99, 0.98, 0.99, 1.01 y 1.03
centímetros. Encuentre un intervalo de
confianza de 99% para el diámetro medio de
las piezas de esta máquina, suponga una
distribución aproximadamente normal.
10
Intervalo de confianza para la media con
varianza poblacional desconocida
(muestra grande )
S S
X z1 / 2 X z1 / 2
n n
S N n S N n
X z1 / 2 X z1 / 2
n N 1 n N 1
11
Ejercicio3
Para estimar el gasto promedio de los
clientes en el McDonald’s local, los
estudiantes de una clase de estadística
toman una muestra de 200 clientes y
encuentran un gasto promedio de US$ 5.67,
con una desviación estándar de US$ 1.10.
¿Cuál es el intervalo de confianza del 95%
para los gastos promedio de todos los
clientes? Interprete sus resultados.
12
Ejercicio4
Una muestra aleatoria de 600 propietarios
de automóviles muestra que, en el estado de
Virginia, un automóvil se maneja, en
promedio, 23500 kilómetros por año con
una desviación estándar de 3900
kilómetros. Construya un intervalo de
confianza de 99% para el número promedio
de kilómetros que se maneja un automóvil
anualmente en Virginia.
13
Tamaño de muestra
Si X se usa como estimación de , podemos tener
(1-)x100% de confianza de que el error no exceda
una cantidad específiva e cuando el tamaño de la
muestra es: 2
z 1 / 2
n
e
Si el cálculo del tamaño de muestra resulta un valor
con decimales, se debe redondear al siguiente
número entero.
14
Nota: Si el muestreo es sin reemplazo, el
tamaño de muestra se calcula con la
siguiente fórmula:
n0
n
n0
1
N
2
donde: z 1 / 2
n0
e
15
Tamaño de muestra cuando la
varianza poblacional es desconocida
2
z1 / 2 s
n
e
El valor de s puede ser obtenido a partir de una muestra preliminar de por lo menos 30 elementos.
Nota: Si el valor del tamaño de muestra es decimal se debe redondear al siguiente número entero.
16
Ejercicio1
Un estudio que usted está realizando requiere
un intervalo del 95% para la tasa de
rendimiento promedio que su empresa gana
sobre los proyectos para presupuestar capital.
¿Cuántos proyectos debe tener su muestra si su
supervisor especifica un error máximo de sólo
el 5% y s = 2.3%?
17
Ejercicio2
Un experto en eficiencia desea determinar
el tiempo promedio que toma el hacer tres
perforaciones en una cierta pieza metálica.
¿Qué tan grande se requiere que sea la
muestra si se necesita una confianza de
95% de que su media muestral estará
dentro de 15 segundos del promedio real?
Asuma, por estudios anteriores
40 que
segundos.
18
Ejercicio 3
Una máquina de refrescos está ajustada de
tal manera que la cantidad de líquido
despachada se distribuye aproximadamente
en forma normal. ¿Qué tan grande se
requiere que sea la muestra si se desea tener
una confianza de 98% de que su media
muestral estará dentro de 0.09 decilitros del
promedio real?. Se cuenta con información
de una muestra piloto de tamaño 24.
19
1.99 2.59 2.04 1.86 2.58 2.04
(n 1) S 2 (n 1) S
2
X2
2
2
/2 X 1 / 2
21
Ejemplo. Un fabricante de baterías para
automóviles afirma que sus baterías durarán, en
promedio, tres años con una varianza de un año.
Si cinco de estas baterías tienen duraciones de
1.9, 2.4, 3.0, 3.5 y 4.2 años, construya un
intervalo de confianza del 95% para la varianza
real y decida si la afirmación del fabricante de es
válida. Suponga que la población de duraciones
de las baterías es de forma aproximadamente
normal.
22
Problema. Para estimar el tiempo promedio
que lleva ensamblar cierto componente de
una computadora, el supervisor de una
empresa electrónica tomó el tiempo que 20
técnicos tardaban en ejecutar esta tarea,
obteniéndose una media de 12.73 minutos y
una desviación estándar de 2.06 minutos.
Asuma que los tiempos tienen distribución
normal.
Construya e interprete un intervalo de
confianza de 98% para la varianza real que
lleva ensamblar el componente de la
computadora.
23
Intervalo de confianza para la
proporción poblacional
Si p̂ es la proporción de éxitos en una muestra
aleatoria de tamaño n y q̂ 1 p̂ , un intervalo
de confianza aproximado de (1-)x100% para
el parámetro binomial p está dado por:
pˆ qˆ pˆ qˆ
pˆ z1 / 2 p pˆ z1 / 2
n n
24
Problema. Una empresa desea estimar
la proporción de trabajadores de la línea
de producción que están a favor de que
se corrija el programa de aseguramiento
de la calidad. Se toma una muestra de
100 trabajadores y resulta que 80 están
a favor. Estime con 99% de confianza la
proporción de trabajadores de la línea
de producción que están a favor de que
se corrija el programa de aseguramiento
de la calidad
25
Tamaño de muestra
Si p̂ se utiliza como una estimación de p,
podemos tener una confianza del (1-)x100%
de que el error será menor de una cantidad
específica e cuando el tamaño de la muestra es
aproximadamente:
2
z /2 p̂q̂
n 2
e
26
Nota: Si el muestreo es sin reemplazo, el
tamaño de muestra se calcula con la
siguiente fórmula:
2
2
IC ( 1 2 ) X 1 X 2 z1 / 2 1
2
n1 n2
29
Ejemplo. Para comparar dos métodos de la enseñanza
de las matemáticas, se aplicaron a 200 alumnos elegidos
al azar el método tradicional y a otra muestra de 250
alumnos el método nuevo resultando las calificaciones
promedio respectivos de 13 y 15. Suponga que las
varianzas poblacionales respectivas son 9 y 16.
Utilizando un intervalo de confianza del 95% para la
diferencia de las medias, ¿podemos afirmar que no hay
diferencias significativas entre los dos métodos?, si hay
diferencias, ¿podemos afirmar que el método nuevo es
mejor que el método tradicional?
30
Intervalos de confianza para la
diferencia entre dos medias.
Caso2: Varianzas poblacionales desconocidas pero
iguales
1 1
IC ( 1 2 ) X 1 X 2 t / 2 S
2
p
n1 n2
( n 1) S 2
( n 1) S 2
S 2p 1 1 2 2
n1 n2 2
31
Problema. Se comparan el rendimiento de la
gasolina de dos automóviles, A y B, probando
cada uno de ellos con cinco marcas de gasolina.
Cada uno de los vehículos gasta un tanque de
cada marca, y el resultado, en millas por galón,
es el siguiente
Marca Automóvil Automóvil
A B
1 28.3 29.2
2 27.4 28.4
3 29.1 28.2
4 28.7 28
5 29.4 29.6
32
Calcule un intervalo de confianza de 99%
para la diferencia de promedios.¿Hay
evidencia que sugiera que existe una
diferencia entre las cifras promedio
verdadero para el rendimiento de los dos
automóviles? Asuma poblaciones normales
con varianzas iguales.
33
Caso3: Varianzas poblacionales desconocidas y
diferentes
2 2
S S
IC ( 1 2 ) X 1 X 2 t( v , / 2 ) 1
2
n1 n2
2
S S 2 2
1
2
n n
1 2
v
S12 2 S 22 2
n n
1 2
n 1 1 n 2 1 34
Ejemplo. Una compañía de taxis trata de
decidir si comprar neumáticos de la marca A o
de la B para su flotilla de taxis. Se lleva a cabo
un experimento utilizando 12 de cada marca.
Los neumáticos se utilizaron hasta que se
gastan. Los resultados son:
Marca A Marca B
x 1 36 300 kilómetros x 2 38 100 kilómetros
s 12 5 000 kilométros s 22 6 100 kilométros
Calcule un IC de 90% para la diferencia de rendimiento
promedio de ambas marcas de neumáticos. Suponga
poblaciones normales con varianzas distintas.
35
Prueba de
hipótesis
36
Conceptos generales
La prueba de hipótesis involucra una suposición
elaborada sobre algún parámetro de la población. A
partir de la información proporcionada por la muestra se
verificará la suposición sobre el parámetro estudiado. La
hipótesis que se contrasta se llama hipótesis nula (Ho).
Partiendo de los resultados obtenidos de la muestra,
o bien rechazamos la hipótesis nula a favor de la
alternativa, o bien no rechazamos la hipótesis nula y
suponemos que nuestra estimación inicial del
parámetro poblacional podría ser correcto.
37
Tipos de errores
Información muestral
Rechazar
Aceptar H0 H0
H0 es No hay
cierta error Error I
La
realida H0 es No hay
d falsa Error II error
38
Pasos a seguir en una Prueba
de Hipótesis
Paso 1: Planteo de hipótesis.
Paso 2: Nivel de significación.
Paso 3: Prueba estadística.
Paso 4: Suposiciones.
Paso 5: Regiones críticas. Criterios de
decisión.
Paso 6: Realización de la prueba.
Paso 7: Resultados y conclusiones.
39
Prueba de hipótesis para una media
poblacional (varianza conocida)
Una empresa eléctrica fabrica focos
cuya duración se distribuye de forma
aproximadamente normal con media
de 800 horas y desviación estándar de
40 horas. Pruebe la hipótesis de que
horas contra la alternativa horas si
una muestra aleatoria de 28 focos
tiene una duración promedio de 784
horas. Utilice un nivel de significancia
de 0.05.
40
1. Planteo de hipótesis.
H 0 : 800
H 1 : 800
2. Nivel de significación: = 0.05
3. Prueba estadística
_
x
Zc ~ N(0.1)
/ n
4. Supuestos.
a. Población normal.
b. Muestra tomada al azar.
41
5. Regiones críticas. Criterios de decisión.
La hipótesis alternante define la(s) zona(s) de
rechazo.
6. Cálculos
784 800
Zc 2.12
40 / 28
42
Prueba de hipótesis para una media
poblacional (varianza desconocida)
Problema1: Antes de publicar un nuevo libro
de cocina, Bantam Books desea probar la
hipótesis, con un nivel de significancia del 2%
de que el precio promedio de tales libros es de
US$ 35.00. ¿Esta afirmación se sustenta si una
muestra de 50 libros de cocina tiene una
media de US$ 32.97 y una desviación
estándar de US$ 12.87?
43
Problema2: Un químico ha desarrollado un
material plástico que, según él, tiene una
resistencia media a la ruptura de 29 onzas por
pulgada cuadrada. Para comprobar la bondad
del método se tomaron 20 láminas de plástico
en mención hallándose que en cada una de
éstas la resistencia a la ruptura es,
respectivamente,
44
30.1 22.5 28.9 29.8 31.4
32.7 27.5 27.7 28.9 30.4
27.0 24.3 22.8 22.3 33.4
31.2 26.4 29.4 29.1 23.5
45
Prueba de hipótesis para la
varianza
Problema: Se reporta que la desviación
estándar de la resistencia al rompimiento de
ciertos cables producidos por una compañía
es 240 lb. Después de que se introdujo un
cambio en el proceso de producción de estos
cables, la resistencia al rompimiento de una
muestra de 8 cables mostró una desviación
estándar de 300 lb. Investigue la
significancia del aumento aparente en la
variación usando un nivel de significancia de
0.05
46
Pruebas de hipótesis para una
proporción poblacional
Problema. En cierta universidad se estima
que el 25% de los estudiantes van a
bicicleta a la universidad. ¿Esta parece ser
una estimación válida si, en una muestra
aleatoria de 90 estudiantes universitarios, se
encuentra que 28 van en bicicleta a la
universidad? Utilice un nivel de
significancia de 0.05
47
Pruebas de hipótesis para dos
varianzas poblacionales
Ejemplo1: Suponga que el director de capacitación de una
compañía manufacturera desea comparar dos enfoques de
trabajo en equipo. Cada miembro de un grupo de 16
empleados nuevos se asigna al azar a uno de los tres
métodos. Una vez terminada la capacitación de los
participantes, se evalúa el tiempo que tardan (en minutos) en
ensamblar el producto. Los resultados se resumen como
sigue:
48
A 8.82 9.26 8.7 8.97 8.64 8.29 9.45 9.42
a) ¿Existe homogeneidad de
varianzas? Analice los datos
considerando un nivel de
significación del 5%.
49
Pruebas de hipótesis para la
diferencia de medias (varianzas
desconocidas e iguales)
Ejemplo2: Clean All es un nuevo limpiador de
uso múltiple cuya demanda se prueba
exhibiéndolo en dos lugares diferentes dentro
de varios supermercados. A continuación se
muestra el número de botellas de 12 onzas
que se vendieron en cada ubicación.
Cerca de las 12 18 10 15
cervezas
Con otros 25 28 30 32
limpiadores
50
a) Analice los datos, formule las hipótesis adecuadas y
contrástelas considerando un nivel de significación del 5%.
b)Determine si es posible, ¿Cuál es el lugar dentro del
supermercado más efectivo para la venta del limpiador
Clean All?
51
Pruebas de hipótesis para la diferencia
de medias (varianzas desconocidas y
diferentes)
Ejemplo: Para investigar la influencia
de la especialización en el salario inicial
de los graduados en Ingeniería, se
entrevistó a dos grupos de estudiantes
recién graduados especializados en
ingeniería y en otras profesiones. Los
resultados fueron como sigue:
52
Ingeniería Otras Si se asume
profesiones poblaciones
normales, ¿se
70000 109000 puede
95000 97000 concluir que
100000 95000 el salario
110000 99000 promedio de
otras
85000 105000
profesiones es
75000 110000 mayor que en
70000 106000 ingeniería?
98000 Use = 0.05.
53