PRUEBA DE HIPOTESIS Teoria

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 17

PRUEBA DE HIPOTESIS

En la actualidad, muchos problemas de ingeniería, ciencia, y administración, requieren que se tome una
decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe el nombre
de hipótesis.

Este es uno de los aspectos más útiles de la inferencia estadística, puesto que muchos tipos de problemas de
toma de decisiones, pruebas o experimentos en el mundo, pueden formularse como problemas de prueba de
hipótesis.

Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más poblaciones.

La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de poblaciones que al
inicio se supone cierta (es decir, la "creencia a priori").

La hipótesis alternativa, representada por H1, es la afirmación contradictoria a Ho, y ésta es la hipótesis del
investigador.( Datos que brinda la muestra)

La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia muestral sugiere que H o es
falsa. Si la muestra no contradice decididamente a Ho, se continúa creyendo en la validez de la hipótesis nula.
Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son rechazar Ho o no rechazar
H o.

El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es verdadera. También es
conocido como ó nivel de significancía.

El error tipo II ó error se define como la aceptación de la hipótesis nula cuando ésta es falsa.

Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes que determinan si la
decisión final es correcta o errónea.

Decisión Ho es verdadera Ho es falsa

Aceptar Ho Decisión correcta Error tipo II ó

Rechazar Ho Error tipo I ó Decisión correcta


.

PASOS PARA ESTABLECER UN ENSAYO DE HIPOTESIS

INDEPENDIENTEMENTE DE LA DISTRIBUCION QUE SE ESTE TRATANDO

1. Interpretar correctamente hacia que distribución muestral se ajustan los datos del enunciado.
2. Interpretar correctamente los datos del enunciado diferenciando los parámetros de los estadísticos. Así
mismo se debe determinar en este punto información implícita como el tipo de muestreo y si la
población es finita o infinita.
3. Establecer simultáneamente el ensayo de hipótesis y el planteamiento gráfico del problema. El ensayo
de hipótesis está en función de parámetros ya que se quiere evaluar el universo de donde proviene la
muestra. En este punto se determina el tipo de ensayo (unilateral o bilateral).
4. Establecer la regla de decisión. Esta se puede establecer en función del valor crítico, el cual se obtiene
dependiendo del valor de (Error tipo I o nivel de significancía) o en función del estadístico límite de
la distribución muestral. Cada una de las hipótesis deberá ser argumentada correctamente para tomar la
decisión, la cual estará en función de la hipótesis nula u Ho.
5. Calcular el estadístico real, y situarlo para tomar la decisión.
6. Justificar la toma de decisión y concluir.
Tipos de Ensayo

Se pueden presentar tres tipos de ensayo de hipótesis que son:

 Unilateral Derecho
 Unilateral Izquierdo
 Bilateral

Dependiendo de la evaluación que se quiera hacer se seleccionará el tipo de ensayo.

 Unilateral Derecho. El investigador desea comprobar la hipótesis de un aumento en el parámetro, en


este caso el nivel de significancía se carga todo hacia el lado derecho, para definir las regiones de
aceptación y de rechazo.

Ensayo de hipótesis:

Ho; Parámetro x

H1; Parámetro x

 Unilateral Izquierdo: El investigador desea comprobar la hipótesis de una disminución en el


parámetro, en este caso el nivel de significancía se carga todo hacia el lado izquierdo, para definir las
regiones de aceptación y de rechazo.

Ensayo de hipótesis:

Ho; Parámetro x

H1; Parámetro x

 Bilateral: El investigador desea comprobar la hipótesis de un cambio en el parámetro. El nivel de


significancía se divide en dos y existen dos regiones de rechazo.

Ensayo de hipótesis:

Ho; Parámetro x

H1; Parámetro x
Ejemplos:

1. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado
muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de
8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor que 70 años? Utilice
un nivel de significancía de 0.05.

Solución:

1. Se trata de una distribución muestral de medias con desviación estándar conocida.


2. Datos:

=70 años

= 8.9 años

= 71.8 años

n = 100

= 0.05

3. Ensayo de hipótesis

H o; = 70 años.

H1; > 70 años.

4. Regla de decisión:

Si zR 1.645 no se rechaza Ho.

Si zR> 1.645 se rechaza Ho.

5. Cálculos:

6. Justificación y decisión.

Como 2.02 >1.645 se rechaza Ho y se concluye con un nivel de significancía del 0.05 que la
vida media hoy en día es mayor que 70 años.

2. Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma
aproximadamente normal con una media de 800 horas y una desviación estándar de 40
horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas,
¿muestran los datos suficiente evidencia para decir que la duración media ha cambiado?
Utilice un nivel de significancía del 0.04.
Solución:

1. Se trata de una distribución muestral de medias con desviación estándar conocida.


2. Datos:

=800 horas

= 40 horas

= 788 horas

n = 30

= 0.04

3. Ensayo de hipótesis

Ho; = 800 horas

H1; 800 horas

4. Regla de Decisión:

Si –2.052 ZR 2.052 No se rechaza Ho

Si ZR < -2.052 ó si ZR > 2.052 Se rechaza Ho

5. Cálculos:

6. Justificación y decisión:

Como –2.052 -1.643 2.052 por lo tanto, no se rechaza Ho y se concluye con un nivel de
significancia del 0.04 que la duración media de los focos no ha cambiado.

Solución por el otro método:

785.02 y 814.98

Regla de decisión:
Si 785.02 814.98 No se rechaza Ho

Si < 785.02 ó > 814.98 se rechaza Ho

Como la = 788 horas, entonces no se rechaza Ho y se concluye que la duración media de los
focos no ha cambiado.

3. Una muestra aleatoria de 64 bolsas de palomitas de maíz pesan, en pomedio 5.23 onzas
con una desviación estándar de 0.24 onzas. Pruebe la hipótesis de que = 5.5 onzas
contra al hipótesis alternativa,

< 5.5 onzas en el nivel de significamcia de 0.05.

Solución:

1. Se trata de una distribución muestral de medias con desviación estándar desconocida, pero
como el tamaño de muestra es mayor a 30 se puede tomar la desviación muestral como un
estimador puntual para la poblacional.
2. Datos:

= 5.5 onzas

s= 0.24 onzas

= 5.23 onzas

n = 64

= 0.05

3. Ensayo de hipótesis

Ho; = 5.5 onzas

H1; < 5.5 onzas

4. Regla de decisión:

Si ZR -1.645 No se rechaza Ho

Si ZR < -1.645 Se rechaza Ho

5. Cálculos:

6. Justificación y decisión:

Como –9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel de significancia del
0.05 que las bolsas de palomitas pesan en promedio menos de 5.5 onzas.

Solución por el otro método:


Regla de decisión:

Si 5.45 No se Rechaza Ho

Si < 5.45 Se rechaza Ho

Como la = 5.23 y este valor es menor que 5.45 pot lo tanto se rechaza Ho.

4. Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que se
construyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta afirmación
si una investigación de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas
bombas de calor? Utilice un nivel de significancia de 0.10.

Solución:

1. Se trata de una distribución muestral de proporciones.


2. Datos:

P= 0.70

p = 8/15 = 0.5333

n = 15

= 0.10

3. Ensayo de hipótesis

Ho; P = 0.70

H1; P 0.70

4. Regla de Decisión:

Si –1.645 ZR 1.645 No se rechaza Ho

Si ZR < -1.645 ó si ZR > 1.645 Se rechaza Ho

5. Cálculos:
6. Justificación y decisión:

Como –1.645 -1.41 1.645 No se rechaza Ho y se concluye con un nivel de significancia


de 0.10 que la afirmación del constructor es cierta.

Solución por el otro método:

= 0.505 y 0.894

Regla de decisión:

Si 0.505 pR 0.894 No se rechaza Ho

Si pR < 0.505 ó si ZR > 0.894 Se rechaza Ho

Como el valor del estadístico real es de 0.533 por lo tanto no se rechaza Ho y se llega a la misma
conclusión.

3. Un fabricante de semiconductores produce controladores que se emplean en aplicaciones


de motores automovilísticos. El cliente requiere que la fracción de controladores defectuosos
en uno de los pasos de manufactura críticos no sea mayor que 0.05, y que el fabricante
demuestre esta característica del proceso de fabricación con este nivel de calidad, utilizando

= 0.05. El fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y


encuentra que cuatro de ellos son defectuosos. ¿El fabricante puede demostrar al cliente la calidad
del proceso?

Solución:

1. Se trata de una distribución muestral de proporciones.


2. Datos:

P= 0.05

p = 4/200 = 0.02

n = 200

= 0.05

3. Ensayo de hipótesis

Ho; P = 0.05

H1; P < 0.05


4. Regla de decisión:

Si ZR -1.645 No se rechaza Ho

Si ZR < -1.645 Se rechaza Ho

5. Cálculos:

6. Justificación y decisión:

Puesto que –1.946<-1.645, se rechaza Ho y se concluye con un nivel de significancia del


0.05 que la fracción de artículos defectuosos es menor que 0.05.

6. Un diseñador de productos está interesado en reducir el tiempo de secado de una pintura


tapaporos. Se prueban dos fórmulas de pintura; la fórmula 1 tiene el contenido químico
estándar, y la fórmula 2 tiene un nuevo ingrediente secante que debe reducir el tiempo de
secado. De la experiencia se sabe que la desviación estándar del tiempo de secado es ocho
minutos, y esta variabilidad inherente no debe verse afectada por la adición del nuevo
ingrediente. Se pintan diez especímenes con la fórmula 1, y otros diez con la fórmula 2. Los
dos tiempos promedio de secado muestrales son 121 min y 112 min respectivamente. ¿A
qué conclusiones puede llegar el diseñador del producto sobre la eficacia del nuevo
ingrediente, utilizando

= 0.05?

Solución:

1. Se trata de una distribución muestral de diferencia de medias con desviación estándar


conocida.
2. Datos:

1 = =8
2

n1=n2= 10

= 0.05

3. Ensayo de hipótesis

Ho; -
1 2 =0

H1; 1- 2 > 0 Se desea rechazar Ho si el nuevo ingrediente disminuye el tiempo promedio


de secado, por eso se pone la diferencia mayor a cero o sea positiva para poder probar que
2 es menor que 1.
4. Regla de decisión:

Si zR 1.645 no se rechaza Ho.

Si zR> 1.645 se rechaza Ho.

5. Cálculos:

6. Justificación y decisión:

Puesto que 2.52>1.645, se rechaza Ho, y se concluye con un nivel de significancia de 0.05
que la adición del nuevo ingrediente a la pintura si disminuye de manera significativa el
tiempo promedio de secado

Solución por el otro método:

Regla de decisión:

Si 5.88 No se rechaza Ho

Si > 5.88 Se rechaza Ho

Puesto que = 121-112 = 9 y este número es mayor a 5.88 por lo tanto se rechaza
Ho.

8. Existen dos tipos de plástico apropiados para su uso por un fabricante de componentes
electrónicos. La tensión de ruptura de ese plástico es un parámetro importante . Se sabe
que 1= 2= 1.0 psi. De una muestra aleatoria de tamaño 10 y 12 para cada plástico
respectivamente, se tiene una media de 162.5 para el plástico 1 y de 155 para el plástico 2.
La compañía no adoptará el plástico 1 a menos que la tensión de ruptura de éste exceda a
la del plástico 2 al menos por 10 psi. Con base a la información contenida en la muestra, ¿la
compañía deberá utilizar el plástico 1? Utilice

= 0.05 para llegar a una decisión.

Solución:
1. Se trata de una distribución muestral de diferencia de medias con desviación estándar
conocida.
2. Datos:

1 = = 1.0 psi
2

n1= 10

n2= 12

= 0.05

3. Ensayo de hipótesis

Ho; 1- 2 = 10

H1; 1- 2 > 10 Se desea rechazar Ho si la media del plástico 1 supera a la media del
plástico 2 en por lo menos 10 psi.

4. Regla de decisión:

Si zR 1.645 no se rechaza Ho.

Si zR> 1.645 se rechaza Ho.

5. Cálculos:

6. Justificación y decisión:

No existe evidencia suficiente para apoyar el uso del plástico 1 ya que


–5.83 1.645, por lo tanto no se rechaza Ho.

Solución por el otro método:


Regla de decisión:

Si 10.70 No se rechaza Ho

Si > 10.70 Se rechaza Ho

Puesto que = 162.5-155 = 7.5 y este número es no es mayor a 10.7 por lo tanto no se
rechaza Ho.

8. Se evalúan dos tipos diferentes de soluciones para pulir, para su posible uso en una
operación de pulido en la fabricación de lentes intraoculares utilizados en el ojo humano
después de una cirugía de cataratas. Se pulen 300 lentes con la primera solución y, de
éstos, 253 no presentaron defectos inducidos por el pulido. Después se pulen otros 300
lentes con la segunda solución, de los cuales 196 resultan satisfactorios. ¿Existe alguna
razón para creer que las dos soluciones para pulir son diferentes? Utilice

= 0.01

Solución:

1. Se trata de una distribución muestral de diferencia de proporciones.


2. Datos:

p1= 253/300= 0.8433

p2 = 196/300= 0.6533

n1=n2 = 300

3. Ensayo de hipótesis:

Ho; P1-P2 = 0

H1; P1-P2 0

4. Regla de Decisión:

Si –2.575 ZR 2.575 No se rechaza Ho

Si ZR < -2.575 ó si ZR > 2.575 Se rechaza Ho

5. Cálculos:
En esta fórmula se puede observar que en el denominador se tienen a las proporciones
poblacionales o sea los parámetros, los cuales no se conocen, por lo que en el ensayo de
hipótesis la fórmula para poder calcular la ZR cambia, estimando a el parámetro común P de
la siguiente forma:

ó bien

Entonces la fórmula de ZR quedaría de la siguiente manera:

Se calculará el valor de P:

6. Justificación y decisión:

Puesto que 5.36>2.575, se rechaza la hipótesis nula y se concluye con un nivel de


significancia de 0.01 que los dos fluidos para pulir son diferentes.

10. Se tomará el voto entre los residentes de una ciudad y el condado circundante para
determinar si se debe construir una planta química propuesta. El lugar de construcción está
dentro de los límites de la ciudad y por esta razón muchos votantes del condado consideran
que la propuesta pasará debido a la gran proporción de votantes que favorecen la
construcción. Para determinar si hay una diferencia significativa en la proporción de votantes
de la ciudad y votantes del condado que favorecen la propuesta, se realiza una encuesta. Si
120 de 200 votantes de la ciudad favorecen la propuesta y 240 de 500 residentes del
condado también lo hacen, ¿estaría de acuerdo en que la proporción de votantes de la
ciudad que favorecen la propuesta es más alto que la proporción de votantes del condado?
Utilice un nivel de significancia de 0.025.

Solución:

1. Se trata de una distribución muestral de diferencia de proporciones.


2. Datos:

p1= 120/200= 0.60

p2 = 240/500= 0.48

n1 = 200

n2 = 500

3. Ensayo de hipótesis:
Ho; P1-P2 = 0

H1; P1-P2 > 0

4. Regla de decisión:

Si zR 1.96 no se rechaza Ho.

Si zR> 1.96 se rechaza Ho.

5. Cálculos:

Se calculará el valor de P:

6. Justificación y decisión:

Puesto que 2.9>1.96, se rechaza la hipótesis nula y se concluye con un nivel de significancia
de 0.025 que la proporción de votantes de la ciudad a favor de la propuesta es más alta que
la proporción de votantes del condado.

Uso de valores P para la toma de decisiones

Al probar hipótesis en las que la estadística de prueba es discreta, la región crítica se puede elegir de forma
arbitraria y determinar su tamaño. Si es demasiado grande, se puede reducir al hacer un ajuste en
el valor crítico. Puede ser necesario aumentar el tamaño de la muestra para compensar la
disminución que ocurre de manera automática en la potencia de la prueba (probabilidad de
rechazar Ho dado que una alternativa específica es verdadera).

Por generaciones enteras de análisis estadístico, se ha hecho costumbre elegir un nivel de


significancia de 0.05 ó 0.01 y seleccionar la región crítica en consecuencia. Entonces, por
supuesto, el rechazo o no rechazo estricto de Ho dependerá de esa región crítica. En la estadística
aplicada los usuarios han adoptado de forma extensa la aproximación del valor P. La aproximación
se diseña para dar al usuario una alternativa a la simple conclusión de "rechazo" o "no rechazo".

La aproximación del valor P como ayuda en la toma de decisiones es bastante natural pues casi
todos los paquetes de computadora que proporcionan el cálculo de prueba de hipótesis entregan
valores de P junto con valores de la estadística de la prueba apropiada.

 Un valor P es el nivel (de significancia) más bajo en el que el valor observado de la


estadística de prueba es significativo.
 El valor P es el nivel de significancia más pequeño que conduce al rechazo de la hipótesis
nula Ho.
 El valor P es el mínimo nivel de significancia en el cual Ho sería rechazada cuando se utiliza
un procedimiento de prueba especificado con un conjunto dado de información. Una vez que
el valor de P se haya determinado, la conclusión en cualquier nivel particular resulta de
comparar el valor P con

1. Valor P  rechazar Ho al nivel .
2. Valor P >  No rechazar Ho al nivel

Ensayo Unilateral Derecho:

Ensayo Unilateral Izquierdo:

Ensayo Bilateral:

Ejemplos:

1. Calcular el valor de P para el primer ejemplo de ensayo de hipótesis en donde se quería


probar que la edad media de los habitantes de Estados Unidos es superior a 70 años.

Solución:

1. Ensayo de hipótesis

Ho; = 70 años.

H1; > 70 años.


2. Regla de decisión:

Si P 0.05 se rechaza Ho.

Si P > 0.05 No se rechaza Ho.

3. Cálculos:

Esta es el valor de Z que se utilizará para calcular el valor de P, como es un ensayo


unilateral derecho se calculará el área a la derecha de este valor.

4. Justificación y decisión:

Como el valor de P es 0.217 y es menor al valor del nivel de significancia de 0.05 por lo
tanto se rechaza H0, y se concluye que la edad media de los habitantes es mayor a 70 años.

1. Calcular el valor de P para el ejemplo 7 de esta sección en donde se tiene dos máquinas y
se quiere ver si tienen la misma cantidad promedio de llenado en las botellas de plástico.

Solución:

1. Ensayo de hipótesis

Ho; -
1 2 =0

H1; 1- 2 0 Si se cae en Ho se podrá probar que el volumen de llenado es el mismo en


las dos máquinas.

2. Regla de Decisión:
Si P 0.05 Se rechaza Ho

Si P > 0.05 No se rechaza Ho

3. Cálculos:

Como este es un ensayo bilateral se procederá a calcular el valor de P mediante el valor de la Z R,


positiva y negativa y luego se sumarán las áreas.

Como el valor de P es mayor al de , se no se rechaza H0, y se concluye que las maquinas tienen
el mismo llenado promedio.

1. Se afirma que un automóvil se maneja en promedio más de 20,000 kilómetros por año. Para
probar esta afirmación, se pide a una muestra de 100 propietarios de automóviles que lleven
un registro de los kilómetros que viajen. ¿Está de acuerdo con esta afirmación si la muestra
aleatoria tiene un promedio de 23,500 kilómetros y una desviación estándar de 3900
kilómetros? Utilice un valor P para su conclusión.

Solución:

En este ejercicio no nos manejan ningún valor de por lo que se procederá a plantear el ensayo
y luego calcular z para poder conocer el valor de P y llegar a una conclusión.

1. Ensayo de hipótesis

H o; = 20,000 kilómetros.

H1; > 20,000 kilómetros.

2. Cálculos:

3. Decisión.

Se observa que este valor de Z es muy grande, ni siquiera se encuentra en la tabla,


entonces quiere decir que el área a la derecha de ese valor es cero y este sería el valor de
P, por lo que no apoya a la hipótesis nula y se concluye que los automóviles se manejan en
promedio más de 20,000 kilómetros por año.

4. Se estudia la fracción de circuitos integrados defectuosos producidos en un proceso de


fotolitografía. Para ello se somete a prueba una muestra de 300 circuitos, en la que 13 son
defectuosos. Utilice los datos para probar
Ho: P=0.05 contra H1: P

0.05. Utilice un valor de P para su conclusión.


Solución:

1. Ensayo de hipótesis

Ho; P = 0.05

H1; P 0.05

2. Cálculos:

3. Decisión:

Este valor de P de 0.596 es muy grande por lo que se concluye que la fracción defectuosa
de circuitos integrados es de 0.05, o sea no se rechaza Ho.

También podría gustarte