Prueba de Hipótesis 2020 Completo Con Paramétricas

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 46

Pruebas de Hipótesis

Introducción-1ra Parte
PRUEBA DE HIPÓTESIS

 Se trata de un procedimiento estadístico que permite establecer, con cierto


grado de probabilidad, si una hipótesis científica es consistente con la información
muestral obtenida.
 Se relaciona con los conceptos de potencia de una prueba y de errores tipo I y II, que
se relacionan con la posibilidad de tomar un suceso falso como verdadero o uno
verdadero como falso.
 La ciencia no puede existir sin una verificación objetiva de las hipótesis y a menudo
esto es imposible sin la estadística inferencial. En el corazón de una metodología
científica se encuentra el experimento, y éste está diseñado para comprobar una
hipótesis.
 La esencia de una prueba de hipótesis es comprobar si alguna relación entre
variables existe. A partir de los hechos, y los cálculos estadísticos dela prueba se
puede determinar si se acepta o rechaza a hipótesis. Se usan dos hipótesis, una
determinada y una alternativa, y se intenta dirimir cuál de las dos es la verdadera.
¿Qué es una hipótesis?
 Es una expresión tentativa o proposición (conjetura, suposición) en modo
afirmativo acerca de la relación general o específica entre dos o más
variables.
 Toda hipótesis debe expresar la relación entre variables.
 Son inferencias que permiten probar las relaciones establecidas.
 Por ejemplo: “Un mayor gasto en publicidad incrementa los votos en un partido
político”.
 Ambas son variables, que pueden ser cuantificadas.
 Por lo tanto, es posible hacer inferencias estadísticas que pueden ser probadas.

 Es una afirmación respecto a una característica de la población.


¿Qué se entiende por la
comprobación de hipótesis?
 Comprobar o contrastar una hipótesis es comparar las predicciones que se deducen
de ella con la realidad que observamos.
 Estas predicciones pueden referirse a la forma de la población: ¿Es normal? , etc. o
bien a los parámetros de la población conocida su forma (su media, su proporción,
etc.)
 Hipótesis estadística es una suposición acerca de los parámetros de una población
conocida su forma.
 Hipótesis estadística es una suposición sobre la forma de la población
 Cuando se rechaza una hipótesis significa que la vamos a sustituir por otra que
explique los datos observados.
 Cuando hemos formulado una hipótesis importante necesitamos recolectar los datos
empíricos, que son los que nos darán la información necesaria para juzgar la
aceptación o rechazo de una hipótesis.
Hipótesis Estadística
 La terminología clásica hablaba de Prueba de hipótesis o Test de
significación.
 Se debe formular una hipótesis de lo que sucede en una población.
 Esta hipótesis de investigación es la que se deriva de una teoría.
 Esta hipótesis de investigación se denomina Hi o Ha y se formula como
una proposición operacional.
 El procedimiento de verificación de la hipótesis debe estar basado en
nuestra información y el riesgo que queremos correr de que nuestra
decisión respecto de la hipótesis sea correcta. Incluye: 1) Especificar la
población o poblaciones de interés; 2) definir la variable y cómo la
medimos; 3) Relacionar la variable con los parámetros de las poblaciones.
Pasos en la Prueba de Hipótesis

 1) Formular la Ho y la Hipótesis alterna (Ho, Ha, o Hi).


 2) Selección de las muestras de forma aleatoria.
 3) Recolección de los datos.
 4) Elegir la prueba estadística con su correspondiente modelo muestral
para rechazarla o no la Ho.
 5) Determinar el nivel de significación alfa( ), los tipos de errores y el
tamaño de la muestra, la curva operatoria característica y la curva de
potencia.
 Hallar la distribución muestral de la prueba estadística para la Ho.
 Definir la zona de rechazo.
 Calcular le valor del estadístico usando los datos de la muestra.
 Decisión.
HIPÓTESIS NULA /
HIPÓTESIS ALTERNATIVA
En todo experimento compiten dos hipótesis para explicar los
resultados: La Hipótesis alternativa y la Hipótesis nula
• Hipótesis alternativa (Ha): Generalmente es la hipótesis de investigación.
• Es un enunciado sobre la población.
• Es la formulación operacional de la Hipótesis de Investigación
• Lo típico es considerar como Ho a aquella que es más precisa. Ha es la que está definida con menos exactitud.
• Cuando Ha pronostica una dirección en sentido favorable o desfavorable, el contraste es unidireccional. Por ejemplo: “El nuevo método de
enseñanza es sustancialmente mejor que el método tradicional”
• Hipótesis nula (Ho):
• Es una hipótesis que expresa lo contrario de la hipótesis alternativa.
• Su rechazo da como resultado la aceptación de la hipótesis alternativa, de modo que ambas forman parte de la prueba.
• Es la que mantendremos a menos que los datos nos digan lo contrario, y nos digan que la Ho es Falsa.
• Se considera aquella que es más precisa. Por ejemplo: que un tratamiento no produzca mejoras, que sean iguales sus medias, =0, por lo tanto
más precisa. Corresponde a la negación de los efectos que estamos estudiando. Es la negación de la primera, y se denomina Nula. Se llama nula
a la que es aceptada provisionalmente como verdadera y la que se somete a comprobación experimental
• No debe entenderse como neutra. Nunca se considera probada aunque sea rechazada por los datos. Porque nunca estudiamos toda la población,
y por ahí haya un dato que no la confirme. Por eso se dice no que se acepta, sino que no se rechaza.
• Es un hipótesis simple que permite hacer predicciones sin ambigüedad.
• La Ho formula que dos parámetros poblacionales o más son iguales.
PRUEBA BIDIRECCIONAL /
PRUEBA UNIDIRECCIONAL

El tipo de hipótesis de investigación determina la formulación de H1.Una Hipótesis


alternativa puede tomar una de las siguientes formas:
Cuando Ha no marca una dirección en sentido favorable o desfavorable, el
contraste de hipótesis es bidireccional. Simplemente dice: “Existen diferencia…“
Por ejemplo: No existen diferencias en los sujetos tratados con el método A
o el Método B. Ha= “Existen diferencias en los sujetos tratados con el Método A
o el B”
µa≠µb ≠ 0; µa-µb ≠ 0
Ho=“No existen diferencias en los sujetos tratados con el método
A o el Método B.
Ho= “Existen diferencias en la curación de los sujetos tratados
con el Método A o el B”.
Ho=µa=µb=0; µa-µb=0
Cuando Ha marca una dirección favorable o desfavorable, la prueba es
unidireccional. Mejor, peor, mayor, menor, etc. (> o <). Por ejemplo: Ha:µa>µb o
µa<µb;
Metodología de contraste de
hipótesis
 Cuando la Ho y la Ha se han formulado y se ha elegido la prueba estadística apropiada,
el paso siguiente consiste en especificar el nivel de significación α. Se llama valor p o “p
valor” es el que indica la probabilidad de que rechacemos la Ho siendo ésta cierta.
 Antes de recolectar los datos establecemos la distribución muestral, es decir todas las
muestras posibles que podemos hallar si Ho es cierta. De estas seleccionamos un grupo,
que aún siendo posibles, su probabilidad de ocurrencia (esta probabilidad se llama Nivel
de significación, y se usa, 0.01 o 0.05) es muy pequeña. Si en esta investigación nuestra
muestra se encuentra en este grupo entonces Rechazamos Ho.
 Esa zona se llama Zona de rechazo de Ho.
 Si se rechaza Ho entonces Ha es cierta. Este es nuestro objetivo. Cuando no podemos
rechazar no decimos que Ho sea cierta simplemente que las evidencias no nos permiten
rechazar Ho.
NIVEL DE SIGNIFICACIÓN Y
ZONA DE RECHAZO DE Ho

 Nivel de significación ( ): A partir del conocimiento de la distribución


probabilística de todos los resultados que podemos hallar cuan-do Ho es
cierta, se selecciona un grupo de esos resultados que obligaría a rechazar
Ho.
 Zona de rechazo de Ho: El nivel de significación se asocia con la zona de
rechazo de Ho. Para determinar esta zona hay que tener en cuenta la
formulación de Ha.
DECISIÓN
 Siempre juzgamos un experimento mediante la observación de Ho, porque
podemos calcular la probabilidad delos eventos aleatorios, pero no hay
posibilidad de calcularlos en la Ha.
 Si el resultado de la prueba se ubica en la zona de rechazo de Ho, se acepta
de manera indirecta Ha; en tal caso se dice que el resultado es significativo o
confiable. En caso contrario, Ho se mantiene como única explicación razonable.
Errores Tipo I y II
 Error tipo I es el riesgo de error que se comete al rechazar la Ho cuando
en realidad es cierta o verdadera. Se denomina alfa o nivel de significación.
 Error Tipo II consiste en No rechazar la Ho cuando en realidad es falsa.
Se relaciona con Beta.
 Alfa y Beta tienen una relación inversa, cuando se aumenta uno, disminuye
el otro, y si se quiere disminuir ambos se debe aumentar n, o tamaño de la
muestra.
Decisión Ho Ho Falsa
verdadera

Aceptamos Ho Decisión Error Tipo II


correcta
Rechazamos Ho Error Tipo I
TIPOS DE PRUEBAS
ESTADÍSTICAS

Pruebas paramétricas Pruebas no paramétricas


 Se apoyan en supuestos Parten de supuestos débiles y sus
fuertes y en variables que requisitos de medición permiten
deben medirse por lo menos en trabajar con escalas nominales u
una escala de intervalos. ordinales.
 
Tipo de Pruebas
Pruebas Paramétricas
Pruebas No Paramétricas
2ª Parte
¿

¿Qué elijo? ¿Una prueba paramétrica o


No paramétrica?

Se encuentran por lo menos la variable medida a un nivel de


intervalos y presentan supuestos fuertes, como por ejemplo: las
muestras deben ser aleatorias e independientes (la selección de
un caso no influye en la selección de otro), generalmente
igualdad de varianzas y poblaciones distribuidas normalmente?


Elige una prueba paramétrica
PRUEBAS PARAMÉTRICAS
PRUEBA DE DIFERENCIA ENTRE MEDIAS
Hay varios modelos de esta prueba. Consideraremos sólo tres.
 a) Diferencia de dos medias con muestras independientes con 1 y 2
conocidas
• b) Diferencia de dos medias con muestras grandes e independientes, 1 y 2
supuestamente desconocidas y desiguales.
• c) Diferencia de dos medias con muestras pequeñas e independientes, 1 y 2
supuestamente desconocidas e iguales.
Prueba de la diferencia entre dos medias 1 - 2 con
observaciones independientes y  1 y  2 conocidas e
iguales

 Si es posible conocer las varianzas poblacionales y las muestras


son grandes, aleatorias e independientes, poblaciones de las que
se extraen las muestras son normales,y suponemos igualdad de
varianzas. Se utiliza como estadístico de prueba la Prueba Z.
 También se puede usar Z si las muestras son pequeñas pero se
conoce el sigma poblacional.
 Es muy raro que se pueda conocer
Distribución muestral de la diferencia
entre dos medias
 Teorema del Límite Central: Si de poblaciones normales se extraen muestras
independientes al azar de tamaños n1 y n2 respectivamente, la distribución muestral de
la diferencia entre las dos medias será normal, con
 X= 1-2;
D ² = (1² / n1)+ (2² / n2)

 Independientemente de las formas de distribución de las poblaciones de las que fueron


extraídas las muestras, a medida que n1 y n2 aumentan, la distribución muestral de la
DX diferencia de medias se aproxima cada vez más a la normalidad (Ley de los grandes
Números)
Fórmula Z

X 1  X 2  ( 1   2 )
Z
1  2
2 2
 Tiene distribución Normal
n1 n2 (µ,  12  2 2 )

n1 n2
Nivel de significación: α=0.05
Aplicación de la Prueba: se calcula Z
Zona crítica: Se establece el valor crítico de Z y
de allí se observa nuestro valor Z obtenido.
Si el resultado obtenido es igual o mayor que el
valor crítico se rechaza la Ho

Tipo de Prueba α=0.05 α=0.01

Bidireccional Z=±1,96 Z=±2,58


Unidireccional Z=±1,65 Z=±2,33
Prueba de la diferencia entre dos medias 1 - 2 con muestras grandes con
observaciones independientes y  1 y  2 supuestamente desconocidas y
desiguales

Supuestos de la prueba
 Ho: 1-2=0
 Poblaciones normales (o de cualquier tipo si n1 y n2 son grandes).
 1 y 2 supuestamente desconocidas y desiguales.
 Muestras con n1 y n2 observaciones independientes.
 Nivel de medición: escala de intervalos o de razones.
EJEMPLO

Hipótesis de investigación
“Los estudiantes de ingeniería tienen diferente
capacidad para el razonamiento matemático que los
estudiantes de filosofía”.
Datos

Muestra 1 (Ing.) Muestra 2 (Fil.)


n = 79 n = 79
= 40 = 38
s= 5 s = 5
X X

Ho: 1=2
Distribución muestral de la diferencia
entre dos medias

 Como se trata de muestras grandes y se desconoce 1 y 2, s1 y s2 pueden


considerarse estimaciones aproximadas de los correspondientes parámetros.
 La distribución muestral de medias es aproximadamente normal, y la semejanza es
mejor a medida que n1 y n2 aumentan de tamaño.
 En este caso en la fórmula aparecen s1 y s2 como estimaciones de 1 y 2
DX
ESTADÍSTICO DE LA PRUEBA

X 1  X 2  ( 1   2 )
Z ´
2 2
S1 S 2

n1 n2
Valores críticos de z

Prueba Bidireccional
=0,05 z = 1,96 y -1,96
=0,01 z = 2,58 y -2,58

Prueba Unidireccional
=0,05 z = 1,65 o -1,65
=0,01 z = 2,33 o -2,33
Cálculo de la Prueba

40  38  ( 1   2 )
Z ´obs   2,53
25 25

79 79

zobs= 2,53
Nivel de significación
Zona de rechazo de Ho
Ha bidireccional
= 0,05
DECISIÓN

Para =0,05 y prueba bidireccional, el resultado


obtenido ( z= 2,53) está ubicado en la zona de
rechazo de la hipótesis nula (Ho).Se concluye
que las diferencias entre las medias no se
deben al azar; las evidencias refuerzan la
hipótesis alternativa (Ha).
Prueba de diferencia entre dos medias de muestras
pequeñas con observaciones independientes, 1 y2
desconocidas pero iguales
Supuestos de la prueba
 Ho: 1-2=0
 Poblaciones normales, con 1 y 2 supuestamente desconocidas pero
iguales.
 Muestras con observaciones independientes entre sí.
 Nivel de medición: escala de intervalos o de razones.
EJEMPLO

Un investigador realiza un estudio en dos


muestras aleatorias independientes de
operarios de la fábrica “X”, una de la
Sección “1” y otra de la Sección “2”.
Formulación de la hipótesis
de investigación

Los empleados de la Sección “1” tienen


mejor memoria visual que los empleados
de la Sección “2”.
Datos

Sección “1” Sección “2”


n = 26 n = 28
=33 =31
X X
s = 4 s = 4

Ho: A = B
Elección de la prueba de significación

Prueba t
La distribución muestral de esta prueba se
aproxima a la distribución t de Student para
gl= n1+n2-2.
Estadístico de la prueba

(n1  1)s1  (n 2 1)s 2


2 2
n1  n2
S DX  DX
DX

n1n2
n1  n2  2
Zona de rechazo de Ho

=0,01
Ha unidireccional; gl= 52
Cálculos. Decisión

(25 x4 )  (27x4 ) 2
54 2

X SD =
52 (26 x28)

t obs = ( 33-31) / 1,09 = 1,83


gl = 26 + 28 -2 = 52
 Prueba unidireccional, t crítico=2,40
 Decisión: No se rechaza Ho. El investigador no encontró evidencias
que refuercen su hipótesis inicial.
Análisis de varianza simple para determinar la
significación de la diferencia entre varias medias

 Hipótesis de investigación
El rendimiento académico de los estudiantes es diferente según sean las condiciones
ambientales de las aulas donde se desarrollan las actividades prácticas.
Datos
Puntajes en una prueba de rendimiento académico
Aula 1 Aula 2 Aula 3
25 21 19
24 19 18
26 23 21
25 21 18
100 84 76

Ho: 1 = 2=3
Estadístico de la prueba

Estadístico de la prueba

F = s²E / s²I

Expresa la relación entre las dos estimaciones de la varianza poblacional:


1) Varianza entre los grupos (s²E)
2) Varianza dentro de los grupos (s²I).
Supuestos y distribución muestral de la
prueba

Supuestos
 Poblaciones normales.
 Varianzas poblacionales iguales.
 Muestras aleatorias independientes.
 Nivel de medición: Una escala nominal y una escala de intervalos.

Distribución muestral:
Hay una curva diferente para cada combinación posible de los grados de libertad
correspondientes a las dos varianzas estimadas. Varianza entre los grupos: gl= k –1
(donde k es el número de columnas). Varianza dentro de los grupos: gl= n –k (donde n es
el total de casos).
Zona de rechazo de Ho para gl =2(entre grupos) y
gl = 9 (intragrupos)
Nivel de significación: = 0,05
Decisión y conclusión
Si F obtenido es igual o mayor que F crítico para
= 0,05 y grados de libertad igual a 2 (entre grupos)
y 9 (dentro de los grupos), se rechaza Ho y se refuer-za la afirmación inicial.

Si F obtenido es menor que F crítico, no se rechaza Ho y se concluye que los tres
grupos son muestras aleatorias extraídas de la misma población.

También podría gustarte