No Parametrica

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 25

ESTADISTICA NO PARAMÉTRICA

Prueba U Mann Whitney-Kruskal Wallis


PRUEBA U DE MANN WHITNEY

La prueba U de Mann Whitney es una similar No Paramétrica


de la prueba “t” empleada para comparar la media de dos
poblaciones independientes y fue creada por Henry Mann y D.
Whitney y Wilcoxon .

Recordemos que la prueba “t” para muestras independientes se


puede usar cuando los datos son cuantitativos o están medidos
al menos en escala intervalar y esta normalmente distribuida.
Si no cumple lo dicho anteriormente, la prueba U de Mann
Whitney es una opción aceptable para analizar los datos.
PRUEBA U DE MANN WHITNEY

Suposiciones:
* Los datos medidos al menos en escala ordinal,
* Los grupos son independientes

* La muestra es seleccionada aleatoriamente

Nota:
Esta prueba también es conocida con el nombre de “suma de
rangos de Wilcoxon” debido a que Wilcoxon fue uno de los
creadores de esta prueba para tamaños iguales.
PRUEBA U DE MANN WHITNEY

Procedimiento:

 Plantear las hipótesis correspondientes

 Asignar rangos a los datos como si los valores en ambas


muestras pertenecieran todos a un sólo grupo. En caso de
empate se asigna el promedio de los rangos que ocupan las
observaciones.

 Hallar la suma de rangos Ri. para cada muestra.

 La prueba estadística se basa en: UC = mín ( U1 , U2 )

 Para prueba de una cola, utilice U2.


PRUEBAS U MANN WHITNEY MUESTRAS INDEPENDIENTES
UNILATERAL UNILATERAL
PASOS BILATERAL
IZQUIERDA DERECHA

H0: Me1 ≥ Me2 H0: Me1 = Me2 H0: Me1 ≤ Me2


1. Hipótesis
H1: Me1 < Me2 H1: Me1 ≠ Me2 H1: Me1 > Me2
2. Nivel de
significación
 puede ser 0.01, 0.05, 0.10, etc 
n1 ( n1  1)
U 1  R1 
2
3.
Estadístico U C  U1 n ( n2  1)
U 2  R2  2 UC  U2
2
de Prueba
U C  min(U 1 , U 2 )

4. Valor UTT =
U =U ;Un2; α
Un1n1;n2;α U
UTT==UU
n1;U n2; α
crítico UT = Un2,n1;α n1;n2;α

5. Decisión
Rechazar Ho, si: Rechazar Ho, si: Rechazar Ho, si:
U1 <= UT UC <= UT U2 <= UT
Problema 1

La Compañía Constructora “San Jhose” estudia las resistencias a


la rotura de dos marcas de cable de acero. Dos muestras
aleatorias independientes de los cables A y B revelaron las
siguientes resistencias a las roturas en libras:
Cable A: 85 88 62 73 77 84 76 70 75 80
Cable B: 67 68 64 66 74 78 65 70 72 73 65 70
Al nivel de significación del 1%, pruebe la hipótesis de que la
mediana de la resistencia del cable A es mayor que la mediana del
cable B.
Solución 1: Método de los 5 pasos
1.- Planteamiento de hipótesis

H0: Me1 ≤ Me2 (La resistencia del cable A es menor o igual que el cable B)

H1: Me1 > Me2 (La resistencia del cable A es mayor que el cable B)
2.- α = 0.05

3.- Estadística prueba 4.- Valor critico

U2 = 22.5 (ver diapositiva siguiente) UT = U(10,12,0.01) = 25

5.- Decisión:

Como U2 = 22.5 ≤ UT = 25, se rechaza Ho y se acepta la H1. Es decir; a un nivel de


significancia de 0.01 la resistencia del cable A es mayor que el cable B
CÁLCULO DEL ESTADISTICO DE PRUEBA , U2
1.- Ordenando, considerando el 2.- Hallando U1 y U2 que viene a
grupo y luego rankeando ser la suma de los rangos en sus
Valor Grupo Rango grupos respectivos
62 1 1
64 2 2
65 2 3.5 R1 R2
65 2 3.5 1 2
66 2 5 9 3.5
67 2 6 12.5 3.5
68 2 7
15 5
70 1 9
70 2 9 16 6
70 2 9 17 7
72 2 11 19 9
73 1 12.5 20 9
73 2 12.5
21 11
74 2 14
75 1 15
22 12.5
76 1 16 14
77 1 17 18
78 2 18 R1=152.5 R2=100.5
80 1 19
84 1 20
85 1 21
U1 = 97.5
88 1 22 U2= 22.5
Solución 2: Método de los 3 pasos

Nivel de significación = 0.05

Mann-Whitney Test and CI: CABLE_A, CABLE_B N Median


CABLE_A 10 76.50
CABLE_B 12 69.00
Point estimate for ETA1-ETA2 is 8.00
99.1 Percent CI for ETA1-ETA2 is (-1.00,16.00)
W = 152.5
Test of ETA1 = ETA2 vs ETA1 > ETA2 is significant at 0.0073
The test is significant at 0.0073 (adjusted for ties)
Como p-valor = 0.0073 < α=0.01, se rechaza Ho y se acepta H1.
Es decir; a un nivel de significancia de 0.01 la resistencia del cable A es
mayor que el cable B
Problema 2

Una fábrica de cerámicas quiere comparar el tiempo necesario para


que se enfríen las piezas de arcilla después de haber sido
“horneadas”. Los alfareros cuecen ocho piezas con el método 1 y en
forma independiente otras ocho piezas con el método 2. Se sabe que
el número de minutos necesarios para que enfríen las piezas no
tienen distribución normal. Los datos obtenidos se indican a
continuación:

Si utilizamos un nivel de significancia del 5% ¿Podemos concluir


que el tiempo promedio requerido para que enfríen las piezas de
arcilla son lo mismos?
Solución 1. Método de los 5 pasos
1.- Planteamiento de hipótesis
H0: Me1 = Me2 (El tiempo requerido para que enfríen las arcillas son
iguales con ambos métodos)
H1: Me1 ≠ Me2 (El tiempo requerido para que enfríen las arcillas son
diferentes con ambos métodos)
2.- α = 0.05

3.- Estadística Prueba 4.- Valor critico

U2 = 30 (ver diapositiva siguiente) UT =U(8,8,0,05)= 13


5.- Decisión:

Como UC=30 > UT=13, No Rechazamos Ho. Es decir, a un nivel


de significancia del 5%, el tiempo requerido para que enfríen las
arcillas son iguales con ambos métodos.
CALCULO DEL ESTADISTICO DE PRUEBA U2
1.- Ordenando con sus grupos
respectivo y rankeando
Solución 2: Método de los 3 pasos
H0: Me1 = Me2 (El tiempo requerido para que enfríen las arcillas son
iguales con ambos métodos)
H1: Me1 ≠ Me2 (El tiempo requerido para que enfríen las arcillas son
diferentes con ambos métodos)
Nivel de significación: 0.05
Mann-Whitney Test and CI: Met_1, Met_2 N Median
Met_1 8 38.00
Met_2 8 35.50
Point estimate for ETA1-ETA2 is 0.50
95.9 Percent CI for ETA1-ETA2 is (-7.00,9.00) W = 70.0
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.8748

The test is significant at 0.8743 (adjusted for ties)


Como p-valor = 0.8743 > 0.05, NTHo. Es decir Es decir, a un nivel de significación
del 5%, el tiempo requerido para que enfríen las arcillas son iguales con ambos
métodos.
PRUEBA DE KRUSKAL WALLIS

Es una prueba alternativa al Análisis de Varianza (Anova). La


prueba de Kruskal Wallis fue creada en el año 1952 por William
Kruskal y W. Allen Wallis. Se usa para determinar si k ≥ 3
muestras provienen de la misma población o de diferentes.
Suposiciones
* Los datos medidos al menos en escala ordinal,
* Los grupos son independientes
* La muestra es seleccionada aleatoriamente
PRUEBA DE KRUSKAL WALLIS
Procedimiento:
 Plantear las hipótesis correspondientes

 Asignar un rango Rij a cada valor como si se tratara de una


sola muestra de n observaciones. En caso de empate asignar
el promedio de los rangos.

 Hallar la suma de rangos Ri. Para cada muestra.

 Calcular:
12 k
Ri2.
H  
n(n  1) i 1 ni
 3(n  1)
1.- Planteamiento de hipótesis
Ho : Me1 = Me2 = ........= Mek H1 : al menos Mei ≠ Mej

2.- Fijar nivel de significancia: α = 0.01, 0.5, etc

3.- Estadística de Prueba 5.- Decisión:

12 k
Ri2.
H 
n(n  1) i 1 ni
 3(n  1)

4.- Valor critico


Rechazar Ho, si:
 T2   k21,1  C2   k21;1
COMPARACIONES MÚLTIPLES: PROCEDIMIENTO DE DUNN
 Calcular el rango promedio para cada grupo
 Calcular las diferencias en valor absoluto
 Calcular el alcance crítico:
n(n  1)  1 1 
Alcance crítico  Z 
12  ni n j 


1
k ( k 1)

n : viene a ser el número total de observaciones de todos los grupos


combinados
ni y nj son el número de observaciones de los grupos a compararse
Z valor en tabla normal

 Si la diferencia en valor absoluto de los rangos promedios es


superior al alcance crítico se rechaza Ho.
Problema 3:
Un ingeniero en control calidad de una compañía fabricante de equipos
electrónicos de audio se encuentra inspeccionando un nuevo tipo de
batería que tal vez pueda utilizar. Un lote de 20 baterías fue dividido
aleatoriamente en cuatro grupos (de modo que había 5 baterías en cada
uno). Cada grupo de baterías fue sometido a un nivel particular de
presión: baja, normal, alta y muy alta. Las baterías se probaron
simultáneamente bajo estos niveles de presión y se registraron los tiempo
de falla (en horas).
Baja Normal Alta Muy alta
8 7.6 6 5.1
8.1 8.2 6.3 5.6
9.2 9.8 7.1 5.9
9.4 10.9 7.7 6.7
11.7 12.3 8.9 7.8
El ingeniero de control de calidad, por experiencia, sabe que tales datos
provienen de poblaciones que no están distribuidas de manera normal, y
desea utilizar un procedimiento libre de distribución para el análisis de
datos.

Al nivel de significación de 0.05, analice los datos para determinar si


existe evidencia de una diferencia en los cuatro niveles de presión
respecto a la mediana de las vida de las baterías.
1.- ordenando y rankeando 2.- Hallando el estadístico de prueba
Datos
Grupo Rango
ordenados
4 5.1 1 ni Baja Normal Alta Muy alta
4 5.6 2 1 11 8 4 1
4 5.9 3 2 12 13 5 2
3 6 4 3 15 17 7 3
3 6.3 5 4 16 18 9 6
4 6.7 6 5 19 20 14 10
3 7.1 7 Ri 73 76 39 22
2 7.6 8 ni 5 5 5 5
4

3 7.7 9 i
2
R / ni 1065.8 1155.2 304.2 96.8 
i1
R i2 / n i  2 6 2 2
4 7.8 10
1 8 11
1 8.1 12
2 8.2 13
3 8.9 14
1 9.2 15
1 9.4 16
2 9.8 17
2 10.9 18
1 11.7 19
2 12.3 20
Solución 1. Método de los 5 pasos
1.- Planteamiento de hipótesis
Ho : Los tiempos de falla en baterías es igual en los cuatro grupos.

H1 : Existe al menos una tiempo de falla en baterías que es diferente


a los demás.

2.- α = 0.05

3.- Estadística de Prueba 4.- Valor critico


 C2  11 .91 T2   32;0.95  7.815
5.- Decisión:

como  calc
2
 11 .91   tabla
2
 7.815,
Se rechaza la hipótesis nula. Es decir, existe al
menos un tiempo de falla en baterías que es
diferente a los demás. Por lo cual, pasamos a
comparaciones múltiples.
Solución 2. Método de los 3 pasos
Ho : Los tiempos de falla en baterías es igual en los cuatro grupos.

H1 : Existe al menos una tiempo de falla en baterías que es diferente


a los demás.
Nivel de significación: 0.05

Kruskal-Wallis Test: Presión versus Grupo


Kruskal-Wallis Test on Presión

Grupo N Median Ave Rank Z


1 5 9.200 14.6 1.79
2 5 9.800 15.2 2.05
3 5 7.100 7.8 -1.18
4 5 5.900 4.4 -2.66
Overall 20 10.5
H = 11.91 DF = 3 P = 0.008
Como p-valor =0.008 < α = 0.05; se Rechaza la Ho y se acepta la H1. Es
decir, existe al menos un tiempo de falla en baterías que es diferente a los demás.
Por lo cual, pasamos a comparaciones múltiples.
COMPARACIONES MÚLTIPLES

Primero, hallamos el alcance crítico, con la fórmula siguiente:

n( n  1)  
 1  1   9.88
Alcance crítico  Z
1

12 n nj 
k ( k 1)  i 
Segundo, hallamos las diferencias y realizamos las comparaciones
Pregunta de auto-evaluación

Se realiza la prueba de Kruskal Wallis y el resultado de la prueba fue


significativa, luego debo usar __________________________ para saber
cuál es mejor o peor

Los investigadores de mercado no están seguros que se cumple las


condiciones de normalidad y homocedasticidad en su análisis de datos,
luego ellos podrían usar la estadística
_______________________________
Los investigadores de mercado quieren comparar en que tienda sus
trabajadores están más satisfechos con sus jefes, realizaron el estudio y los
datos se presentan como rangos, luego ellos podrían usar la estadística
___________________________________
Pregunta auto-examen

El banco Presta quiere estudiar el ingreso familiar semanal de dos


ciudades A y B. Una muestra aleatoria de A y otra de B han dado los
siguientes ingresos semanales en dólares:

Ciudad A: 150 154 143 160 95 70 83 97 135

Ciudad B: 200 140 190 193 205 122 62 95 123 180

Al nivel de significación del 5%, pruebe la hipótesis de que el ingreso


semanal en la ciudad A es menor que en la ciudad B.

También podría gustarte