MES13
MES13
MES13
Bradley Efron
(1938-?)
1
Unidad IV: Pruebas No Paramétricas
Pruebas de Hipótesis (Parte III)
1. Introducción
2. Prueba de hipótesis para una muestra k relacionada
a. Prueba Q de Cochran
b. Prueba de Friedman
c. Prueba de Page
3. Prueba de hipótesis para k muestras independientes
a. Prueba de la Mediana
b. Prueba de Kruskal Wallis
c. Prueba de Jonckheere-Terpstra
d. Prueba de Levene
e. Prueba de Fligner-Killeen
f. Prueba de Cochran
2
Por otro lado, las pruebas estadísticas para k
muestras independientes se utilizan principalmente
para comparar si un parámetro de posición es
similar en todas las poblaciones o al menos uno es
diferente a los demás.
En el caso paramétrico se puede hacer uso de la
prueba F de k muestras independientes. Sin
embargo, en las pruebas no paramétricas hay
varias alternativas algunas mas poderosas que otras
y estas se eligen dependiendo del objetivo del
estudio.
◼ Aspectos Generales:
Es una extensión de la prueba de Mc Nemar.
Evalúa si tres o más grupos de datos difieren o no entre ellos.
El diseño es simple a n sujetos se les toma k medidas
dicotómicas o k medidas dicotómicas son medidas en una
muestra.
Estamos por lo tanto en un diseño idéntico al DBCA pero aquí
la variable respuesta es dicotómica.
◼ Supuestos:
✓ La muestra es seleccionada al azar.
✓ Las observaciones deben ser susceptibles de
transformación dicotómica.
3
◼ Hipótesis:
H0: 1= 2 =… = k
H1: Al menos un i es diferente a los demás i=1,2..,k
◼ Prueba Estadística:
k k
2
( k − 1) k G j − G j
2
j =1 j =1
Q= n n
~ (21− ,k −1)
k Li − Li 2
i =1 i =1
donde: Gj es la suma correspondiente al grupo j, Li es la
suma correspondiente al individuo i.
En R existe la función cochran.qtest del paquete
RVAideMemoire
7
◼ Ejemplo
Se desea verificar si 4 preguntas de una prueba de
rendimiento poseen o no el misma nivel dificultad. Para ello
se evalúan a 10 individuos anotando su desacierto (0) o
acierto (1). Realice la prueba respectiva use =0.05.
Sujeto Pregunta 1 Pregunta 2 Pregunta 3 Pregunta 4
1 1 1 1 1
2 1 0 0 0
3 1 0 1 0
4 1 1 1 0
5 0 0 1 0
6 0 1 1 0
7 1 0 1 1
8 0 0 1 0
9 1 1 1 0
10 0 1 1 0
4
◼ Ejemplo
H0: 1= 2 =3= 4
H1: Al menos un i es diferente a los demás i=1,2,3,4
◼ =0.05
◼ Pvalor = 0.019 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que las preguntas de dicha
evaluación no poseen igual nivel de dificultad.
◼ Aspectos Generales:
Esta prueba es apropiada siempre que los datos pueden
disponerse significativamente en una clasificación de dos
criterios, es decir es el equivalente no paramétrico de un
análisis de dos vías o Diseño de Bloques Completos al
Azar (DBCA).
◼ Supuestos:
✓ La muestra es seleccionada al azar.
✓ Los b bloques son mutuamente independientes, es
decir los resultados de un bloque no influyen en los
resultados de los otros bloques.
✓ La escala de medida es al menos ordinal.
10
5
◼ Procedimiento:
✓ Para cada uno de los b bloques, las k grupos son
ordenadas en un rango de 1 a k.
✓ Los rangos asignados a las observaciones en cada uno de
los k grupos se suman por separado para dar k sumas de
rangos.
✓ Aplicar el estadístico de la prueba que se basa en estos
rangos
◼ R:
En R se utiliza la función friedman.test(respuesta, tratamiento,
bloque). Esta función se puede complementar con la función
friedmanmc del paquete pgirmess
En el paquete agricolae se encuentra la función friedman que
permite realizar las pruebas de comparación.
friedman(bloque, tratamiento, respuesta)
11
◼ Hipótesis:
H0: Me1=Me2=…=Mek
H1: Al menos una Mei es diferente a las demás i=1,2,…,k
◼ Prueba Estadística:
1 k 2
A = R ( X ij ) Ri
k b
B=
2
i =1 j =1 b i =1
b 2 k ( k + 1)
2
( )
k − 1 bB −
4
T= ~ (21− ,k −1)
bk ( k + 1)
2
A−
4
donde: b es el número de bloques y k es el número de
grupos.
12
6
Si se rechaza H0 una inquietud es determinar cual o
cuales son los mejores tratamientos, para eso se debe
realizar la prueba de comparación.
◼ Hipótesis de Comparación:
H0: Mei=Mej i j i,j=1,2,…,k
H1: MeiMej
◼ Criterio de Decisión Estadística:
2b ( A − B )
Si Ri − R j t se rechaza H0
1− ,( b −1)( k −1)
2
( b − 1)( k − 1)
13
◼ Ejemplo
Se realizó un experimento para analizar el sabor de una
nueva marca de cola antes de que se lance al mercado. Las
marcas de colas en comparación fueron dadas a 5 jueces
especializados y se estableció una escala de valores de (1-5)
donde 1 es el de peor sabor y 5 el de mejor sabor
Los resultados del experimento se muestran a continuación:
Marcas de gaseosas colas
Jueces Cola 1 Cola 2 Cola 3 Nueva
Cola
1 5 2 3 2
2 4 1 3 4
3 5 2 2 3
4 5 1 3 2
5 5 2 3 3
Realice la prueba de Friedman de sus conclusiones a un nivel
de significación de 0.05.
14
7
◼ Ejemplo
H0: Me1=Me2=Me3=Me4
H1: Al menos una Mei es diferente a las demás i=1,2,3,4
◼ =0.05
◼ Pvalor = 0.008 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que el sabor es diferente en
al menos una de las marcas de sabor cola en estudio.
15
Cuadro resumen
a 1 19.5
b 4 12.5
b 3 12
c 2 6
16
8
◼ Aspectos Generales:
En ocasiones, un investigador puede desear mantener una
hipótesis alterna más específica en cuanto al orden de los
tratamientos o grupos. La prueba de Page para alternativas
ordenadas, evalúa la hipótesis de que la mediana en los
grupos son los mismos contra la hipótesis alterna de que los
grupos están ordenados en una secuencia específica.
◼ Supuestos:
✓ Los b bloques son mutuamente independientes, es decir los
resultados de un bloque no influyen en los resultados de los
otros bloques.
✓ La escala de medida es al menos ordinal, de modo que las
observaciones pueden ser ordenadas dentro de cada
bloque.
17
◼ Hipótesis:
H0: Me1=Me2=…=Mek
H1: Me1<Me2<…<Mek
k
◼ Prueba Estadística: L = iRi
i =1
Donde Ri es la suma de los rangos de los tratamientos.
Si la muestra es grande se puede usar la aproximación a la Normal.
L − L
Z=
L
bk ( k + 1) bk 2 ( k 2 − 1)
2
L =
2
si no hay empates
L2 =
4 144 ( k − 1)
k ( k 2 − 1) b
2
L2 =
12
S si hay empates y S Bj es la
j =1
2
Bj
18
9
◼ R
En R se cuenta con la función page.trend.test, del paquete
crank:
page.trend.test(matriz de datos,ranks=FALSE)
19
◼ Ejemplo
En años recientes se ha incrementado el interés por la capacidad de las personas de percibir
patrones táctiles. Se han desarrollado dispositivos que convierten caracteres impresos en
patrones táctiles, con el propósito, entre otros, de capacitar a las personas con deficiencias
visuales a “leer” textos de manera táctil. Uno de los dispositivos desarrollados, el Optacon,
contiene una rejilla de pequeños puntos, cada uno de los cuales puede vibrar
independientemente. Las letras del alfabeto producen distintos patrones de puntos que
vibran. En investigaciones que involucran la integración temporal de tales patrones táctiles,
Craig examinó la cantidad de integración entre los elementos individuales. En un estudio
subsecuente, el experimentador manipuló los estímulos de inicio asincrónico (EIA) por parte
de los patrones y el espaciamiento entre los renglones de puntos vibrantes, los cuales están
en contacto con la yema del dedo de los sujetos. La tarea era indicar si había espaciamiento
o no en los modelos presentados.
Se evaluaron cuatro sujetos entrenados durante un gran número de ensayos en los cuales el
estímulo variaba en la sincronía inicial y el espaciamiento entre los estímulos. A fin de
evaluar la precisión de los sujetos para detectar la presencia de un espacio, era necesario
determinar que tan exactos eran los sujetos al reportar la ausencia de un espacio entre los
sucesivos estímulos, sólo que también se varió el EIA. En cada sujeto se utilizaron seis
diferentes EIA. En la tabla siguiente se resume la proporción de respuestas correctas para
cada sujeto en cada condición. El principal interés del investigador era evaluar la hipótesis de
que la exactitud estaba inversamente relacionada con los EIA
20
10
Estímulos de inicio asincrónico (ms)
Sujeto 204 104 56 30 13 0
A 0.797 0.873 0.888 0.923 0.942 0.956
B 0.794 0.772 0.908 0.982 0.946 0.913
C 0.838 0.801 0.853 0.951 0.883 0.837
D 0.815 0.801 0.747 0.859 0.887 0.902
= 0.05
k
Prueba Estadística
L = iRi
i =1
Desarrollo de la Prueba
L=342
Z=3.07 > 1.96 se rechaza H0
Conclusión
A un nivel de significación de 0.05 se puede afirmar que la exactitud estaba inversamente
relacionada con los EIA
21
◼ Aspectos Generales:
Otra alternativa similar a la prueba de Kruskal Wallis es la
prueba de la Mediana. Por lo tanto, esta prueba puede
utilizarse para probar la hipótesis nula de que k muestras
independientes se han extraído de poblaciones con medianas
iguales.
◼ Supuestos:
✓ Las observaciones deben expresarse en al menos escala
de intervalo.
✓ Las muestras son aleatorias e independientes.
22
11
◼ Procedimiento:
✓ Calcular la mediana común de las k muestras (o grupos) es
decir de todo el conjunto de observaciones sin importar a
que grupo pertenezcan.
✓ Para cada grupo se determina en una fila el número de
observaciones que son menores o iguales a mediana
común y en otra columna aquellas observaciones que son
mayores a ella.
✓ Las frecuencias resultantes se disponen en una tabla 2 x k.
✓ Aplicar la prueba estadística.
23
◼ Hipótesis:
H0: Me1=Me2=…=Mek
H1: Al menos una Mei es diferente a las demás i=1,2,…,k
◼ Prueba Estadística:
2
c2 =
k
(o
ij − eij )
2
2k −1,1−
i =1 j =1 eij
24
12
◼ Ejemplo
Quince alumnos en un curso técnico son aleatoriamente
asignados a tres tipos diferentes de métodos de
instrucción, todos los cuales persiguen el desarrollo de
un nivel específico de habilidad en diseño asistido por
computadora. Las calificaciones de la prueba de
aprovechamiento al término de la unidad de instrucción
se reportan en la siguiente tabla:
Método A1 Método A2 Método A3
86 90 82
79 86 68
81 88 73
70 82 71
84 89 81
Verifique a un =0.05 si algún método es mejor a los
demás.
25
◼ Ejemplo
H0: Me1=Me2=Me3
H1: Al menos una Mei es diferente a las demás i=1,2,3
◼ =0.05
◼ Pvalor = 0.036 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que algún método es mejor a
los demás.
26
13
◼ Aspectos Generales:
Esta prueba sirve para probar la hipótesis nula de que varias
poblaciones tienen las mismas medianas. Es el equivalente no
paramétrico del Diseño Completamente al Azar de un factor.
Es decir esta prueba puede ser utilizada cuando no se
cumplen las suposiciones de que las poblaciones de las
cuales se extraen las muestras no están distribuidas
normalmente con varianzas iguales, o cuando los datos
constan solo de rangos.
.
◼ Supuestos:
✓ Las observaciones deben expresarse en al menos escala
de intervalo.
✓ Las muestras son aleatorias e independientes.
✓ Las k poblaciones tienen la misma forma.
27
◼ Procedimiento:
✓ Las n1, n2,…nk observaciones de los k grupos se combinan
en una sola serie de tamaño n y se disponen en orden de
magnitud desde la más pequeña hasta la más grande.
Cuando dos o más observaciones tienen el mismo valor, a
cada una de ellas se le asigna la media de los rangos con
los cuales está relacionado.
✓ Los rangos asignados a las observaciones en cada uno de
los k grupos se suman por separado para dar k sumas de
rangos.
✓ Aplicar la prueba estadística.
28
14
◼ Hipótesis:
H0: Me1=Me2=…=Mek
H1: Al menos una Mei es diferente a las demás i=1,2,…,k
◼ Prueba Estadística:
1 k ni 2 n ( n + 1)
ni
Ri = R ( X ij )
2
S2 = R ( X ij ) −
n − 1 i =1 j =1 4
j =1
1 k Ri2 n ( n + 1)
2
T = 2 − ~ (1− ,k −1)
2
S i =1 ni 4
29
15
◼ Ejemplo
Quince alumnos en un curso técnico son aleatoriamente
asignados a tres tipos diferentes de métodos de
instrucción, todos los cuales persiguen el desarrollo de
un nivel específico de habilidad en diseño asistido por
computadora. Las calificaciones de la prueba de
aprovechamiento al término de la unidad de instrucción
se reportan en la siguiente tabla:
Método A1 Método A2 Método A3
86 90 82
79 86 68
81 88 73
70 82 71
84 89 81
Verifique a un =0.05 si algún método es mejor a los
demás.
31
◼ Ejemplo
H0: Me1=Me2=Me3
H1: Al menos una Mei es diferente a las demás i=1,2,3
◼ =0.05
◼ Pvalor = 0.018 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que algún método es mejor a
los demás.
32
16
H0: Mei=Mej i j i,j=1,2,3
H1: MeiMej
Cuadro resumen
Groups, Treatments and mean of the ranks
a 2 12.4
b 1 7
b 3 4.6
33
◼ Aspectos Generales:
Prueba la hipótesis de que las muestras se encuentran
ordenados en una secuencia específica a priori.
A fin de asegurar el uso adecuado de la prueba, el
investigador debe ser capaz de especificar el orden de los
grupos. El orden debe ser especificado antes de recabar los
datos.
◼ Supuestos:
✓ Las observaciones deben expresarse en al menos escala
de intervalo.
✓ Las muestras son aleatorias e independientes.
✓ Las muestras provienen de una misma población.
34
17
◼ Procedimiento:
✓ Para cada una las k muestras (o tratamientos) de manera
independiente ordenar las observaciones de menor a mayor.
✓ Formar todos los diferentes pares de muestras.
✓ En cada par fijar una muestra, para cada una de las
observaciones de esta muestra contabilizar cuantas
observaciones de la otra muestra son superiores (o
inferiores). Repetir este proceso para cada uno de los pares.
✓ Calcular la suma de las contabilizaciones de cada par.
✓ Determinar el estadístico J que es la sumatoria de los
recuentos determinados en el paso anterior.
◼ R:
En R se utiliza la función jonckheere.test del paquete
clinfun
jonckheere.test(respuesta, grupo, alternativa)
35
◼ Hipótesis:
Unilateral izquierda Bilateral Unilateral derecha
H0: Me1 =Me2 =…= Mek H0: Me1 =Me2 =…= Mek H0: Me1 =Me2 =…= Mek
H1: Al menos un Mei es
H1: Me1 Me2 < …< Mek H1: Me1 Me2 …> MeK
diferente i=1,2,..,k
◼ Prueba Estadística:
Muestras
n pequeñas
U ij = # ( X hi , j )
i
Muestras Grandes
k k
n2 − n2j n 2 (2n + 3) − n 2j (2n j + 3) J − J
j =1 j =1 Z= ~N(0,1)
J = J2 = J
4 72
36
18
◼ Ejemplo
Se desea realizar un experimento para verificar si los juicios
de salinidad se incrementarían conforme se disminuye la
proporción de NaCl (cloruro de sodio) en los ensayos de
prueba. Los datos se presentan a continuación:
Porcentaje de NaCl puro
80 50 17 10
8.82 13.53 19.23 73.51
11.27 28.42 67.83 85.25
15.78 48.11 73.68 85.82
17.39 48.64 75.22 88.88
24.99 51.40 77.71 90.33
39.05 59.91 83.67 118.11
47.54 67.98 86.83
48.85 79.13 93.25
71.66 103.05
72.77
90.38
103.13
37
2 6 6 72.77
1 1 1 90.38
0 0 1 103.13
Uij 66 73 62 52 48 36
38
19
◼ Ejemplo
H 0 : Me1 = Me2 = Me3 = Me4
H1 : Me1 Me2 Me3 Me4
=0.05
◼ Pvalor = 0.0003 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que los juicios de salinidad
se incrementarían conforme se disminuye la proporción de
NaCl (cloruro de sodio) en los ensayos de prueba.
39
◼ Estadístico de prueba:
W= i =1
~ F(1− ,k −1,n −k )
( )
k ni
( k − 1) Zij − Z i•
2
Z ij = Yij − Y i•
donde puede ser la media, mediana o
media podada de la i-ésima muestra.
Z •• : Es la media global de Zij.
Z i• : Es la media de la i-ésima muestra.
◼ Pvalor=P(Fk-1,n-k>Fcal)
◼ En R se puede usar el paquete lawstat la función es
levene.test(datos,grupos) o el paquete car con la función es leveneTest,
LeveneTest del paquete DescTools.
40
20
◼ Supuestos: muestras al azar e independientes.
◼ Estadístico de prueba:
n (a )
k 2
i i −a
2 = i =1
~ (21− ,k −1)
(a )
n
( n − 1)
2
−a
Donde: j =1
n, j
1 an, j
i n an , j
an ,i = −1 + ai = a=
2 2 ( n + 1) jGi ni j =1 n
◼ Pvalor=P(2(k-1)>2cal)
41
S i =1
i
2
42
21
Una forma aproximada para calcular el pvalor haciendo
uso de la distribución F se puede obtener mediante la
siguiente expresión:
k
k − 1
pvalor = 1 − P Fni −1,( k −1)( ni −1)
1
− 1
H cal
43
44
22