INTRODUCCION
Los métodos estadísticos no paramétricos son útiles no solamente cuando los
datos representan una ordenación, como en los casos anteriores, sino también
cuando se tienen únicamente diferencias direccionales. Es decir una persona
puede indicar su preferencia entre un par de artículos de prueba pero puede no
poder indicar una medida de la magnitud de su preferencia.
La palabra no paramétrico está ligada con los tipos de hipótesis que se prueban
usualmente al tener este tipo de datos. Las hipótesis paramétricas son aquellas
que tienen que ver con los parámetros poblacionales. Por otra parte muchas veces
las hipótesis no paramétricas están relacionadas con la forma de la distribución de
frecuencia de la población. Las pruebas de hipótesis sobre el parámetro binominal
ρ , pruebas sobre µ o σ², y las pruebas de análisis de varianza son paramétricas.
Por otra parte, una hipótesis que establezca que una población tiene una
distribución normal (sin especificar los valores paramétricos) es no paramétrica.
En forma semejante, una hipótesis que establece que las distribuciones de dos
poblaciones son idénticas es también no paramétricas.
Los métodos no paramétricos son aplicables no solo en los casos en que las
mediciones son difíciles de cuantificar son particularmente útiles para hacer
inferencias en situaciones en las que se tienen serias dudas sobre la satisfacción
de las hipótesis que respaldan la metodología estándar. Por ejemplo, la prueba (ʈ)
para la comparación de un par de medias, está basada en la suposición de que las
dos poblaciones están normalmente distribuidas y tienen la misma varianza.
Generalmente, el investigador no sabe si estas suposiciones se satisfacen en
situaciones de tipo práctico, pero frecuentemente está razonablemente seguro de
que las desviaciones son lo suficientemente pequeñas para que los
procedimientos estadísticos no se vean alterados. Es decir, (ɑ) y (β) tendrán
aproximadamente los valores que el piensa que tienen. Por otra parte, es
frecuente que un experimentador tenga dudas acerca de las suposiciones y de la
validez del procedimiento estadístico. Esta dificultad se puede evitar usando
pruebas estadísticas no paramétricas, evitando así la dependencia de un conjunto
de suposiciones de las que no se tiene ninguna certeza.
OBJETIVOS
Probar hipótesis cuando no es posible hacer alguna suposición sobre la
distribución de la cual se muestrea.
Saber que pruebas sin distribución (tiene no paramétricas) son apropiadas
para diferentes situaciones
Usar e interpretar cada una de las 6 pruebas de hipótesis no paramétricas
estándar.
Conocer las ventajas y desventajas de la pruebas no paramétricas
CARACTERÍSTICAS DE LAS PRUEBAS NO
PARAMÉTRICAS
VENTAJAS DE LOS MÉTODOS NO PARAMÉTRICAS.
Los métodos no paramétricos tienen un número de ventajas claras sobre los
métodos paramétricos:
1.- no quieren que hagamos las suposiciones de que una población está
distribuida en forma de curva normal u otra forma específica.
2.- generalmente son más fáciles de efectuar y comprender, la mayoría de las
pruebas no paramétricas no demandan el tipo de laboriosos cálculos a menudo
requeridos por ejemplo:
Calcular una desviación estándar una prueba no paramétrica nos puede pedir
reemplazar valores numéricos con el orden en el que esos valores parecen en una
lista.
3.-algunas veces ni siquiera se requiere del ordenamiento o clasificación formal a
menudo lo único que podemos hacer es describir un resultado como mejor que
otro cuando este es el caso o cuando nuestras mediciones no son tan exactas
como es necesario para las pruebas paramétricas podemos usar métodos no
paramétricos.
DESVENTAJAS DE LOS MÉTODOS NO PARAMÉTRICOS
Dos desventajas acompañan el uso de pruebas no paramétricas:
1.- ignoran una cierta cantidad de información.
2.- a menudo no son tan eficientes o “agudas” como las pruebas paramétricas, la
estimación de un nivel intervalo al nivel de confianza de 95% usando una prueba
no paramétrica puede ser el doble de tamaño que la estimación al utilizar una
prueba paramétrica, efectuamos un trueque: perdemos agudeza al estimar
intervalos, pero ganamos la habilidad de usar menos información y calcular más
rápidamente.
PRUEBA DE SIGNOS PARA DATOS POR PARES
Una de las pruebas no paramétricas más fáciles de usar es la prueba de signo.
Su nombre proviene del hecho de que está basada en dirección(o signos que
presentan más o menos) de un per de observaciones y no en su magnitud
numérica.
La prueba de los signos también puede servir como alternativa no paramétrica a la
prueba t de muestra apareada o a la correspondiente prueba de muestra grande.
En tales problemas, cada par de valores muéstrales se remplaza por un signo de
mas si el primer valor es menor que el segundo, por un signo de menos si el
primer valor es menor que el segundo, o bien se descarta si los dos valores son
iguales.
Supóngase que se desea comparar la forma en que los consumidores califican (en
escala de 1 a 10) a dos limpiadores para ventanas. Para el efecto, se selecciona al
azar 6 amas de casa de un grupo de consumidoras ahora que cada una de ellas
califique una ventana tratada con el limpiador A y otra con el limpiador B. como
puede verse, se ha usado un experimento de diferencias.
Tabla; calificaciones de los consumidores para los limpiadores de ventanas
LIMPIADOR
AMA DE CASA A B
1 10 7
2 7 5
3 8 7
4 5 2
5 7 6
6 9 6
Apareadas (diseño aleatorizado en bloques) para efectuar la comparación. Los
limpiadores A y B son tratamientos. Los bloques corresponden a las amas de casa
y su objeto es eliminar la variabilidad entre amas de casa.
Los datos del experimento aparecen en la tabla anterior. Presentan los datos
suficientes evidentes que indique una diferencia en la preferencia de los
consumidores por los limpiadores?
Para contestar la pregunta, no se necesita efectuar una prueba estadística
complicada. De hecho, se necesita efectuar una prueba del signo, que es muy
fácil de aplicar. Es decir, es fácil notar que la calificación para el limpiador A
excede a la B en los seis casos (por lo que los signos de las diferencias son todos
positivos). Suponiendo que no existe diferencia entren los limpiadores, el resultado
es equivalente a lanzar una moneda balanceada seis veces y observar seis
caras(o cruces). La probabilidad de dicho evento, (½)6 + (½)6=1/32, es demasiada
pequeña. Por lo tanto, se rechazaría la hipótesis de que las distribuciones de las
calificaciones de los limpiadores son idénticas.
Para determinar si había evidencia que indicara una diferencia en el desgaste
promedio de dos tipos de llantas, en el experimento de diferentes apareadas. Se
utilizo la prueba no paramétrica anterior como un procedimiento alterno. Se
compararon las parejas de respuestas y (y) el número de veces que A accedió a
B) se uso como estadística de prueba. Esta prueba no paramétrica se denomina
prueba de signos porque y es el numero de signos positivos(o negativos)
asociados a las diferencias. La hipótesis nula es que las dos distribuciones
poblacionales son idénticas y el método es totalmente independiente de la forma
de la distribución de las diferencias. Cuando la hipótesis nula es verdadera,
independientemente de la distribución de las diferencias, la probabilidad de que A
excede B en una pareja de mediciones es ρ =.5.
ESTABLECIMIENTO DE LAS HIPÓTESIS
Estamos usando la prueba de signos para determinar si nuestro papel percibe una
diferencia real entre los dos tipos de clase. Puesto que estamos probando
diferencias percibidas, excluiremos las evaluaciones empatadas (0). Vemos que
hay 19 signos más y 11 signos menos, para un total de 30 respuestas utilizables.
Si no hay diferencia entre los dos tipos de clase, p (la probabilidad de que la
primera calificación exceda a la segunda) seria 0.5, y esperaríamos obtener
aproximadamente 15 signos más y 15 signos menos. Estableceríamos nuestra
hipótesis de la siguiente manera:
HO: P=0.5 hipótesis nula: no hay diferencia entre dos tipos de clase
H1: p≠0.5 hipótesis alternativa: hay diferencia entre los dos tipos de
clase.
Si observa con cuidado las hipótesis, notara que la situación es parecida al
lanzamiento de monedas que analizamos. Si lanzaremos al aire una moneda no
cargada 30 veces seria0.5, y esperaríamos aproximadamente 15 caras y 15
cruces. En ese caso, utilizaremos la distribución binomial como la distribución de
muestreo apropiada. Tal vez también recuerde que cuando np y nq son cada
una almenos5, podemos utilizar la distribución normal para aproximar a la
binomial. Este es precisamente el caso con los resultados de nuestro papel de
estudiante. Así, podemos aplicar la distribución normal a nuestra prueba de los
métodos de enseñanza.
pH =0.5
0 Proporción hipotética de la población que prefiere las conferencias para
todos
qH =0.5
0 Proporción hipotética de la población que piensa que prefiere secciones
pequeñas (qH0 = 1 –pH0)
n =30 tamaño de muestra
p = 0.633 proporción de éxitos en la muestra (19/30)
q =0.367 proporción de fracasos en la muestra (11/30)
Ejercicio
Los siguientes datos muestran los índices de trabajo defectuoso de los empleados
antes y después de un cambio en el plan de incentivos al salario. Compare los dos
conjuntos de datos siguientes para ver si el cambio disminuyo las unidades
defectuosas producidas. Utilice el nivel de significancia de 0.10.
Solución
Antes 8 7 6 9 7 10 8 6 5 8 10 8
Después 6 5 8 6 9 8 10 7 5 6 9 8
Signo - - + - + - + + 0 - - 0
12 respuestas: 4(+), 6(-), 2(0).
Para n =10, p =0.5, la probabilidad de 6 o más signos menos es 0.3770. Como
0.3770 >0.10, no se puede rechazar H0. El plan de incentivos al salario no baja
significativamente las tasas del trabajo defectuoso.
PRUEBA DE SIGNO PARA MUESTRAS GRANDES(N )
Hipótesis nula: Ho: p=.5 (no se prefiere el primer tratamiento sobre el segundo y
viceversa.
Hipótesis alternativa: Ho: p 5, para una prueba de dos colas. (nota: se usa la
prueba de dos colas como ejemplo muchos análisis requieren pruebas de una
cola).
Estadística de prueba:
Región de rechazo: rechace Ho si z za/2 en la cola superior de la distribución
normal.
EJEMPLO:
Una superintendente de producción afirma que no hay diferencia en las tasas de
accidentes entre los turnos diurnos y nocturnos de una gran planta manufacturera.
El nuero de accidentes por día se registro para los dos turnos durante n=100 días
se encontró que el número de accidentes por día del turno nocturno excede al
turno diurno en 63 de los 100 días.
Presenta estos resultados suficiente evidencia que indique una diferencia en la
tasa de accidentes entre los dos turnos?
SOLUCIÓN:
Se tiene un experimento de diferencias apareadas, con n=100 pares de
observaciones correspondientes a los 100 días para probar la hipótesis nula de
que las dos distribuciones de accidentes son idénticas, se usa la estadística de
prueba.
Donde y representa el numero de diferencias positivas en las tasas diarias de
accidentes. Para ɑ=.05, se rechazara la hipótesis nula si z 1.96 o z 1.96.
Sustituyendo en la fórmula para z, se tiene que.
Como el valor calculado de z excede a za/2=1.96 se rechaza la hipótesis nula los
datos proporcionan suficiente evidencia de que las distribuciones de la tasa de
accidentes son diferentes.
NOTA; la prueba del signo es usada más frecuentemente para observaciones que
han sido seleccionadas aleatoriamente por parejas usando un experimento de
diferencias apareadas.
PRUEBA “U” DE MANN WHITNEY
se utiliza para comparar dosmedianas de muestras independientes.
Equivalente no paramétrico de la pruebe t de muestras independientes.
Ejemplo:
Un psiquiatra desea determinar si hombres y mujeres difieren en cuanto a la edad
en que se adquiere cierto desorden emocional debido al stress, para lo cual toma
datos de 10 hombres y 10 mujeres.
Hombres R1 Mujeres R2
65 19 45 13
21 1 36 10
25 5 24 4
32 9 27 7
23 3 28 8
67 20 53 15
39 12 49 14
56 16 60 18
22 2 37 11
26 6 59 17
suma 93 117
1.- HIPÓTESIS
H0:Med1 = Med2
H1: Med1 ≠ Med2
2.- NIVEL DE SIGNIFICACIÓN: 10%
a-U = n1*n2 + n1(n1 +1) – suma R1
U= 10*10 +10(11) -93 = 62
b-U= a-U = n1*n2 + n2(n2 +1) – suma R2
U= 10*10 +10(11) -117 = 38
U0: Menor valor U0= 38
4.- Decisión
Tabla U
n1 = 10 y n2 = 10
U t= 23 No rechazar H0
U0 <Ut Rechazar H0
En nuestro análisis:
U0>Ut, por consiguiente, no rechazamos H0
5.- conclusión
No existe diferencia en las medianas de edades en que se adquiere cierto
desorden emocional.
Nota:
• Cuando n1 o n2 es mayor que 20 se debe aproximar a la curva normal.
• No es necesario que las dos muestras sean del mismo tamaño.
Para tamaños de muestra pequeños la distribución del estadístico U, bajo el
supuesto de que la hipótesis nula sea cierta, es discreta y está tabulada. Si los
tamaños son suficientemente grandes (n1, n2>20) la distribución del estadístico se
aproxima a una normal de parámetros: