Correlaciones 1
Correlaciones 1
Correlaciones 1
INTEGRANTES
TACNA – PERÚ
2020
INTRODUCCION
En el siguiente trabajo trata sobre las Correlaciones: Tau-b-Kendall, Pearson, Spearm. Donde se dará a
El coeficiente de correlación de Pearson se utiliza para estudiar la relación (o correlación) entre dos
variables aleatorias cuantitativas (escala mínima de intervalo); por ejemplo, la relación entre el peso y la
altura.
El coeficiente de correlación de Spearman (Rho) es una prueba no paramétrica que mide la asociación o
interdependiente entre dos variables discretas medidas, al menos de una ellas, en escala ordinal.
Este coeficiente de correlación es una medida no paramétrica de asociación para variables ordinales y
muestras pequeñas, el signo del coeficiente indica la dirección de la relación, los valores posibles van de
-1 a 1, de tal modo que los mayores valores absolutos indican relaciones más fuertes (Genest y
Nelešhová, 2009).
COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON
adecuadamente.
Características
p. 3)
entre dos variables aleatorias cuantitativas (escala mínima de intervalo); por ejemplo, la
En otras palabras, se trata de un índice que mide el grado de covariación entre distintas
3
• Debemos tener clara la diferencia entre relación, correlación o covariación entre dos
Si el coeficiente es mayor que 0, la correlación es positiva (“A más, más, y a menos menos). En
cambio, si es menor que 0 (negativo), la correlación es negativa (“A más, menos, y a menos, más).
Finalmente, si el coeficiente es igual a 0, sólo podemos afirmar que no hay relación lineal entre las
Consideraciones
variables), y disminuye en el caso contrario. Por otro lado, para afirmar si un valor es alto o
bajo, debemos comparar nuestros datos con otras investigaciones con las mismas variables y en
circunstancias parecidas.
Para representar las relaciones de diferentes variables que combinan linealmente, podemos utilizar
con unos (la correlación de una variable consigo misma es perfecta, =1).
4
Coeficiente elevado al cuadrado
1. Varianza asociada
2. Diferencias individuales
de las diferencias individuales en Y que están asociadas / dependen de / son explicadas por
proporción del error cuadrático medio eliminado usando Y’ (la recta de regresión,
elaborada a partir de los resultados) en vez de la media de Y como pronóstico. En este caso
5
Por lo tanto, "1-coeficiente Pearson al cuadrado" = error que se sigue cometiendo al usar
Cuando mayor sea el valor del coeficiente (más cercano a 1), más se aproximarán los
puntos a Y’ (a la recta).
puntos donde representamos los pares de valores de X e Y para cada uno de los sujetos y los
6
b) Relación lineal negativa.
Estatura e Inteligencia
7
Tabla 1
Escala de correlación
Valor Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta
Destaquemos que este tipo de relación, bien positiva o negativa en que los puntos forman una línea
perfecta son situaciones que no se dan nunca en relaciones reales entre variables psicológicas; sólo
Ejemplo ilustrativo:
Con los datos sobre las temperaturas en dos días diferentes en una ciudad, determinar el tipo de
8
X 18 17 15 16 14 12 9 15 16 14 16 18 SX =180
Y 13 15 14 13 9 10 8 13 12 13 10 8 SY= 138
Solución:
9
Se aplica la fórmula:
siguiente fórmula:
Donde
n = número de datos.
f = frecuencia de celda.
fx = frecuencia de la variable X.
fy = frecuencia de la variable Y.
Ejemplo ilustrativo:
Con los siguientes datos sobre los Coeficientes Intelectuales (X) y de las calificaciones en una
N° de estudiante X Y N° de estudiante X Y
10
1 76 28 26 88 40
2 77 24 27 88 31
3 78 18 28 88 35
4 79 41 29 88 26
5 79 43 30 89 30
6 80 45 31 89 24
7 80 34 32 90 18
8 81 18 33 90 11
9 82 40 34 90 15
10 82 35 35 91 38
11 83 30 36 92 34
12 83 21 37 92 31
13 83 22 38 93 33
14 83 23 39 93 35
15 84 25 40 93 24
16 84 11 41 94 40
17 84 15 42 96 35
18 85 31 43 97 36
19 85 35 44 98 40
20 86 26 45 99 33
21 86 30 46 100 51
22 86 24 47 101 54
23 86 16 48 101 55
24 87 20 49 102 41
25 88 36 50 102 45
Solución:
llama frecuencia de celda. Todos los totales indicados en la última fila y en la última
separadas de la variable X y Y.
11
Para elaborar la tabla se recomienda:
En la variable X:
En la variable Y:
12
Nota: Para la variable X se tomará un ancho de intervalo igual a 5 y para la variable Y un
ancho de intervalo igual a 8 para obtener un número de intervalos igual a 6 para cada
variable.
Contando las frecuencias de celda para cada par de intervalos de las variables X y Y se
Interpretación:
conocimiento.
13
- El número 50 es total de frecuencias marginales y representa al número total de
estudiantes.
Nota:
el producto f·dx·dy, así por ejemplo, para obtener el número el número -8 de los intervalos
Los números de la última columna (24, -2, 7, 0, 5 y 12) se obtienen sumando los números
de las esquinas en cada fila, así, por ejemplo, para obtener el número 24 se suma 6 + 18 =
24.
14
Los números de la última fila (0, 5, 0, 2, 12 y 27) se obtienen sumando los números de las
esquinas en cada columna, así, por ejemplo, para obtener el número 27 se suma 18 + 6 + 3
= 27.
Para obtener último número de la última fila se obtiene sumando los resultados de la última
fila (46=0+5+0+2+12+27), y tiene que ser igual al último número de la última columna
Observando los datos en la tabla anterior se reemplaza los valores en la ecuación del
15
COEFICIENTE DE CORRELACIÓN DE SPEARMAN
Según Tomás-Sábado, (2009), “el coeficiente de correlación de Spearman (Rho) es una prueba
no paramétrica que mide la asociación o interdependiente entre dos variables discretas medidas, al
Según (Fernan, A. M., 1996 citado por Pedroza & Dicovskyi, (2007), el coeficiente de
correlación de Spearman, es una variante del coeficiente de correlación de Pearson (R), esta
variante consiste en que, en lugar de medir el grado de asociación lineal a partir de los propios
calores de las variables, se mide a partir de la asignación de rango de valores ordenados. En ese
las variables en escala ordinal (variables de Likert). Por lo demás, sus valores se interpretan
exactamente igual al del coeficiente de Pearson(R), con valores que oscilan entre -1 y +1. Los
valores próximos a 1 indican una correlación fuerte y positiva, mientras que los valores próximos
a -1 indica una correlación fuerte y negativa. Los valores próximos a 0 indican que no hay
correlación lineal.
Según Rial Boubeta & Varela Mallou,(2014), plantea una lista de las situaciones en las que su
uso es interesante
2. Cuando trabaja con variables cuantitativas (intervalo o razón), pero que no siguen una
distribución normal.
16
4. Cuando no se asume necesariamente una relación lineal entre las variables estudiadas.
Tabla 2
Interpretación del coeficiente de correlación de Spearman
Valor de Rho Significado
-1 Correlación negativa grande y perfecta
-0.9 a -0.99 Correlación negativa muy alta
-0.7 a -0.89 Correlación negativa alta
-0.4 a -0.69 Correlación negativa moderada
-0.2 a -0.39 Correlación negativa muy baja
-0.01 a -0.19 Correlación negativa baja
0 Correlación nula
0.01 a 0.19 Correlación positiva muy baja
0.2 a 0.39 Correlación positiva baja
0.4 a 0.69 Correlación positiva moderada
0.7 a 0.89 Correlación positiva alta
0.9 a 0.99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta
Nota: elaborado por: Martínez Rebollar, A., & Campos Francisco, W.. (2015). Correlación entre
Actividades de Interacción Social Registradas con Nuevas Tecnologías y el grado de Aislamiento Social en
los Adultos Mayores. Revista mexicana de ingeniería biomédica, 36(3), 181-
191. https://doi.org/10.17488/RMIB.36.3.4
17
¿Como realizar un análisis de correlación con el programa SPSS?
Según Bernal Morell, (2014) nos explica los pasos para realizar una correlación con el
programa SPSS.
✓ Primero: tenemos que definir en la hoja de recogida de daos las variables cuantitativas
continuas.
es <0.05, se rechaza la H0 (H0= no hay correlación) y podemos decir que existe una
18
TAU-B DE KENDALL
Es una medida no paramétrica de asociación para variables ordinales o de rangos que tiene en
consideración los empates. El signo del coeficiente indica la dirección de la relación y su valor
absoluto indica la magnitud de la misma, de tal modo que los mayores valores absolutos indican
relaciones más fuertes. Los valores posibles van de -1 a 1, pero un valor de -1 o +1 sólo se puede
ordinales y muestras pequeñas, el signo del coeficiente indica la dirección de la relación, los
valores posibles van de -1 a 1, de tal modo que los mayores valores absolutos indican relaciones
más fuertes (Genest y Nelešhová, 2009). Como el índice de correlación de Spearman y el Tau-b
asumiendo que los pares aleatorios bajo considera-ción tienen márgenes uniformes en la unidad
del intervalo.
Tau-a
La prueba estadística Tau indica la fuerza de asociación de las tabulaciones cruzadas. Ambas
variables tienen que ser ordinales. Tau-a no hará ningún ajuste ante empates.
La estadística Tau-b, a diferencia de Tau-a, hace ajustes ante empates. Los valores de Tau-b varían
19
El coeficiente Kendall Tau-b se define como:
Cuando se estudia la relación entre variables cualitativas de tipo ordinal se debe utiliza el
coeficiente de correlación de rangos de Kendall (1938), denominado (tau) de Kendall, del cual
existen dos variantes tau-b y tau-c; además su aplicación tiene sentido si las variables objeto de
estudio no poseen una distribución poblacional conjunta normal; es decir, si se requiere determinar
el grado de asociación lineal entre dos variables cuantitativas pero las mismas no siguen un
comportamiento normal, será preferible estimar este indicador mediante el coeficiente de Kendall.
Como este indicador está basado en rangos y no en los datos originales, su estimación requiere que
los valores de la variable ordinal sean transformados en rangos, este coeficiente se ve poco afectado
adaptándose bien en aquellas variables que reportan moderadas asimetrías en torno a la relación
general.
20
Una característica notable del coeficiente de Kendall es que reporta valores más bajos con respecto
a los coeficientes de Spearman y Pearson, en aquellas situaciones donde se analiza las asociaciones
lineales con la misma intensidad (sin la presencia de valores atípicos); por ejemplo, se presentan
casos donde fuertes correlaciones son reportadas por Spearman y Pearson, digamos al menos 0,90,
mientras Kendall lo reportaría alrededor de 0,70. Este resultado no se puede traducir como si el
coeficiente de Kendall es menos preciso que los otros dos, sino que tau se determina a partir de
valores ranqueados, e inclusive reporta la misma tendencia en datos con distribución monótonas
no lineales, en comparación con Spearman. Según Siegel y Castellan (1998, pag. 285, 287), para
tomados de dos variables aleatorias digamos X e Y, el cual se denota por Txy, se utiliza la expresión
de la Tabla 1.
21
El coeficiente Txy de Kendall varía de -1 a +1. Como se puede notar se realizan un total de n(n-
incrementan junto con los valores de X, entonces S= n(n-1)/2 de tal manera que TXY = +1, por el
contrario si todos los valores Y decrecen con el incremento de los valores de X, entonces S= -n(n-
1)/2 y por lo tanto TXY = -1. También Siegel y Castellan (1998), recomiendan que, si se estudia la
correlación en muestras con tamaños n mayor de 10 datos, se puede efectuar una aproximación de
Existen estudios donde dos o más casos estudiados dentro de una muestra reciben la misma
puntuación en la misma variable, cuando esto sucede se dice que las puntuaciones están
“empatadas”, y por lo tanto a cada una de ellas se le debe asignar el promedio de los rangos que
importante: En la ecuación (2) se muestra su forma de cálculo (ver Tabla 4). Una de las ventajas
de este coeficiente es que puede ser generalizado a un coeficiente de correlación parcial, también
juicios de expertos. La discusión detallada de este indicador será tema de otro trabajo.
opción Analizar, Correlaciones bivariadas, en el cual se eligen las variables que vamos a estudiar,
22
EJEMPLOS CON EL PROGRAMA SPSS
1) Hacer clic
en analizar
23
Introducir las variables
cuantitativas continuas que se
quiere correlacionar
Tabla 1
Análisis de correlación de Pearson
Gasto Aproximado
Ciclo de estudio
en su educación
Gasto Aproximado en su Correlación de Pearson 1 ,026
educación Sig. (bilateral) ,611
N 400 400
Ciclo Estudio Correlación de Pearson ,026 1
Sig. (bilateral) ,611
N 400 400
Nota: según la tabla 1 podemos afirmar que las variables ciclo de estudio y gasto aproximado en
su educación existe una correlación muy baja debido a que la correlación de Pearson es 0.026, lo
que significa que a medida que el estudiante va pasando de ciclo no afecta en su economía, en
24
CÁLCULO DEL COEFICIENTE DE CORRELACIÓN DE SPEARMAN EN SPSS
1) Hacer clic en
analizar
3) Seleccionar
2)Luego seleccionar
bivariadas
correlaciones
25
Tabla 2
Análisis de Correlación de Spearman
grado de asociación entre las diferentes variables no paramétricas del estudio. Con los resultados
que muestra podemos interpretar que la variable Lectura (comprensión lectora: comprender diferentes
textos) se relaciona con la variable Biblioteca, debido a que el coeficiente de correlación Spearman
muestra que hay una relación positiva de 0,139 entre percepción de Lectura y Biblioteca. Esto quiere
decir, que, a mayor interés en la lectura, mayor es la frecuencia del uso de la biblioteca en la
universidad.
26
CÁLCULO DEL COEFICIENTE DE CORRELACIÓN DE TAU-B DE KENDALL EN SPSS
1) Hacer clic en
analizar
3) Seleccionar
2)Luego seleccionar
bivariadas
correlaciones
27
Tabla 3
Análisis de correlación de Spearman
28.Actualizació 31.Disponibilid
n periódica de ad de revistas
libros de especialidad
Tau-b de Kendall 28.Actualización periódica Coeficiente de correlación 1,000 ,118**
de libros Sig. (bilateral) . ,004
N 400 400
31.Disponibilidad de Coeficiente de correlación ,118** 1,000
revistas de especialidad Sig. (bilateral) ,004 .
N 400 400
**. La correlación es significativa en el nivel 0,01 (bilateral).
Nota: En la tabla se utiliza el análisis de correlación bivariada (Tau-b de Kendall) para determinar
el grado de asociación entre las diferentes variables no paramétricas del estudio. Con los resultados
que muestra podemos interpretar que existe una correlación entre las variables Actualización
muestra que hay una relación positiva de 0,118. Esto quiere decir, que, la actualización periódica de los
28
Referencias bibliograficas
Bernal Morell, E. (2014). Bioestadística Básica para Investigadores con SPSS (Primera Ed).
Bioestadistica Bernal Morell.
Pedroza, H., & Dicovskyi, L. (2007). Sistema de Analisis Estadistico con SPSS. IICA Biblioteca
Venezuela.
Rial Boubeta, A., & Varela Mallou, J. (2014). Estadística práctica para la investigación en
ciencias de la salud. Netbiblo, S. L.
Tomás-Sábado, J. (2009). Fundamentos de bioestadística y análisis de datos para enfermería
(Primera Ed). Servei de Publicacions.
Xu, W., Hou, Y., Hung, Y. S. & Zou Y. (2012). A comparative analysis of Spearman’s rho and Kendall’s tau
in normal and contaminated normal models.
Ulrich, R., Wirtz (M.) (2004). On the correlation of a naturally and an artificially dichotomized
variable.
29