Teoria de Correlacion
Teoria de Correlacion
Teoria de Correlacion
La relacin entre dos sper variables cuantitativas queda representada mediante la lnea
de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes
elementales de una lnea de ajuste y, por lo tanto, de una correlacin, son la fuerza, el
sentido y la forma:
En ocasiones nos puede interesar estudiar si existe o no algn tipo de relacin entre dos
variables aleatorias. As, por ejemplo, podemos preguntarnos si hay alguna relacin entre
las notas de la asignatura Estadstica I y las de Matemticas I. Una primera aproximacin
al problema consistira en dibujar en el plano R2 un punto por cada alumno: la primera
coordenada de cada punto sera su nota en estadstica, mientras que la segunda sera su
nota en matemticas. As, obtendramos una nube de puntos la cual podra indicarnos
visualmente la existencia o no de algn tipo de relacin (lineal, parablica, exponencial,
etc.) entre ambas notas.
En particular, nos interesa cuantificar la intensidad de la relacin lineal entre dos
variables. El parmetro que nos da tal cuantificacin es el coeficiente de correlacin
lineal de Pearson r, cuyo valor oscila entre 1 y +1
TIPOS DE CORRELACIN:
La correlacin puede clasificarse en dos tipos dependiendo de la cantidad de variables
analizadas y por el tipo de relacin lineal:
1. Correlacin simple: se estudia la dependencia nicamente entre dos variables.
2. Correlacin mltiple: se estudia la dependencia entre ms de 2 variables.
3. Correlacin parcial: cuando se incluye la influencia de variables exgenas no
consideradas en el clculo de los coeficientes.
Dependiendo del tipo de relacin lineal el coeficiente relaciona:
1. Correlacin directa:
La correlacin directa se da cuando al aumentar una de las variables la otra
aumenta.
La recta correspondiente a la nube de puntos de la distribucin es una recta
creciente.
2. Correlacin inversa:
La correlacin inversa se da cuando al aumentar una de las
variables la otra disminuye.
La recta correspondiente a la nube de puntos de la distribucin es
una recta decreciente.
3. Correlacin nula:
La correlacin nula se da cuando no hay dependencia de ningn
tipo entre las variables.
En este caso se dice que las variables son incorreladas y la nube
de puntos tiene una forma redondeada.
Nos indica que al modificarse en promedio una variable en un sentido, la otra lo hace en
la misma direccin.
Correlacin negativa o inversamente proporcional r = (-).
Nos muestra que al cambiar una variable en una determinada direccin (en promedio), la
otra lo hace en sentido contrario u opuesto.
Incorrelacin r = 0
Cuando la obtencin de dicho indicador r sea exactamente igual a cero, se dice que no
existe alguna relacin, asociacin o dependencia entre las variables estudiadas, siendo
por tanto ellas, variables correlacionadas o faltes de alguna dependencia lineal.
GRADO DE CORRELACIN:
El grado de correlacin indica la proximidad que hay entre los puntos de la nube de
puntos. Se pueden dar tres tipos:
1. Correlacin fuerte:
2. Correlacin dbil
La correlacin ser dbil cuanto ms separados estn los puntos de la recta.
3. correlacin nula
El coeficiente de correlacin lineal, el cociente entre la varianza el producto de las
desviaciones tpicas ambas variables.
El coeficiente de correlacin lineal se expresa mediante:
Coeficientes de correlacin:
Existen diversos coeficientes que miden el grado de correlacin, adaptados a la
naturaleza de los datos. El ms conocido es el coeficiente de correlacin de Pearson
(introducido en realidad por Francis Galton), que se obtiene dividiendo la covarianza de
dos variables por el producto de sus desviaciones estndar. Otros coeficientes son:
Coeficiente de correlacin de Spearman
Correlacin cannica.
Coeficiente de correlacin de Pearson
En estadstica, el coeficiente de correlacin de Pearson es un ndice que mide la relacin
lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlacin de Pearson es independiente de la escala de medida de las variables.
El coeficiente de correlacin entre dos variables aleatorias X e Y es el cociente donde
XY es la covarianza de (X,Y) y X y Y las desviaciones tpicas de las distribuciones
marginales.
Coeficiente de correlacin de Spearman
En estadstica, el coeficiente de correlacin de Spearman, (ro) es una medida de la
correlacin (la asociacin o interdependencia) entre dos variables aleatorias continuas.
Para calcular , los datos son ordenados y reemplazados por su respectivo orden.
El estadstico viene dado por la expresin:
Donde D es la diferencia entre los correspondientes valores de x - y. N es el nmero de
parejas.
Se tiene que considerar la existencia de datos idnticos a la hora de ordenarlos, aunque si
stos son pocos, se puede ignorar tal circunstancia
La interpretacin de coeficiente de Spearman es igual que la del coeficiente de correlacin
de Pearson. Oscila entre -1 y +1, indicndonos asociaciones negativas o positivas
respectivamente, 0 cero, significa no correlacin pero no independencia. La tau de
Kendall es un coeficiente de correlacin por rangos, inversiones entre dos ordenaciones
de una distribucin normal bivariante. (Enciclopedia Libre Wikipedia (2010. Parra. 1))
De esta forma podemos observar cmo se orienta la aplicacin de cada uno de estos
viendo que el primero toma en cuenta dos variables aleatorias cuantitativas y el segundo
entre dos variables aleatorias continuas.
Clasificacin del grado de correlacin.
CORRELACIN
VALOR O RANGO
Perfecta: |R| = 1
Excelente: 0.9 <= |R| < 1
Buena: 0.8 <= |R| < 0.9
Regular: 0.5 <= |R| <0.8
Mala: |R|< 0.5
Ejemplo:
Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:
Matemticas
2
3
4
4
5
6
6
7
7
8
10
10
Fsica
16
16
16
16
20
25
16
24
36
16
36
36
36
28
49
16
42
49
36
56
64
49
10
90
100
81
10
10
100
100
100
72
60
431
504
380
2 Calculamos la covarianza.
10
Correlacin parcial:
El procedimiento Correlaciones parciales permite estudiar la relacin lineal existente entre
dos variables controlando el posible efecto de una o ms variables extraas. Un
coeficiente de correlacin parcial es una tcnica de control estadstico que expresa el
grado de relacin lineal existente entre dos variables tras eliminar de ambas el efecto
atribuible a terceras variables.
El coeficiente de correlacin parcial de primer orden, anotado aqu, permite conocer el
valor de la correlacin entre dos variables A y B, si la variable C haba permanecido
constante para la serie de observaciones consideradas.
Dicho de otro modo, el coeficiente de correlacin parcial es el coeficiente de correlacin
total entre las variables A y B cuando se les retir su mejor explicacin lineal en trmino
de C
Por ejemplo, se sabe que la correlacin entre las variables inteligencia y rendimiento
escolar es alto y positivo. Sin embargo, cuando se controla el efecto de terceras variables
como el nmero de horas de estudio o el nivel educativo de los padres, la correlacin
entre inteligencia y rendimiento desciende, lo cual indica que la relacin entre inteligencia
y rendimiento est condicionada, depende o est modulada por las variables sometidas a
control.