Correlación - Wikipedia
Correlación - Wikipedia
Correlación - Wikipedia
En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos
variables estadísticas. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían
sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación entre ellas
si al disminuir los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí
misma, ninguna relación de causalidad (Véase cum hoc ergo propter hoc).
Índice
Fuerza, sentido y forma de la correlación
Coeficientes de correlación
Interpretación geométrica
Distribución del coeficiente de correlación
Referencias
Enlaces externos
La fuerza extrema según el caso, mide el grado en que la línea representa a la nube de puntos: si la nube es
estrecha y alargada, se representa por una línea recta, lo que indica que la relación es fuerte; si la nube de
puntos tiene una tendencia elíptica o circular, la relación es débil.
El sentido mide la variación de los valores de B con respecto a A: si al crecer los valores de A lo hacen los de B,
la relación es directa (pendiente positiva); si al crecer los valores de A disminuyen los de B, la relación es
inversa (pendiente negativa).
La forma establece el tipo de línea que define el mejor ajuste: la línea recta, la curva monotónica o la curva no
monotónica
Coeficientes de correlación
Existen diversos coeficientes que miden el grado de correlación, adaptados a la naturaleza de los datos. El más conocido es el
coeficiente de correlación de Pearson (introducido en realidad por Francis Galton), que se obtiene dividiendo la covarianza de dos
variables entre el producto de sus desviaciones estándar. Otros coeficientes son:
Interpretación geométrica
Dados los valores muestrales de dos variables aleatorias e , que pueden ser consideradas como
vectores en un espacio a n dimensiones, pueden construirse los "vectores centrados" como:
e .
El coseno del ángulo alfa entre estos vectores es dado por la fórmula siguiente:
Pues es el coeficiente de correlación muestral de Pearson. El coeficiente de correlación es el coseno del ángulo entre
ambos vectores centrados:
Por supuesto, desde el punto vista geométrico, no hablamos de correlación lineal: el coeficiente de correlación tiene siempre un
sentido, cualquiera sea su valor entre -1 y 1. Nos informa de modo preciso, no tanto sobre el grado de dependencia entre las
variables, sino sobre su distancia angular en la hiperesfera a n dimensiones.
La Iconografía de las correlaciones es un método de análisis multidimensional que reposa en esta idea. La correlación lineal se da
cuando en una nube de puntos se encuentran o se distribuyen alrededor de una recta.
La fórmula de correlación para dos series distintas con cierto desfase "k", está dada por la fórmula:
Si las dos variables aleatorias que trata de relacionarse proceden de una distribución gaussiana bivariante entonces el coeficiente
de correlación r sigue una distribución de probabilidad dada por:1 2
donde:
es la distribución gamma
es la función gaussiana hipergeométrica.
por tanto, r es estimador sesgado de . Puede obtenerse un estimador aproximado no sesgado resolviendo la ecuación:
para
Aunque, la solución:
es subóptima. Se puede obtener un estimador sesgado con mínima varianza para grandes valores de n, con sesgo de orden
, i.e.
Referencias
1. Kenney, J. F. and Keeping, E. S., Mathematics of Statistics, Pt. 2, 2nd ed. Princeton, NJ: Van Nostrand, 1951.
2. Correlation Coefficient - Bivariate Normal Distribution (http://mathworld.wolfram.com/CorrelationCoefficientBivaria
teNormalDistribution.html)
Enlaces externos
Wikcionario tiene definiciones y otra información sobre correlación.
Diccionario Estadístico - Divestadística (http://www.divestadistica.es/es/diccionario_estadistico.html#C) (en
castellano)
[1] (http://cajael.com/mestadisticos/T1EDescriptiva/node20.php) (enlace roto disponible en Internet Archive; véase el
historial (https://web.archive.org/web/*/http://cajael.com/mestadisticos/T1EDescriptiva/node20.php) y la última versión (https://web.arc
hive.org/web/2/http://cajael.com/mestadisticos/T1EDescriptiva/node20.php)). Simulación de la correlación entre dos
variables discretas con R (lenguaje de programación)
Obtenido de «https://es.wikipedia.org/w/index.php?title=Correlación&oldid=118847793»
Esta página se editó por última vez el 2 sep 2019 a las 18:45.
El texto está disponible bajo la Licencia Creative Commons Atribución Compartir Igual 3.0; pueden aplicarse
cláusulas adicionales. Al usar este sitio, usted acepta nuestros términos de uso y nuestra política de privacidad.
Wikipedia® es una marca registrada de la Fundación Wikimedia, Inc., una organización sin ánimo de lucro.