Unidad 2. Teoria de Correlacion

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 18

UNIDAD 2

Presentan:
Cervantes De La Rosa Juan Manuel
Gamez Gaspar Jandy Nathaly
Jandy Nathaly Gamez Gaspar
UNIDAD 2
Regresión y
Correlación
2.1 Teoria de Correlacion
2.1 TEORIA DE CORRELACION

La correlacion junto con la regresion, son las dos herramientas estadisticas mas
poderosas y versatiles que se pueden utilizar para solucionar problemas comunes
en los negocios. Muchos estudios se basan en la creencia de que se puede
identificar y cuantificar alguna relacion funcional entre dos o mas variables. Se
dice que una variable depende de la otra. Se puede decir que Y depende de X en
donde Y y X son dos variables cualquiera. Esto se puede escribir asi:
2.1 . TEORIA DE CORRELACION

Debido a que Y depende de de X, Y es la variable dependiente y X es la variable


independiente.

Variable dependiente: Es la variable que se desea explicar o predecir, tambien


se le denomina regresando o variable de respuesta.
“La variable independiente X se utiliza para explicar Y.”

Variable independiente: Tambien llamada variable explicativa o regresor.


“Se dice que Y esta regresando por X”
2.1 . TEORIA DE CORRELACION
Proposito de la Correlacion
Estudiar la posible relacion entre dos variables:
2.1 . TEORIA DE CORRELACION

Como prueba
Información de Como fácil y rápida
atributos, “predictor” o para eliminar
variables mas para una factores que no
normales y no respuesta dada influyen en la
normales. predicción.
2.1 .1 CORRELACION LINEAL
El coeficiente de correlación lineal es una medida de regresión que sirve para establecer
una relación lineal entre dos variables. De esta manera, su cálculo permite conocer con
exactitud el grado de dispersión de los valores de una variable en relación con una
media para dicha variable.

Para estudiar la relación lineal existente entre dos variables continuas es necesario
disponer de parámetros que permitan cuantificar dicha relación. Uno de estos
parámetros es la covarianza, que indica el grado de variación conjunta de dos variables
aleatorias.
2.1.2 MEDIDAS DE CORRELACION

La correlación es una medida de la relación (covariación) lineal entre dos


variables cuantitativas continuas (x, y). La manera más sencilla de saber si dos
variables están correlacionadas es determinar si co-varían (varían
conjuntamente).
La correlación es en esencia una medida normalizada de asociación o covariación
lineal entre dos variables. Esta medida o índice de correlación rr puede variar
entre -1 y +1, ambos extremos indicando correlaciones perfectas, negativa y
positiva respectivamente. Un valor de rr = 0 indica que no existe relación lineal
entre las dos variables.
2.1.2 MEDIDAS DE CORRELACION

Una correlación positiva indica que ambas variables varían en el mismo sentido.
Una correlación negativa significa que ambas variables varían en sentidos
opuestos. Lo interesante del índice de correlación es que rr es en sí mismo una
medida del tamaño del efecto, que suele interpretarse de la siguiente manera:

- Correlación despreciable: rr < |0.1| 
- Correlación baja: |0.1| < rr <= |0.3|
- Correlación mediana: |0.3| < rr <= |0.5|
- Correlación fuerte o alta: rr > |0.5|
2.1.3 COEFICIENTE DE CORRELACION

El coeficiente de correlación, también llamado índice de correlación calcula la


frecuencia de movimientos de los precios en una dirección y en la opuesta por
dos valores durante un periodo determinado de tiempo. Esta frecuencia se
muestra entre los valores +1 y -1. Se usa para medir la correlación de las
tendencias de dos mercados o valores.
2.1.3 COEFICIENTE DE CORRELACION

El coeficiente estará comprendido entre +1 y -1. Llegará a +1 cuando existe una


perfecta correlación entre las dos series. Alcanzará -1 cuando la correlación es
opuesta y 0 cuando no existe ninguna relación entre las dos series. Un bajo
coeficiente de correlación (por ejemplo + 0.10) sugiere que la relación entre dos
variables es escasa. La dirección del cambio de la variable dependiente
dependerá del signo del coeficiente. Si es positivo entonces la variable
dependiente se moverá en el mismo sentido que la variable independiente, y si es
negativo, entonces la variable dependiente se moverá en sentido contrario al
movimiento de la variable independiente. Un valor de correlación alto negativo
(ej: -0.80) significa que cuando el oscilador cambie, seguramente nuestro precio
cambiará en sentido contrario.
2.1.3 COEFICIENTE DE CORRELACION
2.1.3 COEFICIENTE DE CORRELACION

• Correlación de Pearson: La correlación de Pearson es la medida más utilizada para


determinar una relación lineal entre dos variables. Cuanto más fuerte sea la
correlación entre estos dos conjuntos de datos, más cerca estará de +1 o -1.
2.1.3 COEFICIENTE DE CORRELACION

• Correlación de Spearman: Este tipo de correlación se utiliza para determinar la


relación o asociación monótona entre dos conjuntos de datos. A diferencia del
coeficiente de correlación de Pearson, se basa en los valores clasificados de cada
conjunto de datos y utiliza variables asimétricas u ordinales en lugar de las
distribuidas normalmente.
• Correlación con Kendall: Este tipo de correlación mide la fuerza de la dependencia
entre dos conjuntos de datos.
2.1.3 COEFICIENTE DE CORRELACION

• Reglas Empíricas
2.1.4 CORRELACION DE ATRIBUTOS

La correlación de atributos es necesaria para definir qué atributos de destino se


corresponden con los atributos de una cuenta.
La correlación puede decir algo acerca de la relación entre las variables. Se utiliza
para entender:
- si la relación es positiva o negativa
- la fuerza de la relación.
En el caso del ingreso familiar y el gasto familiar, es fácil ver que ambos suben o
bajan juntos en la misma dirección. Esto se denomina correlación positiva.
En caso del precio y la demanda, el cambio se produce en la dirección opuesta, de
modo que el aumento de uno está acompañado de un descenso en el otro. Esto se
conoce como correlación negativa.
2.1.5 CORRELACION DE SERIES DE
TIEMPO

Series de tiempo: una recolección de datos para alguna variable o conjunto de


variables durante varios periodos.
El proceso de desarrollar un pronóstico comienza con la recolección de datos
anteriores durante varios periodos. El conjunto de datos resultantes se denomina
una serie de tiempo o serie temporal porque contiene observaciones para alguna
variable durante el tiempo. Los periodos de tiempo varían en duración, pueden
ser anuales, trimestrales, mensuales o incluso diarios. Los periodos de solo una
hora pueden utilizarse para variables altamente volátiles como el precio o para las
acciones transadas en una de las bolsas de valores reconocidas.
2.1.5 CORRELACION DE SERIES DE
TIEMPO

El propósito del análisis de las series de tiempo es predecir o proyectar los


valores futuros de la variable a partir de observaciones anteriores.

Las series de tiempo son colecciones de observaciones sobre un determinado


fenómeno efectuadas en sucesivos momentos del tiempo, usualmente
equiespaciados. Corresponde a una realización de un proceso generador de datos.

También podría gustarte