0% encontró este documento útil (0 votos)
5 vistas19 páginas

Apuntes Medidas de Asociacion Regresion Ok Poblacion 466566

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1/ 19

APUNTES

MEDIDAS DE ASOCIACIÓN
MODELO DE REGRESIÓN LINEAL
MEDIDAS DE ASOCIACION DE
VARIABLES

COVARIANZA entre las variables X e Y. Es


una medida de la variación conjunta. Se
define como
Puede tomar valores positivos o negativos.
Positivo, significa que ambas variables tienden a
variar de la misma forma, hay una
asociación positiva.

Negativo, significa que si una aumenta, la otra


tiende a disminuir, y vice versa.

Covarianza cero indica que no hay asociación


entre las variables.
EJEMPLO: Los datos correspondientes a 9 empleados
del club de salud de una empresa:
X pulsaciones por minuto en reposo
Y tiempo en correr 1 milla ( seg)
X 67 52 56 66 65 80 77 65 68
Y 481 292 357 345 425 300 290 295 300

203703
− 66 , 2 2∗ 342 ,78=− 65 , 22
9
El valor resultante
indica que existe asociación entre las pulsaciones
por minuto y el tiempo en correr 1 milla (ya que es
distinto a cero). Además la tendencia de la
asociación es decreciente, negativa o inversa, esto
quiere decir, que a medida que una de las variables
aumenta la otra disminuye.
COEFICIENTE DE CORRELACION DE PEARSON

La covarianza tiene el inconveniente de que su valor


no es acotado, por lo que, a partir de él es
difícil juzgar si es grande o pequeña.

Se define la correlación, como una medida de


asociación lineal independiente de las unidades
de medida, que entrega la fuerza, magnitud,
intensidad o grado de asociación de las variables.
El coeficiente de correlación de Pearson ( r ) se
mueve entre -1 y 1.
Si r > 0 indica que la asociación lineal es creciente o
positiva y mientras mas cercano este el valor a 1,
indica que el grado de asociación es mayor.

Si r < 0 indica que la asociación lineal es decreciente o


negativa y mientras mas cercano este el valor a -1,
indica que el grado de asociación es mayor.

Si r = 0 indica que no existe asociación lineal entre las


variables.
Para calcular el coeficiente de correlación utilizamos la siguiente
expresión:

𝐶𝑜𝑣 (𝑥 , 𝑦 )
𝑟=
𝜎𝑥 ∗ 𝜎 𝑦
Si consideramos el ejemplo anterior, el coeficiente de correlación
de Pearson
−65 ,22
𝑟= =− 0 , 12
8,297 ∗64,446
El resultado nos indica que existe un bajo grado de asociación
lineal de tipo inversa entre las variables, ya que, es un valor
cercano a cero y además negativo.
Existen algunos “criterios teóricos” que nos pueden ayudar
para decidir si el grado de asociación es alto o no.

El tener un alto grado de asociación lineal da paso a pensar


que es posible asociar un modelo predictivo que permita
relacionar estas variables, en este caso al ser una relación
lineal se le aplicaría un modelo del tipo lineal
GRAFICA DE DISPERSION

Este grafico también llamado nube de puntos muestra


la asociación entre dos variables. La forma de graficar
es dibujar un punto en cada uno de los pares
ordenados de datos.
Este grafico permite también visualizar la tendencia de
los datos (asociación creciente o decreciente)
• Grafico de dispersión de ejemplo
600

500

400

300
Y

200

100

0
50 55 60 65 70 75 80 85
Pulsaciones por minuto en reposo

Como podemos observar el grafico no muestra una asociación del tipo


lineal clara, pero si muestra una tendencia decreciente, inversa o
negativa.
Esto se puede corroborar con los datos calculados anteriormente, es
necesario recordar que los gráficos son solo un apoyo visual.
REGRESION LINEAL SIMPLE

El modelo de regresión lineal establece un modelo


para pronosticar los posibles resultados de la
relación entre las variables X e Y que están
debidamente relacionadas.
Estableceremos un modelo o recta de regresión que
pronostique los efectos causados por la variable
independiente X sobre la variable de respuesta Y

Y = A + BX

A y B son dos cantidades fijas (parámetros del modelo)


o coeficientes del modelo
A: Intercepto de la recta
B: Pendiente de la recta o razón de cambio por cada
unidad que aumente la variable independiente X
Cálculos de los parámetros del
modelo

𝐶𝑜𝑣( 𝑋 , 𝑌 )
𝐵=
𝜎 2𝑋

A=𝑌 − 𝐵∗ 𝑋
Calculemos los parámetros del modelo para el ejemplo:

𝐶𝑜𝑣( 𝑋 , 𝑌 ) − 65 , 22
𝐵= 2
= 2
=− 0,947
𝜎𝑋 ( 8,297)

A=𝑌 − 𝐵∗ 𝑋 =342.78 − ( −0,947 ∗ 66 , 22 ) =405 , 49


Obtenemos el siguiente modelo de regresión lineal

Si deseamos por ejemplo, determinar cuál será el tiempo estimado en correr una milla, si el
individuo tiene 60 pulsaciones por minuto en reposo, debemos reemplazar este valor en el
modelo, de la siguiente manera:

El tiempo estimado es de aproximadamente 348,67


segundos
Observaciones:

** El pronostico solo se puede realizar, si el valor de la


valor se encuentra dentro del recorrido de la variable
independiente X.

** Sobre el grafico de dispersión se traza la recta


obtenida desde el modelo de regresión lineal simple. La
cual indicara de forma visual los posibles pronósticos.
COEFICIENTE DE DETERMINACION

Este coeficiente indica la bondad del modelo de


regresión o ajuste de regresión, calidad del modelo o
porcentaje de variabilidad que esta siendo explicado por
la variable independiente X.

En otras palabras que tan confiable son los pronósticos


realizados por el modelo de regresión lineal simple.
El coeficiente de determinación se encuentra entre 0 y 1
o 0 y 100%.
Mientras mas cercano a 1 sea el coeficiente de
determinación el ajuste del modelo es mejor, si es
exactamente 1 o 100 % quiere decir que la estimación
del pronostico es perfecta.

En la grafica indica que los puntos están mas cercanos


a la recta de regresión, si el coeficiente es 100% los
puntos forman una recta perfecta.

cuadrado el coeficiente de correlación de Pearson, 𝒓𝟐


El calculo de este coeficiente se obtiene elevando al

También podría gustarte