Regresión Lineal Simple y Correlación

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Regresión lineal simple y correlación

La correlación lineal y la regresión lineal simple son métodos estadísticos que estudian la relación
lineal existente entre dos variables. Diferencias: La correlación lineal cuantifica que tan
relacionadas están dos variables, mientras que la regresión lineal consiste en generar un modelo
(ecuación) que en base a ambas variables permita decidir el valor de una a partir de la otra.

La regresión lineal simple consiste en generar un modelo (ecuación de una recta) que permita
explicar la relación lineal que existe entre dos variables . A la variable dependiente se le identifica
como 𝒚 y a la variable predictora o independiente como X

El modelo de regresión lineal simple se describe de acuerdo a la ecuación:


Y=β0+β1X1+ϵ

Siendo β0 la ordenada en el origen, β1 la pendiente y ϵ el error aleatorio. Este último representa la


diferencia entre el valor ajustado por la recta y el valor real. Recoge el efecto de todas aquellas
variables que influyen en Y pero que no se incluyen en el modelo como predictores. Al error
aleatorio también se le conoce como residuo.

En la gran mayoría de casos, los valores β0 y β1 poblacionales son desconocidos, por lo que, a
partir de una muestra, se obtienen sus estimaciones β^0 y β^1

Estas estimaciones se conocen como coeficientes de regresión, ya que toman aquellos valores que
minimizan la suma de cuadrados residuales, dando lugar a la recta que pasa más cerca de todos
los puntos. (Existen alternativas al método de mínimos cuadrados para obtener las estimaciones de
los coeficientes).
PLANTEAMIENTO
Una compañía de seguros desea determinar el grado de
relación entre el ingreso familiar “x” y el monto de seguro de
vida “y” del jefe de familia. Con base en una muestra aleatoria
de 18 familias, se obtuvo la siguiente información (en miles de
dólares).

Ingreso 45 20 40 40 47 30 25 20 15 35 40 55 50 60 15 30 35 45
(x)

Seguro 70 50 60 50 90 55 55 35 40 65 75 105 110 120 30 40 65 80


de vida
(y)
DIAGRAMA DE DISPERCION
Tema 1: Regresión lineal simple y correlación.
DIAGRAMA DE DISPERCION
¿QUE INDICA MI DIAGRAMA? DESCRIPCCION
En este diagrama de flujo con los datos obtenidos del problema, nos El diagrama de dispersión se usa comúnmente para mostrar
muestra como resultado que el diagrama de dispersión va de Forma cómo dos variables se relacionan entre sí. De este modo, permite
ascendente. Lo que significa que mientras mas alto es el ingreso de la estudiar las relaciones que existen entre dos factores, problemas
familia puede acceder a mejores seguros de vida o causas relacionadas.

SEGURO DE
INGRESOS VIDA
DIAGRAMA DE DISPERSION 45 70
20 50
140
40 60
120
SEGURO DE VIDA

40 50
100 47 90
80 30 55
60 25 55
20 35
40
15 40
20 35 65
0 40 75
0 10 20 30 40 50 60 70 55 105
INGRESO FAMILIAR 50 110
60 120
15 30
30 40
35 65
45 80
MEJOR ESTIMACION DE LA RECTA
Tema 1: Regresión lineal simple y correlación.
DATOS FORMULAS SUSTITUCION
𝟐𝟔𝟑𝟎𝟗 𝟏𝟏𝟗𝟓 − 𝟔𝟒𝟕 𝟒𝟖𝟑𝟖𝟎
N= 18 Ῡ= a + bx a=
𝟏𝟖 𝟐𝟔𝟑𝟎𝟗 − 𝟔𝟒𝟕 ²
=2.500227
⅀𝑥² ⅀𝑦 − ⅀𝑥 ⅀𝑥𝑦
a= 𝑛 ⅀𝑥² − ⅀𝑥 ²
𝟏𝟖 𝟒𝟖𝟑𝟖𝟎 − 𝟔𝟒𝟕 𝟏𝟏𝟗𝟓
b= = 1.77
𝟏𝟖 𝟐𝟔𝟑𝟎𝟗 − 𝟔𝟒𝟕 ²
𝑛 ⅀𝑥𝑦 − ⅀𝑥 ⅀𝑦
b=
𝑛 ⅀𝑥² − ⅀𝑥 ²
Ῡ = 2.500227+1.77X

SEGURO DE VIDA Ῡ
INGRESOS (X) (Y) (X)(Y) X² x = 2.500227+1.77x
45 70 3150 2025 45 82.150227
20 50 1000 400 20 37.900227
40 60 2400 1600 40 73.300227
40 50 2000 1600 40 73.300227
47 90 4230 2209 47 85.690227
30 55 1650 900 30 55.600227
25 55 1375 625 25 46.750227
20 35 700 400 20 37.900227
15 40 600 225 29.050227
15
35 65 2275 1225
35 64.450227
40 75 3000 1600
40 73.300227
55 105 5775 3025
55 99.850227
50 110 5500 2500
50 91.000227
60 120 7200 3600
60 108.700227
15 30 450 225
15 29.050227
30 40 1200 900
30 55.600227
35 65 2275 1225
35 64.450227
45 80 3600 2025
⅀=647 ⅀ =1195 ⅀ =48380 ⅀=26309 45 82.150227
⅀=647 ⅀=1190.194086

MEJOR ESTIMACION DE LA RECTA x = 2.500227+1.77x
45 82.150227
Una recta que mejor se ajusta es una línea recta que es la mejor 20 37.900227
aproximación del conjunto de datos dado. Es usada para estudiar la 40 73.300227
naturaleza de la relación entre dos variables. 40 73.300227
47 85.690227
Una recta que mejor se ajusta puede ser determinada aproximadamente 30 55.600227
usando el método visual al dibujar una línea recta en una grafica de 25 46.750227
dispersión para que tanto el número de puntos arriba de la 20 37.900227
recta y debajo de la recta sean casi iguales (y la línea pasa a través de 29.050227
15
tantos puntos como sea posible). 64.450227
35
40 73.300227
¿QUE INDICA MI DIAGRAMA? 55 99.850227
50 91.000227
De igual manera que con los datos de el diagrama de dispersión se
60 108.700227
observa que la recta va de forma ascendente.
15 29.050227
30 55.600227
Una recta que se ajusta mejor es una línea recta, la cual es la mejor
35 64.450227
aproximación del conjunto de datos dado.
45 82.150227
⅀=647 ⅀=1190.194086

DIAGRAMA DE DISPERCION Y MEJOR


ESTIMACION DE LA RECTA
140
120 MEJOR ESTIMACION DE LA
SEGURO DE VIDA

100 RECTA

80
60
DIAGRAMA DE FLUJO O
40
DISPERCION
20
0
0 10 20 30 40 50 60 70
INGRESO FAMILIAR

También podría gustarte