Beamer Regresión Lineal
Beamer Regresión Lineal
Beamer Regresión Lineal
CORRELACION
17/06/2014
17/06/2014
Introduccin
La regresin y los anlisis de correlacin nos muestran como
determinar tanto la naturaleza como la fuerza de una relacin
entre dos variables
En el anlisis de regresin desarrollaremos una ecuacin de
estimacin, esto es, una formula matemtica que relaciona las
variables conocidas con la variable desconocida. Tambin
podemos aplicar el anlisis de correlacin para determinar el
grado de en el que estn relacionadas las variables. Por lo
tanto, nos dice que tan bien la ecuacin obtenidarealmente
describe la relacin.
17/06/2014
Modelo
Donde:
17/06/2014
Suposiciones
17/06/2014
Estimacin
Consiste en determinar los valores de a y b a partir de la muestra,
es decir, encontrar los valores de a y b con los datos observados de
la muestra. El mtodo de estimacin es el de Mnimos Cuadrados,
mediante el cual se obtiene:
y a bx
( y y )( x x )
cov
n
Donde sx se calcula
con denominador n
17/06/2014
a a y bx
Cov
b b
s2
x
Departamento Estadstica, Facultad de Biologa
Coeficiente de correlacin
Mide la intensidad de la asociacin lineal entre dos variables aleatorias
xy / x y
covarianza poblacional
coeficiente de
determinacin:
proporcin de
varianza de la
Y explicada
por la X
17/06/2014
Cov
s s
x y
Ejemplos correlacin
10 = 0.134
20 X + 2.122
30
Y
40
50
60
70
80
90
Y =4 X
8X
10
12
14
16
4
6
8
6
8
10
-1 r 0
12
10
r=-1
12
14
14
16
16
0 r +1
14
12
14
r=+1
12
10
10
Y=X
16
Y = 0.134 X + 2.122
16
0
0
10
20
30
40
50
60
70
80
90
17/06/2014
10
12
14
16
Ausencia correlacin
Y = 0.093 X + 4.335
16
Y=4
14
7
12
6
5
10
160
20
#DIV/0!
25
30
35
40
45
50
55
20
60
25
30
35
45
50
55
60
14
40
12
10
r=0
8
6
4
2
0
0
17/06/2014
Precauciones en la interpretacin de r
r significativo NO implica relacin de causalidad entre las variables
t
x
y
17/06/2014
10
yi Y yi y i y i Y
n
i 1
i 1
i 1
Variabilidad no
Explicada
(error)=SSE
Variabilidad
total= SST
Variabilidad
Explicada=SSReg
Fuentes
Variacin
Regresin
Sumas
Cuadrados
SCReg.
g.l
1
Cuadrados
Medios
SCReg/ g.l (I)
Error
SCE
n-2
Total
SCT
n1
17/06/2014
F
Fo=I/II
11
Ejemplo
Los datos de la siguiente tabla representan las
estaturas (X, cm) y los pesos (Y, kg) de una muestra
de 12 hombres adultos. Para cada estatura fijada
previamente se observ el peso de una persona
seleccionada de entre el grupo con dicha estatura,
resultando:
17/06/2014
152
155
152
155
157
152
157
165
162
178
183
178
50
61.5
54.5
57.5
63.5
59
61
72
66
72
84
82
12
Genera un modelo
con un nombre
por defecto
RegModel.1
Fit models
Linear Model
Name Y
Name X
Models
Fit models
Hypothesis tests
Anova table: Genera la tabla ANOVA
Graphics: grficos de diagnstico
17/06/2014
13
Resultados
RegModel.1 <- lm(Y~X, data=EjRegresion)
> summary(RegModel.1)
Call:
lm(formula = Y ~ X, data = EjRegresion)
Residuals:
Min 1Q Median 3Q Max
-6.987 -1.632 0.785 2.611 4.292
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -75.4427 16.4950 -4.574 0.00102 **
X
0.8676 0.1015 8.548 6.56e-06 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.81 on 10 degrees of freedom
Multiple R-squared: 0.8796,
Adjusted R-squared: 0.8676
F-statistic: 73.08 on 1 and 10 DF, p-value: 6.557e-06
17/06/2014
14
17/06/2014
15
Normal Q-Q
10
60
65
70
75
0.0
1.0
-1.0
-2.0
Standardized residuals
0
-8 -6 -4 -2
Residuals
80
1
10
-1.5
Fitted values
1.5
1.0
1.5
Residuals vs Leverage
10
1
0
-1
0.5
1.0
0.5
12
0.5
1
-2
Standardized residuals
Cook's distance 10
0.0
Standardized residuals
0.5
Theoretical Quantiles
Scale-Location
60
65
70
75
80
Fitted values
17/06/2014
-0.5 0.0
0.0
0.1
0.2
0.3
0.4
Leverage
16
17/06/2014
17
Modelo
yi = b0 + b1x1i + b2x2i + . . . bkxki + i
b0 es el intercepto
b1 a bk son k parmetros de pendiente
es el trmino de error o residual
17/06/2014
18
Bondad de ajuste
2
R
17/06/2014
19