Aula Regressao
Aula Regressao
Aula Regressao
3) Independência
Os valores de Y são estatisticamente independentes.
4) Homocedasticidade
A variância de Y é igual, qq que seja X.
Modelos de Regressão
Modelos de Regressão
Yi 0 1 X i i
onde:
Yi é o valor da variável dependente na i-ésima observação;
0 e 1 são parâmetros;
Xi é uma constante conhecida; é o valor da variável independente
na i-ésima observação;
i é um termo de erro aleatório com média zero e variância
constante 2 (E(i)=0 e 2 (i)= 2 )
i e j são não correlacionados (independentes) para i j
(2 (i,j)= 0 )
Modelo de Regressão Linear
InterceptoInclinação
Populacional Variável
Populacional
Independente
Variável
Dependente Yi=0+1Xi +i Erro
Aleatóri
o
Yi
Y i Y = E(Y) = 0 + 1 X
1 Coeficiente
angular Ŷi=b0+b1Xi Modelo estimado
0 i =Yi-Ŷi Resíduo
X
Significado de 0 e 1
Os parâmetros 0 e 1 são denominados coeficientes de regressão.
• 1 é a inclinação da reta de regressão. Ela indica a mudança na
média de Y quando X é acrescido de uma unidade.
• 0 é o intercepto em Y da equação de regressão (é o valor de Y
quando X = 0.
0 só tem significado se o modelo incluir X = 0.
E[Yi ] Xi
Y 0 1
1
0
0
X
Regressão Linear Múltipla
n
Q [Yi 0 1 X i ]2
i 1
Estimação
A soma dos quadrados dos desvios (єi) é dada por:
n n
(ε
i 1
i
2
) (Ŷi β̂0 β̂1Xi)
i 1
( X X )(Y Y )
i i
ˆ 0 Y ˆ 1 X ̂ 1 i 1
n
(
i 1
Xi X ) 2
Inferência
0,08
H 0 : ˆ 1 0 0,06
t
* b1
0,04 1a
s (b1 )
Ha : ˆ 1 0 0,02
a/2 a/2
0
0 - 5
-t1-a/2;n-2 10
0 t1-a/2;n-2 15 +
Se ˆ 1= 0 , Y e X são não correlacionados
Rejeitar H 0 que o modelo que inclui X é melhor do
que o modelo que não inclui X mesmo que a linha reta
não não seja a relação mais apropriada.
Inferência
H0 : 0 0
H1 : 0 0
n n n
(Y
i 1
i Y ) 2
(Y
i 1
ˆi Y ) (Yi Yˆ ) 2
2
i 1
(Y
i 1
i Y ) (Y
i 1
ˆi Y ) 2 (Yi Yˆ ) 2
i 1
SQM
SQT
Coeficiente de determinação
Uma medida do efeito de X em reduzir a variabilidade do Y é:
SQM SQT - SQR SQR Note que: 0 R2 1
R2 1
SQT SQT SQT
H 0 : ˆ 1 ˆ2 ...ˆk 0
▪ Teste do F parcial
H 0 : ˆ * 0
Modelo Y=0+1X1+...pXp+*X*
Fpc(x*/x1,x2,...xp) ~ F 1,n-(p+1)-1
Tabela ANOVA - F
Graus de Soma dos Quadrado Razão da
Liberdade quadrados médio variância
(df) (SQ) SQM=SQ/df
Total 29 SQT =
14787.46
R
2
R 0.43 F F
SST 14787.46 SSR /(n k 1) (1 R 2 /(n k 1)
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:
X
Não Linearidade
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:
X
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:
X
Erros Correlacionados
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:
A presença de outliers
0,8
Resíduos Padronizados
0,6
0,4
0,2
0
150 155 160 165 170 175 180 185
-0,2
-0,4
X
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:
0
Resíduo
X
Análise de Resíduos