CE731Aula1 RegressaoMultipla
CE731Aula1 RegressaoMultipla
CE731Aula1 RegressaoMultipla
Ementa
Método de Mínimos Quadrados Ordinários
Análise de Variabilidade
Inferência para os Coeficientes
Bibliografia
Gori Maia, A. 2017. Econometria: Conceitos e Aplicações. Caps. 1-8.
Wooldridge, J. M. 2001. Introductory Econometrics. Caps. 1-5. 1
Função de Regressão Populacional
Seja a relação entre Y e X na população:
Yi = a + bXi + ei Modelo de
Y ou Regressão Linear
Simples para Y na
Yi
E(Y/Xi) = a + bXi população
ei Onde:
E(Y/Xi) Y é a variável dependente ou regressando
X é a variável independente ou regressor
a é o intercepto ou constante do modelo
Xi b é o coeficiente angular do modelo
X
Erro de previsão:
Seja Xi a i-ésima observação de X, teremos:
Yi é o valor observado em Y para o i-ésimo valor de X
2
E(Y/Xi) é a esperança condicional de Y e representa o valor esperado de Y
para o i-ésimo valor de X
ei é o erro, ou variação de Yi não explicada pelo modelo
Função de Regressão Amostral
A relação entre Y e X estimada na amostra será dada por:
i =1 i =1
MQO – Notação Matricial
• Obtém os estimadores da função de regressão de tal forma
que os erros sejam mínimos ;
Seja a função: Yi = a + b1 X1 + b 2 X 2 + ... + b k X k + ei
E a equivalente matricial: y = Xβ + e
X1 X2
^ ^
b0 + b1 X
Regressão Amostral
#1 6
X
Amostra Aleatória #1 ( ) X
Amostra Aleatória #2 ( )
Teste t
• Estima a significância de cada coeficiente do modelo, ou seja, qual a
probabilidade de erro (p) se afirmarmos que a j-ésima variável
independente contribui isoladamente para explicar a variabilidade
da variável dependente (rejeitar H0).
Onde:
Dado o modelo: Y = a + b1 X1 + ... + b k X k + e Sβˆ2 = ( XT X) -1sˆ 2
ìï H 0 : b j = 0 t = bˆ j Sbˆ p/2 e:
p/2 y T y - βˆ T XT y
E as hipóteses: í j
sˆ =
2
ïî H1 : b j ¹ 0 t n - (k + 1)
Rejeitar b1=0 e b2=0 Rejeitar apenas b2=0 Rejeitar apenas b1=0 Não Rejeitar b1=0 e b2=0
Y Y Y Y
X1 X2 X1
X2
X1 X2 X1 X2
Variabilidade
Variabilidade total de X2
total de X1 8
Efeito conjunto de X1
e X2 sobre Y
Soma dos Quadrados
• Permitem estimar a qualidade Y
STQ
do ajuste; n
STQ = å (Yi - Y ) 2 = y T y - nY 2
• Bons modelos implicam i =1
X1 X2
variabilidade relativamente
baixa dos resíduos (SQRes) e
variabilidade relativamente alta
do ajuste de regressão (SQReg); SQReg = n (Yˆ - Y ) 2 = βˆ T XT y - nY 2 Y
å
i =1
i
SQReg
Y X1 X2
Y n Y
SQRes = å (Yi - Yˆi ) 2 = y T y - βˆ T XT y SQRes
i =1
^ X1 X2 9
Y
X
Coeficiente de Determinação
• Estima a proporção da variabilidade da variável dependente Y
que é explicada pelo conjunto das k variáveis independentes
do modelo de regressão X.
Y
SQ Re g SQ Re s
R2 = = 1-
STQ STQ X1 X2
Escala de R2:
Y Y Y Y
X1 X2 X1
X2
X1 X2 X1 X2
Fonte gl SQ QM F p
SQReg QMReg
Regressão k βˆ T XT y - nY 2 valor p
k QMRes
SQRes
Resíduos n-(k+1) y T y - βˆ T XT y n - (k + 1)
Total n -1 y T y - nY 2 12
Exemplo Aplicado no R
1) O arquivo Data_TravelCosts.csv contém informações sobre
o custo de viagem de vários municípios brasileiros ao
Parque Nacional da Serra Geral (referência: MAIA, A. G. ,
ROMEIRO, A. Validade e confiabilidade do método de custo
de viagem: um estudo aplicado ao Parque Nacional da Serra
Geral. Revista de Economia Aplicada, v. 12, p. 103-123,
2008):
a) Analise os coeficientes da regressão para a taxa de visitação
como uma função linear simples do custo de viagem;
b) Analise a significância do modelo e dos coeficientes;
c) Adicione variáveis explicativas adicionais e análise suas
relações com a taxa de visitação;
d) Compare a qualidade dos ajustes dos modelos lineares sem (a)
e com controles (c); 13