Econometria Cap10 Multicolinearidade

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 11

Multicolinearidade

Econometria
Alexandre Gori Maia

Ementa:
• Definição;
• Fator Inflacionário da Variância;
• Identificação: Estatística Conflitantes e Ajsute entre Regressores;
• Medidas Paliativas;

Bibliografia Básica:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 10.
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Conceito
Seja o modelo definido por: Y = a + b1 X1i + b 2 X 2i + ei
Variabilidade de Variabilidade Se X1 e X2 são independentes, a
Y explicada por de Y explicada variabilidade de Y explicada pelo modelo
X1 (SQReg1) Variabilidade por X2 de RLM divide-se em duas partes
total de Y (SQReg 2)
disjuntas: o efeito isolado de X1 (SQReg1)
e o efeito isolado de X2 (SQReg2).
Variabilidade Teríamos ainda os mesmos coeficientes
Variabilidade total de X2 angulares das regressões simples:
total de X1
Y = a1 + b1 X1i + e1i SQ Re g1
Y = a 2 + b 2 X 2i + e2i SQ Re g2
Variabilidade No outro extremo, poderíamos ter uma
total de Y relação linear exata entre X1 e X2 (perfeita
colinearidade), ou seja:
Efeito
conjunto de X1i = l2 X 2i
Variabilidade X1 e X2 Nesta situação, seria impossível estimar
X
conjunta1de X1 sobre Y
e X2 os efeitos isolados de X1 e X2 sobre Y.
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Conceito
Seja o modelo definido por: Y = a + b1 X1i + b 2 X 2i + ei
Frequentemente observamos relação entre
Efeito Efeito
Variabilidade
isolado de isolado de as variáveis independentes X1 e X2 e,
total de Y
X1 em Y X2 em Y nesses casos, oefeito sobre Y poderá ser
dividido em 3 partes: i) efeito isolado de
X1; ii) isolado de X2; e iii) efeito conjunto
Variabilidade de X1 e X2.
Variabilidade total de X2
total de X1 O problema é que quando há uma forte
relação linear entre X1 e X2
Efeito conjunto de (multicolinearidade) pode ficar muito
X1 e X2 sobre Y difícil identificar os efeitos isolados de X1
Efeito
Efeito
isolado de e X2 sobre Y. Ou seja, a maior parcela da
X1 em Y Variabilidade isolado de
total de Y X2 em Y variabilidade de Y é explicada pelo efeito
conjunto de X1 e X2.

Efeito
Algebricamente, essa relação de
conjunto de multicolinearidade seria dada por:
X1 X2
X1 e X2 X1i = l2 X 2i + vi
sobre Y
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Definição
Colinearidade Perfeita
Duas variáveis são ditas perfeitamente colineares quando há uma relação linear
exata entre essas. De maneira genérica, podemos representar a linearidade perfeita
por: X j = l1 X 1 + l2 X 2 + ... + lk X k
i i i i

Multicolinearidade
Há multicolinearidade em um modelo de regressão múltipla quando duas ou mais
variáveis independentes são fortemente relacionadas linearmente entre si. Nesse
caso, teríamos: X j = l1 X 1 + l2 X 2 + ... + lk X k + vi
i i i i

Conseqüências da Multicolinearidade
A existência de uma colinearidade exata entre duas ou mais variáveis
independentes torna impossível a obtenção dos coeficientes dos parâmetros por
MQO. Por sua vez, na presença de multicolinearidade os estimadores de MQO
continuam sendo os MELNV. O problema é que a multicolinearidade torna muitas
vezes as estimativas dos coeficientes dos parâmetros (b’s) insignificantes, já que
cada um pressupõe, por definição, a variação em Y dada uma variação unitária em
X, mantendo-se constantes as demais informações. Ou seja, se duas variáveis
independentes são fortemente correlacionadas, será muito difícil haver variação em
uma sem que haja em outra.
Definição FIV Identificação Medidas Paliativas

Fator Inflacionário da Variância


O vetor de variância e covariância dos estimadores será dada por:
Var (βˆ ) = ( XT X) -1s 2
Var ( bˆ j )
E a variância de cada estimador !j será
dada por:

ˆ s2 s2 1 s2
Var( b j ) = n 2 = = FIV j
åi =1 x ji (1 - R j ) åi =1 x ji å
2 n 2 (1 - R 2 ) n 2
j x
i =1 ji

Onde R2j é o coeficiente de determinação do ajuste:


R 2j
X ji = l0 + l1 X1i + ... + lk -1 X ki + vi

Fator Inflacionário da Variância - FIV


Representa o quanto a variância de b^j está sendo inflacionada pela relação de
multcolinearidade entre Xj e as demais variáveis independentes. Quando não houver relação
entre as variáveis independentes (R2j =0) o FIVj será igual a 1 e, à medida que aproximamo-
nos de uma relação exata (R2j =1), o FIVj tenderá a infinito.
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Identificação
Alguns sinais de multicolinearidade:
Conflito entre estatísticas R2 e F do modelo e testes t para os parâmetros b: as
estatísticas R2 e F podem indicar um modelo significativo, enquanto os testes t dos
parâmetros b´s seriam insignificantes.
Y = a + b1 X1i + b 2 X 2i + ei H 0 : b1 = b 2 = 0 X H 0 : b1 = 0 e H 0 : b 2 = 0

Ajuste linear significativo entre as variáveis independentes: uma das variáveis


independentes apresentaria forte relação de linearidade com as demais.
X ji = l0 + l1 X1i + ... + lk -1 X ki + vi R2j

Fator Inflacionário da Variância: medida de inflacionamento da variância


devido à multicolinearidade.
R 2j FIV j
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Exemplo
Sejam as informações sobre emissões de CO2, PIB e população de 8 países:
CO2 1.5 8.7 2.8 9.4 4.4 8.4 3.2 0.9
PIB 13.2 197.0 128.6 286.4 72.6 167.8 114.4 58.0
Pop 3.2 35.5 19.1 40.4 3.1 22.3 8.4 9.0

As estimativas de MQO para o modelo linear são:


CO2 = β0 + β1 PIB + β2 Pop + e CO2 = 0,472 + 0,030PIB + 0,028 Pop + eˆ
Os resultados da tabela ANOVA:
Fonte gl SQ QM F p CO2
Regressão 2 63.9 31.9 8.80 0.023
Resíduos 5 18.2 3.6
Total 7 82.0 PIB Pop

E os testes t para os coeficientes:


Embora o ajuste seja significativo no
Variável b^ Sb^ t p
conjunto (teste F), as contribuições
Intercepto 0.472 1.328 0.356 0.737 marginais de cada variável são
PIB 0.030 0.025 1.226 0.275 insignificantes. Resultados que sugerem
Pop 0.028 0.150 0.183 0.862 a presença de multicolinearidade.
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Exemplo
Para nos certificarmos da presença de multicolinearidade, relacionamos os
regressores PIB e Pop:
O ajuste de MQO forneceu os seguintes resultados para a relação entre os regressores:

PIB = l0 + l1 Pop + v PIB = 29,2 + 5,7 Pop + vˆ

Os resultados da tabela ANOVA:


Fonte gl SQ QM F p
Regression 1 46.871,2 46.871,2 47,88 0,0005 PIB Pop
Residual 6 5.873,5 978,9
Total 7 52.744,6

2
RPIB = 0,889
Podemos ainda calcular o FIV por:
1 1 Há multicolinearidade nos regressores, o que
FIV = = = 8,98
2
(1 - R j ) (1 - 0,889) estaria dificultando a identificação dos impactos
isolados dos regressores. O FIV é 9 vezes
superior ao que seria na ausência de relação
entre os regressores.
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Correção
Alguma medidas paliativas na presença de multicolinearidade:
Aumentar o tamanho da amostra: aumentando o tamanho da amostra estaremos
aumentando a variabilidade de Xj e, consequentemente, reduzindo a variância do
estimador de bj. 2
s
Y = a + b1 X1i + b 2 X 2i + ei Var ( bˆ j ) = FIV j
å
n 2
x
i =1 ji

Tranformar as variáveis: a multicolinearidade pode ser eliminada a partir de


funções das variáveis independentes.
Y = a + b1 X1i + b 2 X 2i + ei Y = d 0 + d 0 Zi + ui onde Zi = f ( X1i , X 2i )
Omitir regressor que apresentar alta colinearidade com os demais: uma
solução simples, mas perigosa, é excluir uma ou mais variáveis que apresentam
multicolinearidade. A exclusão de variáveis essenciais para compreensão do
problema pode, entretanto, gerar viés de omissão.
Y = a + b1 X1i + b 2 X 2i + ei Y = a + b1 X1i + ei
Definição FIV Identificação Medidas Paliativas

Correção Multicolinearidade - Exemplo


Sejam as informações sobre emissões de CO2, PIB e população de 8 países:
O ajuste de MQO nos forneceu os seguintes resultados :
CO2 = β0 + β1 PIB + β2 Pop + e CO2 = 0,472 + 0,030PIB + 0,028 Pop + eˆ
Como havia multicolinearidade e os coeficientes eram insignificantes estatisticamente,
podemos propor um novo ajuste:
CO2 PIB CO2 PIB
= d0 + d1 +v = -0,123 + 0,058 + vˆ
Pop Pop Pop Pop
Os resultados da ANOVA seriam: CO2/
Fonte gl SQ QM F p Pop
Regressão 1 0,96 0,96 20,1 0,004
R 2 = 0,77
Resíduos 6 0,29 0,05
PIB/
Total 7 1,25 Pop

O ajuste é significativo. Como se trata de um modelo de RLS, a significância do


teste t será igual à da estatística F.
Definição FIV Identificação Medidas Paliativas

Correção Multicolinearidade - Exemplo


Sejam as informações sobre emissões de CO2, PIB e população de 8 países:
O ajuste de MQO nos forneceu os seguintes resultados :
CO2 = β0 + β1 PIB + β2 Pop + e CO2 = 0,472 + 0,030PIB + 0,028 Pop + eˆ
Uma solução para eliminar a multicolinearidade seria excluir um dos regressores:

CO2 = β0 + β1 PIB + e CO2 = 0,401 + 0,035PIB + eˆ

Os resultados da ANOVA seriam:


CO2
Fonte gl SQ QM F p
Regressão 1 63,77 63,77 20,93 0,004
Resíduos 6 18,28 3,05
Total 7 82,05 PIB

As estimativas dos dois modelos para a variável PIB diferem apenas apenas
ligeiramente. E a relação entre CO2 e PIB passou a ser significativa. Neste caso, a
omissão parece não ter ocasionado um viés de omissão muito grave.
Mas a exclusão de variáveis deve ser analisada com muita cautela!

Você também pode gostar