Econometria 2
Econometria 2
Econometria 2
Econometria
UNIDADE 2 - TEORIA DA CORRELAÇÃO E
REGRESSÃO LINEAR SIMPLES
Autoria: José Tadeu de Almeida – Revisão técnica: Jorge Lisandro Maia Ussan
Introdução
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0gJ… 1/23
23/05/2022 19:25 Econometria
2.1 Correlação
linear
Nesta seção, recordaremos alguns elementos de estatística descritiva que enfatizam o grau de
associação entre variáveis. Utilizando conceitos relacionados à correlação linear e à
covariância, torna-se possível verificar de que modo a trajetória, isto é, a variação de uma
variável dependente, é capaz de ser afetada pelo desenvolvimento de uma variável
independente.
Nessa linha de raciocínio, compreenderemos as aplicações práticas dessa associação entre
variáveis, recorrendo, em particular, ao coeficiente de correlação, o qual exibe, por meio de um
valor real e compreendido em um determinado intervalo, o grau de associação entre variáveis.
Acompanhe!
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0gJ… 2/23
23/05/2022 19:25 Econometria
Caso
Um exemplo de análise bidimensional ocorre quando um
professor procura associar, individualmente, o número de
exercícios resolvidos pelos alunos às notas obtidas por eles em
uma prova. Nesse caso, tomam-se observações relativas a cada
aluno, dispondo os resultados dessas variáveis. É possível que
os alunos que resolveram mais exercícios sejam encontrados
entre aqueles que obtiveram as melhores notas?
Há diferentes respostas em uma situação como essa, em que as
variáveis são “exercícios resolvidos” e “notas obtidas”, aluno por
aluno. Vejamos duas respostas: tomando a hipótese do senso
comum, espera-se que os alunos que fizeram mais exercícios
tenham melhores notas. Mas, eventualmente, um aluno que
respondeu a poucos exercícios pode ser beneficiado se a prova
cobrou exatamente o conteúdo que ele havia respondido, por
exemplo. Assim, para entender se essa relação entre variáveis é
válida, será necessário calcular o coeficiente de correlação.
Naturalmente, é possível compreender a associação entre variáveis por meio de uma análise
gráfica. Na medida das possibilidades, a análise gráfica destaca uma eventual correlação entre
variáveis, mas que não pode ser presumida em termos mais precisos.
Como referência, suponha que um professor de uma disciplina de Econometria distribuiu para
seus 60 alunos, como base para a aplicação de uma prova, uma lista com 300 exercícios. O
aluno que conseguiu resolver menos exercícios foi aquele que respondeu a apenas 20
questões, enquanto o aluno com o melhor desempenho na lista conseguiu resolver 280
perguntas. Para entender a relação entre essa resolução de problemas e a nota na prova,
observe a figura a seguir.
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0gJ… 3/23
23/05/2022 19:25 Econometria
#PraCegoVer: na figura, consta um gráfico que apresenta uma relação entre o número de
exercícios resolvidos pelos alunos, no eixo horizontal, e as notas obtidas por eles, no eixo
vertical. Há uma nuvem de pontos que apontam uma tendência crescente, demonstrando que
aqueles que fizeram mais exercícios apresentaram melhor desempenho por meio de melhores
notas.
Você o conhece?
Karl Pearson (1857-1936) foi um estatístico inglês que
contribuiu para o desenvolvimento dessa disciplina por meio
dos processos de regressão linear e da criação de
indicadores de correlação e de estatísticas de significância,
como a estatística qui-quadrado ( ) (DOANE; SEWARD,
2014).
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0gJ… 4/23
23/05/2022 19:25 Econometria
O coeficiente de correlação entre duas variáveis (X,Y) pode ser obtido de acordo com a
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0gJ… 5/23
23/05/2022 19:25 Econometria
Esses valores demonstram o afastamento dos valores da variável em relação à sua média.
Ao somar os desvios médios, a soma será igual a zero.
Contudo, a fórmula da covariância não necessariamente será igual a zero, pois calcula-se,
na verdade, o somatório entre os produtos de cada desvio médio:
estatística deve ser comparada com a estatística padronizada com ( ) graus de liberdade,
de acordo com a distribuição t de Student. Nesse caso, se superar o valor crítico da
estatística t, é correto rejeitar a hipótese nula ao nível de significância . Caso a hipótese nula
for rejeitada, é coerente concluir que existe, de fato, uma relação significativa entre as variáveis.
Por exemplo, suponhamos que um estudante de Economia decidiu entender a dinâmica do
crescimento econômico e do desemprego em uma determinada região. Para isso, ele mediu a
variação percentual do produto interno bruto (PIB), como variável dependente (Y), e a variação
percentual da taxa de desemprego, como variável independente (X), ao longo de seis anos,
gerando o quadro a seguir.
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0gJ… 6/23
23/05/2022 19:25 Econometria
#PraCegoVer: quadro composto por três colunas, apresentando dados relativos a um caso
hipotético. Na primeira coluna, à esquerda, constam os anos de 1 a 6; na coluna central, é
destacada a variação percentual de crescimento da economia, considerando cada um desses
anos; e na coluna à direita, apresenta-se a variação da taxa de desemprego também para os
anos 1 a 6.
Essa relação específica é analisada pela Lei de Okun, que demonstra uma ligação negativa e
inversamente proporcional entre crescimento econômico e desemprego (BLANCHARD, 2017).
Você o conhece?
Arthur Melvin Okun (1928-1980) foi um economista norte-
americano que atuou junto ao governo dos Estados Unidos
e desenvolveu vários estudos na área da macroeconomia,
como a análise entre desemprego e crescimento econômico
que leva o seu nome, a Lei de Okun (BLANCHARD, 2017).
Graficamente, pode-se observar uma relação decrescente entre essas variáveis, isto é, o
desemprego varia positivamente à medida que a economia sofre retração (havendo queda
percentual na variação do PIB), como apresentado na figura a seguir.
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0gJ… 7/23
23/05/2022 19:25 Econometria
A partir da situação apresentada, é possível questionar: ocorre alguma relação direta entre a
variação do desemprego e a variação do PIB? Deve-se testar a significância dessa correlação
ao nível de 5%. Assim, ao calcular a média de X e Y, observa-se que e que
. Consequentemente, pode-se obter a covariância entre as variáveis X e Y mediante a equação:
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0gJ… 8/23
23/05/2022 19:25 Econometria
a) 0,78.
b) 0,55.
c) 0,22.
d) -0,22.
e) -0,78.
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0gJ… 9/23
23/05/2022 19:25 Econometria
Verificar
Por fim, de acordo com Maia (2017), a correlação também não é capaz de demonstrar alguns
aspectos básicos que são relacionados à distribuição dos dados amostrais, por exemplo: se há
uma variação absoluta em X, qual a variação que deve ocorrer em Y? E, da mesma forma, se
há um valor fixo em X, qual o valor esperado para a variável Y?
Para superar essas limitações e obter uma ferramenta eficiente de estimação de uma dispersão
ou de variabilidade de um conjunto de dados, é conveniente recorrer a um procedimento de
regressão linear, assunto que veremos na próxima seção!
Vamos Praticar!
É importante que você conheça as aplicações práticas e sociais dos
métodos de amostragem e da análise de variáveis. Assim, pesquise
de modo mais aprofundado a respeito dos métodos de coleta de
amostras populacionais do Censo Demográfico do Instituto
Brasileiro de Geografia e Estatística (IBGE). Para isso, leia o Tópico
11.2 do livro Metodologia do Censo Demográfico 2010, do IBGE
(2016), denominado “Amostragem”, elaborando um breve resumo,
com cerca de 20 linhas, sobre os métodos estatísticos
apresentados.
O conceito de regressão foi criado no final do século XIX pelo matemático e antropólogo
Francis Galton (1822-1911). Esse pesquisador analisou uma possível relação entre a altura
média dos pais e a dos filhos adultos em uma família. Ao realizar uma coleta de dados
amostrais, ele obteve duas informações importantes (e razoavelmente esperadas) (MAIA,
2017):
os pais que tinham maior estatura no grupo amostral apresentavam filhos mais altos;
os filhos de pais com maior estatura não são tão altos quanto seus pais;
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 10/23
23/05/2022 19:25 Econometria
os filhos de pais com menor estatura também não são tão baixos quanto seus pais.
Ou seja, a altura média dos filhos regredia à altura média da população, isto é, apresentava
uma tendência de convergir para uma estatura média. Essa é a base histórica do conceito de
regressão, que discutiremos com mais profundidade ao longo deste tópico.
Você sabia?
Observe que uma variável dependente, de acordo com seu
próprio nome, desenvolve-se em função dos dados de outra
variável. Não ocorre, no entanto, uma relação direta de
causa e efeito entre essas variáveis, tal como se a variável
dependente fosse apenas um resultado relativo às variáveis
independentes.
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 11/23
23/05/2022 19:25 Econometria
Setor privado
Suponhamos, por exemplo, a existência de duas variáveis, a saber, uma variável dependente
expressa por Y e uma variável independente expressa por X. A relação estabelecida entre elas
é dada pela equação . Assim, para um conjunto de dados da variável independente
dada por , também haverá um conjunto de valores distintos no conjunto
. Esses valores podem ser apresentados em uma reta, pois a relação de
determinação entre as variáveis é absoluta, de acordo com a figura a seguir.
#PraCegoVer: gráfico apresentando uma linha reta que une diversos pontos de acordo com a
equação . Nesse caso, quando X é igual a 2, Y é igual a 8, e assim por diante.
Contudo, há situações — que compõem a maioria dos casos — em que a variável dependente
se torna diretamente influenciada por diferentes elementos ligados à variável independente.
Esses elementos são conhecidos como exógenos, e geram uma diferença entre valores reais e
esperados, denominados resíduos ou erros. Esses resíduos são capazes de afetar os
resultados previstos pelo modelo de regressão linear (GUJARATI, 2011).
Por fim, deve-se considerar que o modelo de regressão linear simples é definido por alguns
pressupostos, apresentados a seguir (HOFFMANN, 2016).
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 12/23
23/05/2022 19:25 Econometria
Pressuposto 3
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 13/23
23/05/2022 19:25 Econometria
Pressuposto 4
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 14/23
23/05/2022 19:25 Econometria
Entretanto, é necessário observar que o modelo econométrico gera uma tendência, isto é, uma
estimação dos valores esperados da variável dependente. Porém, pode haver outros fatores,
não explicados pelo modelo (ou seja, que são exógenos ou externos ao modelo), que podem
gerar uma variação real dos dados dessa variável.
Nesse caso, haverá uma discrepância entre os valores estimados e os valores reais ,
gerando um erro amostral também conhecido como resíduo ou desvio. Esse erro é criado
aleatoriamente (isto é, por fatores exógenos) e é dado por . Logo, uma formalização mais
adequada de um modelo econométrico é expressa do seguinte modo:
(MAIA, 2017).
Para observar a relação entre valores previstos e residuais em um modelo, vamos retomar o
exemplo do início desta unidade, o qual efetuava uma associação entre o número de exercícios
respondidos por um grupo de alunos (em uma lista com 300 questões) e as respectivas notas
nas avaliações. Trazendo agora a base de dados relativa à criação do gráfico de dispersão
observado anteriormente, pode-se elaborar o quadro a seguir.
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 15/23
23/05/2022 19:25 Econometria
#PraCegoVer: quadro composto por oito colunas, apresentando as notas individuais dos alunos
mencionados no exemplo anterior sobre a lista de exercícios de estatística e o número de
exercícios resolvidos por eles. O aluno com o pior desempenho elaborou 20 exercícios e teve
nota 0,5 na prova, e o aluno com o melhor desempenho elaborou 280 exercícios e obteve nota
9,9.
No quadro, você pôde verificar que 60 alunos realizaram a lista de exercícios, de modo que se
espera uma variação da nota Y a cada variação do número X de exercícios resolvidos.
Recorrendo ao cálculo dos coeficientes linear e angular, de acordo com Hoffmann (2016), para
uma média igual a 154, e uma média igual a 5,5, tem-se o seguinte:
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 16/23
23/05/2022 19:25 Econometria
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 17/23
23/05/2022 19:25 Econometria
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 18/23
23/05/2022 19:25 Econometria
#PraCegoVer: gráfico destacando as notas estimadas para cada aluno, conforme o modelo
econométrico gerado nesse exercício. As notas estão dispostas em uma reta, denominada reta
de regressão.
Observe que, nesse caso, há uma relação perfeitamente linear entre as variáveis independente
e dependente, supondo que há uma associação perfeita entre essas variáveis, isto é, uma
ausência de resíduos no modelo. Contudo, esses resíduos existem e determinam variações
importantes entre os valores estimados e reais. Para compreendê-los, vamos tomar quatro
exemplos como referência, focando nos alunos que responderam a 20, 114, 180 e 250
exercícios, observando suas notas reais e o desemprenho esperado para cada um deles.
Assim, considere a figura a seguir.
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 19/23
23/05/2022 19:25 Econometria
Observe, apenas nesses quatro casos, as discrepâncias entre valores estimados e valores
reais. Nesse caso, o resíduo , isto é, o primeiro resíduo apresentado à esquerda no gráfico, é
igual a , enquanto os outros resíduos são, respectivamente, 2,31, -3,51 e -6,54.
Assim, em resumo, a figura a seguir apresenta a relação existente entre valores reais e
esperados no modelo econométrico enfocado nesta unidade.
#PraCegoVer: gráfico apresentando duas séries de dados, sobrepondo a nuvem de dados que
foi apresentada na Figura 1, com as notas reais dos alunos, e os dados da reta de regressão da
Figura 4.
A sobreposição de dados relativos aos valores reais e do modelo econométrico gerado a partir
desses dados permite observar as tendências de dispersão dessas séries: enquanto o modelo
econométrico é perfeitamente linear, os dados reais apontam para uma tendência de dispersão.
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 20/23
23/05/2022 19:25 Econometria
a) I e IV.
b) II e III.
c) II e IV.
d) I, II e III.
e) I, III e IV.
Verificar
Com base nessa situação, há alunos que deveriam ter obtido uma nota baixa, mas que tiveram
bom desempenho, ao mesmo tempo em que outros com uma boa performance na resolução da
lista obtiveram notas baixas. Como mencionado anteriormente, tais situações podem ser
atribuídas a diferentes fatores: o aluno pode ter ficado nervoso, os exercícios da prova não
corresponderam aos exercícios elaborados na lista, o aluno inverteu algum sinal na resolução,
entre outras possibilidades. Esses fatores, na verdade, constituem-se como elementos
exógenos os quais o modelo foi incapaz de captar. Assim, para verificar a eficiência explicativa
do modelo, será preciso recorrer a um outro cálculo, relativo ao coeficiente de determinação (
).
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 21/23
23/05/2022 19:25 Econometria
Vamos Praticar!
Vamos pensar em uma experiência prática de regressão ligada
à sua vida pessoal: selecione seis pares de pais (ou mães) e
seus filhos, tomando a altura de cada um deles. Assim, você
terá seis pares ordenados etc. A
partir desses dados, elabore uma regressão linear, verificando
de que modo a variação da altura P dos pais determina a
variação da altura F dos filhos.
Conclusão
A análise de variáveis implica a criação de coeficientes que permitem
entender a intensidade da relação entre diferentes grupos amostrais.
Assim, por meio do coeficiente de correlação e da regressão linear
simples, por exemplo, é possível compreender e avaliar a associação
de diferentes variáveis, apreendendo tendências de distribuição e a
existência de erros amostrais que dizem respeito às diferenças entre
valores reais e estimados.
Nesta unidade, você teve a oportunidade de:
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 22/23
23/05/2022 19:25 Econometria
Referências
BLANCHARD, O. Macroeconomia. 7. ed. São Paulo:
Pearson, 2017.
BUSSAB, W. O.; MORETTIN, P. Estatística básica. 7. ed.
São Paulo: Saraiva, 2017.
DOANE, D.; SEWARD, L. Estatística aplicada à administração e economia. Porto
Alegre: AMGH, 2014.
FIGUEIREDO FILHO, D. B.; SILVA JÚNIOR, J. A. Desvendando os mistérios do
coeficiente de correlação de Pearson (r). Revista Política Hoje, Recife, v. 18, n. 1, p.
115-146, 2009. Disponível em:
https://periodicos.ufpe.br/revistas/politicahoje/article/viewFile/3852/3156
(https://periodicos.ufpe.br/revistas/politicahoje/article/viewFile/3852/3156). Acesso
em: 24 jan. 2021.
GUJARATI, D. N. Econometria básica. 5. ed. Porto Alegre: Bookman, 2011.
HOFFMANN, R. Análise de regressão: uma introdução à econometria. Piracicaba:
Edição do Autor, 2016.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE). Metodologia do
Censo Demográfico 2010. 2. ed. Rio de Janeiro: IBGE, 2016.
MAIA, A. G. Econometria: conceitos e aplicações: aprenda os fundamentos da análise
econométrica e resolva problemas econômicos concretos. São Paulo: Saint Paul,
2017.
VARIÂNCIA e desvio padrão. [S. l.: s. n.], 2018. 1 vídeo (9 min). Publicado pelo canal
Portal da Matemática OBMEP. Disponível em: https://www.youtube.com/watch?
v=c8x_ZChTiLk (https://www.youtube.com/watch?v=c8x_ZChTiLk). Acesso em: 9
fev. 2021.
WOOLDRIDGE, J. M. Introdução à econometria: uma abordagem moderna. 6. ed.
São Paulo: Cengage Learning, 2017.
https://student.ulife.com.br/ContentPlayer/Index?lc=aSssD5bAQpXJMlZjGXTVTQ%3d%3d&l=FrBZdOIAG8p3VktncyRfoA%3d%3d&cd=9MZ0g… 23/23