Regressão Linear Simples
Regressão Linear Simples
Regressão Linear Simples
Simples Múltipla
Não- Não-
Linear Linear
Linear Linear
1
Modelo de Regressão Linear
População Amostra
Aleatória
Yi b0 b1X i i
Relacionamento
desconhecido
Y 0 1X
2
Modelo de Regressão Linear para a
Amostra
Y Yi b0 b1X i ei
i = erro aleatório
observação
não-
Yi b0 b1X i amostrada
X
valor observado
na amostra
Análise Exploratória
Representação Gráfica
Y
60
40
20
0
X
0 20 40 60
3
Mínimos Quadrados Ordinários: MQO
Yi 0 1 X i i i 1,..,n
Yi ( 0 1 X i )
e3
5,5
4,5
e1
VALOR
3,5
e2
2,5
e5
1,5
2 6 10 14 18 22
IDADE
4
Estimadores de mínimos quadrados
Os valores de 0 e 1 que minimizam o critério Q podem ser obtidos diferenciando-se (10) em
relação a 0 e 1 , portanto, obtemos:
n
Q
0
2 (Yi 0 1 X i )
i 1
n
Q
1
2 X i (Yi 0 1 X i )
i 1
b1 (i X X i) 2
( X X )(Y Y )
i
b0 n Yi b1 X i Y b1 X
1
XY
X Y
n
b1
X
2
2 X
n
5
Coeficientes das Equações
i 1
X i2 ()
n X
Intercepto b0 Y b1X
• Inclinação (b1)
3 Estima as mudanças em Y em decorrência do
aumento de X de uma unidade.
– Se b1 = .2, então espera-se que os gastos (Y )
aumentem de 20% do aumento no saldo médio
(X).
• Intercepto (b0)
3 Valor esperado de Y quando X = 0
– Se b0 = 4, então espera-se que o valor dos gastos
(Y ) seja 4 quando o saldo médio (X) é 0.
6
Exemplo
cliente
4s
3
2
1
0
0 1 2 3 4 5
cartas
7
Tabelas para Estimação dos Parâmetros
2 2
Xi Yi Xi Yi XiYi
1 1 1 1 1
2 1 4 1 2
3 2 9 4 6
4 2 16 4 8
5 4 25 16 20
15 10 55 26 37
Solução
n _ _
X iYi nXY ( ) 0.70
37 5 3 x 2
i 1
b1 n _
55 5 (9)
i 1
X i2 n X () 2
_ _
b0 Y b1X 2 0.70 x3 0.10
8
Interpretação dos coeficientes - Solução
• Inclinação (b1)
3 Espera-se que o número de clientes (Y) aumente de
0.7 para cada carta (X) a mais enviada, isto é, 7
clientes para cada 10 cartas.
• Intercepto (b0)
3 Quando não se manda nenhuma carta espera-se que
o número de clientes diminue 0.1 (Y)
– Espera-se a perda de clientes sem envio de
correspondência.
Interpretação Geométrica
Y
X
Xi
9
Medidas de Variação
Decomposição da Variação
10
Coeficiente de Determinação
Coeficiente de Determinação
11
Interpretação Geométrica
Y r2 = 1 Y r2 = 1
^=b +b X
Yi 0 1 i
^=b +b X
Yi 0 1 i
X X
Y r2 = .8 Y r2 = 0
^=b +b X
Y ^=b +b X
Y
i 0 1 i i 0 1 i
X X
12
Tabela
2 2
Xi Yi Xi Yi XiYi
1 1 1 1 1
2 1 4 1 2
3 2 9 4 6
4 2 16 4 8
5 4 25 16 20
15 10 55 26 37
Solução
n n 81.67% da
2
b0 Yi b1 X iYi n(Y ) variação no
número de cliente
r2 i 1
n
i 1 é devido a cartas
2 enviadas por
Yi 2 n(Y ) mala direta.
i 1
13
Coeficiente de Correlação
Coeficiente de Correlação
• No exemplo anterior,
rxy 0,8167 0,9037
14
Interpretações errôneas dos coeficientes de
determinação e correlação
15
Análise de variância
Teste de significância global do modelo
Rejeite H 0 se F* F (1, n 2)
16
Análise de variância
Teste de significância global do modelo
Fonte de Graus de Soma dos Média dos F
Variação Liberdade Quadrados Quadrados
Regressão 1 SSR
SSR
MSR=
1 MSR
Erro n-2 SSE
SSE MSE
MSE=
n2
Total n-1 SST
Teste F
• Testa se a variância explicada pela regressão é
significativamente maior do que a variância não explicada.
• Também indica uma relação significante em regressão.
• Se a hipótese nula ( H 0 : 1 0) é verdadeira, o valor de
MSR/MSE deverá ser próximo de um.
• Se a hipótese nula é falsa ( H 1 : 1 0 ), MSR/MSE dará
valores altos mostrando que a relação entre x e y é
estatisticamente significante.
17
Exemplo anterior
Fonte de Graus de Soma dos Média dos F
Variação Liberdade Quadrados Quadrados
Total 4 6,0000
Exemplo anterior
0,05
18
Predição com Modelos de Regressão
• Tipos de predição
3 Estimativa pontual l O que é predição
3 Estimativa através de Valor esperado da
população (Y/X) para um
intervalos
dado X
Y YIndividual – Ponto na reta de
regressão da população
média de Y Resposta individual (Yi)
dado X ( Y/X ) para um dado X=x*
Intervalo de Confiança para
a média de Y/X
^
Previsão, Y
Intervalo de Confiança para
a predição (depende do
X anterior)
Xdado
19
Limites dos Intervalos de Confiança
para a Predição
_ X
X Xdado
Exemplo
• Deseja-se prever o retorno de TEL4 em função do retorno
do IBOVESPA.
• Constrói-se um modelo de regressão simples (este é
MARKET MODEL que é a versão ex-post do CAPM)
r = + rM + erro
• Os coeficientes da regressão podem ser estimados
usando o Excel (Tools/data analysis/regression)
20
Regressão Simples no Excel
Saída numérica
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.877857221 Testa a significância
R Square 0.770633301
Adjusted R Square 0.770058447
GLOBAL
Standard Error 0.01444875 da regressão
Observations 401 (é bastante significante)
ANOVA
df SS MS F Significance F
Regression 1 0.279866453 0.279866 1340.572 1.2113E-129
Residual 399 0.083297782 0.000209
Total 400 0.363164234
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 0.000844948 0.000721568 1.170988 0.242302 -0.000573603 0.002263498 -0.000573603 0.002263498
X Variable 1 0.923898485 0.025233594 36.61383 1.2E-129 0.874291073 0.973505897 0.874291073 0.973505897
21
Resíduos
RESIDUAL OUTPUT
Saída gráfica
0.05 0.1
0.05
0.00
0
-0.30 -0.20 -0.10 0.00 0.10 0.20
-0.05 -0.05 0 20 40 60 80 100
-0.1
-0.10
-0.15
-0.15 -0.2
-0.25
-0.20
Sample Percentile
-0.25
22
Cuidado Com
• Violação da premissas
Normalidade (os resíduos seguem uma distribuição Normal)
– Importante para os testes estatísticos
Independência (os resíduos são independentes de X)
Homocedasticidade (variância constane em relação a X)
• Influência de dados específicos
• Nível de significância (R )
2
• Extrapolação (predições para valores extremos de X)
23
Exemplo
• A analista de mercado tem
interesse em estabelecer uma
relação entre o valor de venda e
a avaliação do imóvel. Para o
estudo foi selecionada uma
amostra de cinco propriedades.
24
25
Exercício
• A Armand’s Pizza é uma cadeia de restaurantes italianos
localizados em cinco estados. As localizações mais bem-
sucedidas da Armand’s têm sido as que estão perto de
campus universitários. Os gerentes acreditam que as
vendas trimestrais para esses restaurantes (y) estão
relacionadas positivamente com o tamanho da população
de estudantes (x). Fazer uma análise de regressão completa
para o caso.
Xi Yi
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 169
9 22 149
10 26 202
26