Regressão Linear e Correlação PDF
Regressão Linear e Correlação PDF
Regressão Linear e Correlação PDF
Correlação Amostral
b) O coeficiente de correlação
É um valor numérico, uma medida, para o grau de associação entre duas
variáveis.
Se for observada uma associação entre as variáveis quantitativas (a partir de um
diagrama de dispersão, por exemplo), é muito útil quantificar essa associabilidade.
1
INF 162 Prof. Luiz Alexandre Peternelli
i =1 n
2 2
n n
∑ X i ∑ Yi
SQDY = ∑ Yi − i =1
n n
SQD X = ∑ X i −
2 i =1
e 2
i =1 n i =1 n
Para o exemplo:
Amostra A 4 8 3 9 7 5
Amostra B 1 5 2 14 3 11
n n
∑ Ai ∑ Bi
i =1 = 252 − (36)(36 ) = 36
= ∑ Ai Bi − i
n
=1
SPD AB
i =1 n 6
2
n
∑ Ai
SQD A = ∑ Ai2 − i =1 = 244 −
n
(36)2 = 28
i =1 n 6
2
n
∑ Bi
SQDB = ∑ Bi2 − i =1 = 356 −
n
(36)2 = 140
i =1 n 6
2
INF 162 Prof. Luiz Alexandre Peternelli
SPAB 36
rAB = = = 0,5750
SQD A . SQD B (28) (140)
Regressão linear
3
INF 162 Prof. Luiz Alexandre Peternelli
aplicando o somatório,
n n
∑ e = ∑ [Y − β
i =1
2
i
i =1
i 0 − β1 X i ]
2
(1)
∑x ∑y
∑x y −
i i
i i
n SPD xy
β̂ 1 = = e βˆ 0 = Y − βˆ1 X
(∑ xi )2 SQDx
∑x 2
i −
n
Uma vez obtidas estas estimativas, podemos escrever a equação estimada:
Yˆi = βˆ0 + βˆ1 X i
Exemplos:
4
INF 162 Prof. Luiz Alexandre Peternelli
1) Para verificar se existe relação linear de primeiro grau entre umidade relativa
(UR) do ar de secagem de sementes e a germinação das mesmas, um pesquisador
realizou um experimento com 4 valores diferentes para a %UR do ar, obtendo-se
os seguintes dados (dados hipotéticos)
% UR 20 30 40 50
% germinação 94 96 95 97
a) Verificar se existe efeito da UR do ar de secagem na % de germinação. Usar α =
5%.
b) Qual seria a % de germinação esperada quando UR = 45 %?
c) Como poderia ser apresentada, num relatório técnico, a equação de regressão
ajustada para esse exemplo?
R.: a) β̂ 0 = 92,7; β̂ 1 = 0,08. F = 3,55; t = 1,88. b) 95,5 %
2) Foi realizado uma análise de regressão para investigar a existência de ralação
linear simples entre a temperatura superficial de uma estrada (X) medida em graus
F e a deformação da pavimentação (Y) medida segundo uma técnica especial.
Baseado nas seguintes informações pede-se:
n = 20; ∑y i = 12,75; ∑y 2
i = 8,86; ∑x i = 1478; ∑x 2
i =143215,8; e ∑x y
i i =
1083,67
a) Calcule as estimativas dos parâmetros da regressão. Apresente a equação ajustada
num gráfico;
b) Use a equação para estimar qual deformação haveria na pavimentação quando a
temperatura superficial fosse de 85 graus F.
c) Qual seria a mudança esperada na deformação da pavimentação para uma
mudança de 1o F na temperatura superficial?
d) Suponha que a temperatura seja medida em graus C ao invés de graus F. Qual
seria a nova equação ajustada resultante? Lembre-se: C = 5(F – 32)/9.
e) Qual seria a mudança esperada na deformação da pavimentação para uma
mudança de 1o C na temperatura superficial?
Exercício Proposto
Os dados a seguir provêm de um experimento para testar o desempenho de
uma máquina industrial. O experimento utilizou uma mistura de óleo diesel e gás,
derivados de materiais destilados orgânicos. O valor da capacidade da máquina em
cavalo vapor (HP) foi coletado a diversas velocidades medidas em rotações por
minuto (rpm × 100).
X Y X Y X Y X Y
22,0 64,03 15,0 46,85 18,0 52,90 15,0 45,79
20,0 62,47 17,0 51,17 16,0 48,84 17,0 51,17
18,0 54,94 19,0 58,00 14,0 42,74 19,0 56,65
16,0 48,84 21,0 63,21 12,0 36,63 21,0 62,61
14,0 43,73 22,0 64,03 10,5 32,05 23,0 65,31
12,0 37,48 20,0 62,63 13,0 39,68 24,0 63,89
X = velocidade Y = capacidade
5
INF 162 Prof. Luiz Alexandre Peternelli
COEFICIENTE DE DETERMINAÇÃO
6
INF 162 Prof. Luiz Alexandre Peternelli
βˆ1 − β 1* σˆ 2
a) tcalc = , onde Vˆ ( βˆ1 ) =
Vˆ ( βˆ1 ) SQDx
∑ (Y i − Y ) 2 = ∑ (Yˆi − Y ) 2 + ∑ (Yi − Yˆ ) 2 ,
ou, em outra palavras,
SQTotal = SQRegressão + SQResíduo.
Onde
SQTotal = variação total em Y = SQDY
SQRegressão = variação em Y explicada pela regressão ajustada = β̂ 1 SPDXY
de modo que
SQResíduo = SQRes = variação não explicada pela regressão = SQDY - β̂ 1 SPDXY
Baseado nessa identidade o seguinte quadro pode ser montado:
FV GL SQ QM F
Regressão 1 SQReg QMReg = SQReg QM Re g
QM Re s
Resíduo, ou n–2 SQRes SQ Re s -
Independente da QMRes =
Regressão n−2
Total n–2 SQTotal
7
INF 162 Prof. Luiz Alexandre Peternelli
em que:
- p = no de coeficientes de regressão (não inclui o β0 )
- n = no de observações.
i =1 n
SQIndependente da Regressão = SQTotal - SQRegressão
8
INF 162 Prof. Luiz Alexandre Peternelli
2
n
n n n
∑ Y
i =1 i
SQ Re gressão = β 0 ∑ Yi + β 1 ∑ Yi X i + β 2 ∑ Yi X i −
" " " 2
i =1 i =1 i =1 n
Exercícios Propostos:
1) (questão de prova do II/2000) Para estudar a relação entre Y (número total de horas
necessárias à montagem da parte de uma estrutura) e X (número total de operações
de furar e rebitar), registraram-se os dados da tabela abaixo.
estudo A B C D E F G H I
X 236 80 127 445 180 343 305 488 170
Y 5,1 1,7 3,3 6,0 2,9 5,9 7,0 9,4 4,8
Para facilitar seus cálculos considere as seguintes informações:
∑ xi = 2374; ∑ yi = 46,1; ∑ xi2 = 786368; ∑ yi2 = 279,41; ∑ xi yi = 14512,6
i i i i i
também, SPDxy = 2352,4444; SQDx = 160159,5556
Pede-se:
a) Obter a equação de regressão ajustada para o modelo Yi = β0 + β1xi + εi
R.: Yˆ = 1,271 + 0,0146X
b) Interpretar as estimativas obtidas dos parâmetros da regressão.
c) Calcular o coeficiente de determinação para o modelo ajustado. Faça a
interpretação apropriada para esse resultado. R.: 79,9%
d) A análise de variância (ANOVA) da regressão pode ser resumida no seguinte
quadro
9
INF 162 Prof. Luiz Alexandre Peternelli
F.V. g.l. SQ QM F
Regressão 1 34,59 34,59
Resíduo 7 8,68 1,24
Total 8 43,27
Uma maneira de verificar a significância da regressão ajustada é por meio da
ANOVA apresentada acima. Apresente a hipótese a ser testada pela ANOVA e
realize o teste apropriado (use α = 5%) para testar essa hipótese.
e) Se fosse concluído que podemos considerar β1 = 0, como deveria ser reescrito o
modelo ajustado? Justifique.
10
INF 162 Prof. Luiz Alexandre Peternelli
n n n
∑ Yi = n βˆ + βˆ ∑ X + βˆ ∑ X 2
0 1 i 2 i
i =1 i =1 i =1
n n n n
∑ i i = βˆ
0∑ + β ˆ
1∑ + β ˆ
2∑ Xi
2 3
Y X X i X i
i =1 i =1 i =1 i =1
n n n n
∑ i i = βˆ
0∑ + βˆ
1∑ + β ˆ
2∑ Xi
2 2 3 4
Y X X i X i
i =1 i =1 i =1 i =1
11