Regressão Atual
Regressão Atual
Regressão Atual
1. Regressão
Assim como a correlação, a regressão também tem como objetivo estimar
numericamente o grau de relação que possa ser identificado entre populações de duas
ou mais variáveis, a partir de amostras.
Considere o exemplo de uma rede de lojas de confecções que coletou uma amostra
de dados passados referentes a seus gastos com publicidade ($ mil) e seu volume de
vendas ($ mil). Os dados são apresentados na tabela 1:
Tabela 1: Vendas versus gastos com publicidade de loja de confecções
Gastos com publicidade (em $ mil) 3 4 8 12 14
Vendas (em $ mil) 7 14 15 28 32
A apresentação dos dados pode ser feita com o auxílio de um diagrama de dispersão,
conforme a figura 1 abaixo:
1
FATEC – Adamantina
Prof. Me. Camila Gonçalves Costa
Análise de Regressão
A análise de regressão fornece uma função matemática que descreve a relação entre duas
ou mais variáveis. Esta função pode ser usada para estimar ou predizer valores futuros de
uma variável, com base em valores conhecidos ou supostos.
A análise de regressão linear simples tem por objetivo obter a equação matemática da
reta que representa o melhor relacionamento numérico linear entre duas variáveis:
𝑦 = 𝑎 + 𝑏𝑥 (1)
em que 𝑥 é a variável independente e 𝑦 é a variável dependente. Os números 𝑎 e 𝑏 são
números reais encontrados pelo método dos mínimo quadrados, que determina a equação
de ajuste linear que apresenta a menor soma dos quadrados dos erros 𝑒, conforme
observamos na figura 2. Observe que 𝑎 = 𝑌𝑖 quando 𝑋𝑖 = 0.
2
FATEC – Adamantina
Prof. Me. Camila Gonçalves Costa
3
FATEC – Adamantina
Prof. Me. Camila Gonçalves Costa
Temos então
4
FATEC – Adamantina
Prof. Me. Camila Gonçalves Costa
Exemplo:
plot(x,y,main=”Gráfico de Dispersão entre x e y”, pch=16, col=”lightblue”)
abline(lm(y~x), col=”red”)
5
FATEC – Adamantina
Prof. Me. Camila Gonçalves Costa
Embora modelos lineares possam ser construídos para análise entre o volume de
chuvas e a produção de manga, abacate, ameixa, goiaba ou acerola (𝑦 = 50 + 2𝑥; 𝑦 =
47,5867 + 3,1032𝑥; 𝑦 = 46,4283 − 0,3038𝑥; 𝑦 = 18,8658 + 0,007𝑥 e 𝑦 = 50 −
0,5𝑥, respectivamente), essas equações nada dizem sobre a qualidade do modelo.
Existem modelos onde os pontos estão mais próximos da reta de ajuste,
apresentando erros menores, mas existem modelos com pontos mais dispersos,
apresentando maiores erros. Desta forma, é necessário complementar o modelo de
regressão por estatísticas de correlação.
Análise de Correlação
Sendo 𝑟 o coeficiente de correlação, temos:
6
FATEC – Adamantina
Prof. Me. Camila Gonçalves Costa
7
FATEC – Adamantina
Prof. Me. Camila Gonçalves Costa
O Coeficiente de Determinação
O coeficiente de determinação, 𝑟 2 (o quadrado do coeficiente de correlação),
representa a relação entre a variação explicada pelo método e variação total:
variação explicada
𝑟2 = .
variação total
Quanto maior o valor de 𝑟, maior o percentual da variação explicada em relação à variação
total.
O coeficiente de determinação 𝑟 2 (0 ≤ 𝑟 2 ≤ 1) expressa o quanto da variação em
relação à média é explicada pelo modelo linear construído.
8
FATEC – Adamantina
Prof. Me. Camila Gonçalves Costa
9
FATEC – Adamantina
Prof. Me. Camila Gonçalves Costa
Exercícios
Referências Bibliográficas
[1] BRUNI, A. L. Estatística Aplicada à Gestão Empresarial. Editora Atlas,
São Paulo, 2007.
10