Roteiro Detalhado Sisdea

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 19

F calculado

Significância geral do Modelo

Significância individual das variáveis

(em percentagem)

Em valor absoluto
Obs.: O coeficiente de determinação (R²), apesar de ser um indicador sensível
para explicação do modelo, trata-se de uma medida descritiva e, por si só, não
mede a qualidade do modelo de regressão. Devem ser verificadas a sua
consistência, através dos testes de hipóteses (t e F) a distribuição dos resíduos
e a coerência do modelo com o mercado.
Para análise da equação do modelo escolhida, devemos selecionar
Ferramentas > Regressão Linear > Equação...

A tela que surgir deverá ser similar à próxima figura:


Nas colunas temos informações quanto aos nomes das variáveis utilizadas e
os respectivos tipos, o valor médio amostral para cada variável, o valor de t
calculado, os coeficientes da equação (regressores), as transformações
matemáticas utilizadas nas variáveis e a elasticidade de cada variável
independente, sendo esta última coluna utilizada principalmente para a análise
da coerência das variáveis dicotômicas.

No quadro exibido no canto inferior esquerdo da tela temos a função


estimativa/equação de regressão, podendo ser alternada a sua exibição
conforme selecionada a aba de interesse. Neste quadro é realizada a análise
dos sinais da equação, sendo este fator imprescindível para se confirmar as
hipóteses de pesquisa quanto ao comportamento do mercado, caso a hipótese
inicial não se confirme o software irá plotar o nome da variável em vermelho.

Os principais motivos podem ser a presença de pontos influenciantes,


colinearidade ou multicolinearidade entre variáveis independentes, omissão de
variável chave do modelo e erro do avaliador na hora de inserir a restrição do
regressor antes do cálculo, ou seja, a restrição imposta selecionada é inversa à
hipótese da pesquisa inicial.

Obs.: Função estimativa refere-se à equação do modelo sem a transformação


matemática da variável dependente, na equação de regressão a variável
dependente é exibida na forma transformada (somente se o modelo
selecionado conter a referida transformação na variável dependente, caso
contrário, a função estimativa e a equação de regressão serão iguais).

Obs2.: Conforme o Anexo A da NBR 14653-2:2011, no tópico A.9 “A variável


dependente no modelo de regressão deve ser apresentada no laudo na forma
não transformada”. Ou seja, mesmo quando adotado uma equação de
regressão com a variável dependente sofrendo uma transformação
matemática, para efeito de apresentação no laudo deve-se utilizar a função
estimativa com a denominação (“equação de regressão na forma direta”),
sendo esta uma inconsistência da norma que segundo Antônio Pelli será
colocado em pauta na próxima revisão.
Já no canto inferior direito tem-se os gráficos da variável independente
versus a variável dependente (sendo considerado como constante o valor
médio das outras variáveis independentes), estes gráficos podem ser utilizados
para a análise das hipóteses de pesquisa quanto ao comportamento do
mercado. Para mudar o gráfico que você deseja analisar deve-se clicar nas
setas do canto superior direito do gráfico.

Para análise dos resíduos, devemos selecionar Ferramentas > Regressão


Linear > Resíduos...

A tela que surgir deverá ser similar à próxima figura:

Na coluna “Dados”, tem-se a identificação de cada dado de mercado


efetivamente utilizado no modelo. Ao clicarmos sobre o título de qualquer uma
das colunas é possível ordenar os dados em ordem crescente/decrescente em
relação à coluna selecionada.

Na coluna identificada como “Observado”, são exibidos os valores


observados dos respectivos dados coletados em campo.

Na coluna “Estimado”, temos as projeções de valores, para cada um dos


elementos amostrais calculados através da equação de regressão, utilizando-
se todas as características inerentes a cada um dos elementos. Nesta coluna
não podem ocorrer valores com sinais negativos para nenhum dos dados.

Na coluna “Resíduo”, temos a diferença em valores absolutos, entre os


valores observados e os estimados. Enquanto que, na coluna “Resíduo
Relativo” temos o resultado percentual desta diferença. Esta última informação
é mais consistente por considerar a proporção do resíduo em relação ao seu
valor original. Sugerimos se o valor for acima de 40 % - examinar o dado, caso
seja acima de 50 % - preocupar-se com a aceitação do dado na amostra, e se
for acima de 70 % - verificar o comportamento do modelo sem o dado.

Na coluna “Resíduo/DP Estimativa”, temos o resultado que indica há quantos


desvios padrões está distante o valor observado da reta de regressão
(Estimativa). Valores superiores a +2 e inferiores a -2 serão considerados
outliers (nem sempre estes pontos devem ser eliminados, pois a própria
distribuição normal prevê um percentual de 5% para estas ocorrências).

Enquanto que, na coluna “Resíduo/DP Regressão”, temos o resultado que


indica há quantos desvios padrões está distante o valor observado da reta de
regressão (Regressão). Valores superiores a +2 e inferiores a -2 serão
considerados outliers (nem sempre estes pontos devem ser eliminados, pois a
própria distribuição normal prevê um percentual de 5% para estas ocorrências).

Ainda nas colunas Resíduo/DP quando ordenadas em ordem


crescente/decrescente de valores, podemos observar a distribuição dos
resíduos nos intervalos [-1;+ 1], [-1,64;+1,64] e [-1,96;+1,96] (informação já
fornecida pelo software no campo de normalidade dos resíduos).

Na coluna “Variação Inicial”, temos a porcentagem da variação de cada dado


observado no mercado em relação à média aritmética amostral, isto é, o valor
observado subtraído do valor da média aritmética amostral, elevado ao
quadrado, dividido pela variação total da regressão e multiplicado por 100.

Na coluna “Variação Residual”, temos a porcentagem da variação de cada


dado em relação ao valor estimado pela reta de regressão, isto é, o resultado
do valor estimado subtraído do valor observado, elevado ao quadrado, dividido
pela variação residual total do modelo e multiplicado por 100.
Ainda na mesma tela, no seu canto inferior esquerdo, tem-se o gráfico de
resíduos da regressão/estimativa versus valores estimados. Nele é possível a
verificação da homocedasticidade do modelo. Para tal, o gráfico deverá
apresentar pontos distribuídos aleatoriamente em torno de uma reta horizontal
azul, sem nenhum padrão definido, de maneira a se considerar um indicador
favorável à aceitação da hipótese da variância constante para o erro.

Em caso contrário, se os pontos apresentarem alguma tendência, conclui-se


que a variância dos erros não é constante sendo identificada a
heterocedasticidade do modelo.

Gráfico de resíduos da regressão versus valores estimados.

Ainda no gráfico é possível a identificação dos dados outiliers, isto é,


elementos amostrais cujos resíduos, em valor absoluto, superam duas vezes o
valor do desvio padrão do modelo. Graficamente estes pontos são identificados
pela sua coloração (magenta). Para saber quais os dados que são outiliers
devemos pressionar a tecla CTROL+N de maneira a numerar os dados.

Estes pontos devem ser analisados cuidadosamente, verificando se os


mesmos não constituem erros de coleta ou até mesmo de digitação. Pontos
outliers não devem, sumariamente, serem eliminados sem a devida análise do
conjunto de pontos e equilíbrio existente entre outliers “negativos” e “positivos”.
É comum partir do pressuposto da normalidade dos erros que os outliers não
devem representar mais que 5,0% dos dados efetivamente utilizados no
modelo.
Ainda na análise de resíduos ao clicarmos na aba “Distância de Cook”, no
canto inferior esquerdo da tela, teremos o gráfico das distâncias de cook. Este
gráfico é utilizado para a identificação de pontos influenciantes, os pontos
que possuírem Di superior a 1,0, ou seja, os posicionados graficamente acima
da linha azul, devem ser retirados do modelo e testado o novo ajuste sem a
presença do dado.

É importante salientar também que a presença de pontos influenciantes pode


ser detectada também na análise do comportamento gráfico da variável
dependente, em relação a cada variável independente (na aba variáveis >
exibir variáveis).

Gráfico da distância de Cook.

Para análise da aderência do modelo, devemos selecionar Ferramentas >


Regressão Linear > Aderência...

A tela que surgir deverá ser similar à próxima figura:


Nas colunas do canto esquerdo temos novamente algumas informações
referentes aos resíduos (já explicado anteriormente).

No gráfico de “Valores estimados versus Valores observados” (canto


superior direito), temos o grau de ajustamento do modelo em relação aos
dados coletados. Neste gráfico são plotados os dados de mercado na
intersecção dos valores estimados com os valores observados no mercado.
Este gráfico permite verificar com rapidez o poder de “predição” do modelo, os
pontos mais distantes da diagonal (linha amarela) são os dados mais
discrepantes, e devemos analisar e dar a estes a maior atenção.

Sabemos também que o coeficiente de determinação (r²) varia de zero a um e


representa a porcentagem de ajustamento (aderência dos pontos coletados na
pesquisa com a equação de regressão) do modelo, ou seja, quanto mais
próximo os pontos estiverem da linha amarela, maior será o coeficiente R² do
modelo.
Obs.: NO LAUDO NA MODALIDADE COMPLETO DEVE CONSTAR O
GRÁFICO DE VALORES ESTIMADOS VERSUS VALORES OBSERVADOS.
O segundo gráfico (verde) é para verificar se houve aderência dos resíduos do
modelo de regressão à distribuição normal, que está representada pela
distribuição normal reduzida. A verificação da normalidade resume-se em
examinar se o histograma formado pelos resíduos adere razoavelmente a uma
distribuição normal. A tendência é que, modelos com maior número de
elementos (n>30) tenham melhor aderência a uma distribuição mais próxima
da curva normal, também conhecida como curva gaussiana ou curva em forma
de sino.

Para análise da matriz de correlações do modelo, devemos selecionar


Ferramentas > Regressão Linear > Correlações...

A tela que surgir deverá ser similar à próxima figura:


A análise das correlações “isoladas” entre cada uma das variáveis
independentes e a variável dependente permite verificar, pelo seu sinal, a
forma da relação (se positiva, aumenta o valor do imóvel ou se, negativa,
diminui) e, pela magnitude do coeficiente (de -1 a 1) o quanto cada uma das
variáveis independentes contribui isoladamente para maximizar a predição
(variação explicada) da variável dependente.

Em caso de correlação linear elevada (valores superiores a 0,80) entre


quaisquer subconjuntos de variáveis independentes, isto é,
multicolinearidade, deve-se examinar a coerência das características do imóvel
avaliando com a estrutura de multicolinearidade inferida, vedada a utilização do
modelo em caso de incoerência.

Um exemplo prático disso seria um modelo no qual os dados de mercado


utilizados apresentem as variáveis área e frente, sendo que, os imóveis que
possuem grandes áreas possuem também grandes frentes e imóveis com
pequenas áreas têm pequenas frentes, desta forma este modelo não pode ser
utilizado para avaliar um imóvel de grande área com pequena frente, nem de
pequena área com grande frente.

Na aba “Influência” tem-se a indicação do relacionamento entre duas


variáveis analisadas, na presença de uma ou mais variáveis que com elas
atuam simultaneamente.
Obs.: É esperada uma forte correlação entre cada variável independente e a
variável dependente, ou seja, a correlação entre cada variável independente e
a dependente não é problemática, pelo contrário, é desejável.

Na parte inferior da tela, tem-se exibido graficamente os resultados


provenientes da matriz de correlações, o que proporciona uma melhor
visualização dos resultados. Para trocar o gráfico da variável que deseja
analisar é necessário clicar nas setas posicionadas no canto superior direito do
gráfico, conforme imagem a seguir.

Gráficos das matrizes de correlações.

Para análise dos resultados gerados do modelo, devemos selecionar


Ferramentas > Regressão Linear > Projetar...

A tela que surgir deverá ser similar à próxima figura:


Nas colunas do lado direito, é exibido os atributos projetados para o imóvel (is)
avaliando(s), quando há alguma variável em que se tenha “extrapolado” o
software irá plotar a mesma em vermelho.

Ainda nas colunas do lado direito, mas agora na parte superior, temos um
“pequeno triângulo invertido cinza”, esta opção é utilizada para projetar
valores caso você deseje modificar algum atributo do imóvel avaliando. Ao lado
direito do triângulo, temos o ícone de um “sinal de adição vermelho”, ao
selecionar este ícone você poderá criar projeções para um novo imóvel
avaliando, sendo necessário selecionar o ícone das “setas” para o software
modificar o imóvel avaliando.

No caso de você trabalhar com mais de um imóvel avaliando, ao selecionar a


aba “estimativas”, na parte central inferior da tela, será exibido todos os
imóveis avaliandos inseridos pelo avaliador, caso você deseje excluir algum
imóvel avaliando, basta selecionar a célula do imóvel avaliando e
posteriormente clicar no “xis vermelho”, disponível na parte superior da tela.

Já na coluna denominada “regressão linear”, no lado esquerdo da tela, você


terá todos os resultados das estimativas para o imóvel avaliando. Lembre-se
que o grau de precisão da sua avaliação é obtido através da amplitude do
intervalo de confiança de 80% em torno da estimativa de tendência central, ou
seja, o somatório entre a amplitude do valor mínimo e o valor máximo do IC,
que no caso do exemplo seria 2,34% + 2,36%= 4,7%, grau III de precisão.

Você também pode gostar