Tutorial IpeaGEO VF
Tutorial IpeaGEO VF
Tutorial IpeaGEO VF
15_06_26
Tutorial
1 / 183
Sumrio
Introduo ....................................................................................................................................................... 4
O que o IpeaGEO ...................................................................................................................................... 4
Quem somos ............................................................................................................................................... 4
Instalao do IpeaGEO .................................................................................................................................... 6
Onde Encontrar ........................................................................................................................................... 6
Requisitos Tecnolgicos .............................................................................................................................. 6
Utilizando o IpeaGEO ...................................................................................................................................... 7
Iniciando o IpeaGEO .................................................................................................................................... 7
Abrindo Projeto Salvo.................................................................................................................................. 9
Arquivo Shape (Malha Digital)..................................................................................................................... 9
Importar Malha ..................................................................................................................................... 10
Adicionar Camadas (Layers) Auxiliares.................................................................................................. 15
Alterando as Propriedades das Camadas (Layers) ................................................................................ 17
Base de Dados ........................................................................................................................................... 23
Importar Dados ..................................................................................................................................... 23
Exportar Dados ...................................................................................................................................... 34
Funcionalidades......................................................................................................................................... 36
Mapa Temtico.......................................................................................................................................... 39
Funes Estatsticas do IpeaGEO .................................................................................................................. 44
Anlise Exploratria dos Dados ................................................................................................................. 44
Anlise Grfica ....................................................................................................................................... 44
Calculadora ............................................................................................................................................ 51
Correlaes ............................................................................................................................................ 58
Estatsticas Descritivas .......................................................................................................................... 60
Gerao de Variveis Dummy ............................................................................................................... 63
Matriz de Vizinhana ............................................................................................................................. 66
Tabelas de Frequncia........................................................................................................................... 74
Tabulaes Cruzadas ............................................................................................................................. 76
Analise Multivariada.................................................................................................................................. 80
Analise de Clusters ................................................................................................................................ 80
Analise de Componentes Principais ...................................................................................................... 84
Analise Fatorial ...................................................................................................................................... 87
Clculo de Taxas ........................................................................................................................................ 93
Econometria Bsica ................................................................................................................................... 97
Propensity Score Matching ................................................................................................................... 97
Regresso com Dados Binrios ........................................................................................................... 103
Regresso Linear ................................................................................................................................. 107
2 / 183
3 / 183
Introduo
O que o IpeaGEO
O IpeaGEO um software desenvolvido pela Assessoria de Mtodos
Quantitativos da Diretoria de Estudos e Polticas Regionais, Urbanos e Ambientais do
Ipea - Dirur.
Ele funciona como uma ferramenta gratuita de anlises estatsticas, voltada
especialmente para anlises espaciais. A incluso de tcnicas espaciais consolidadas e
foco no territrio nacional so alguns dos diferenciais do programa.
Quem somos
Instituto de Pesquisa Econmica Aplicada - Ipea
O Instituto de Pesquisa Econmica Aplicada (Ipea) uma fundao pblica
federal vinculada Secretaria de Assuntos Estratgicos da Presidncia da Repblica.
Suas atividades de pesquisa fornecem suporte tcnico e institucional s aes
governamentais para a formulao e reformulao de polticas pblicas e programas de
desenvolvimento brasileiros. Os trabalhos do Ipea so disponibilizados para a sociedade
por meio de inmeras e regulares publicaes e seminrios e, mais recentemente, via
programa semanal de TV em canal fechado.
4 / 183
Responsveis tcnicos:
Equipe de desenvolvimento:
5 / 183
Instalao do IpeaGEO
Onde Encontrar
O download do software IpeaGEO gratuito e est disponvel no seguinte
endereo: http://www.ipea.gov.br/IpeaGEO
Requisitos Tecnolgicos
Requisitos Mnimos de Hardware/Software:
HARDWARE : Mnimo de 2 GB de disco rgido, 512 MB de memria RAM e processador
de 1 GHz.
SISTEMA OPERACIONAL : Windows XP com Service Pack 2, Windows 2003, Windows
Vista ou superior.
Microsoft .NET Framework 4 Client Profile (caso o usurio no possua, o IpeaGEO o
encaminha para o site de download).
Conexo com a Internet necessria para carregamento de dados e mapas hospedados
no site do IPEA.
6 / 183
Utilizando o IpeaGEO
Iniciando o IpeaGEO
Viso Geral
Tela inicial do IpeaGEO
Abrir ShapeFile (Ctrl + A) - Permite abrir um arquivo do tipo malha digital (shape)
do seu computador.
7 / 183
Dados para Download Permite ao usurio abrir um arquivo do tipo malha digital
(shape) e dados j existentes no site do Ipea.
Janelas Caso haja mais de uma janela aberta no programa, essa opo permite
ao usurio organiza-las de acordo com sua preferncia.
8 / 183
9 / 183
Importar Malha
Viso Geral
No IpeaGEO, possvel importar a malha digital de duas maneiras: diretamente
de um arquivo armazenado no computador do usurio ou realizar o download no prprio
programa.
Exemplo
Importando o arquivo malha do Ipea
Para importar um arquivo de malha digital do Ipea clique em Dados para
Download
10 / 183
11 / 183
Aps clicar no boto pesquisar uma nova aba ficar disponvel com os dados
12 / 183
encontrados na pesquisa.
13 / 183
14 / 183
Para que a malha seja importada corretamente, os arquivos com extenses .dbf
e .shx tambm precisam estar na pasta onde est localizado o arquivo .shp.
Exemplo
Aps importar a malha digital por quaisquer das maneiras descritas no tpico
"Importar Malha", possvel adicionar camadas (layers) auxiliares para serem
trabalhadas conjuntamente com a malha digital principal. Existem duas maneiras
diferentes para importao dessas camadas (layers):
Clique no boto "Adio de layers auxiliares ao mapa"
, ou clique com o
boto direito do mouse, sobre o mapa que representa a camada (layer) principal e, em
seguida, clique em "Adicionar layer de visualizao".
15 / 183
16 / 183
Exemplo
Aps importar a malha digital por quaisquer das duas maneiras descritas em
"Importar Malha" ou aps adicionar as camadas auxiliares conforme descrito em
"Adicionar Layers Auxiliares", possvel alterar as respectivas propriedades clicando
sobre a camada correspondente com o boto direito do mouse, selecionando
"Propriedades dos elementos do layer" e, em seguida, "Propriedades para todos os
elementos".
17 / 183
Labels;
Visualizao;
Linha;
Informaes do Layer;
Dados do Mapa;
Filtro de Seleo.
18 / 183
19 / 183
Para alterar a cor do contorno da camada, basta aplicar um duplo clique sobre a
caixa de cores intitulada Cor do contorno para abrir o seguinte formulrio:
20 / 183
21 / 183
22 / 183
Base de Dados
Importar Dados
Viso Geral
No IpeaGEO, o usurio pode importar sua tabela de dados para trabalhar
conjuntamente com um arquivo de malha digital ou ainda, caso prefira, pode realizar
anlises somente com sua tabela de dados.
Exemplos
23 / 183
24 / 183
Importar uma tabela de dados para concatenar com uma malha (shape)
. Neste momento o
26 / 183
27 / 183
Caso a tabela contenha dados faltando (dados missing), iro aparecer duas novas
abas: Dados Missing e Obs. Missing:
28 / 183
29 / 183
Caso a opo desejada seja Substituir valor missing por mdia dos vizinhos, o
seguinte formulrio contido na aba Mdia dos vizinhos ir se abrir.
30 / 183
Neste formulrio, aps definir as opes para manipulao das variveis que
contenham dados missing, clique no boto Atualizar.
Caso a opo desejada seja Substituir valor missing por mdia do sub-grupo, o
seguinte formulrio, contido na aba Mdia do Subgrupo ir se abrir.
31 / 183
Ao clicar no boto Relatrio uma nova aba de mesmo nome se abrir, contendo
as informaes definidas anteriormente.
Por fim, clique no boto Atualizar para atualizar o relatrio de acordo com o
tratamento escolhido e em seguida clique em Executar.
32 / 183
33 / 183
O prximo passo definir qual a tabela que se deseja importar. Para isso, escolha
uma dentre as tabelas disponveis em "Tabela no Arquivo" e clique em "Importar
Tabela". Aps a importao, necessrio selecionar as variveis chaves e realizar o
mesmo procedimento descrito no tpico anterior.
Exportar Dados
Viso Geral
O IpeaGEO oferece a opo de exportar a tabela de dados que est se
trabalhando a qualquer momento, seja aps alterar sua base original ou realizar os
resultados de uma anlise estatstica nessa base.
Exemplos
possvel exportar a base de dados de duas maneiras:
Opo 1: Clique com o boto direito do mouse sobre a tabela e, em seguida, em
"Exportar tabela de dados".
34 / 183
35 / 183
Funcionalidades
Viso Geral
Aps o usurio abrir um arquivo de malha digital e concatenar com uma tabela de
dados, os seguintes cones so habilitados:
Descrio
Adicionar uma tabela a partir de dados j existentes no IpeaGEO.
Adies de layers auxiliares ao mapa Adiciona camadas (layers) que
podem ser sobrepostos ao mapa.
36 / 183
Salvar Projeto.
Adicionar uma tabela a partir de dados externos.
Inserir dados em um painel espacial.
Exportar tabela de dados Exporta a tabela de dados para os formatos
Microsoft Excel (*.xls), Microsoft Access (*.mdb), XML (*.xml) e texto
(*.txt).
Abrir tabela de dados em planilha Excel - Abre automaticamente a planilha
de dados no Excel.
Atualizar tabela e mapa.
Mover o mapa Permite mover o mapa a todas as direes.
Adiciona Zoom Aplica zoom no mapa inteiro.
Remove Zoom Remove zoom no mapa inteiro.
Zoom Aplica zoom na rea selecionada do mapa.
conjunto
Permite
selecionar
reas
do
mapa
Seleciona individualmente
individualmente.
Permite
selecionar
reas
do
mapa
37 / 183
38 / 183
Mapa Temtico
Viso Geral
Mapas temticos so mapas personalizados que tm como objetivo identificar a
distribuio espacial de eventos fsicos, polticos, culturais, econmicos, sociolgicos ou
qualquer outro aspecto que se deseja investigar, de uma determinada rea geogrfica
de interesse, como, por exemplo, municpios, microrregies, unidades de federao, etc.
O mapa dividido em classes, no necessariamente com o mesmo tamanho e
amplitude, no qual cada classe possui a sua cor.
Os mtodos disponveis para gerar os mapas temticos so:
Quantil: Intervalos so selecionados de modo que o nmero de observaes em
cada intervalo igual.
Equal: Os valores so divididos em k classes com intervalos iguais com o mesmo
tamanho (w) em que w = Amplitude k.
Jenks (Natural breaks): o mtodo mais utilizado nos pacotes de anlise
espacial. Sua composio tem como objetivo criar classes com a menor varincia interna
e maior variabilidade externa. Pode demandar muito tempo de clculos. No IpeaGEO os
clculos do mtodo so feitos na forma logartmica.
Valores nicos: Cada valor considerado uma classe e apresentado no mapa
com uma cor diferente.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) e
concatenar o arquivo de malha digital com a tabela de dados (ver tpico de
concatenao), clique no boto Mapas Temticos
opes exibidas abaixo.
39 / 183
Variveis Quantitativas
Ao selecionar a opo Variveis Quantitativas, abrir a nova janela.
40 / 183
41 / 183
42 / 183
Variveis Categricas
43 / 183
Anlise Grfica
Viso Geral
A anlise grfica uma ferramenta que auxilia na anlise exploratria dos dados,
onde o usurio pode verificar, por meio de grficos, o comportamento dos dados em
estudo.
44 / 183
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) ou
concatenar o arquivo de malha digital (shape) com a tabela de dados (ver tpico de
concatenao), clique na opo Anlise Exploratria e manipulao de dados
e, em seguida, na opo Anlise Grfica.
45 / 183
Varivel Numrica;
Varivel Categrica.
46 / 183
47 / 183
48 / 183
49 / 183
50 / 183
Calculadora
Viso Geral
A Calculadora do IpeaGEO permite a aplicao de diversas funes em um
conjunto de dados.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar o arquivo de malha digital com a tabela de dados (ver tpico de
concatenao), clique na opo Calculadora localizada no boto "Anlise Exploratria
e Manipulao de Dados"
51 / 183
52 / 183
53 / 183
Caso o usurio esteja trabalhando com os dados concatenados com uma malha
digital, possvel obter as seguintes medidas para os polgonos: rea do Polgono,
Permetro do Polgono, Coordenada do Centroide, as coordenadas do retngulo limite do
polgono (Bounding Box), a distncia entre uma determinada varivel e o polgono
escolhido; tambm permitido gerar a matriz de distncias entre polgonos.
Ao clicar no boto "Executar", sero acrescentadas na tabela de dados principal
novas colunas com as selees de medidas feitas.
54 / 183
55 / 183
Na opo Valor 1 o usurio deve escolher o nmero a ser utilizado como base
para realizar o clculo. Ao selecionar as operaes Entre (inclusive) ou Entre
(exclusive) a opo Valor 2 tambm se torna disponvel para o preenchimento.
Ressalta-se que para utilizar o filtro estabelecido na nova varivel gerada
56 / 183
necessrio que a opo localizada no canto inferior direito Aplicar filtro para clculo de
valores esteja marcada.
57 / 183
Correlaes
Viso Geral
O formulrio de correlaes do IpeaGEO permite ao usurio verificar a existncia
de correlaes entre as variveis disponveis na tabela de dados utilizada.
Exemplo
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar o arquivo de malha digital com sua tabela de dados (ver tpico de
concatenao) clicando na opo Anlise Exploratria e manipulao de dados
e, em seguida, em Correlaes.
58 / 183
59 / 183
Estatsticas Descritivas
Viso Geral
As estatsticas descritivas so medidas resumo importantes para a anlise
exploratria dos dados. Elas permitem, por exemplo, que o pesquisador conhea o
comportamento dos dados que esto sendo analisados e identifique inconsistncias,
presena de valores extremos (outliers), dentre outros problemas comuns que se pode
ter em um conjunto de dados.
As estatsticas disponveis no IpeaGEO so: Mdia, Mediana, Desvio Padro,
Varincia, Mximo, Mnimo, Coeficiente de Assimetria, Coeficiente de Curtose, o
tamanho amostral (Nmero de Observaes), o primeiro (1 quartil) e terceiro (3 quartil)
quartil (tendo em vista que a mediana o segundo quartil) e o Intervalo interquartlico,
que a diferena entre o terceiro e o primeiro quartil. O IpeaGEO ainda permite ao
usurio definir quatro percentis livre escolha, chamados de Percentil 1, Percentil 2,
Percentil 3 e Percentil 4.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar a malha digital com a tabela de dados (ver tpico de concatenao),
clique na opo Estatsticas Descritivas localizada no boto "Anlise Exploratria e
Manipulao de Dados"
60 / 183
62 / 183
63 / 183
64 / 183
65 / 183
Matriz de Vizinhana
Viso Geral
No IpeaGEO possvel gerar uma matriz de vizinhana ou ainda importar a
matriz j calculada diretamente do seu computador.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) ou
concatenar o arquivo de malha digital com a tabela de dados (ver tpico de
concatenao), clique na opo Matriz de Vizinhana localizada no boto "Anlise
Exploratria e Manipulao de Dados"
66 / 183
Queen Normalizada;
Rook (1 vrtice em comum);
Rook Normalizada.
Selecionar tambm a ordem desejada.
Caso seja escolhido Definio de vizinhos via distncias uma nova aba denominada
Decaimento Paramtrico ir se abrir:
68 / 183
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar seu arquivo de malha digital com sua tabela de dados (ver tpico de
concatenao), clique na opo Importar Matriz de Vizinhana localizada no cone
Ferramentas
69 / 183
70 / 183
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar seu arquivo de malha digital com sua tabela de dados (ver tpico de
concatenao), clique na opo Exportar Matriz de Vizinhana fixada no cone
Ferramentas
. A opo Exportar Matriz de Vizinhana fica disponvel aps a
matriz de vizinhana ser gerada, como explicado nos tpicos anteriores deste tutorial.
72 / 183
73 / 183
Tabelas de Frequncia
Viso Geral
As tabelas de frequncia permitem ao usurio verificar, em seu conjunto de
dados, a existncia de valores missings, outliers, isto , a distribuio dos dados em que
est trabalhando.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) ou
concatenar o arquivo de malha digital com a tabela de dados (ver tpico de
concatenao), clicar na opo Tabelas de Frequncia, presente dentro do cone
"Anlise Exploratria e Manipulao de Dados"
74 / 183
75 / 183
Tabulaes Cruzadas
Viso Geral
76 / 183
Usando o boto
possvel selecionar uma varivel. O boto
todas as variveis disponveis.
77 / 183
seleciona
Para efetuar o clculo preciso selecionar duas variveis. No lado inferior direito
esto localizadas as opes que permitem acrescentar ao resultado as frequncias
absolutas e os percentuais nas linhas, colunas e do total.
78 / 183
79 / 183
Analise Multivariada
Analise de Clusters
Viso Geral
A anlise de clusters ou de agrupamento uma tcnica estatstica multivariada
que tem por objetivo agrupar elementos amostrais de acordo com alguma medida de
similaridade definida em funo de um conjunto de variveis. Tal agrupamento
realizado de modo que a variabilidade dentro dos grupos seja a menor possvel,
enquanto que a variabilidade entre os grupos seja maximizada.
Existem duas famlias de mtodos para realizar a anlise de clusters, os mtodos
hierrquicos e o no hierrquicos.
No agrupamento hierrquico calculada uma matriz de distncias (similaridades)
para cada par de elementos amostrais; o processamento se inicia com o agrupamento
do par de elementos com a menor distncia (maior similaridade). A cada passo a matriz
de distncias recalculada considerando os grupos formados nos passos anteriores. O
processamento termina quando houver apenas um grupo que concentra toda a amostra.
No agrupamento no hierrquico os elementos amostrais so distribudos
aleatoriamente em um nmero fixo de grupos. A cada passo o centroide de cada grupo
calculado, assim como a distncia dos elementos amostrais com relao a cada
centroide dos grupos. Se houver algum elemento alocado em um grupo, mas que tenha
uma distncia menor para o centroide de outro grupo, tal elemento deslocado para o
grupo de menor distncia. Neste ponto os centroides dos grupos envolvidos com o
deslocamento do elemento amostral so recalculados. O processamento termina quando
todos os elementos amostrais estiverem nos grupos cujas distncias para os centroides
sejam mnimas.
As principais fundamentaes dessa metodologia podem ser vistas em Johnson
e Wichern (2007) e Mingoti (2005).
Exemplo
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar o arquivo de malha digital com sua tabela de dados (ver tpico de
concatenao) clique na opo Ferramentas
Anlise de Clusters K-Means.
80 / 183
Anlise Multivariada
82 / 183
83 / 183
84 / 183
Anlise Multivariada
matriz de correlao.
As seguintes opes tambm esto disponveis aos usurios:
86 / 183
Analise Fatorial
Viso Geral
A anlise fatorial uma tcnica multivariada paramtrica que permite expressar a
matriz de varincia-covarincia ou a matriz de correlao dos dados originais como a
87 / 183
soma de dois componentes: uma matriz que depende apenas da combinao linear das
variveis originais e uma matriz que representa a variabilidade residual. Desta forma,
possvel criar variveis latentes, chamadas de fatores, que so combinaes lineares
das variveis originais semelhante aos modelos de regresso linear de modo que a
matriz de variabilidade associada a uma quantidade menor de fatores que das variveis
originais represente uma parcela significativa da variabilidade total. Esta tcnica permite
reduzir a dimenso do conjunto de dados, bem como identificar variveis latentes que
podem ter significados prticos. Observe que a semelhana com o mtodo dos
componentes principais no por acaso, tendo em vista que os componentes principais
um dos mtodos usados para se extrair os fatores.
O IpeaGEO permite a estimao da matriz de coeficientes (chamada de matriz de
cargas fatoriais) pelos mtodos dos componentes principais, fatores principais e pela
mxima verossimilhana. Os escores podem ser calculados por mnimos quadrados
ponderados ou por regresso. Alm disso, possvel aplicar as seguintes rotaes aos
dados: quartimax, varimax, entropia mnima, quatimin, bi-quartimin e covarimin. Na
apresentao dos resultados possvel exibir o screeplot, os autovalores e as
comunalidades, as matrizes de varincia-covarincia e de correlao, os valores
estimados para os coeficientes (cargas fatoriais), a matriz residual e a inversa da matriz
de correlao. Existe tambm a possibilidade de se realizar o teste de Bartlett para
verificar se as variveis originais so correlacionadas; caso sejam no correlacionadas
tais variveis formam uma base ortogonal e sero idnticas aos fatores.
Exemplo
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar seu arquivo de malha digital (shape) com sua tabela de dados (ver tpico
de concatenao) clicando na opo Ferramentas
Anlise Fatorial.
88 / 183
Anlise Multivariada
89 / 183
possvel definir o mtodo de clculo dos escores fatoriais, que pode Mnimos
Quadrados Ponderados ou Regresso.
90 / 183
Scree Plot;
Autovalores e Comunalidades;
Matriz de Correlao;
Matriz Residual;
91 / 183
92 / 183
Clculo de Taxas
Viso Geral
O mapeamento da taxa de ocorrncia de eventos uma importante ferramenta
para o direcionamento de polticas pblicas. O clculo de taxas brutas pode levar a
distores como, por exemplo, para de municpios muito pequenos. Nesses casos a
estimao de taxas brutas pouco vivel, pois o pequeno nmero de observaes pode
levar a distores nas estimativas das taxas, inclusive com a inflao na variabilidade
estimada.
Clayton e Kaldor (1987) solucionaram tal problema por meio da suavizao
Bayesiana. Alm desse trabalho, Marshall (1991) props uma estimativa de taxas de alta
estabilidade, que inclui a localizao geogrfica do municpio como informao adicional.
Tais metodologias so chamadas de empricas uma vez que, em ambos os casos, os
dados auxiliares so obtidos da prpria amostra. Pringle (1996) faz uma reviso de
tcnicas Bayesianas empricas tendo como base estudos de caso de cncer e
mortalidade neonatal.
Nesse mdulo, so apresentadas rotinas para clculo de taxas nas quais a
Estatstica Bayesiana e a Espacial so as ferramentas metodolgicas bsicas. Com isso,
tm-se estimativas com menor variabilidade e, por isso, mais indicadas.
O formulrio de Clculo de Taxas do IpeaGEO contm as seguintes opes de
metodologia (veja detalhes abaixo):
93 / 183
Taxa bruta;
Taxa espacial;
Taxa Bayesiana emprica;
Taxa Bayesiana emprica espacial;
Risco relativo;
Risco relativo Bayesiano (Clayton e Kaldor);
Taxa Bayesiana (Clayton e Kaldor);
o Priori Gamma;
o Priori Log-Normal;
o Priori Gamma Espacial;
o Priori Log-Normal Espacial;
Exemplo
O formulrio de clculo de Taxas est disponvel no seguinte local: Aps
concatenar um arquivo de malha digital (shape) com os dados, clicar em Ferramentas
Clculo de Taxas.
95 / 183
96 / 183
Econometria Bsica
Propensity Score Matching
Viso Geral
O propensity score matching (PSM) uma tcnica estatstica utilizada para a
construo de grupos com o objetivo de fazer comparaes estatsticas entre grupos.
Esta tcnica baseada em um modelo de probabilidade da participao de um individuo
em um determinado grupo ou tratamento, usando caractersticas observadas.
Os participantes so ento associados (matched) com base na probabilidade
estimada de participao em cada grupo, ou com base no escore de propenso
(propensity score).
O efeito mdio do tratamento (average treatment effect - ATE) de um programa
ento calculado como a diferena mdia entre os resultados (outcomes) para os dois
grupos estudados: participantes e no participantes do programa.
A validade do PSM depende de duas condies:
Exemplo
No boto Ferramentas, clique na opo Econometria Bsica e, em seguida, na
opo Propensity Score Matching.
98 / 183
100 / 183
101 / 183
102 / 183
Exemplo
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar seu arquivo de malha digital com sua tabela de dados (ver tpico de
concatenao), clique na opo Econometria Bsica e em seguida na opo
Regresso com Dados Binrios.
103 / 183
Incluir Intercepto;
Apresenta matriz de covarincia dos coeficientes;
Anlise de multicolinearidade;
105 / 183
106 / 183
Regresso Linear
Viso Geral
O formulrio do IpeaGEO para regresso linear ajusta uma reta de regresso
linear simples(apenas uma varivel independente) ou mltipla(mais que uma varivel
independente). Os coeficientes da equao de regresso so estimados pelo mtodo de
mnimos quadrados.
Esto disponveis, tambm, as seguintes opes: anlise de multicolinearidade e
heterocedasticidade (por meio do teste de White, resduos e presena de observaes
influentes); e anlise grfica de resduos (histograma e P-P plot dos resduos).
Para a anlise de ajuste do modelo so calculados os seguintes coeficientes:
coeficiente de determinao (R2), coeficiente de determinao ajustado (R2 ajustado),
critrio de informao de Akaike (AIC Akaike Information Criteria), critrio de
informao de Akaike para pequenas amostras (AICc Akaike Information Criteria
Corrected), critrio de informao bayesiano (BIC Bayesian Information Criteria) e
estatstica de Wilk (-2 * log-verossimilhana).
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar o arquivo de malha digital com a tabela de dados (ver tpico de
concatenao), clique no cone Ferramentas
em seguida na opo Regresso Linear.
107 / 183
108 / 183
109 / 183
110 / 183
111 / 183
Viso Geral
Os modelos Lineares Generalizados, assim como na regresso linear, tm como
objetivo analisar a influncia de uma ou mais variveis sobre outra de interesse, com o
grande diferencial de expandir esse conceito para gerar modelos com menos
pressupostos. Essa tcnica relaciona a varivel de interesse com as explicativas por
meio de funes de ligao
Exemplo
Na janela principal (formulrio mapas), selecione Ferramentas Econometria
Bsica Modelos Lineares Generalizados.
112 / 183
114 / 183
Estatstica Bsica
Anlise e testes para mdias
Viso Geral
115 / 183
Teste de qui-quadrado;
Exemplo
Existem duas maneiras para realizar tais testes no IpeaGEO:
116 / 183
Ao clicar em Anlise e Testes para Mdias abrir uma aba chamada Tabela de
Dados, na qual o usurio tem que importar um arquivo de dados do seu computador,
clicando em "Arquivo" e em seguida em "Importar arquivo de dados".
117 / 183
. O boto
seleciona
120 / 183
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar seu arquivo de malha digital (shape) com sua tabela de dados (ver tpico
de concatenao), clique no cone Ferramentas
em seguida na opo Descrio dos Dados.
122 / 183
123 / 183
Caso deseje voltar aba anterior para mais testes, basta clicar na aba
Especificaes.
Distribuies Contnuas
Viso Geral
O IpeaGEO permite verificar o ajuste de variveis aleatrias contnuas com as
seguintes distribuies: Normal, Exponencial, Gama, Cauchy, F, Qui-quadrado, Beta,
Qui (Chi), Weibull e Logstica.
Exemplo
Existem dois modos para realizar essa anlise no IpeaGEO:
124 / 183
125 / 183
126 / 183
127 / 183
. O boto
128 / 183
Distribuies Discretas
Viso Geral
O IpeaGEO permite verificar o ajuste de variveis aleatrias discretas com as
seguintes distribuies: Bernoulli, Binomial, Geomtrica, Pascal e Poisson.
Exemplo
Assim como para as distribuies contnuas, existem dois modos para realizar essa
anlise no IpeaGEO:
129 / 183
132 / 183
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) ou
concatenar o arquivo shape com a tabela de dados (ver tpico de concatenao), clique
na opo Mtodos de Apoio Deciso localizada na caixa Ferramentas
133 / 183
O boto
permite selecionar uma nica varivel, enquanto que o boto
permite selecionar todas as variveis disponveis.
134 / 183
Famlia Geral:
Algbrico;
Componentes principais.
135 / 183
Famlia AHP:
136 / 183
Famlia Promthe:
Promthe 1;
Promthe 2;
Promthe 3;
137 / 183
Promthe 4.
138 / 183
139 / 183
Exemplo
No boto Ferramentas, clique na opo reas Mnimas Comparveis e, em
seguida, na opo Compatibilizao de Variveis.
141 / 183
Para importar a tabela que ser usada no formulrio clique no boto Dados. O
formulrio de importao de tabela de dados ir se abrir.
142 / 183
143 / 183
Posteriormente, deve ser escolhido o ano para as AMCs e o ano (padro) para a
tabela de dados.
144 / 183
Uma nova aba contendo a associao das AMCs ir aparecer com os dados das
variveis e anos selecionados.
145 / 183
146 / 183
Conglomerados Espaciais
Hierrquico
Viso Geral
147 / 183
Exemplo
Aps concatenar o arquivo de malha digital (shape) com a tabela de dados (ver
tpico de concatenao), clique no cone Ferramentas
Espaciais e, em seguida, na opo Hierrquico.
, opo Conglomerados
149 / 183
150 / 183
151 / 183
Na parte Outras opes escolha qual o tipo de mtodo a ser aplicado para a
definio da matriz de vizinhana e quais as cores a serem utilizadas na construo do
mapa com os resultados da anlise. Caso seja de interesse, pode-se optar pelas opes
Cores Aleatrias e Gerar relatrio. Definidos os parmetros, clique no boto Gerar
rvore de conglomerados.
152 / 183
153 / 183
No grfico possvel dar zoom ou selecionar apenas uma parte do grfico para
melhor visualizao. Essas manipulaes so feitas com o mouse. Ao se utilizar o zoom
os eixos do grfico so ajustados automaticamente.
154 / 183
Mapa gerado:
155 / 183
Dependncia Espacial
156 / 183
Viso Geral
Uma etapa fundamental na anlise espacial a mensurao da dependncia
espacial entre as observaes, ou seja, testar se h ou no dependncia geogrfica
entre os eventos de estudo. Para isso, se utiliza duas abordagens diferentes: (1)
possvel estimar o quanto um determinado elemento est relacionado com seus vizinhos
de fronteira, de acordo com uma varivel de interesse essa relao pode ser avaliada
pelos ndices de autocorrelao espacial, tais como os ndices de Moran, Geary e GetisOrd Gi; (2) em alguns casos importante verificar se existem agrupamentos de unidades
geogrficas similares quanto s variveis em anlise isso pode ser feito por meio dos
indicadores de conglomerados espaciais de Tango e Rogerson.
ndices Globais
Viso Geral
Os indicadores globais so teis por apresentarem uma nica medida de
tendncia espacial para toda a regio em estudo. Assim, so as tcnicas mais utilizadas
na fase inicial de anlises exploratrias de dados de rea. Alm do teor exploratrio,
permitem ainda efetuar testes de hiptese, cuja hiptese nula que no h dependncia
espacial entre as unidades geogrficas, de acordo com as variveis originais.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) ou
concatenar o arquivo de malha digital (shape) com a tabela de dados (ver tpico de
concatenao), clique no cone Ferramentas
em seguida, na opo ndices Globais.
157 / 183
158 / 183
desejadas.
160 / 183
ndices Locais
Viso Geral
Quando muitos polgonos so analisados provvel que ocorra diferentes
regimes de autocorrelao espacial na regio em estudo. Nesses casos, apenas os
ndices globais no seriam suficientes para entender a estrutura dos dados analisados.
Portanto, importante apresentar tambm, para cada polgono, uma medida de
autocorrelao espacial. Essas estatsticas locais, em geral, derivam de algum dos
ndices de dependncia global apresentados no mdulo de ndices Globais.
As opes de Indicadores para os usurios do IpeaGEO so:
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) ou
concatenar o arquivo de malha digital (shape) com a tabela de dados (ver tpico de
concatenao), clique no cone Ferramentas
em seguida, na opo ndices Locais.
161 / 183
162 / 183
163 / 183
164 / 183
Econometria Espacial
Cross-Section
Viso Geral
O formulrio de dados cross-section espaciais tratam modelos de regresso para
observaes, em um momento do tempo, referentes a um conjunto de unidades
geogrficas. O objetivo principal desses modelos incorporar a possvel presena de
correlaes espaciais entre as unidades geogrficas. Para isso, existem diversas opes
disponveis para representao da dependncia espacial entre as unidades.
Alm das diferentes opes para determinao da estrutura de dependncia
espacial entre os vizinhos, possvel optar por diferentes mtodos de estimao para os
modelos de regresso disponveis. Essas opes so aplicveis para diferentes
situaes, dependendo, por exemplo, do tipo de informaes disponveis. As opes de
modelagem disponveis no formulrio de regresso para dados cross-section espaciais
so:
165 / 183
Exemplo
Existem dois modos para realizar essa anlise no IpeaGEO:
166 / 183
167 / 183
Para tornar as opes Tipo de matriz de vizinhana, Clculo do logdeterminante, Matriz de covarincia no estimador de Kelejian-Prucha e Funo kernel
(HAC) habilitadas, necessrio, inicialmente, determinar a matriz de vizinhana
desejada (ver tpico Matriz de Vizinhana).
Aps escolher a matriz de vizinhana desejada, o usurio tem a disposio novas
opes de tipos de modelos, so elas: SAR (MLE); SAR (Kelejian e Prucha); SEM
(MLE); e SAC (MLE).
171 / 183
173 / 183
Viso Geral
Os ndices de segregao espacial medem o quo irregular a distribuio de
certo grupo em uma determinada rea geogrfica. Os primeiros estudos dos ndices de
segregao surgiram na dcada de 1950 com o estudo de Ducan e Ducan (1955a).
Segundo eles, o problema das medidas de segregao foi a construo delas a partir de
noes simples e pobres ao invs de serem formuladas por meio de articulaes
conceituais claras de seu processo. Ducan e Ducan (1955a, p.217) caracterizavam essa
simplicidade conceitual como uma ingnua noo de segregao.
[Segregao] um conceito rico em sugestividade terica e de um valor
heurstico inquestionvel. Claramente ns no desejamos sacrificar o capital da
teorizao e observao j investidas no conceito. At o momento, isso o que est
envolvido na soluo oferecida pelo operacionalismo ingnuo, mais ou menos uma
combinao arbitrria de alguns convenientes procedimentos numricos de um conceito
verbal de segregao.
Segundo Wong (1999), a medida segregao de Duncan e Duncan (1955a)
ainda a melhor medida de segregao, pois ela capta efetivamente a dimenso
evenness, a mais importante dimenso de segregao.
Exemplo
Aps concatenar o arquivo de malha digital (shape) com a tabela de dados (ver
tpico de concatenao), clique no boto Ferramentas
, opo Indicadores
Espaciais e, em seguida, na opo ndices de Segregao Espacial.
175 / 183
Indicador de Entropia;
Coeficiente de Gini;
ndice de Atkinson.
Tipo exposition:
Tipo clustering:
176 / 183
Tipo exposition:
Tipo clustering:
Dissimilaridade (Dissimirarity);
Coeficiente de Gini;
Teoria da Informao (Information Theory).
Tipo exposition:
178 / 183
179 / 183
180 / 183
Referncias Bibliogrficas
AGRESTI, A. Categorical data analysis. 2 edio. New York: Wiley, 2002.
AGRESTI, A. Introduction to the Analysis of Categorical Data. New York: Wiley, 1995.
ANSELIN, L. Local indicators of spatial association LISA. Geographical Analysis, 27,
93-115. 1995.
ANSELIN, L.; LE GALLO, J.; JAYET, H. Spatial panel econometrics. The Econometrics
of Panel Data. In Mtys, L., Sevestre, P. (eds.). Springer-Verlag, 2008.
ANSELIN L., Luc Spatial Econometrics: Methods and Models. Kluwer Academic
Publishers, Dordrecht, 1988.
BAILEY, T.; GATRELL, A. Interactive Spatial Data Analysis. Longman, Har-low 1995.
BALTAGI, B.; EGGER, P.; PFAFFERMAYR, M. A generalized spatial panel data model
with random effects. Syracuse University, Working Paper, 2007a.
BALTAGI, B.; SONG, S. H.; JUNG, B. C.; KOH, W. Testing for serial correlation, spatial
autocorrelation and random effects using panel data. Journal of Econometrics, v. 140,
2007b.
BUSSAB, W. O.; MORETTIN, P. A. Estatstica Bsica. 5 Ed. So Paulo: Saraiva, 2002.
536p.
CARON, R. Regresso de dados binrios: distribuio weibull. So Carlos: UFSCar,
2010.
CARVALHO, A. X. Y, ALBUQUERQUE, P. H. M., ALMEIDA JNIOR, G. R.,
GUIMARES, R. D., LAURETO, C. R. Clusterizao Hierrquica Espacial com Atributos
Binrios.
Texto
para
Discusso
no.
1428.
Ipea.
2009.
http://www.ipea.gov.br/sites/000/2/publicacoes/tds/td_1428.pdf.
CLAYTON, D.; KALDOR, J. Empirical bayes estimates of age-standardized relative risks
for use in disease mapping. Biometrics, v. 43, n. 3, p. 671-681, 1987.
CONNOVER, W. J. Practical Nonparametric Statistics. John Wiley & Sons, 2 ed., 1980.
CRESSIE, N. A.C. Spatial Statistics. John Wiley, New York, 1993.
CMARA, G.; DAVIS C.; MONTEIRO, A.M.; D'Alge, J. C. Introduo Cincia da
Geoinformao. So Jos dos Campos, INPE, 2001.
DEMTRIO, C. G. B. Modelos Lineares Generalizados em Experimentao Agronmica.
ESALQ/USP, 2002.
DEMPSTER, A. P.; LAIRD, N. M.; RUBIN, D. B. Maximum likelihood for incomplete data
via the EM algorithm (with discussion). Journal of the Royal Statistical Society, v. 39, n. 1,
p. 1-38, 1977 (Series B).
DOANE, D.P. Aesthetic frequency classifications. Amer. Statist. 30-4, 181- 183. 1976.
DRUCK, S. CMARA, G. e MONTEIRO, A.M. Anlise espacial de dados geogrficos.
Embrapa, Planaltina, 2004.
181 / 183
analysis
of
segregation
37, 17-33.
MORI,T. An optimal length of class interval for histogram. Japan.J.Applied Statistics , 4-1,
17-24. 1974.
MUTL, J. Dynamic panel data models with spatially correlated disturbances. Ph.D. thesis,
University of Maryland, College Park, 2006.
MUTL, J.; PFAFFERMAYR, M. The spatial random effects and the spatial fixed effects
model: the Hausman test in a Cliff and Ord panel model. Manuscript, Institute of
Advanced Studies, Vienna, 2008.
NELDER, J. A.; WEDDERBURN, R. W. M. Generalized Linear Models. Journal of the
Royal Statistical Society. Series A (General), v. 135, n. 3, 1972.
PAULA, G. A. Modelos de Regresso com apoio computacional. So Paulo: IME/USP,
2010.
PRINGLE, D. G. Mapping disease risk estimates based on small numbers: An
assessment of empirical bayes techniques. Economic and Social Review, v. 27, p. 341363, 1996.
RIPLEY, B. D. Spatial Statistics. John Wiley, New York, 1981.
182 / 183
ROGERSON, P. The detection of clusters using a spatial version of the chi squared
goodness-of-fit test. Geographical Analysis, 31, 130-147, 1999.
ROGERSON, P.; YAMADA, I. Statistical Detection and Surveillance of Geo-graphic
Clusters. Chapman and Hall, 2008.
SATTERTHWAITE, F. E. An approximative distribution of estimates of variance
componentes. Biometrics Bulletin, v. 2, p. 110 114, 1947.
STEVENSON, W.J. Estatstica: Aplicada Administrao. So Paulo: Harbra, 2001.
511p.
STURGES, H.A. The choice of a class interval. J.Amer.Statist.Assoc. 21.65-66. 1926.
TANGO, T. A class of tests for detecting generaland focusedclustering of rare
diseases. Statistics in Medicine, 7, 649-660. 1955.
WALLER, L. A.; TURNBULL, B. W.; CLARK, L. C.; NASCA, P. Chronic disease
surveillance and testing of clustering of disease and exposure: Application to leukemia
incidence and TCE-contaminated dumpsites in upstate New York. Environmetrics 3, 281300, 1992.
WELCH, B. L. The generalization of students problem when several different
population variances are involved. Biometrika, v. 34, p. 28 35, 1947.
WONG, D. W. S. Geostatistics as measures of spatial segregation. Urban Geography,
20 (7), 635-647, 1999.
YU, J., LEE, L. F. (2010). Some recent developments in spatial panel data models.
Regional Science and Urban Economics, v. 40, pp. 255-271.
183 / 183