Una Cartilla para Espacial Econometría: Giuseppe Arbia

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 246

Machine Translated by Google

TEXTOS DE PALGRAVE EN ECONOMÉTRICA

Una cartilla para espacial


Econometría
Con Aplicaciones en R

Giuseppe Arbia
Machine Translated by Google

Introducción a la econometría espacial


Machine Translated by Google

PalgraveTexts en econometría

Editores generales: Kerry Patterson y Terence Mills


Editores regionales: Europa del Norte: Niels Haldrup; Lejano Oriente: En Choi; ESTADOS UNIDOS:
Guillermo Greene; Sur de Europa y Oceanía: Tommaso Proietti

El ritmo de desarrollo de la econometría ha hecho que sea cada vez más difícil tanto para los estudiantes como
para los profesionales ser conscientes de lo que es impotente y probable que sea duradero en la teoría y las
aplicaciones prácticas. Esta serie aborda desarrollos clave importantes dentro de un marco unificado, con
volúmenes individuales organizados temáticamente. La serie es relevante tanto para estudiantes como para
profesionales que necesitan mantenerse al día con los desarrollos econométricos, pero está escrita para una
amplia audiencia con un estilo diseñado para poner los conceptos econométricos a disposición de los
economistas que no son econometristas.

Los títulos incluyen:

Simon P. Burke y John Hunter


MODELADO DE SERIES TEMPORALES NO ESTACIONARIAS

Michael P. Clements
EVALUACIÓN DE PRONÓSTICOS ECONOMÉTRICOS DE VARIABLES ECONÓMICAS Y FINANCIERAS

Lesley Godofredo
PRUEBAS BOOTSTRAP PARA MODELOS DE REGRESIÓN

Terence C. Molinos
MODELIZACIÓN DE TENDENCIAS Y CICLOS EN SERIES TEMPORALES ECONÓMICAS

Kerry Patterson
PRIMER PARA PRUEBAS DE RAÍZ UNIDAD

Kerry Patterson
PRUEBAS DE RAÍCES UNITARIAS EN SERIE DE TIEMPO VOLUMEN 1

Conceptos y problemas clave

Kerry Patterson
PRUEBAS DE RAÍCES UNITARIAS EN SERIE DE TIEMPO VOLUMEN 2

Ampliaciones y Desarrollos

Terence C. Molinos
ANÁLISIS DE DATOS ECONÓMICOS
Una introducción concisa

Giuseppe Arbia
UN PRIMER PARA LA ECONOMÉTRICA ESPACIAL
Con Aplicaciones en R

Textos de Palgrave en econometría


Orden permanente de la serie ISBN 978–1–403–90172–9 (tapa dura) 978–1–403–
90173–6 (tapa blanda)
(solo fuera de América del Norte)

Puede recibir títulos futuros de esta serie a medida que se publiquen haciendo un pedido permanente.
Póngase en contacto con su librero o, en caso de dificultad, escríbanos a la dirección que figura a continuación
con su nombre y dirección, el título de la serie y el ISBN citado anteriormente.

Departamento de Atención al Cliente, Macmillan Distribution Ltd, Houndmills,


Basingstoke, Hampshire RG21 6XS, Inglaterra
Machine Translated by Google

Una cartilla para espacial


Econometría
Con Aplicaciones en R

Giuseppe Arbia
Machine Translated by Google

© Giuseppe Arbia 2014


Prólogo © William Greene 2014

Reimpresión en tapa blanda de la 1ª edición en tapa dura 2014 978-0-230-36038-9

Reservados todos los derechos. Ninguna reproducción, copia o transmisión de este


la publicación puede hacerse sin permiso por escrito.

Ninguna parte de esta publicación puede ser reproducida, copiada o transmitida


excepto con permiso por escrito o de acuerdo con las disposiciones de la Ley de derechos de
autor, diseños y patentes de 1988, o bajo los términos de cualquier licencia que permita la copia
limitada emitida por la Agencia de licencias de derechos de autor, Saffron House, 6–10 Kirby
Street, Londres EC1N 8TS.

Cualquier persona que realice cualquier acto no autorizado en relación con esta publicación.
puede ser objeto de enjuiciamiento penal y demandas civiles por daños y perjuicios.

La autora ha hecho valer su derecho a ser identificada como la autora de este trabajo de
conformidad con la Ley de derechos de autor, diseños y patentes de 1988.

Publicado por primera vez en 2014 por


PALGRAVE MACMILLAN

Palgrave Macmillan en el Reino Unido es una impresión de Macmillan Publishers Limited,


registrada en Inglaterra, número de compañía 785998, de Houndmills, Basingstoke, Hampshire
RG21 6XS.

Palgrave Macmillan en EE. UU. es una división de St Martin's Press LLC, 175 Fifth
Avenue, Nueva York, NY 10010.

Palgrave Macmillan es el sello académico global de las empresas mencionadas y tiene empresas
y representantes en todo el mundo.

Palgrave® y Macmillan® son marcas registradas en los Estados Unidos, el Reino Unido,
Europa y otros países.

ISBN 978-1-137-42816-5 ISBN 978-1-137-31794-0 (libro electrónico)

DOI 10.1057/9781137317940

Este libro está impreso en papel apto para el reciclaje y fabricado con
fuentes forestales gestionadas y sostenidas. Se espera que los procesos de tala, pulpa y
fabricación se ajusten a las reglamentaciones ambientales del país de origen.

Un registro de catálogo para este libro está disponible en la Biblioteca Británica.

Un registro de catálogo para este libro está disponible en la Biblioteca del Congreso.

Compuesto por MPS Limited, Chennai, India.

Transferido a Impresión Digital en 2014


Machine Translated by Google

A P, E, F y E
Machine Translated by Google

Contenido

Lista de Figuras ix

Lista de ejemplos X

Prólogo de William Greene xi

Prefacio y Agradecimientos XIII

1 El modelo clásico de regresión lineal 1.1 El 1


modelo básico de regresión lineal 1.2 No 1
esfericidad de las perturbaciones 1.3 11
Endogeneidad 1.4 Códigos R: ejecutar una dieciséis

regresión Términos y conceptos clave Preguntas 20


presentadas Ejercicios Referencias al capítulo 22
22
23
25

2 Algunas definiciones espaciales importantes 26


2.1 La matriz de peso espacial W y la definición de retraso espacial
2.2 Prueba de autocorrelación espacial entre MCO 26

residuos sin una hipótesis alternativa explícita 33


2.3 Códigos R 39
Términos y conceptos clave presentados 47
Preguntas Ejercicios Referencias al capítulo 47
47
50

3 modelos de regresión lineal espacial 51


3.1 Generalidades 51
3.2 Autorregresión espacial pura 3.3 52
El modelo clásico con regresores no estocásticos
retrasados espacialmente 3.4 El modelo de error 55
espacial (SEM) 55
3.5 El modelo de retraso espacial (SLM) 66
3.6 El modelo general SARAR(1,1) 3.7 74
Probando la autocorrelación espacial entre los
residuos con una hipótesis alternativa explícita 82

viii
Machine Translated by Google

viii Contenido

3.8 Interpretación de los parámetros en espacial


modelos econométricos 87
3.9 Códigos R: estimación de modelos espaciales lineales 90
Términos y conceptos clave presentados Preguntas Ejercicios 93
93
94
Referencias al Capítulo 4 Temas 97

adicionales en econometría espacial 4.1 Innovaciones 99


heteroscedásticas 99
4.2 Modelos espaciales para variables de respuesta binaria 4.3 111
Modelos de datos de panel espacial (Escrito por Giovanni Millo) 128
4.4 Modelos econométricos espaciales no estacionarios 4.5 145
Códigos R 153
Términos y conceptos clave introducidos 158
Preguntas 160
Ejercicios 160
Referencias al Capítulo 162

5 especificaciones de modelos alternativos para grandes conjuntos de datos 167


5.1 Introducción 167
5.2 La especificación MESS 5.3 El 169
enfoque de aproximación unilateral 5.4 Un enfoque de 178
probabilidad compuesta 5.5 Códigos R 189
196
Términos y conceptos clave introducidos 198
Preguntas 198
Ejercicios 199
Referencias al Capítulo 200

6 Conclusiones: ¿Qué sigue? 202

Soluciones a los ejercicios 207

Índice 225
Machine Translated by Google

Lista de Figuras

2.1 Autocorrelación espacial y heterogeneidad espacial 27

2.2 Criterios de contigüidad en una cuadrícula de celosía cuadrada regular 27

2.3 Límites de las 20 regiones italianas 41

5.1 Tres regiones dispuestas en una cuadrícula de celosía regular 180

5.2 Dos matrices W diferentes que incorporan dos direcciones


diferentes de dependencia espacial 5.3 Patrón de 181

codificación bivariante en una cuadrícula de celosía cuadrada regular 190

5.4 Cuatro esquemas de codificación bivariados diferentes para los


datos de la Figura 5.3 195

ix
Machine Translated by Google

Lista de ejemplos

1.1 Modelo de convergencia regional de Barro y Sala-i-Martin 9

1.2 Zellner-Revankar revisó la función de producción de


Cobb-Douglas 10

1.3 Modelo de convergencia regional de Barro y Sala-i-Martin


(continuación) 15

1.4 Función de producción de Zellner-Revankar (continuación) 18

2.1 Algunos ejemplos de matrices W 2.2 28

Matriz W basada en la contigüidad de las regiones del 30

Reino Unido 2.3 Ley de Okun para las 20 regiones 35

italianas 2.4 Curva de Phillips para las 20 regiones italianas 37

3.1 Autorregresión espacial del índice de precios en las 20


regiones italianas 54

3.2 La relación entre el precio de los autos usados y los impuestos


en 48 estados de EE. UU. 63

3.3 Determinantes del precio de la vivienda en Boston 70

3.4 Determinantes del precio de la vivienda en Boston (continuación) 80

3.5 Curva de Phillips (continuación) 86

3.6 Ley de Okun en Italia (continuación) 90

4.1 Un estudio urbano: Los determinantes del crimen en


Columbus (Ohio) 106

4.2 Explicación de los precios de las casas de lujo en Baltimore 115

4.3 Precios de casas de lujo en Baltimore (continuación) 127

4.4 Modelo de productividad del capital público de Munnell 130

4.5 Modelo de productividad del capital público de


Munnell (continuación) 142

4.6 Un análisis de efectos fijos de panel espacial de


convergencia en regiones italianas 143

4.7 El determinante de los logros educativos en Georgia 5.1 La planificación de la 151

salud en México 176

X
Machine Translated by Google

Lista de ejemplos xi

5.2 Anisotropías en el modelo de convergencia de Barro


y Sala-i-Martin 183

5.3 Planificación de la salud en México (continuación) 187


5.4 Evaluación Monte Carlo del método de estimación BML 195
Machine Translated by Google

Prefacio

He tenido el gran placer de disfrutar de mi propio estudio de econometría espacial en


colaboración con Giuseppe Arbia durante su trabajo en esta monografía. Hay mucho que
aprender en este campo de rápido crecimiento.
Este manual introduce el caballo de batalla del campo, el modelo de regresión lineal
espacialmente autorregresivo y espacialmente autocorrelacionado. Se dedica un capítulo a
términos importantes del arte en el campo. Luego avanzamos a través de extensiones del
modelo lineal a heterocedasticidad y tratamientos de datos de panel. Los desarrollos recientes
de la econometría espacial han extendido los modelos a muchos casos no lineales, incluida
la elección binaria y multinomial, las fronteras estocásticas, la selección de muestras y los
modelos para datos de conteo y elecciones ordenadas. Este manual proporciona una puerta
de entrada a esa literatura a través de la presentación de un modelo espacial de elección
binaria.
Los lectores apreciarán la extensa presentación de ejemplos numéricos reales en R, que se
ha convertido en el software elegido por los constructores de modelos en esta área.

La econometría espacial está disfrutando de un crecimiento muy disperso en muchas de


las ciencias sociales. Los lectores de este manual encontrarán que es un trampolín muy
accesible e informativo para su propio estudio e investigación en curso, como lo he hecho yo.

guillermo verde
Escuela de Negocios Stern
Nueva York, agosto de 2013

xi
Machine Translated by Google

Prefacio y Agradecimientos

La econometría espacial es un tema en rápida expansión con aplicaciones en


campos científicos tan diversos que es casi imposible enumerar completamente
todas las disciplinas. De hecho, en los últimos años podemos encontrar
aplicaciones en campos como la economía regional, la criminología, las finanzas
públicas, la organización industrial, las ciencias políticas, la psicología, la
economía agrícola, la economía de la salud, la demografía, la epidemiología, la
economía empresarial, la planificación urbana, la educación, la uso del suelo,
ciencias sociales, desarrollo económico, difusión de la innovación, estudios
ambientales, historia, mano de obra, economía de recursos y energía, transporte,
seguridad alimentaria, bienes raíces, mercadeo y muchos otros.
Dado el amplio interés en el tema, este libro tiene como objetivo satisfacer la
creciente demanda al presentar metodologías básicas de econometría espacial
a una amplia variedad de investigadores. Está diseñado específicamente como
una referencia para investigadores aplicados que desean recibir una visión
general amplia sobre el tema. En este sentido, no pretende ser un libro de texto
completo sobre el tema; más bien, la intención es mantener los detalles al
mínimo y brindar una guía práctica que ilustre el potencial del modelado
econométrico espacial, discuta problemas y soluciones, y permita al lector
interpretar correctamente los resultados empíricos y comenzar a trabajar con los
métodos.
Hay varias características que distinguen este libro de otros textos existentes
sobre el tema. En primer lugar, este libro es autónomo y no asume ningún
conocimiento previo aparte de un conocimiento práctico de la estadística
inferencial elemental. El Capítulo 1 contiene un resumen de los resultados
econométricos estándar básicos que se utilizan a lo largo de este texto; como
tal, puede ser omitido por el lector que ya tiene conocimientos sobre el tema. El
tratamiento de los diversos temas es riguroso, pero con pruebas formales de
bajo nivel y reducidas a la mínima expresión. El libro proporciona los conceptos
básicos mínimos esenciales y las intuiciones sobre cada tema y hace referencia
a otros libros de texto y a la literatura para una discusión más profunda. Además,
el texto está integrado con ejemplos, conjuntos de problemas y ejercicios
prácticos. Hasta cierto punto, uno puede pensar en este libro como un capítulo
extenso de un libro de texto de econometría. Por lo tanto, pretende explícitamente
cerrar la brecha entre los libros de texto estándar, que todavía ignoran en gran
medida el tema, y los libros de texto más completos y especializados. Aunque el
libro está orientado a la aplicación, me he ocupado

XIII
Machine Translated by Google

xiv Prefacio y Agradecimientos

proporcionar desarrollos metodológicos sólidos y utilizar notaciones generalmente


aceptadas para los temas que se tratan. Por lo tanto, el lector encontrará que este
texto proporciona una buena preparación para el estudio de material de econometría
espacial más avanzado.
En segundo lugar, este libro solo se superpone parcialmente con los libros de
texto existentes sobre el tema. Aunque no contiene un tratamiento completo de
todos los temas de la econometría espacial, incluye algunos de los avances
recientes que no se tratan en otros libros de texto existentes. Por ejemplo, diversas
alternativas de estimación al paradigma tradicional de Máxima Verosimilitud, el
tratamiento de las innovaciones heteroscedásticas, los modelos espaciales de
elección discreta y los modelos no estacionarios. Además, incluso si la mayor parte
del libro trata sobre modelos espaciales transversales sincrónicos, la sección 4.3
contiene una introducción al tratamiento de datos de panel espacial, un campo de
rápido crecimiento en la econometría espacial.
En tercer lugar, las personas que trabajan en este campo aprenden rápidamente
que la mayoría de los procedimientos ilustrados en este libro encuentran severas
limitaciones computacionales cuando se aplican a conjuntos de datos muy grandes
con tamaños de muestra que se aproximan a miles de observaciones. Los
problemas computacionales pueden, de hecho, representar una gran limitación
para muchos académicos involucrados en el análisis espacial en campos no
especializados que no tienen acceso a grandes instalaciones informáticas. Pueden
representar una limitación incluso con la disponibilidad de potentes máquinas
informáticas en todos aquellos casos en los que se deba tomar una decisión en
tiempo real en base al análisis econométrico como, por ejemplo, la vigilancia
epidemiológica y ambiental o la cirugía asistida por ordenador, basado en imágenes
médicas. Para superar tales limitaciones, este libro también incluye un capítulo
enteramente dedicado a discutir una serie de técnicas alternativas de estimación
que pueden ayudar a reducir drásticamente el tiempo computacional y los requisitos de memoria d
Finalmente, el texto introduce al lector a los procedimientos contenidos en el
software estadístico libre “R”. Si bien las metodologías econométricas espaciales
aún no están integradas en los productos de software econométrico (como, por
ejemplo, Eviews, Gauss, Gretl, Limdep, Microfit, Minitab, RATS, SAS, SPSS, TSP
y muchos otros), actualmente existen algunos paquetes que tratan la mayoría de
los temas tratados en este libro (por ejemplo, STATA, Matlab) junto con software
más especializado en el tema (por ejemplo, GeoDa). En este libro, sin embargo,
hemos decidido ilustrar los diversos métodos haciendo uso del lenguaje estadístico
R por tres razones principales. En primer lugar, el paquete está disponible
gratuitamente, por lo que el lector del libro puede replicar inmediatamente las
técnicas utilizando los datos disponibles. En segundo lugar, el lenguaje R es
intuitivo y requiere solo una pequeña inversión inicial. En tercer lugar, dado que la
econometría espacial es un rápido
Machine Translated by Google

Prefacio y Agradecimientos xv

En expansión, el lenguaje R garantiza una actualización casi en tiempo real


cuando se introducen nuevos procedimientos en la literatura.
El material presentado se puede utilizar como libro de texto para un curso de
introducción a la econometría espacial que supone un conocimiento práctico
de la econometría al nivel de, por ejemplo, los capítulos introductorios de la
séptima edición del libro de texto de Greene (ver W. Greene, Econometric
Análisis (2011)) o similar. En particular, los capítulos 1 a 3 podrían constituir el
material para un curso de dos o tres días (10 a 12 horas de clase).
Los capítulos 4 (3 a 4 horas) y 5 podrían ser material complementario cubierto
en días adicionales. Para el capítulo 4, el instructor tendría la opción de cubrir
todo el capítulo, lo que podría tomar un día completo, o cubrir una parte del
capítulo, lo que tomaría solo tres o cuatro horas. Los ejemplos, las preguntas y
los ejercicios contenidos en la parte final de cada capítulo pueden usarse en
combinación con un conjunto de sesiones de laboratorio de computación que
podrían acompañar las conferencias.
La idea de un libro de texto introductorio y fácil de usar para investigadores
aplicados se desarrolló durante las muchas ocasiones a lo largo de la última
década, en las que tuve la oportunidad de impartir cursos de introducción a la
econometría espacial en diferentes universidades e instituciones en Milán,
Barcelona, Fortaleza, Salvador-Bahia y en la escuela de verano, 'Instituto
Avanzado de Econometría Espacial', que se realiza anualmente en Roma desde 2008.
El primer plan del libro fue escrito mientras visitaba el Departamento de
Economía de la Stern School of Business de la Universidad de Nueva York
durante el semestre de primavera de 2011. Agradezco a Bill Greene por
invitarme en esa ocasión y en las dos siguientes. años en primavera cuando
trabajé en este proyecto. El borrador final se completó durante el período que
pasé como profesor invitado en ERMES, Université Panteon Assas, París II,
por lo que estoy en deuda con Alain Pirotte, quien fue muy amable al recibirme
y proporcionarme un entorno adecuado para terminar mi trabaja. El resto del
trabajo lo realicé en la Universidad Católica del Sagrado Corazón de Roma,
donde me mudé a finales de 2011.
La sección 4.3 está escrita por Giovanni Millo de Assicurazioni Generali,
Trieste, Italia y le agradezco su importante contribución a la preparación del
libro y su paciencia al trabajar conmigo.
También agradezco a Carrie Dolan del College of William & Mary, Williamsburg,
EE. UU., por revisar cuidadosamente mi borrador. Obviamente, soy
completamente responsable de todos los errores restantes. Carrie también fue
invaluable al proporcionar y editar algunos de los mapas utilizados en el texto
y en los ejemplos. Agradezco también a Miguel Flores del Tecnológico de
Monterrey, México por proporcionar los datos y los mapas de México en los
que basé algunos de los ejemplos del capítulo 5, y a Diego
Machine Translated by Google

xvi Prefacio y Agradecimientos

Giuliani, Francesca Petrarca y Myriam Tabasso por su rápida asistencia y asesoramiento


en línea con respecto a algunos de los procedimientos R. Giovanni, Carrie, Miguel,
Diego, Francesca y Myriam son antiguos participantes del 'Instituto Avanzado de
Econometría Espacial' antes mencionado y también quisiera expresar mi gratitud a
todos los estudiantes que formaron parte de la escuela en los últimos seis años (más
¡más de 200!) porque su presencia activa en clase fue sin duda el mayor estímulo que
recibí al escribir este libro.

Este libro está dedicado a mi familia. Si reviso los prólogos que he escrito para mis
libros anteriores, encuentro expresiones de agradecimiento a Paola ya mis tres hijos
por su presencia, paciencia, ayuda y aliento. Han pasado veinticinco años desde la
publicación de mi primer libro y siete desde el último. Los niños han crecido y muchas
cosas han cambiado, pero mi familia todavía está aquí conmigo y para ellos mis
pensamientos están agradecidos en este lluvioso y sombrío día de finales de invierno,
cuando estoy aquí sentado frente a mi computadora escribiendo las últimas palabras
de este libro.

Roma, Miércoles de Ceniza, 2014


Machine Translated by Google

1
La regresión lineal clásica
Modelo

1.1 El modelo básico de regresión lineal

Consideremos el siguiente modelo lineal

norte y1 = norte Xkk b1 + e1 norte (1.1)

ÿÿ

ÿy 1
...
donde y1 = es un vector de n observaciones del dependiente
norte
...

ÿ
ÿÿÿÿÿÿÿy
norte
ÿÿÿÿÿÿÿ

ÿ1 XX ÿ1
ÿ
11 1k ÿ

... ...
variable y, X = una matriz de n observaciones en k – 1
nk 1
1 XX
ÿ norte1 nk 1 ÿ ÿ

ÿ
b1 ÿÿ

=
regresores exógenos no estocásticos que incluyen un término constante, k b1
ÿ

ÿÿ
segundo

k ÿÿÿÿÿÿÿ

ÿ mi ÿÿ

1
...
mi =
un vector de k parámetros desconocidos a estimar y norte 1 un

ÿ ÿ ÿ ÿ ÿ ÿ ÿ ÿ mi ÿÿÿÿÿÿÿ
norte

vector de perturbaciones estocásticas. Supondremos a lo largo del libro que las n


observaciones se refieren a unidades territoriales como regiones o países.

1
Machine Translated by Google

2 Introducción a la econometría espacial

El modelo de regresión lineal clásico asume normalidad, identidad e


independencia de las perturbaciones estocásticas condicionadas por los
k regresores. En breve

eÿX ÿ iidN (0, s2es en) (1.2)

n Al ser una matriz identidad n-por-n . La ecuación (1.2) también se puede escribir como:

E(eÿX) = 0 (1.3)

E(eeT ÿX) = s2es en (1.4)

La ecuación (1.3) corresponde al supuesto de exogeneidad, la ecuación


(1.4) al supuesto de perturbaciones esféricas (Greene, 2011).
Además, se supone que los regresores k no son perfectamente
dependientes entre sí (rango completo de la matriz X). Bajo este conjunto de
hipótesis, el criterio de ajuste de mínimos cuadrados ordinarios (MCO)
conduce a los mejores estimadores lineales insesgados (AZUL) del vector de
MCO =
parámetros b,bˆ. De hecho,
digamos bˆ el criterio OLS requiere:

S(b ) = eT e = min (1.5)

donde e = y ÿXbˆ son los errores observados y eT indica la transpuesta de e.


De la Ecuación (1.5) tenemos:
d dd ( ) =
=0
Xy TTT T segundo
S X y X XXee = ( ) ( segundo )=2 bb ÿÿ ÿ y
dbdd
bb ()

De dónde:

bMCO = (XT X)ÿ1 XT y (1.6)

Como se dijo, el estimador OLS es imparcial

E(bˆ MCOÿX) = b (1.7)

con una varianza

Var(bˆ MCOÿX) = (XT X)ÿ1 s2 mi (1.8)

que alcanza el mínimo entre todos los estimadores lineales posibles


( eficiencia total) y tiende a cero cuando n tiende a infinito (consistencia débil).
Machine Translated by Google

El modelo clásico de regresión lineal 3

Del supuesto de normalidad de las perturbaciones estocásticas, también se sigue la normalidad


de los estimadores:

bˆ MCOÿX ÿ N[ b; (XTX )ÿ1 s2 ] mi (1.9)

Además, del supuesto de normalidad de las perturbaciones estocásticas también se deduce que
los estimadores alternativos, basados en el criterio de Máxima Verosimilitud (ML), coinciden con
la solución MCO.
De hecho, la perturbación estocástica única se distribuye como:

1 ÿÿ1
ÿÿÿ 2

F ()=
yo
_
yo
_ Exp ÿ ÿ
mi
yo

ÿ 2p _ 2ÿÿ

siendo f una función de densidad, y en consecuencia la probabilidad de la muestra observada es:

1 1
norte norte
ÿ

2 2
Lb
(, ÿ ÿ ) =i f( ) =
ÿ mi yo y yo
ÿ

mi _ ÿ ÿ expÿÿ ÿ2ÿ
i =1
ÿ 2p _ 2
yo = 1 mi ÿ
mi ÿ

eeT
norte
norte

= 22 ÿ

ÿ
ÿÿ

(ÿ mi ) ( 2 pag ) 2
ÿ ÿ expÿÿ ÿ2
(1.10)
2 ÿ
mi
ÿ ÿ

ÿ
ÿ norte ÿ 2 eeT ÿ

= porque t (ÿ 2 exp
) ÿÿ 2 mi
2
ÿ

ÿ
ÿ mi ÿÿ

del supuesto de independencia de las perturbaciones. De (1.1) tenemos que

e = y – Xb (1.11)

por lo tanto (1.10) se puede escribir como:

ÿ norte ÿ 2 T
ÿ ( segundo )( yX yX
segundo )ÿ
ÿ ÿ
ÿ

2
L segundo
ÿ (
mi ( , ) = costo t
2 ÿ exp ÿ
mi ) ÿ

2 (1.12)
2ÿ mi ÿ

y la log-verosimilitud como:

T
( lLyXt ÿÿ
) 22 2segundo ( , segundo ) = 2segundo )( norte yXÿsegundo
ÿ ÿ ee e ) ÿ ÿ
ÿ ÿ

ln en
( , )( = porque
(1.13)
ÿ ÿ

2
2 ÿ
mi

Las funciones de puntuación se definen como:

ÿÿ
ÿ dL
ln ( , (segundoÿ 2) ÿ
1 ˆ
ÿÿ
)= ÿ = (X yT XX T
mi

b)=0
ÿ

ˆ
ÿ ÿ

ÿ
sÿ
segundo
2
ÿ b ÿ
mi
ÿ ˆ ˆ (1.14)
ÿ re L 2
( )( n yXbyXTb
ÿ

ÿ
segundo
ln ( , ÿ
mi
) ÿ
ÿ ÿ

2 ÿ
= + )=0
ÿÿ (mi)= re
ÿ

ÿs
ÿ

ÿÿ 22 4 2ˆ 2ˆ
ÿ

ÿ
ÿÿ ee ee
Machine Translated by Google

4 Introducción a la econometría espacial

y resolviendo el sistema de k +1 ecuaciones, tenemos:

ˆ
T ÿ

1 T
b ML =( )XXXy
ˆ2 T
ee (1.15)
ÿ =
mi , ML
norte

Así, bajo la hipótesis de normalidad de residuos, el estimador ML de b coincide con el


estimador MCO. El estimador ML de s2 sobre el mi

te
contrario difiere del estimador insesgado 2 s
mi
= y es parcial,
nk -
pero asintóticamente imparcial.
Para asegurar que la solución obtenida es un máximo consideramos la
segundas derivadas:

2
dlb 2
ÿÿ
(, ) ()ÿ 1
dsb
ÿ

ÿ
mi
= = ˆ XXT
2 22
ÿ

ÿ base
de datos
db ÿ
mi
ÿ

22 2
ÿ

dlb (, ) ÿ
mi
ds ( ÿ) norte

ÿ
ÿ

2
= mi
= (1.16)
2 24
ÿ

ÿ
ddÿ ÿÿeee 2ˆ
ÿ

dl2 (,b) ÿÿ 2
ÿ

mi
ÿ =0
ÿ

ddb ÿ
2
ÿÿ mi

que se pueden organizar en la matriz de información de Fisher:

ÿ1ÿ ÿ

T
ˆ 2 XX 0 ÿ

ÿ
2 mi
k +1 +1 yo
( b, )=ÿ mi (1.17)
norte

0
ÿ
2ˆÿ 4 mi ÿ

que es definida positiva.


La equivalencia entre los estimadores ML y OLS asegura que la solución encontrada
disfrute de todas las propiedades de muestra grande de los estimadores ML, es decir:
normalidad asintótica, consistencia, insesgamiento asintótico, eficiencia total con respecto a
una clase más grande de estimadores que no sean los estimadores lineales y la invariancia.

Los estimadores MCO también coinciden con el Método de los Momentos


estimadores (MM). De hecho, considere la siguiente condición de momento:

1 T mi
Xe EX=T n ( ) =0 (1.18)
Machine Translated by Google

El modelo clásico de regresión lineal 5

Resolviendo la Ecuación (1.18) da:

1 T
XyX( b )=0
ÿ

norte

11
T T
Xy XX
ÿ

b =0
norte norte

y resolviendo para b, tenemos:


ˆ 1 ˆ ˆ
T
ÿ

= == T
b milímetro ( XX Xy) MCO ML b b (1.19)

En cuanto a la prueba de hipótesis, consideremos primero el siguiente sistema


de hipótesis relacionadas con el parámetro único bi :

H 0 : b=i 0
(1.20)
H ÿ: 1 bi 0

donde bi es un elemento genérico de la matriz b tal que bˆ iÿ N[bi , Siis2 ], y Sii mi

es el i-ésimo elemento de la diagonal principal de la matriz XTX. Se puede


derivar una prueba estadística tomando la diferencia entre el valor de b bajo la
hipótesis nula y bajo la alternativa escalada por su desviación estándar:

ˆ
H0
prueba = bi ÿ
norte (0,1) (1.21)
ÿS ii
mi

Esto, sin embargo, no es una cantidad fundamental a menos que sepamos el valor de s2. mi

2
n ks
()
ÿ

2
Ya que 2
2
ÿe x ( nk )
ÿ
(con x (n- k)
una distribución chi-cuadrado con n – k
ÿ
mi

grados de libertad) y usando la independencia entre s2 mi


y bˆ, we
puede construir la cantidad fundamental:
ˆ
prueba =
bi ÿ t
( nk ) ÿ

(1.22)
ss mi
yo

que se puede utilizar para probar la hipótesis nula. Si consideramos, en cambio,


la hipótesis nula múltiple

H 02: 3bb
= =b=! = 0 k
(1.23)
H ÿ: 1 bi 0
Machine Translated by Google

6 Introducción a la econometría espacial

podemos probar la importancia del modelo como un todo a través de la cantidad:

R 2k/( ÿ

1)
F = ÿ ÿÿF (k 1; nk ) (1.24)
2
(1
ÿ

R nk
) /(
ÿ

que se distribuye como una F con k –1 y n – k grados de libertad y donde

RSS
R2 = (1.25)
acero inoxidable

En la Ecuación (1.25), SSR representa la suma de los cuadrados de la regresión definida como
SSR = 1 – SSE = 1 – eTe (SSE representa la suma de los cuadrados de los errores), SST = yTy
– ny¯ representa la suma total de los cuadrados y y ¯ la media muestral de y. R2 es el llamado
coeficiente de determinación (0 < R2 ÿ 1), un parámetro que mide el grado de ajuste de los datos
observados a una función lineal. La versión ajustada de R2, que tiene en cuenta el número de
grados de libertad de la regresión, viene dada por:

1
R2 = 1 R2)
norte

(1 (1.26)
ÿ ÿ

nk ÿ

+1

Las medidas alternativas del grado de ajuste son la información de Akaike.


Criterio

ÿÿ
Camiseta k 2 ÿ ÿ
AIC = ln ÿ ÿ + ÿ ÿ ÿ ÿ
(1.27)
norte norte
ÿ ÿ

y el criterio de información de Schwartz (o bayesiano)

ÿ Camiseta
en ÿ
kn ÿ
BIC = ln ÿ ÿ ÿ ÿÿ+ÿÿ
(1.28)
norte norte
ÿ ÿ

Otro enfoque para la prueba de hipótesis en regresión (que podría aplicarse al sistema de
hipótesis (1.20) y que se empleará más adelante en este libro) se basa en el procedimiento de
prueba general conocido como razón de verosimilitud. La razón de verosimilitud de un vector de
parámetros, digamos ÿ, viene dada por:

L ()0()0 0 L ÿ
ÿ = ˆ = ˆ (1.29)
L ÿ( ML ) L ()ÿ
Machine Translated by Google

El modelo clásico de regresión lineal 7

con el subíndice 0 indicando el valor de los parámetros bajo el nulo. Representa la relación entre la
función de verosimilitud evaluada en el valor del parámetro bajo el valor nulo y la función de
verosimilitud en su máximo. Una transformación monótona del estadístico de prueba l no cambia
las conclusiones inferenciales, por lo que es más común referirse a la prueba de razón de

verosimilitud como la cantidad:

LR = 2 ln( ) = 2 yo( ) ( )
ÿ ÿÿ
ÿ

ÿ
lÿ ÿ0 lÿ ÿ

(1.30)
ÿÿ

Desarrollando l(q0) como una serie de Taylor sobre qˆ obtenemos:

2 "

)1 l()ÿÿ ÿ+(ÿÿ2
ˆˆ ˆ
ÿ

LR = 2 ÿ ÿ ÿ (ÿ 0
¢
0
ÿ

) yo
¢¢
() + ÿ ÿ descanso

ÿ
(1.31)
1 ˆˆ ÿÿÿ ÿÿ ÿ ˆ 2 "

( )() ( ( )+
ÿ

ÿÿÿ=2
ÿÿ ÿ

0 s+2 0 ) no descanso ÿ

ÿ ÿ

~ ~
donde q ÿ(qˆ,q0), s(.) es la función de puntuación y ni(q ) el elemento de la
matriz de información de Fisher. Por definición s(qˆ) = 0, de modo que:

ˆ 2
= (
LR norte ) ) (i +0(1) op ÿÿ ÿ (1.32)
ÿ

La aproximación:

ˆ 2
ÿ norte =
LR W (( yo - ÿÿ) ÿ 0 0 ) (1.33)

se llama la estadística de prueba de Wald. Una aproximación adicional de LR:

¢ 2
=
yo
( ÿ0 )
LR LM
ÿ
( ni 0 0 ) (1.34)

se denomina "estadística de la prueba de puntaje de Rao" en estadística, pero es mejor conocida


en econometría como la "prueba del multiplicador de Lagrange". Los tres estadísticos de prueba
LR, W y LM son asintóticamente equivalentes y asintóticamente distribuidos como c2 con el número
de grados de libertad igual al número de parámetros a estimar. Con respecto a las otras dos
pruebas, la prueba LM tiene la ventaja de que se puede calcular sin obtener previamente la
estimación de Máxima Verosimilitud de los parámetros desconocidos y que no requiere la
especificación de ninguna hipótesis alternativa explícita.
Machine Translated by Google

8 Introducción a la econometría espacial

Para un vector de parámetros la Ecuación (1.34) se convierte en:

LM =( ) ()ÿ ÿÿ T yo
0( )ÿ 1s 0 (1.35)

que es la expresión general de la prueba del multiplicador de Lagrange que se utilizará más
adelante en este libro. En el caso de la regresión lineal, una forma sencilla de probar hipótesis
sobre los parámetros es definir:

2
ÿ )ÿk s, ) (1.36)
ÿ

k 1 +1 0 ÿ1( ( (ÿ )=
ss segundo 0 ÿ
0 ,e ÿÿ

Yo ÿ (+1
yo
+1kk+1kk0 +1 )=0 0, ( segundo
ÿ, )2mi (1.37)

y sustituyendo (1.14) y (1.17) en (1.36) y (1.37) y ambas en (1.35), obtenemos la prueba LM


para hipótesis sobre los parámetros de regresión.

Finalmente, una hipótesis crucial a probar en el modelo es la hipótesis de la normalidad


de los residuos en la que se basan todas las estrategias de prueba anteriores. Jarque y Bera
(1987) introdujeron un procedimiento paramétrico popular, quienes sugirieron construir una
prueba de normalidad probando conjuntamente que el tercer y cuarto momento de la
distribución empírica de residuos no son significativamente diferentes de los de la distribución
gaussiana. La expresión formal de la prueba es la siguiente:

(K ÿ ÿ3 )2
ÿ

norte

=
JB SK
ÿ

2+
6 4
ÿ ÿ

1 3
ÿ
norte

i =1
(yo
_
ÿ

mi )
con SK = norte

la asimetría y, respectivamente,
ÿ (eeÿÿyo)ÿÿ 32 2
norte
ÿ1

ÿ ÿ norte
i =1

1 4
ÿ
norte

i =1
(yo _ ÿ

)
k = norte
la curtosis de los residuos. Bajo el nulo de
2
2
ÿ
norte
ÿ1
i =1
(yo _ÿ ÿ ÿ) ÿ
ÿ ÿ norte

normalidad, se puede demostrar que esta cantidad se distribuye como c2 con 2 grados de
libertad.
Machine Translated by Google

El modelo clásico de regresión lineal 9

Ejemplo 1.1 Modelo de convergencia regional de Barro


y Sala-i-Martin

El modelo de convergencia regional de Barro y Sala-i-Martin (1995) expresa la tasa de


crecimiento del PIB per cápita de una región en un momento determinado (expresada
como el logaritmo del cociente) como una función lineal del PIB per cápita al comienzo
del período. Si la pendiente en este modelo lineal es negativa, entonces aquellas
regiones que son más pobres al comienzo del período experimentan tasas de crecimiento
más altas y, por el contrario, aquellas regiones con el PIB per cápita más alto al
comienzo del período experimentan tasas de crecimiento más bajas. Esto indica una
convergencia de las regiones hacia el mismo nivel de PIB per cápita. Podemos expresar el modelo como

y eso
log = + ab ey + t = 1, 2,... , T
yo 0 i
y i0

yit = siendo el PIB per cápita en el año ty la región i. El parámetro


ln(1 b ) +
representa la llamada “velocidad de convergencia”. El seguimiento
ÿ

segundo =

T
La tabla muestra el PIB per cápita en el año 2000 y el crecimiento del PIB real per cápita
en el período 2000–08 tal como se observó en las 20 regiones italianas.

Región Por Crecimiento Región Por Crecimiento

cápita del PIB cápita del PIB


PIB (2000–2008) PIB (2000–2008)

1. Piamonte 130 2,7 11. Marcas 125 3.1


2. Valle de Aosta 150 2,5 12. Lacio 13. 130 2.9
3. Lombardía 4. 140 2,7 Abruzos 14. 100 4.0
Trentino Alto 170 0,5 Molise 90 3.5
Adige. 15. Campania 110 2.1
5. Véneto 160 1.5 16. Apulia 95 3.0
6. Friuli Venecia 160 0.5 17. Basílica 80 4.2
Giulia 18. Calabria 100 3.0
7. Liguria 135 2.0 19. Sicilia 100 2.0
8. Emilia 145 1.6 20. Cerdeña 110 2.4
Romaña
9. Toscana 135 2.2
10. Umbría 130 3.2

Fuente: http:// sitis.istat.it/ sitis/ html/.


La estimación del modelo utilizando el método OLS conduce a los siguientes resultados

Parámetro Error estándar prueba t valor p

Interceptar 6,161369 0.731837 8.419 1.18e-07***


Pendiente – 0,029510 0.005752 – 5.130 7.01e – 05***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0
Machine Translated by Google

10 Introducción a la econometría espacial

R2 = 0,5938 Estadísticas F = 26,32 (valor p = 7,01e – 05) = Prueba de Wald AIC =


42,95174 BIC = 45,93894 Prueba JB = 1,0884 (valor p = 0,5803)

Las pruebas t muestran que tanto el intercepto como la pendiente son significativamente
diferentes de cero con la pendiente del signo negativo esperado, mientras que la prueba
F conduce a la aceptación del modelo con una significación superior al 99%.
Además, el coeficiente de determinación (R2) indica que el modelo explica el 59.38%
por ciento de la variabilidad del crecimiento. Finalmente, no se puede rechazar la
hipótesis de normalidad con una probabilidad de 0,5803.

Ejemplo 1.2 Función de producción Cobb-Douglas


revisada de Zellner-Revankar

La popular función de producción Cobb-Douglas expresa el nivel de producción en


función de los dos insumos de los factores de producción: capital y trabajo.
La función revisada introducida por Zellner y Revankar (1970) se basa en los valores per
cápita de las variables tanto de salida como de entrada obtenidos al dividir los agregados
regionales por el número total de establecimientos en cada región. Esta especificación
permite tener en cuenta economías de escala.
La siguiente tabla muestra los datos utilizados para la validación empírica del modelo
referente a la industria de equipos de transporte de los Estados Unidos. Se refieren al
“valor agregado”, “capital” y “trabajo” observado en 1957 en 25 estados de EE.UU.
Todos los valores se expresaron originalmente en millones de dólares de 1957.

Expresar Por Por Por Expresar Por Por Por


cápita cápita cápita cápita cápita cápita
Valor Capital Mano de obra Valor Capital Mano de obra

Agregado Agregado

Alabama 1855,118 55,941 463,985 Massachusetts 1404,244 89,227 229,163


California 2333,445 135,165 330,061 Míchigan 7182,313 766,030 863,352
Connecticut 4484,870 257,870 805,675 Misuri 5216,680 262,720 678,648
Florida 192,795 22,421 65,688 Nueva Jersey 2700,862 134,785 336,166
Georgia 4289,169 162,394 641,324 Nueva York 2039,978 158,295 412,351
Illinois 2629,193 214,498 321,422 Ohio 4440,493 435,201 716,022
Indiana 3816,035 434,169 571,269 Pensilvania 2650,554 147,313 421,253
Iowa 477,280 35,973 106,893 Tejas 1712,380 73,818 356,260
Kansas 6506,776 136,316 1134,066 Virginia 2051,694 84,388 368,247
Kentucky 4030,581 168,161 387,097 Washington 3558,369 172,106 491,413
Luisiana 637,635 32,722 138,261 Virginia Occidental 1513,333 102,867 270,867
Maine 363,790 24,284 79,877 Wisconsin 2462,754 154,937 371,958
Maryland 3219,085 136,016 537,535

La función Cobb-Douglas generalizada propuesta por Zellner y Revankar (1970) se


puede especificar de la siguiente manera:

y yo
kl yo
bbyob01ln(
2 ) = + ln( ) + ln( ) +
mi
Machine Translated by Google

El modelo clásico de regresión lineal 11

siendo yi el valor agregado per cápita en la región i, ki el gasto de capital per cápita en la
región i y li el gasto laboral per cápita en la región i. La estimación OLS de los parámetros
conduce a los resultados que se muestran a continuación en la tabla:

Parámetro Error estándar prueba t valor p

b0 – 0,06707 0,21156 – 0,317 0.754208


b1 3,19780 0,83224 3,842 0.000885***
b2 5,35042 0,52584 10,175 8.8e-10***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

R2 = 0,9243 R2 ajustado = 0,9174 Estadísticas F = 134,3


(valor p = 4,7678e – 13)
AIC = 43,4129 BIC = 48,28841 Prueba JB = 5,6914
(valor p = 0,05809)

Los valores p de las estimaciones muestran que todos los parámetros son muy
significativos, con la única excepción del término constante. El modelo explica el 92,43% de
la variabilidad total del valor agregado per cápita. La prueba F conduce a la aceptación del
modelo y, finalmente, se puede aceptar la nula de normalidad al nivel de significancia del
5%.

1.2 No esfericidad de las perturbaciones

La hipótesis fundamental de la que se derivan todos los resultados anteriores es la contenida


en la Ecuación (1.4), denominada hipótesis de esfericidad de los errores. Tiene una doble
implicación:

(i) elementos constantes en la diagonal principal de la varianza


matriz de covarianza (homocedasticidad)
(ii) valor cero de los elementos fuera de la diagonal de la matriz de covarianza de
varianza (ausencia de autocorrelación)

Ambos son poco realistas cuando se trata de observaciones espaciales típicamente


caracterizadas por la ausencia de homogeneidad y la presencia de correlación espacial. Es
fácil demostrar que cuando se viola una o ambas condiciones, los estimadores MCO
generalmente pierden sus propiedades de optimización.
En este caso, de hecho, tenemos:

T (EX 2
ee VC)=nnÿÿe =
(1.38)

donde VC indica la matriz de varianza-covarianza n-por-n entre los errores y ÿ la matriz de


correlación correspondiente.
Machine Translated by Google

12 Introducción a la econometría espacial

En este caso el estimador MCO es tal que:


ˆ
mi (Xb
MCO )=b (1.39)

mostrando imparcialidad como antes, pero con variación ahora:


ˆ
Var (XXXXXXX
b MCO ) =()ÿ )mi(2 ( T TT T ÿ121ÿÿ
1 ÿ ÿ mi
ÿ XX ) (1.40)

Dependiendo de los valores de los elementos de la matriz ÿ podemos tener


ˆ
ese Var ()b (MCO 2 T1)>ÿ
XX ÿ (como generalmente sucede) mostrando que MCO
mi

los estimadores ya no son de varianza mínima.


Para probar la homocedasticidad, existen muchas alternativas posibles que
se basan todas en la capacidad del investigador para proponer formas
plausibles de violaciones. La prueba de Breusch y Pagan (1979) propone la
i = s2 f(ÿT
forma genérica expresada a través de la ecuación s2Xi )siendo ` un vector de
constantes y Xi el vector de regresores para la i-ésima observación. En el caso de la
homocedasticidad tenemos ` = 0 y la prueba se puede obtener a través de una
regresión simple. En la práctica, las estadísticas de la prueba LM se pueden expresar como:

1
PA = ()ÿ ÿÿ2TT
g TXXXX g ÿ1
ÿ

(1.41)

con g el vector de las perturbaciones transformadas definidas como


mi 2
= i
. Bajo la hipótesis nula de condicional constante
gramo
i
mi eTÿ ( /) 1
norte
varianza, el estadístico de prueba se distribuye asintóticamente como ÿ2
con k – 1 grados de libertad. Una alternativa popular es la prueba de White
(White, 1980) que usa un estimador consistente de la matriz de varianza-
covarianza reportada en la Ecuación (1.40) para construir una prueba de
cedasticidad de salida del hogar. Operacionalmente, esto implica calcular el
estadístico de prueba, WH = nR2 , siendo R2 el coeficiente de determinación
de una regresión donde el cuadrado de las perturbaciones empíricas, e, se
explica en términos de todas las variables independientes y de todos los
productos cruzados entre los variables independientes. Bajo el nulo de
homecedasticidad, WH se distribuye asintóticamente como c2 con k – 1
grados de libertad. Debe señalarse, sin embargo, que tanto la prueba BP
como la WH requieren la independencia de los residuos, por lo que ninguno
de ellos puede usarse sin probar simultáneamente tal hipótesis.
Cuando se trata de datos de series de tiempo, la hipótesis de ausencia de
autocorrelación entre las perturbaciones se puede probar utilizando Durbin–
Watson (Greene, 2011), pero probarlo cuando se usan datos espaciales es
Machine Translated by Google

El modelo clásico de regresión lineal 13

un tema más complicado que requiere un tratamiento ad hoc que se presentará en el


Capítulo 2.
Como se mencionó anteriormente, si se detecta la no esfericidad de los errores, la
solución OLS no proporciona estimadores de varianza mínima y se debe adoptar el
siguiente procedimiento alternativo.
Consideremos una descomposición de la matriz de correlación tal que:
T
nnn
ÿ =nnn PÁGINAS
(1.42)

siendo P una matriz no singular. De (1.42) tenemos

ÿ!1 = P !T P !1 (1.43)

Consideremos ahora las siguientes transformaciones de variables:

* = 111 mi * = * =
ÿÿÿ

y PyX PX P mi
(1.44)

Si premultiplicamos la Ecuación (1.1) por P!1 tenemos:


ÿÿ ÿ

11 1 + mi
Py PX =P b

+
y X *= * * ser (1.45)

Observe que la matriz de varianza-covarianza de los errores es ahora:

T ÿ

1 TT ÿ ÿÿ

2PP
1 ÿÿ e T
mi ee
( * * )= ( EP P ee )= (1.46)

de (1.38) y, finalmente:
T 2
mi ee
( * * )= yo soy

de (1.42). Los errores en la Ecuación (1.44), por lo tanto, ahora satisfacen


los supuestos para la aplicabilidad del OLS.
Los estimadores MCO de los parámetros de la ecuación anterior se
pueden derivar como:
ˆ T 1
*
ÿ

*T
*
b MCO = ( XXXy
* *)
tt tt ÿÿ ÿ

1
= ( )XP PX XP Py (1.47)
T 11 1 T ˆ
= ( ÿ ÿ ÿÿ ÿ
X XX y ) = b GLS
Machine Translated by Google

14 Introducción a la econometría espacial

cuya matriz de varianzas-covarianzas ahora viene dada por:

ˆ
2 11 T
Var b( )=GLS
( ÿ XX ÿÿ ÿ mi ) (1.48)

ˆ
El estimador b GLS se denomina estimador de mínimos cuadrados generalizados (GLS)
o estimador de Aitken. Tal estimador disfruta de todas las propiedades de optimización del OLS.

Se puede demostrar que el estimador GLS es un estimador de Máxima Verosimilitud.


matador De hecho, consideremos la función de verosimilitud en esta situación:

norte
ÿ ÿ segundo ÿ Tÿÿ yX1yX segundoÿ

( )( ) 1 ÿÿ ÿ
ÿ

2
L (b , ÿÿ
) = costo t (ÿ mi2 )2 ÿ 2
experiencia
2 (1.49)
2 ÿ mi
ÿÿ

|ÿ| siendo el determinante de la matriz de correlación. En consecuencia, la log-verosimilitud es:

2 2
ÿ
) = ln ( , Lÿ b
ÿ
libras ( , mi ÿ mi ÿ)
ÿ

T ÿ

n 2 1 ( )( ) y bX ÿ ÿÿ y X segundo (1,50)
= porque t ÿ

en (ÿ mi ) 1 ÿ ÿÿ 2
registro 22 2 ÿ mi

Maximizar la Ecuación (1.50) con respecto al parámetro b corresponde a maximizar solo su


último término ya que todos los demás términos son constantes con respecto a b. Por lo tanto,
los estimadores ML son la solución de la ecuación:

T 1
( ( yX yX ÿ) ÿÿ ÿ bb ) = min

Tomando las derivadas e igualando a 0 obtenemos nuevamente:

ˆ ˆ
T 11 1 T
b ML =( X XX yÿ GLS
ÿ ÿÿ ÿ
) = b (1.51)

como en la Ecuación (1.47).


Un estimador insesgado de s2 mi
se puede obtener aplicando el criterio MCO a la
ecuación (1.45) produciendo:

*T
* ee
2

=
segundos
mi
(1.52)
nk -
Machine Translated by Google

El modelo clásico de regresión lineal 15

con e* = P!1y – P!1Xb*. Por lo tanto tenemos:


* T *
( ) ( 11 11
= PyPX PyPX b b )
ÿÿ ÿÿ

ÿ ÿ

segundos
(1.53)
mi
nk ÿ

que, después de un poco de álgebra da:

T
b ÿÿ1 ÿ yy *Xy
TT
nk 1
ÿ ÿ

2
=
segundos

mi ÿ
(1.54)

Bajo los supuestos anteriores, todos los procedimientos de prueba en los


parámetros individuales y en el modelo completo siguen siendo válidos. Nótese,
sin embargo, que todas las expresiones derivadas para los estimadores y para los
procedimientos de prueba dan lugar a expresiones computables sólo si:

a) la matriz VC de los errores se especifica completamente de tal manera


que se pueden tener en cuenta varias formas de heteroscedasticidad
y autocorrelación, o
b) se conocen todos los elementos de la matriz VC.

Para satisfacer la condición (a) podemos considerar diferentes especificaciones


de la matriz VC que son capaces de capturar los efectos de heteroscedasticidad
y autocorrelación usando un número parsimonioso de parámetros. Este objetivo
se logra en los siguientes capítulos de este libro. La condición (b) rara vez se
cumple en casos prácticos, de modo que, para usar el criterio GLS, tenemos
que sustituir los parámetros desconocidos en la matriz VC con algunos
estimadores consistentes y las consecuencias en términos de las propiedades
de los estimadores tienen a considerar en cada circunstancia particular.

Ejemplo 1.3 Modelo de convergencia regional de Barro


y Sala-i-Martin (continuación)

Refiriéndonos nuevamente a los datos considerados en el Ejemplo 1.1 calculando la prueba


de heterocedasticidad de BP obtenemos

PA = 0,0045, valor p = 0,9462

lo que conduce a la aceptación de la hipótesis nula de homocedasticidad.


Recuerde, sin embargo, que esta prueba conduce a una decisión correcta solo si los
residuos tampoco están correlacionados. Con respecto a la correlación de residuos, como
se mencionó anteriormente, necesitaremos discutir el tema con mayor detalle en el Capítulo 2.
Por el momento, la siguiente figura muestra el diagrama de dispersión y los
residuos de regresión de las 20 observaciones que distinguen las regiones del
norte y del sur de Italia. El gráfico no representa ningún patrón geográfico norte-
sur evidente, pero es obvio que se requiere un análisis más profundo.
Machine Translated by Google

16 Introducción a la econometría espacial

área_geográfica
centro-sur norte
R2 Lineal = 0.594

5.00

4.00

3.00

2.00

1.00

0.00

80.00 100,00 120,00 140,00 160,00 180,00

PIB_2000

Fuente: Elaboración propia a partir de los datos extraídos de la base de datos del ISTAT denominada
“Indicadores territoriales” que se puede descargar en la página web: http://sitis.istat.it/sitis/html/.

1.3 Endogeneidad
Los estimadores MCO poseen sus propiedades de optimalidad solo si se
satisface el supuesto expresado en la Ecuación (1.3), es decir, cuando E(e|X)
= 0. Esta condición también puede expresarse como E(eX) = 0 (dado que
E( X) es una constante) lo que indica que los regresores X no están
correlacionados con las perturbaciones, p. Esto sucede cuando los desórdenes
están predeterminados exógenamente o son innovaciones. Si no se cumple
la condición expresada en la ecuación (1.3), se dice que algunos o todos los
regresores son endógenos y, en general, los estimadores de MCO estarán
sesgados e inconsistentes. Las variables endógenas pueden estar presentes
en varios casos en econometría como el caso de errores en variables o el caso de simultan
Machine Translated by Google

El modelo clásico de regresión lineal 17

(Greene, 2011). También ocurren en algunos casos particulares cuando se trata


de regresiones espaciales, como veremos más adelante.
En este caso se deriva un estimador óptimo con el procedimiento denominado
mínimos cuadrados en dos etapas introducido por Theil (1953) y Basmann (1957).
El procedimiento asume que es posible identificar un conjunto de, digamos
h, variables, llamadas instrumentos. Definamos la matriz nHh que contiene el n
observaciones de las h variables instrumentales. Un instrumento válido
reúne los requisitos de no estar correlacionado con los errores (es
exógeno) y correlacionado con los regresores (es relevante). En la primera
etapa de la regresión, cada columna de la matriz X se retrocede en los
instrumentos H a través de la ecuación

norte
XH +=g n hh 1 11 norte ÿ
(1.55)

suponiendo que h es iid N(0, s2 h). Los estimadores OLS de los parámetros
del modelo se derivan como:
T1
g =
ˆˆ

MCO T =(HH
) HX ÿ (1.56)

En la segunda etapa, la variable dependiente y se retrocede no directamente


sobre X, sino sobre X instrumentada (como decimos) con H. Más precisamente,
se retrocede y sobre el valor estimado de X sobre la base del modelo (1.55), que
ˆ ˆ T 1 T T 1 T
XH=HH
matriz de proyección=(idempotente
)HHX PXH es
gramo
dedecir
= ÿ

H. sobre la , con PHHHH


H =( )
ÿ

Tal regresión viene dada por el modelo:

y = Xˆb + e (1.57)

y el estimador MCO de g viene dado por:


ˆ ˆˆ ˆ
1
b2 SLS = (XXXy
ÿ

T T
) (1.58)

A partir de las propiedades de la matriz idempotente, la Ecuación (1.58) se puede


escribir como:

ˆ T
ˆˆ ˆ
ÿ

1
T T T=
ÿ

1
TT
b 2 SLS = XX Xy) XPPX XPy ( S.S ) H
ÿ

1
T T
= ( (XPX XPy)
H H (1.59)
ÿ

1
ÿ

1 ÿ

1
TT TT TT
= (XHHH (HX XHHH
) Hi ) ( )

Tal estimador se conoce como el estimador de mínimos cuadrados en dos etapas.


(2SLS), el estimador de Variable Instrumental (IV), o el Generalizado
Machine Translated by Google

18 Introducción a la econometría espacial

Estimador de Variables Instrumentales (GIVE). La ecuación (1.59) también


enfatiza que tal estimador también puede verse como un estimador MCG con
una matriz de pesos igual a PH. En el momento en que se introdujo (en la década
de 1950) la estimación se realizaba en los dos pasos descritos, pero hoy en día
(con una potencia de cómputo mucho mayor) el cómputo se realiza en un solo
paso imponiendo exogeneidad a los instrumentos. A nivel de población esto
conduce a:

HT e = 0 (1.60)

y a nivel de muestra la condición se convierte en:

H T ( y – Xbˆ ) = 0 (1.61)

y, resolviendo este sistema de ecuaciones, obtenemos:


ˆ
= (HXT Hy) 1 T
ÿ

b milímetro
(1.62)

que coincide con (1.59). Dado que la Ecuación (1.60) puede verse como un conjunto
de condiciones de momentos, el estimador derivado de su solución también puede
verse como un estimador del Método de los Momentos.
Se puede demostrar que, en condiciones generales, el mínimo de dos etapas
El estimador de cuadrados se distribuye asintóticamente normalmente con
ˆ
(
mi segundo
) 2=b
SLS (1.63)

y
ˆ
Var ( b SLS TT 21
)=ÿ( HXH HH )Z1)
ÿ

(
ÿ

(1.64)
2 mi

y estas expresiones se pueden usar para la inferencia y la prueba de hipótesis.

Ejemplo 1.4 Función de producción de Zellner-


Revankar (continuación)

La siguiente tabla muestra los datos originales sobre los cuales se estimó la
función de producción de Zellner-Revankar (1970) (discutida en el Ejemplo 1.2).
Con estos datos, sólo a modo de ejemplo y sin ánimo de contribuir
sustancialmente a la comprensión del fenómeno, estimamos el modelo de función
de producción donde la variable “Valor añadido” se expresa en función de la
variable “insumo de trabajo” utilizando únicamente la variable “número de
establecimientos” como instrumento. El instrumento es “relevante” en el sentido
de que la variable “número de establecimientos” tiene una correlación de 0.839001
con el regresor “trabajo”.
Machine Translated by Google

El modelo clásico de regresión lineal 19

Expresar Valor Capital Mano de obra Número de


Agregado Aporte Aporte Establecimientos

Alabama 126148 3804 31551 68


California 3201486 185446 452844 1372
Connecticut 690670 39712 124074 154
Florida 56296 6547 19181 292
Georgia 304531 11530 45534 71
Illinois 723028 58987 88391 275
Indiana 992169 112884 148530 260
Iowa 35796 2698 8017 75
Kansas 494515 10360 86189 76
Kentucky 124948 5213 12000 31
Luisiana 73328 3763 15900 115
Maine 29467 1967 6470 81
Maryland 415262 17546 69342 129
Massachusetts 241530 15347 39416 172
Michigan 4079554 435105 490384 568
Misuri 652085 32840 84831 125
New Jersey 667113 33292 83033 247
Nueva York 940430 72974 190094 461
Ohio 1611899 157978 259916 363
Pensilvania 617579 34324 98152 233
Texas 527413 22736 109728 308
Virginia 174394 7173 31301 85
Washington 636948 30807 87963 179
Virginia del Oeste 22700 1543 4063 15
Wisconsin 349711 22001 52818 142

El resultado del procedimiento de estimación se muestra en la siguiente tabla

Parámetro Error estándar prueba t valor p

b0 –55486.25 0.21156 48669.26 –1.140068


b2 7.264460 0.329093 22.07415 0.000***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

R2 = 0,970192 R2 ajustado = 0,968896 Estadísticas F = 487,2683


(valor p = 0,00000)
AIC = BIC = Prueba JB =
26,31817 (valor p = 0,000002)
Prueba BP = 20,18672 (valor p = 0,0002) Segunda etapa SSR = 8,25e + 12

La estimación muestra un buen ajuste del modelo a los datos empíricos. Sin embargo,
existe fuerte evidencia de no normalidad y heteroscedasticidad en los residuales
(pruebas JB y BP) que sugieren que el modelo debe ser reevaluado.
Machine Translated by Google

20 Introducción a la econometría espacial

1.4 Códigos R: ejecutando una regresión


R
Para comenzar, descargue el software gratuito del sitio web http://cran.
r-project.org/ eligiendo su sistema operativo apropiado (Windows, Mac OSX o Linux).

En el R ambiente, podemos ingresar los datos usando el teclado,


definiendo las variables x, y y z como vectores de la siguiente forma:

x=c(x1,x2,…,xn)
y=c(y1,y2,…,yn)
z=c(z1,z2,…,zn)

o, alternativamente, podemos leer los datos de un archivo externo usando uno de los siguientes
comandos según el formato del archivo de datos de origen:

>leer.tabla("nombrearchivo.txt", encabezado=T, dec=".")


>leer.txt("nombre de archivo.txt", encabezado=T, dec=".")
>leer.csv("nombre de archivo.csv", encabezado=T, dec=".")

en el caso, respectivamente, de un archivo de entrada de texto (.txt) o de valores


separados por comas (.csv).
En el caso de la regresión lineal simple, podemos trazar los datos en un scat
ter diagrama con el comando:

> dibujar(x,y)

y podemos estimar un modelo de regresión simple a través del comando

>modelo1 <-lm(y ~x)

siendo “model1” un nombre asignado arbitrariamente y siendo “lm” el comando correspondiente


a las siglas de Linear Modeling.
También podemos agregar la línea de ajuste al diagrama de dispersión con el comando:

>abline(modelo1)

En el caso de una regresión lineal múltiple, de manera similar, estimamos el modelo con el
comando:

>modelo2 <-lm(y ~x+z)

El siguiente comando:

>resumen(modelo2)
Machine Translated by Google

El modelo clásico de regresión lineal 21

devuelve las estimaciones puntuales de los parámetros, su significado, el R-cuadrado, el R-


cuadrado ajustado y la prueba F.
Del mismo modo, los comandos:

>AIC(modelo2)
>BIC(modelo2)

calcular el modelo AIC y BIC pruebas que no están incluidas en el


salida anterior.
Dada la estimación del modelo, podemos calcular la confianza entre
vals de los parámetros a través del comando:

>confin(modelo2)

Para cualquier otra referencia, los residuos se almacenan automáticamente con el nombre:

modelo2$residuales

Para obtener más diagnósticos sobre el modelo, necesitamos instalar los paquetes "lmtest" y
"tseries". Para hacerlo, escriba los comandos:

> instalar.paquetes("lmtest")
> install.packages("tseries")

Una vez instalados los dos paquetes, al inicio de cada sesión, debemos invocarlos a través de
los comandos:

> biblioteca (lmtest)


> biblioteca(tseries)

En los paquetes “lmtest” y “tseries” encontramos varios modelos diagnósticos útiles como, por
ejemplo, la prueba de homocedasticidad de Breush-Pagan (que usa todos los regresores para
explicar la heterocedasticidad):

> bptest(modelo2)

y la prueba de normalidad de Jarque-Bera:

>jarque.bera.test(modelo2$residuales)
Machine Translated by Google

22 Introducción a la econometría espacial

Términos y conceptos clave introducidos

• Modelo lineal con perturbaciones independientes


• Método de estimación de mínimos cuadrados ordinarios (OLS)
• Mejor estimador lineal imparcial (AZUL)
• Propiedades de los estimadores de parámetros: insesgamiento, eficiencia, consistencia,
normalidad
• Método de estimación de Máxima Verosimilitud (ML)
• Función de puntuación
• Matriz de información de Fisher
• Método de estimación de los Momentos (MM)
• Contraste de hipótesis sobre los parámetros del modelo
• Prueba F en el modelo

• Coeficiente de determinación. R2
• R2 ajustado
• Criterio de información de Akaike (AIC)
• Criterio de información de Schwartz (o bayesiano) (BIC)
• Prueba de razón de verosimilitud
• Prueba de Wald

• Prueba de puntuación de Rao (o multiplicador de Lagrange)


• Prueba de Jarque-Bera
• Heterocedasticidad
• Prueba de homocedasticidad de Breusch-Pagan •
Autocorrelación
• Criterio de estimación de mínimos cuadrados generalizados (o Aitken) (GLS)
• Exogeneidad
• Método de estimación de mínimos cuadrados en dos etapas (Generalized Instrumental
Estimador de variables) (2SLS)
• Instrumentos pertinentes
• Instrumentos exógenos

Preguntas

1. ¿Bajo qué condiciones los estimadores OLS son equivalentes a los estimadores ML? ¿Es
probable que se encuentren estas condiciones cuando se trata de regresiones sobre datos
espaciales? ¿Cuáles son las implicaciones de tal equivalencia? ¿Cuáles son las
implicaciones de la falta de esta equivalencia?

2. Supongamos que tenemos una variable y = consumo regional, y una variable x = ingreso
regional, ambas expresadas en miles de dólares y supongamos además el modelo de
regresión y = bx + e. ¿Cuáles son las consecuencias sobre el estimador MCO de b
(digamos bˆ) de expresar el ingreso
Machine Translated by Google

El modelo clásico de regresión lineal 23

en millones de dólares en su lugar? ¿Qué pasa si el consumo también se


expresa en millones de dólares?
3. ¿Cuáles son los elementos cruciales a considerar si queremos juzgar la bondad
del ajuste de los datos observados empíricamente a nuestro modelo teórico?
4. En la estimación de Variable Instrumental (IV) ¿cómo podemos probar que un
instrumento es relevante?
5. En el modelo de regresión de series de tiempo, probamos la autocorrelación en
los residuos utilizando las estadísticas de prueba de Durbin-Watson definidas por

=ÿ T 2 T
d ee
t=2
[ t ] -t ÿ

1 ÿ t=1
et = 1,…, T. Tal prueba explota el natural
2

toneladas

ordenamiento de las observaciones de tiempo que es evidente en la


expresión observando que el índice de tiempo, t oscila entre 1 y T. ¿Qué
elementos tenemos que tener en cuenta al probar la autocorrelación de
residuos en datos espaciales?
6. ¿Por qué tenemos que usar el procedimiento de estimación MCG en lugar
del procedimiento MCO al estimar un modelo de regresión sobre datos que
no satisfacen las hipótesis de homocedasticidad y/o incorrelación de
residuos?

Ejercicios

Ejercicio 1.1 Los datos que se muestran en la siguiente tabla se refieren a


algunos datos económicos regionales en el Reino Unido. Reportan el Valor
Agregado Bruto (VAB) regional como porcentaje del total del país, la
productividad laboral (reportada a un total de 100 países) y la tasa de creación de empresas.

País Región VAB Mano de obra Negocio


(% de Productividad Nacimiento

REINO UNIDO) (Reino Unido = 100) Velocidad (%)

Gales 3,6 81,5 9,3


Escocia 8,3 96,9 10,9
Irlanda del Norte 2,3 82,9 6,5
Inglaterra norte de Inglaterra 3,2 86,2 11,2
Inglaterra Noroeste de Inglaterra 9,5 88,6 11,1
Inglaterra Yorkshire y Humberside 6,9 84,7 10,5
Inglaterra Midlands Orientales 6,2 89,2 10,3
Inglaterra West Midlands 7,3 89,1 10,5
Inglaterra anglia oriental 8,7 96,8 10,5
Inglaterra Gran Londres 21,6 139,7 14,6
Inglaterra Sudeste de Inglaterra 14,7 108,3 10,8
Inglaterra Sudoeste de Inglaterra 7,7 89,8 9,6

Fuente: http:// www.statistics.gov.uk/ hub/ index.html.


Machine Translated by Google

24 Introducción a la econometría espacial

Utilizando el R Los códigos informados en la sección 1.4 hacen lo siguiente:

1. Estimar el modelo que explica el VAB en función tanto del trabajo


productividad y tasa de nacimiento de empresas (modelo 1).
2. Estimar dos modelos que expliquen respectivamente el VAB en función de la productividad
laboral y la tasa de creación de empresas (modelo 2 y modelo 3).
3. Comparar los resultados obtenidos para el modelo 1, modelo 2 y modelo 3.
¿Cuál es el modelo preferido en términos de ajuste a los datos empíricos?
¿Qué elementos tuvo en cuenta al elegir el modelo preferido?

4. Regresión de la productividad laboral sobre la tasa de creación de empresas (modelo 4).


5. Calcular los residuos del modelo 1.
6. Contrastar la hipótesis de normalidad y de homocedasticidad del modelo 1 bajo la
hipótesis de que las innovaciones no están correlacionadas.
7. Observe la distribución geográfica de los residuales del modelo 1 con referencia al mapa
que se muestra en la figura a continuación. ¿Notas algún patrón geográfico interesante?

Escocia

Noreste (Inglaterra)
Irlanda del Norte
Noroeste (Inglaterra)

Yorkshire y el Humber

Irlanda
East Midlands (Inglaterra)

Midlands Occidentales (Inglaterra)


Gales
Este de Inglaterra

Londres

Sudeste (Inglaterra)
Sudoeste (Inglaterra)

Mapa de las 12 regiones del Reino Unido. (Cortesía de Carrie Dolan)


Machine Translated by Google

El modelo clásico de regresión lineal 25

Referencias al Capítulo
Barro, RJ y Sala-i-Martin, X. (1995) Crecimiento económico. Nueva York: McGrawHill.
Basmann, RL (1957) 'Un método clásico generalizado de estimación lineal de
Coeficientes en una ecuación estructural', Econometrica, 25, 1, 77–83.
Breusch, TS, Pagan, AR (1979) 'Una prueba simple para heterocedasticidad y
Variación del coeficiente aleatorio', Econometrica, 47, 5, 1287–94.
Greene, W. (2011) Análisis econométrico, 7.ª edición, Upper Saddle River, NJ: Pearson Education.

Jarque, CM y Bera, AK (1987) 'A Test for Normality of Observations and


Regression Residuals', International Statistical Review, 55, 163–72.
Theil, H. (1953) Mínimos cuadrados repetidos aplicados a sistemas de ecuaciones completos,
La Haya: Oficina de Planificación Central.
White, H. (1980) 'Un estimador de matriz de covarianza consistente con heterocedasticidad y
una prueba directa para heterocedasticidad', Econometrica, 48, 4, 817–38.
Zellner, A. y Revankar, N. (1970) 'Funciones de producción generalizadas', Revisión de
Estudios económicos, 37, 241–50.
Machine Translated by Google

2
Algunas definiciones espaciales importantes

2.1 La Matriz de Peso Espacial W y la definición de


Rezago Espacial
Si alguna autocorrelación está presente en las perturbaciones estocásticas, algunos
o todos los elementos fuera de la diagonal de la matriz de varianza-covarianza son
distintos de cero. En tal situación, como se indicó anteriormente, las propiedades
óptimas de OLS no son válidas y el criterio de GLS solo se puede aplicar si somos
capaces de especificar una forma plausible de autocorrelación. En vista de esto, los
siguientes capítulos considerarán varias alternativas para modelar matrices de
varianza-covarianza no diagonales cuando los datos se observan en unidades
geográficas como países o regiones. En esta sección introduciremos algunos
conceptos preliminares.
Cuando observamos un fenómeno en, digamos, i = 1,…,n regiones, las matrices
de varianza-covarianza no diagonales surgen de la presencia de autocorrelación
espacial entre los términos estocásticos. La relación de autocor espacial positiva
surge cuando las unidades que están cerca entre sí son más similares que las
unidades que están más alejadas. De manera similar, las matrices de VC también
pueden mostrar heterogeneidad espacial cuando algunas áreas presentan más
variabilidad que otras. Como ejemplo, véase la Figura 2.1.
En la definición de autocorrelación espacial mencionamos el concepto de cercanía
que requiere alguna especificación adicional. De hecho, la principal diferencia entre
la econometría estándar y la econometría espacial radica en el hecho de que, para
tratar los datos espaciales, necesitamos utilizar dos conjuntos de información
diferentes.
El primer conjunto de información se relaciona con los valores observados de
las variables económicas, mientras que el segundo conjunto de información se
relaciona con la ubicación particular donde se observan esas variables y con los
diversos vínculos de proximidad entre todas las observaciones espaciales. La presencia de

26
Machine Translated by Google

Algunas definiciones espaciales importantes 27

(un) (b)

Figura 2.1 Autocorrelación espacial y heterogeneidad espacial entre 64 unidades espaciales dispuestas en una
cuadrícula de celosía cuadrada regular de 8 por 8. Diferentes tonos de gris se refieren a diferentes valores de
las variables en estudio que van desde valores bajos (blanco) hasta valores altos (negro). (a) Autocorrelación
espacial. (b) Heterogeneidad espacial. Panel izquierdo: alta variabilidad. Panel derecho: baja variabilidad

(un) (b)

Figura 2.2 Criterios de contigüidad en una cuadrícula de celosía cuadrada regular. (a) El movimiento de la torre
y (b) El movimiento de la dama

este conjunto adicional de información relacionada con el espacio es también la


razón por la cual los paquetes econométricos y estadísticos estándar (por ejemplo,
Eviews o SPSS) son tan reacios a introducir módulos dedicados a la econometría
espacial y las estadísticas espaciales que requieren capacidades adicionales para
manejar mapas espaciales. Si los datos se observan en una cuadrícula de celosía
cuadrada regular, como la que se muestra en la Figura 2.1, la cercanía se puede
definir directamente eligiendo entre el llamado criterio de la torre (dos unidades
están cerca una de la otra si comparten un lado) o la reina criterio (dos unidades
están cerca una de la otra si comparten un lado o una arista), recurriendo a los
análogos de jugadas de ajedrez que se ilustran en la figura 2.2.
Machine Translated by Google

28 Introducción a la econometría espacial

Sin embargo, en econometría espacial, casi invariablemente, tenemos que tratar con unidades
administrativas espaciadas irregularmente, como regiones o países, por lo que se requieren
definiciones adicionales.
En el corazón de los métodos de econometría espacial se encuentra la definición de la llamada
matriz de pesos (o matriz de conectividad). La más simple de todas las definiciones es la siguiente:

ÿ
11 _ ... w ÿ

ÿ
norte 1 ÿ

... w
W = yo
(2.1)
nn

w
ÿ1
w
norte nn ÿ

en el que cada elemento genérico se define como

ÿÿ 1 si j niÿ ( )
= ÿ

wij
_
ÿ (2.2)
ÿ
0 de lo contrario
ÿÿ

Siendo N(i ) el conjunto de vecinos de la ubicación j. Por definición tenemos que wii = 0.

Son posibles diferentes conceptos del conjunto vecino N(i ), que van desde el basado en la
mera adyacencia entre las dos unidades territoriales ilustradas en la Figura 2.2, hasta los basados
en una distancia máxima (es decir, j ÿN(i) si dij< dmax, siendo dij la distancia entre la ubicación i y
la ubicación j), a aquellos basados en el criterio del vecino más cercano. También se pueden
especificar matrices W más generales considerando las entradas wij como funciones (negativas)
de distancias geográficas, económicas o sociales entre áreas en lugar de simplemente
caracterizadas por entradas dicotómicas como en la Ecuación (2.2).

Ejemplo 2.1 Algunos ejemplos de matrices W

A continuación se muestran algunos ejemplos simples de matrices W para un sistema de áreas


irregulares. Consideramos un sistema de ocho regiones irregulares (a) y la correspondiente matriz
W calculada con varios criterios: (b) adyacencia, (c) vecino más cercano, (d) distancia < 2. Las
distancias se miden entre los centroides de las regiones. El lado de una celda se establece
convencionalmente igual a 1. Nótese que las matrices W no necesariamente tienen que ser
simétricas como sucede, por ejemplo, en el caso d). Nótese, además, que convencionalmente
siempre tenemos un 0 en la diagonal principal en el sentido de que cada área no se considera
vecina de sí misma. En el criterio del vecino más cercano, cuando más de una unidad cumple la
condición, seleccionamos una al azar.
Machine Translated by Google

Algunas definiciones espaciales importantes 29

12 345678
1 2 3 1 01 111000
2 10 110000
4
3 11 011111
4 11 100000
567 5 10 100100
6 00 101011
7 00 100101
8 8 00 100110

(un) (b)

12345678 12345678
1 01000000 1 01010000
2 00010000 2 10110000
3 00010000 3 01010000
4 01000000 4 11100000
5 00000100 5 00000110
6 00000010 6 00001010
7 00000100 7 00001101
8 00000010 8 00000010

(C) (d)

Muy a menudo, las matrices W se estandarizan para sumar la unidad en cada fila.
En este caso tenemos:

w *
w* =
yo
yo
; * ÿ ij
wW (2.3)
ÿw
norte

j =1 yo

Esta estandarización puede ser muy útil en algunos casos. Por ejemplo, al usar los pesos
estandarizados, podemos definir el producto de la matriz,

Ly( W
)= y* (2.4)

en el que cada elemento individual es igual a:

norte norte

wyjnij ÿ jj ÿyo ( )
y
Ly( wy
)=i ÿ ÿ yo* j = = (2.5)
j=1 j=1 ÿ w yoN# ()
j=1 ij

con #N(i ) representando la cardinalidad del conjunto N(i ). El término en la Ecuación (2.5)
representa el promedio de la variable y observada en todas las localidades vecinas a la
localidad i (según el criterio elegido para definir W). Por lo tanto, asume el significado del
valor retrasado espacialmente de yi y, por esta razón, a menudo se indica con el símbolo
L(y) por analogía con el operador de retraso en el análisis de series de tiempo.
Machine Translated by Google

Ejemplo 2.2 Matriz W basada en contigüidad de regiones del Reino Unido

Como ejemplo, podemos derivar la matriz W para las 12 regiones del Reino Unido que se muestran en el Ejercicio 1.1. A continuación se muestra una versión basada en
la contigüidad.

1 2 34 5 6 7 8 9 10 11 12 FILAS
SUMA
Escocia N Irlanda Gales N de noroeste Yorksh y W Midlands E Midlands E Anglia SO Inglaterra SE Inglaterra G Londres
Inglaterra Inglaterra Humber

1 Escocia 0 0 01 0 0 00 0 0 00 1 0 00 1 0 11 0 0 0 0 0 0 0 0 1
2 N Irlanda 0 0 1 0 10 1 0 00 1 0 00 0 0 00 0 0 0 0 0 0 0 0 0 0
3 Gales 0 00 0 0 00 0 0 1 0 0 1 0 0 3
4 N de Inglaterra 0 1 0 0 0 0 0 0 2
5 noroeste de Inglaterra 0 1 1 1 0 0 0 0 5
6 Yorksh y Humber 0 0 1 0 0 1 0 0 0 0 3
7 Oeste de las Tierras Medias 0 0 0 1 0 1 1 0 5
8 Este de las Tierras Medias 0 1 1 0 1 0 1 0 5
9 E Anglia 0 0 0 1 0 0 1 0 2
10 SO Inglaterra 0 0 1 0 0 0 1 0 2
11 SE Inglaterra 0 0 1 1 1 1 0 1 5
12 G Londres 0 0 0 0 0 0 1 0 1
Machine Translated by Google

Tenga en cuenta que una isla (a saber, Irlanda del Norte) no tiene vecinos. La última columna muestra el número de vecinos de cada región. La versión
estandarizada por filas de la matriz W se muestra a continuación. Observe que la suma de las filas ahora es igual a 1.

1 23 4 5 6 7 8 9 10 11 12 FILAS
SUMA
Escocia N Irlanda Gales N de noroeste Yorksh y W Midlands E Midlands E Anglia SO Inglaterra SE GRAMO

Inglaterra Inglaterra Humber Inglaterra Londres

1 Escocia 0 0 01 0 0 0 0 0 0 00 0,33333333 0 0000 0 0 01


2 N Irlanda 0 0 0 0,5 0 0,333333333 0 0 0 0 00
3 Gales 0 0 0 0 0,333333333 0 1
4 N de Inglaterra 0 0 0 0 0,5 0 00 0 01
5 noroeste de Inglaterra 0 0 0,2 0,2 0 0 0,2 0,20 0 0,2 0 0,3333333 0 0 0 01
6 Yorksh & 0 0 0,333333333 0,33333333 0 0 01
Humber
7 Oeste de las Tierras Medias 0 0 0,2 0 0 0,2 0 0 0,2 0 0,2 0,2 0 1
8 Este de las Tierras Medias 0 0 0,2 0 000 0 0 0 0 0 0 0 0,2 0,2 0 0,2 00 0,2 0 1
9 E Anglia 0 00 0 0,5 00 0 0,5 0 1
10 SO Inglaterra 0 0000 00 0,5 0 0,2 0,2 0,5 0 1
11 SE Inglaterra 0 00 0,2 0,2 0 0 0 0,2 1
12 G Londres 0 0 0 1 01
Machine Translated by Google

32 Introducción a la econometría espacial

El hecho de que Irlanda del Norte no tenga vecinos constituye un problema si queremos
calcular una variable espacialmente retrasada porque, en este caso, el valor de la variable
“espacialmente retrasada” para Irlanda del Norte siempre sería cero. Para abordar este
problema, convencionalmente podemos considerar a la región más cercana (Escocia) como
vecina de Irlanda del Norte, incluso si, estrictamente hablando, las dos regiones no
comparten un límite común. Habiendo hecho esta corrección a la matriz W estandarizada
por filas , se convierte en:

ÿ 0 0,5 0 0,5 0 0 ÿ 10 0 0 0 00 ÿ000


ÿ

00 0 00 000
0 0 0 0 0,33 0 0,33 0 0 0,33 0 0
0 0 0 0 0,5 0,5 0 00 000
0 0 0.2 0.2 0 0.2 0.2 0.2 0 000
0 0 0 0,33 0,33 0 0 0.33 0 000
W =
0 0 0.2 0 0.2 0 0 0,2 0 0,2 0,2 0
0 0 0 0 0,2 0,2 0,2 0 0,2 0 0,2 0
0000 00 0 0.5 0 0 0.5 0
0000 0 0 0.5 0 0 0 0.5 0
0000 0 0 0.2 0.2 0. 2 0,2 0 0,2
00 0 0 ÿ 00 0 00 0 10 ÿ

Ahora considere nuevamente el conjunto de datos que se muestra en el ejercicio 1.1. Si


premultiplicamos el vector de la variable “productividad laboral” (digamos variable y) por la
matriz W* (estandarizada por filas) obtenemos la variable espacialmente rezagada que se
muestra en la segunda columna de la siguiente tabla.

y W*y

81,5 91,55
96,9 81,50
82,9 105,83
86,2 86,65
88,6 86,42
84,7 87,96
89,2 101,72
89,1 93,52
96,8 98,70
139,7 98,75
108,3 100,92
89,8 108,3
Machine Translated by Google

Algunas definiciones espaciales importantes 33

2.2 Probando la autocorrelación espacial entre los


residuos OLS sin una hipótesis alternativa explícita

La prueba más utilizada para la autocorrelación espacial entre los residuos de regresión de
OLS se basa en una medida general de correlación espacial introducida por Moran (1950) y
propuesta por Cliff y Ord (1972) como una estadística de prueba para la ausencia de
correlación entre residuos de regresión.
Nótese que esta estadística se introdujo en la literatura simultáneamente
análogamente a la medida análoga para los residuos de regresión de series de tiempo: las
célebres estadísticas de Durbin-Watson (Durbin y Watson, 1950) incluso si, como ya se
mencionó, su extensión para tratar con los residuos de regresión se publicó solo más tarde
(Cliff y Ord, 1972). De hecho, la estadística de Durbin-Watson se puede definir como un caso
especial de las estadísticas de Moran simplemente definiendo una matriz W apropiada (ver,
por ejemplo, Arbia, 2006). En esencia, el estadístico de Moran toma la forma de una
correlación entre los residuos de la regresión y sus valores retrasados espacialmente, es
decir:

Cov Lee(, ()) (


Corre(Lee
, )=
Var Var L (2.6)
mi mi
)

De la Ecuación (2.6), utilizando la definición de rezago espacial dada en la Ecuación (2.4) y


suponiendo (por analogía con lo que sucede con las series de tiempo estacionarias) que:

Var ( mi)= ( ) Var L e


(2.7)

tenemos

T
Cov LW
(, ) ee ee=
Corre(L
ee
, )= (2.8)
Var ( mi) eeT

Se puede demostrar que, debido a la naturaleza de la definición de retraso espacial,


la igualdad (2.7) no se cumple para los datos espaciales donde tenemos en cambio
Machine Translated by Google

34 Introducción a la econometría espacial

Var ()miÿ Var L( ) e (ver Arbia, 1989). Uno de los efectos de esta desigualdad es que la
medida introducida en la Ecuación (2.8) no está limitada por 1 en )
Var L( e
valor absoluto, pero posee límites más estrechos dados por
yo ÿ .
Var ( mi
)

Sin embargo, en parte por razones históricas, y más sustancialmente por la equivalencia que
se puede demostrar con una prueba del Multiplicador de Lagrange (ver sección 3.7), esta es la
definición que prevalece actualmente en la literatura y la que se implementa en las rutinas del
software (alternativas son discutido en Whittle, 1954, en Cliff y Ord, 1972 y más recientemente
en Li et al., 2007). En su definición original, el estadístico I de Moran considera el estimador
sesgado de la varianza en el denominador de la Expresión (2.8) y un factor normalizador para
el numerador igual a la suma de los pesos. Como consecuencia, la contrapartida empírica de
(2.8) se puede expresar como:

T
ne Nosotros
yo =
(2.9)
ÿ ÿi
ÿ

camiseta ÿ_ ÿwÿ
ijj
ÿ ÿ

Cuando la matriz de peso está estandarizada por filas, la expresión =


ÿ ÿ wn
i yj yo

anterior se simplifica como:

T
Ewe
yo = (2.10)
T
ee

Cliff y Ord (1972) derivaron la distribución muestral del estadístico I bajo dos hipótesis diferentes:
(i) aleatorización y (ii) normalidad de los residuos. En el primer caso la distribución muestral se
obtiene considerando todas las posibles permutaciones de los datos observados en el sistema
de fronteras y calculando el estadístico Moran I en cada una de ellas. También probaron que la
distribución asintótica es normal con un valor esperado que no depende de la hipótesis particular
elegida y que siempre se expresa por:

IE( Wx ( ) n tr M
)= (2.11)
( Snk
0 ÿ )
Machine Translated by Google

Algunas definiciones espaciales importantes 35

con S0 = w ÿ ÿ Por el
, MI PX XX
IP= ÿ y su varianza
contrario, =(sij )ijXX T 1 T.
depende de la hipótesis de
ÿ

i seleccionada.
los residuos,
X EnXse
particular,
puede expresar asumimos
como:
la normalidad

2 2
ÿ
ÿ ]
ÿ

( xxWx tr MWT tr
n tr2 M WM ) +MW
( )+ ( [
Var (I )= X
IE( ) 2
)ÿ
ÿÿ

ÿ
ÿ

(2.12)
ÿÿÿ
S0ÿÿ
(nknkÿ

)( +
ÿ

2 )

Nótese que la prueba de Moran I adolece de la limitación de no estar basada


en una hipótesis alternativa explícita. Sin embargo, debido a la equivalencia
ya mencionada de la prueba (probada por Burridge, 1980) a una prueba LM ,
esto no es un gran inconveniente. La presentación de estadísticos de prueba
alternativos para la hipótesis de correlación residual no puede tratarse con
más detalle hasta que presentemos algunas formulaciones explícitas para
una hipótesis alternativa. Este objetivo se logra en el Capítulo 3, por lo que
volveremos a tratar este tema en la sección 3.7.

Ejemplo 2.3 Ley de Okun para las 20 regiones italianas

La Ley de Okun (Okun, 1962) es una relación inversa entre la variación de la


tasa de desempleo y la variación del PIB real. La siguiente tabla muestra los
datos necesarios para probar la Ley de Okun en las 20 regiones italianas. Las
variaciones de las dos variables se observan en el período 1990-2010.

Variación de Variación Variación de Variación


Desempleo de Real Desempleo de Real
Velocidad PIB Velocidad PIB

1. Piamonte 4,2 11. Marca 4.2 1.8


2. Valle de Aosta 3,2 1 1.9 12. Lacio 6.4 2
3. Lombardía 4. 3,4 1.7 13. Abruzos 6.2 0.5
Trentino 2,75 1.7 14. Molise 8.1 0.9
Alto Adigio 15. Campania 11.2 0.4
5. Véneto 3.3 1.8 16. Apulia 11.2 1.8
6. Friuli Venecia 3.4 1.9 17. Basílica 9.6 1.4
Giulia 18. Calabria 11.3 0.2
7. Liguria 4,8 2.3 19. Sicilia 13 0.1
8. Emilia 2,9 2 20. Cerdeña 9.9 0.7
Romaña
9. Toscana 4.3 1.1
10. Umbría 4.6 2.3

Fuente: http:// sitis.istat.it/ sitis/ html/.


Machine Translated by Google

36 Introducción a la econometría espacial

El siguiente diagrama de dispersión muestra la relación negativa esperada de la teoría.

norte Sur
norte Sur
R2 Lineal = 0.469

14.00

12.00

10.00

8.00

6.00

4.00

2.00
.0 .5 1.0 1.5 2.0 2.5
variación del PIB real

Fuente: Elaboración propia a partir de los datos extraídos de la base de datos del ISTAT denominada
“Indicadores territoriales” que se puede descargar en la página web: http://sitis.istat.it/sitis/html/.

El gráfico muestra que la variación de la tasa de desempleo es sistemáticamente mayor


de lo esperado en las regiones del sur de Italia (círculos claros, que corresponden a residuos
positivos) y menor en las regiones del norte de Italia (círculos oscuros, que corresponden a
residuos negativos), lo que podría ser interpretado como una posible falta de especificación
del modelo y como un síntoma claro de autocorrelación espacial residual.
Los resultados de la estimación del modelo con OLS se muestran a continuación junto
con los principales estadísticos de prueba.

Parámetro Error estándar prueba t valor p

b0 10.971 1.283 8,8551 9.38e–08***


b1 – 3.326 0.835 – 3,984 0.000871***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

R2 = 0,4686 R2 ajustado = 0,4391 Estadísticas F = 15,87


(valor p = 0,0008705)
AIC = 98,28693 BIC = 101,2741 Prueba JB = 1,2331 (valor p = 0,5398)
Prueba de PA = 0,0225 (valor p = 0,8808)
Machine Translated by Google

Algunas definiciones espaciales importantes 37

La prueba F es altamente significativa y conduce a la aceptación del modelo.


Además, ambos parámetros son significativamente diferentes de cero al nivel de
confianza habitual. Las pruebas JB y BP conducen a la aceptación de las hipótesis de
normalidad y homocedasticidad, respectivamente. La siguiente tabla resume el cálculo
de las estadísticas de la prueba Moran I para la hipótesis de correlación espacial de
los residuos. Observe que la matriz W se especificó por contigüidad (las dos islas se
consideran vecinas a la región más cercana).

Prueba I de Moran

Valor observado Variación del valor esperado valor p de la prueba z

I de Moran 0,40857021 – 0,06968484 0,02737778 2,8904 0,001924

La prueba I de Moran revela la presencia de una autocorrelación espacial positiva


significativa entre los residuos de la regresión, lo que impone una reevaluación de
todos los resultados obtenidos anteriormente y una redefinición del modelo. En este
caso particular, en presencia de autocorrelación espacial positiva, tanto las pruebas t
como la prueba F estarán infladas, lo que nos llevará a aceptar como buenos modelos
que deben rechazarse. Además, las pruebas de JB y BP no fueron significativas, lo
que llevó a aceptar la hipótesis de homocedasticidad y normalidad. Sin embargo,
dado que hemos detectado una autocorrelación espacial significativa en los residuales,
ambas pruebas pueden llevar a conclusiones engañosas.

Ejemplo 2.4 Curva de Phillips para las 20 regiones italianas

La curva de Phillips (Phillips, 1958) es una relación inversa entre la tasa de desempleo
y la tasa de inflación. Afirma que un menor desempleo está asociado con una mayor
tasa de inflación. Si bien originalmente se propuso para explicar el comportamiento
histórico de las dos variables, también se consideró para explicar sus variaciones
espaciales (Anselin, 1988). La siguiente tabla muestra los datos necesarios para
probar el modelo Phillips en las 20 regiones italianas.

% variación % variación % variación % variación índice


índice de precios del desempleo de precios del desempleo
Velocidad Velocidad

1. Piamonte 4.2 2.1 6. Friuli Venecia 3.4 1.8


Julia
2. Valle de Aosta 3.2 1.4 7. Liguria 4,8 1.7
3. Lombardía 3.4 1.7 8. Emilia 2,9 1.9
Romaña
4. Trentino 2.75 1.8 9. Toscana 4.3 1.6
Alto Adigio
5. Véneto 3.3 1.5 10. Umbría 4.6 1.7

(continuado)
Machine Translated by Google

38 Introducción a la econometría espacial

Continuado

% variación % variación % variación % variación


índice de precios del desempleo índice de precios del desempleo
Velocidad Velocidad

11. Marcas 4,2 1,6 16. Puglia 11,2 2.3


12. Lacio 13. 6,4 2 17. Basilicata 9,6 2
Abruzos 14. 6,2 1,6 18. Calabria 19. 11,3 2.4
Molise 15. 8,1 1,9 Sicilia 20. 13 2.4
Campania 11,2 1,8 Cerdeña 9.9 1.9

Fuente: http:// sitis.istat.it/ sitis/ html/.

El siguiente diagrama de dispersión muestra una relación positiva

región
norte Sur
R2 Lineal = 0.519

14.00

12.00

10.00

8.00

6.00

4.00

2.00
1.4 1.6 1.8 2.0 2.2 2.4
variación en el índice de precios

Fuente: Elaboración propia a partir de los datos extraídos de la base de datos del ISTAT denominada “Indicadores
territoriales” que se puede descargar en la página web: http://sitis.istat.it/sitis/html/.

Sin embargo, el gráfico también muestra que la variación en la tasa de desempleo es


sistemáticamente más alta de lo esperado en las regiones del sur de Italia (ligera
Machine Translated by Google

Algunas definiciones espaciales importantes 39

(círculos oscuros, correspondientes a residuos positivos) y menor en las regiones del norte
de Italia (círculos oscuros, correspondientes a residuos negativos), lo que posiblemente
podría ser una indicación de autocorrelación espacial residual.
El resultado de la estimación del modelo con el MCO se muestra a continuación:

Parámetro Error estándar prueba t valor p

b0 –9.827 3.720 –2.642 0.016568*


b2 8.746 1.984 4.409 0.000338***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

R2 = 0.5193 R2 ajustado = 0,4926 Estadísticas F = 19,44 (valor


p = 0,000338)
AIC = 96,28177 BIC = 99,26897 Prueba JB =
0,0128 (valor p = 0,9936)
Prueba de PA = 0,2556 (valor p = 0,6131)

Todas las pruebas de significación de los parámetros conducen al rechazo de la hipótesis


nula, sugiriendo así la aceptación del modelo. Indicaciones similares provienen del análisis
de la prueba F y de las pruebas de normalidad y homocedasticidad.
Al especificar una matriz W por contigüidad (como en el Ejemplo 2.3), el cálculo de la
prueba I de Moran de autocorrelación espacial entre los residuos produce los siguientes
resultados:

Prueba I de Moran

Valor observado Variación del valor esperado prueba z valor p

I de Moran 0,3212607 – 0,06938126 0,02711169 1,5297287 0,063042

En este caso, aunque se detecta una correlación espacial positiva, esta no es significativa
al 5% de confianza.

2.3 Códigos R

La creación y la gestión de una matriz W es la parte más complicada de ejecutar una


regresión espacial en cualquier software. También es lo que distingue al software con
capacidades espaciales del software econométrico estándar.
Por ello dedicaremos una parte importante del presente capítulo a discutir algunos de los
pasos más importantes necesarios para su creación, su importación desde recursos
R proceder
externos y su gestión. Todas las duraciones que se ilustrarán en la presente sección, y la
mayoría de las
Machine Translated by Google

40 Introducción a la econometría espacial

presentados en el resto del libro, están contenidos en el paquete velocidad .

Para instalar el paquete, escriba el comando:

>instalar.paquetes(”spdep”)

por primera vez y luego al comienzo de cada nueva sesión, vuelva a llamarlo escribiendo:

>biblioteca(spdep)

2.3.1 Creación de una matriz W para datos de cuadrícula regulares


Considere, para comenzar, el caso de una cuadrícula de celosía cuadrada regular de
dimensión, por ejemplo, 3 por 3. El software R genera la lista de vecinos automáticamente
con el comando:

> Wnb<-celda2nb(3,3,tipo=" ")

donde el tipo se puede especificar como "torre" o "reina" según la tipología de vecindad
elegida.
El comando indica que queremos cambiar nuestros datos de una celda
sistema (celda) a (2) una lista de vecinos (nb).
El objeto Wnb es solo una lista de vecinos. Si tecleamos Wnb obtenemos un resumen
de la información que contiene (el número de regiones, el número de enlaces de
proximidad, el número medio de enlaces y el número y el porcentaje de enlaces distintos
de cero). Una vez creado este objeto, tenemos que transformarlo en una matriz real,
digamos W, a través del comando:

> W<-nb2listaw(Wnb)

El comando indica que queremos cambiar nuestros datos de una lista de vecinos (nb) a
(2) una matriz de peso (listw). Para visualizar los vecinos reales, escriba:

> W$pesos

Una vez que se crea la matriz de peso W , la variable retrasada espacialmente de una
variable X (por ejemplo, WX) se puede obtener fácilmente a través del comando

> WX<-lag.listw(W,X)

WX es solo un nombre convencional asignado a esta nueva variable.

2.3.2 Creación de una matriz W para datos irregulares


Consideremos ahora el caso de un conjunto irregular de regiones y consideremos, como
ejemplo, las 20 regiones italianas, ya descritas en los Ejemplos 2.3 y 2.4, cuyos límites
se muestran en la siguiente Figura 2.3.
Machine Translated by Google

Algunas definiciones espaciales importantes 41

4
6
2 3 5
1
8
7
9 11
10
13
12
14
dieciséis

15
17
20
18

19

Figura 2.3 Límites de las 20 regiones italianas


Fuente: http://www.istat.it/it/archivio/44523.

Para crear una matriz W necesitamos dos objetos diferentes, a saber:

1. un archivo externo que contiene la lista de vecinos de cada región. Este archivo
debe guardarse como un archivo de texto y nombrarse con la extensión .GAL.
2. una variable interna que contiene solo el identificador de la región (p. ej., 1,
2, …, 20)

Para las 20 regiones italianas que se muestran en la Figura 2.3 anterior, el primero
de los dos archivos tendrá el siguiente formato:

Primera linea

0 20 Italia ita_regions (este es el encabezado: comienza con un 0 obligatorio seguido


del número de regiones (20), del nombre del sistema regional (Italia) y de una variable
que contiene el identificador del polígono (ita_regions))

Segunda linea

2 1 (el identificador de región y el número de vecinos. Esta línea indica


que la región 2 solo tiene un vecino)
1 (el identificador de polígono del vecino. Esta línea indica que la región 2 tiene
solo la región 1 como vecino)
Machine Translated by Google

42 Introducción a la econometría espacial

1, 4 (1 región tiene 4 vecinos) 2, 3, 7, 8 (los identificadores de

polígono de los 4 vecinos de la región 1)

y así. Para ver el archivo completo, consulte a continuación.

Archivo: Italia.GAL

0 20 italia ita_regions
11
22
41
3783
4245
8423
5

54
3468
6157
3289
8523
5799
5 7 8 10
11 12 10
5 8 9 11
12 13 11 4 9
10 12 13 12 6
9 10 11 13 14
15 13 3 10 12
14 14 4 12 13
15 16 15 4 12
14 16 17 16 3 14 15
17 17 3 15 16 18
18 2 17 19 19 2 18
20 20 1 19

fin del documento


Machine Translated by Google

Algunas definiciones espaciales importantes 43

En cuanto al segundo de los dos archivos necesarios para el procedimiento, el identificador


del polígono está representado por la variable interna ita_regions que, en este caso, se
puede crear con el comando:

regiones_ita<-c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,
15,16,17,18,19,20)

o leer desde un archivo externo. Una vez que hemos creado estos dos objetos, se pueden
leer en R a través del comando:

nbitaly<-read.gal("Italia.GAL", region.id=ita_regions)

Tenga en cuenta que la ruta completa del archivo .GAL debe especificarse
completamente para que el procedimiento pueda identificarlo unívocamente.
El objeto nbitalmente así obtenido tiene que ser transformado en un
matriz W real a través del comando (ver sección 2.3.1)

> witaly<-nb2listw(nbitaly)

Si además requerimos una estandarización de filas de la matriz W , el comando anterior


debe modificarse de la siguiente manera:

> witaly<-nb2listw(nbitaly, estilo=”W”)

2.3.3 Lectura de una matriz W desde archivos externos

Cuando el número de unidades se vuelve grande, el método ilustrado en la sección 2.3.2


de ingresar la información del vecindario directamente se vuelve rápidamente inviable. En
este caso, se puede obtener una matriz W leyendo archivos externos generados por
Sistemas de Información Geográfica (SIG) (ver, por ejemplo, Burrough et al., 2014) y
disponibles públicamente para muchos sistemas regionales (ver, por ejemplo, http: //
www.censo.
gov/geo/maps-data/data/tiger-line.html, para los estados de EE. UU. y otros sistemas
fronterizos de EE. UU. o http://epp.eurostat.ec.europa.eu/portal/page/
portal/gisco_Geographical_information_maps/popups/references/
unidades_administrativas_unidades_estadísticas_1 para los Estados de la UE y para
algunos otros sistemas fronterizos mundiales).
En particular, los límites regionales y sus relaciones pueden aparecer en forma de
archivos de forma que consisten en tres archivos obligatorios identificados por las
extensiones .shp, .shx y .dbf. El archivo .shp almacena elementos geométricos como las
coordenadas de los centroides de los polígonos y sus
Machine Translated by Google

44 Introducción a la econometría espacial

límites. El archivo .shx almacena un índice de la geometría de la característica y, finalmente,


el archivo .dbf almacena la información de atributos de las características.
Para adquirir la información necesaria de archivos externos, necesitamos desarrollar tres
pasos. En el primer paso, simplemente leemos los archivos de forma de la fuente externa en
R lista
el sistema. En el paso dos, creamos una de vecinos
Finalmente, en aelpartir
pasode losderivamos
tres archivos de forma.
la W

matriz de la lista de vecinos usando el mismo procedimiento ilustrado en las secciones 2.3.1
y 2.3.2. Estos pasos se describen a continuación.

Paso 1: para importar los archivos de forma (por ejemplo, el archivo de forma, Italia, que
consta de los tres archivos Italia.shp, Italia.shx e Italia.dbf), usamos el comando:

> italia<-readShapePoly(“Italia”, IDvar=”ID”)

donde ID es el nombre de la variable que contiene el código de identificación regional. Una


vez que los datos se leen en el sistema R , podemos enumerar las variables contenidas en el
conjunto de datos con el comando he

>nombres(Italia)

podemos ver la trama de los bordes con el comando

>parcela(Italia)

podemos identificar los centroides de cada región con el comando:

>coords<-coordenadas(Italia)

y podemos mostrar las identificaciones regionales en el mapa con el comando

>texto (coords, label=sapply(slot(italy,"polygons"),


función(i) ranura(i,"ID")))

Paso 2: Para calcular la lista de vecinos basada en contigüidad , usamos el comando:

>contnb<-poly2nb(Italia,reina=T)

El criterio de la reina especificado (ver sección 2.1) asegura que dos regiones se consideren
vecinas si tienen un límite común. Él
Machine Translated by Google

Algunas definiciones espaciales importantes 45

El comando indica que queremos cambiar nuestros datos de una lista de polígonos (poly)
a (2) una lista de vecinos (nb).
Sin embargo, este comando no tolera la presencia de áreas aisladas (como, por ejemplo,
el caso del mapa que se muestra en la Figura 2.3) sin ningún vecino. Podemos forzar al
comando a incluir estas áreas agregando la opción

>contnb<-poly2nb(Italia,queen=T,zero.policy=TRUE)

pero en este caso se generará una matriz W con una o más áreas con todo cero en la
línea correspondiente. El problema puede eliminarse generando una lista de vecinos
basada en la distancia de umbral mínima usando el comando:

> contnb <- dnearneigh(coordenadas(Italia), 0, 380000, longlat=F)

donde 380000 es una distancia de umbral convencional (que se identificará empíricamente


en todos los casos prácticos) medida en kilómetros de círculo máximo (es decir, la distancia
a lo largo de un camino en una esfera).

Paso 3: Finalmente, en el tercer paso podemos obtener la matriz W de la lista de vecinos


generada en los pasos anteriores, usando el siguiente comando (ya ilustrado en las
Secciones 2.3.1 y 2.3.2):

> W<-nb2listw(contnb, glist=NULL)

Nuevamente, como se muestra en las secciones anteriores, si deseamos estandarizar


los pesos por filas, tendremos que agregar la opción adicional:

> W<-nb2listw(contnb, glist=NULL, estilo =”W”)

2.3.4 Cálculo del I de Moran para los residuos de una regresión OLS

Para calcular la prueba de Moran I sobre los residuos de un modelo previamente estimado
(por ejemplo, modelo1), use el comando

> lm.morantest(modelo1, W)

que utiliza una matriz W contenida en el objeto W, obtenida, por ejemplo, mediante los
procedimientos descritos en los apartados 2.3.1 a 2.3.3. Por defecto
Machine Translated by Google

46 Introducción a la econometría espacial

se considera la opción de aleatorización y la prueba unilateral. Para cambiar el valor


predeterminado, introduzca la opción:

> lm.morantest(modelo1, W, aleatorización=FALSO, alternativa


“dos caras”)

que considera la hipótesis de normalidad y una hipótesis alternativa bilateral de autocorrelación


espacial positiva o negativa.

2.3.5 Algunas bases de datos R útiles

El paquete spdep contiene algunos conjuntos de datos que son muy útiles para la práctica
adicional. Estos conjuntos de datos se considerarán en el resto de este libro para ejemplos y
ejercicios prácticos. En particular, consideraremos cuatro bases de datos llamadas “baltimore”,
“boston”, “columbus” y “used.cars”.

Por ejemplo, para acceder a los datos “autos.usados” escriba el comando:

>datos(autos.usados)

Después de descargar estos datos, su sesión contiene dos nuevos objetos.


Para visualizarlos escribe el comando:

>ls()

Como resultado de este comando, verá los dos objetos: (i) used.cars que contiene los datos
reales y (ii) usa48_1960 que contiene la información del mapa en forma de lista de vecinos.
Para visualizar el contenido del archivo de datos escriba el comando:

>str(autos.usados)

lo que muestra que en la base de datos ahora tenemos dos variables llamadas
cargos.de.impuestos.de.autos.usados.y.precio.de.autos.usados$1960. Tenga en cuenta que
el prefijo used.cars$ siempre es necesario cuando tiene más de un conjunto de datos abierto
en la sesión activa.
El objeto usa48_nb es una lista de vecinos a partir de la cual podemos generar
comió la matriz W a través del comando:

W<-nb2listw(usa48.nb)

como se vio anteriormente.


Machine Translated by Google

Algunas definiciones espaciales importantes 47

Se pueden seguir procedimientos análogos para descargar los otros conjuntos de datos.
(baltimore, boston y columbus) mencionado anteriormente.

Términos y conceptos clave introducidos

• Autocorrelación espacial
• Vecindario
• Criterios de vecindad: definición de caso de torre y caso de dama
• Criterio de vecindad: criterio de distancia máxima
• Criterios de vecindad: criterio del vecino más cercano
• Matriz de peso (o conectividad)
• Matriz de peso estandarizada
• Retraso espacial
• Prueba I de Moran de autocorrelación espacial entre residuos de regresión
• Momentos de la prueba I de Moran bajo aleatorización y bajo el
hipótesis de normalidad

Preguntas

1. ¿Por qué no se puede emplear la prueba de Durbin-Watson (disponible en todos los


software econométricos y utilizada para probar la hipótesis de ausencia de
autocorrelación residual) en el caso de regresiones estimadas sobre datos espaciales?
2. ¿Cuál es el significado de variable retrasada espacialmente?
3. ¿Cuál es el significado de la estandarización por filas de una matriz de pesos? En
¿En qué caso es beneficiosa esta operación?
4. ¿Cuál es el significado de la hipótesis de aleatorización utilizada para derivar la
distribución muestral de las estadísticas de la prueba Moran I?
5. En la Pregunta 5 del Capítulo 1 presentamos la prueba de Durbin-Watson

Estadísticas T=d ee T
ÿ t=2
[ t
]2 ÿ tÿ 1
ÿ

1
2
y tt
=
t=1,…,T. Reescribe las estadísticas en

notación matricial, haciendo uso de una matriz W adecuada que describa correctamente
la proximidad entre unidades temporales.

Ejercicios

Ejercicio 2.1 La Nomenclatura de Unidades para Estadísticas Territoriales (NUTS) es un


estándar geocodificado para hacer referencia a la subdivisión de los países de la Unión
Europea con fines estadísticos. Para cada uno de los Estados miembros, Eurostat
establece una jerarquía de tres niveles NUTS, nivel NUTS1
Machine Translated by Google

48 Introducción a la econometría espacial

correspondiente a la subdivisión del país. La siguiente figura muestra los límites de


las ocho regiones NUTS2 rumanas. Sobre la base de este mapa, obtenga la matriz
W correspondiente y su versión estandarizada por filas.
Calcule el porcentaje de entradas distintas de cero de la matriz W ("esparcimiento").

RO21
RO11

RO12

RO22
RO42
RO32
RO31

RO41

Mapa de los límites de las 8 regiones de Rumanía a nivel europeo NUTS2.


Fuente: http:// epp.eurostat.ec.europa.eu/ cache/ GISCO/ yearbook2007/ NUTS2.pdf.

Ejercicio 2.2 Dada la matriz de pesos derivada del Ejercicio 2.1 y los datos que se
muestran en la siguiente tabla, calcule la variable espacialmente rezagada de las
tasas de mortalidad infantil.

Regiones Tasas de Mortalidad Infantil (2011)


RO11 – Nord-Vest 8.7
RO12 – Centro 10.1
RO21 - Nordeste 10.1
RO22 – Sud-Este 11.3
RO31 – Sur - Muntenia 10.3
RO32 – Bucuresti - Ilfov 5.7
RO41 – Sud-Vest Oltenia 9.3
RO42 – Chaleco 8.9

Fuente: http:// epp.eurostat.ec.europa.eu/ portal/ page/ portal/ region_cities/ regional_statistics/ data/ database.
Machine Translated by Google

Algunas definiciones espaciales importantes 49

Ejercicio 2.3 (a) Utilizando el procedimiento ilustrado en la sección 2.3.1, genere una
matriz de pesos (basada en el caso de la torre) para la siguiente cuadrícula de celosía
cuadrada regular de dimensión 5 por 5 (n = 25).

12345
6 7 8 910
11 12 14 16 17 19 22 24 13 15
18 20
21 23 25

(b) Dados los datos dispuestos en la cuadrícula generada anteriormente, ahora calcule
la variable L(X) retrasada espacialmente de la siguiente variable X.

27 16 –1 23 19
36 21 32 33 26
28 25 3 23 35
14 12 16 14 12
4 15 29 31 –1

Ejercicio 2.4 Dadas las 12 regiones del Reino Unido reportadas en el Ejercicio 1.1,
utilizando el procedimiento ilustrado en la sección 2.3, cree el archivo *.GAL y obtenga
la matriz de peso. Considere que Irlanda del Norte es adyacente a Escocia y Gales.

Ejercicio 2.5 Dados los datos mostrados en el Ejercicio 1.1 y utilizando los resultados
del Ejercicio 2.4, calcule los valores retrasados espacialmente de la variable GVA (Valor
Agregado Bruto) para las 12 regiones del Reino Unido.

Ejercicio 2.6 A partir de los resultados obtenidos en el Ejercicio 2.5, dibuje un diagrama
de dispersión con la variable VAB en el eje horizontal y la variable rezagada L(VAB) en
el eje vertical. Este gráfico representa la herramienta exploratoria denominada “diagrama
de dispersión de Moran” en la literatura (Anselin, 1995). ¿Qué tipo de conocimiento
puedes obtener de él?

Ejercicio 2.7 Dados los resultados del Ejercicio 2.4, vuelva a estimar el modelo 1 del
Ejercicio 1.1 [VAB = f(productividad laboral; tasa de creación de empresas)] y pruebe la
presencia de autocorrelación espacial entre los residuos. ¿Podemos aceptar la hipótesis
de la descorrelación espacial de los residuos?

Ejercicio 2.8 Utilizando el procedimiento ilustrado en la sección 2.3.2, genere una


matriz de pesos para las 20 regiones italianas y reproduzca los ejemplos 2.3 y 2.4.
Machine Translated by Google

50 Introducción a la econometría espacial

Ejercicio 2.9 Visite el sitio web http://gis.cancer.gov/tools/seerstat_


bridge/fips_vars/#statefips y descargue los archivos de forma relacionados con
los 51 estados de EE. UU. Luego, utilizando el procedimiento ilustrado en la
sección 2.3.3, genere la matriz de ponderación y trace el mapa de los límites de
los 51 estados.

Referencias al Capítulo
Anselin, L. (1988) Econometría espacial: métodos y modelos, Dordrecht: Kluwer
Editores Académicos.
Anselin, L. (1995) 'Indicadores locales de asociación espacial', Análisis geográfico,
27, 93–115.
Arbia, G. (1989) Configuración de datos espaciales en el análisis estadístico de la economía
regional y problemas relacionados, Dordrecht: Kluwer Academic Press.
Arbia, G. (2006) Econometría Espacial: Fundamentos Estadísticos y Aplicaciones a la
Crecimiento económico regional, Heidelberg: Springer-Verlag.
Burridge, P. (1980) 'Sobre la prueba de Cliff-Ord para la correlación espacial', Journal of the
Royal Statistical Society, B, 42, 107–8.
Burrough PA, Mcdonnell, RA y Lloyd, CD (2014) Principios de los sistemas de información
geográfica, 3.ª edición, Oxford: Oxford University Press.
Cliff, AD y Ord JK (1972) Autocorrelación espacial, Londres: Pion.
Durbin, J. y Watson, GS (1950) 'Pruebas de correlación serial en la regresión de mínimos
cuadrados', I, Biometrika 37, 409–28.
Kelejian, HH y Prucha, I. (2001) 'Sobre la distribución asintótica de la estadística de prueba
de Moran I con aplicaciones', Journal of Econometrics, 104, 219–57.
Li, H., Calder, CA y Cressie, N. (2007) 'Más allá de I de Moran: pruebas de dependencia
espacial basadas en el modelo autorregresivo espacial', Análisis geográfico, 39, 4, 357–75.

Moran, PAP (1950) 'Notas sobre fenómenos estocásticos continuos', Biometrika


37, 1, 17–23.
Okun, AM (1962) PNB potencial, su medición y significado, Cowles
Fundación, Universidad de Yale.
Phillips, AW (1958) 'La relación entre el desempleo y la tasa de cambio de los salarios
monetarios en el Reino Unido 1861–1957', Economica, 25, 100, 283–99.

Whittle, P. (1954) 'Sobre procesos estacionarios en el plano', Biometrika, 41, 434–49.


Machine Translated by Google

3
Modelos de regresión lineal espacial

3.1 Generalidades

Este capítulo discute diferentes especificaciones de modelos econométricos


espaciales lineales que se pueden considerar una vez que se viola la hipótesis
de no autocorrelación espacial en las perturbaciones. Una forma general para
tener en cuenta la violación de las condiciones ideales para la aplicabilidad de
OLS está dada por el siguiente conjunto de ecuaciones:

(1)=(2)
lb por+Wy X WX
+ u + yo 1< (3.1)

u wure= + 1r< (3.2)

con X una matriz de regresores no estocásticos, W una matriz de pesos


dada exógenamente, X iidN
mi
. . . (0, y b(2),s _2l ynnyor )
b(1), ÿ

parámetros a estimar. Las restricciones sobre los parámetros l y r


se mantiene si W está estandarizado por filas.

La primera ecuación considera la variable retrasada espacialmente de la


variable dependiente y como uno de los regresores y también puede contener
variables retrasadas espacialmente de algunas o todas las variables exógenas
(el término WX). La segunda ecuación considera un modelo espacial para las
perturbaciones estocásticas. En principio, no es necesario que las tres matrices
de pesos de las Ecuaciones (3.1) y (3.2) sean iguales, aunque en casos
prácticos es difícil justificar una elección diferente.
La ecuación (3.1) también se puede escribir como:

= Zu1
y Wy + lb
+ l< (3.3)

51
Machine Translated by Google

52 Introducción a la econometría espacial

habiendo definido la matriz de todos los regresores, actuales y retrasados espacialmente,


=ÿ ,
como Z = [X,WX] y el vector de parámetros de regresión como b bb ÿ ÿ ÿ (1) (2) .

Este modelo fue denominado SARAR(1,1) (acrónimo de Spatial AutoRegres


sive con estructura de error AutoRegresivo adicional) por Kelejian y Prucha
(1998) y abarca varios modelos econométricos espaciales. En concreto
tenemos cinco casos destacables:

(i) b = 0 y l o r = 0, conocido como autorregresivo espacial puro


modelo
(ii) l = r = 0, conocido como modelo de variable independiente rezagada
(iii) l = 0, r ÿ 0 conocido como modelo de retraso espacial (SLM)
(iv) l ÿ 0, r = 0 conocido como modelo de error espacial (SEM)
(v) l ÿ 0, r ÿ 0 el modelo completo (SARAR)

Revisaremos estos cinco casos en las siguientes secciones. Sin embargo,


antes de hacer esto, consideremos una condición general sobre los parámetros
del modelo.
En primer lugar, observe que la Ecuación (3.1) también se puede escribir como:

(IW
) = yl bb
ÿ

X WX u +
(1) (2)
+

1ÿ + (3.4)
=( WX
y IWX
ÿ

tuÿ+) lbb
ÿ ÿ(1) (2) ÿ

y la Ecuación (3.2) como:

1 uIWÿ=(
r )ÿ mi
(3.5)

siempre que existan las dos matrices inversas. Utilizando el teorema de


Gerschgorin (1931), Kelejian y Prucha (1998) demostraron que, cuando la
matriz W está estandarizada por filas, ambas matrices inversas existen si |r| <
1 y |l| < 1, de ahí la restricción de parámetros reportada en las Ecuaciones (3.1)
y (3.2).

3.2 Autorregresión espacial pura

Cuando b = 0 y l = 0 o r = 0, y suponiendo además


mi X iidN. . (0, 2
ÿ
soy nne ) y W no estocástico, entonces el modelo reduce

a una autorregresión espacial simple que se puede estimar mediante el


procedimiento ML (Whittle, 1954).
Machine Translated by Google

Modelos de regresión lineal espacial 53

En este caso tenemos

l el < y+Wy = 1 (3.6)

cuando ÿ = 0 o

+<
y Wy = 1 r er (3.7)

cuando l = 0 ya que, en este caso, y = u. En este caso podemos derivar la


probabilidad de la siguiente manera. En primer lugar, de la Ecuación (3.6) (o
(3.7)) tenemos que:

(I –rW)y = e

por lo tanto

y = (I – rW)–1 e

así que eso

E(y) = 0 (3.8)

)= T( ) ( IWIW
E (yy
2
sr r ÿÿ ÿ 1 12 T
)=
ÿ ÿ

mi
se
_ (3.9)

Habiendo supuesto la normalidad de las innovaciones, la función de


verosimilitud se puede expresar como:

1 ÿ1ÿ
2
L ( , )= rs T 1
ÿ

2 ÿ

constantes _ ÿÿ ÿ 2exp ÿ ÿ ÿ yy ÿ (3.10)


mi
2s 2
mi

Sustituyendo la expresión explícita por la matriz ÿ reportada en la Ecuación (3.9), podemos


escribir:

ÿ
norte
ÿ
1
L ( r, )= 22 1 constante(ÿÿ e ) 2 ( IWIW
)( r
ÿ
ÿ

r ) T
ÿ

2
mi

ÿ ÿ (3.11)
ÿ
1 1
ÿ

ÿ ÿÿ ÿ ) ( )TyI WIWÿyr
ÿ

" ÿ experiencia ÿ ÿ
ÿ

1 ÿ

T ÿ

2ÿ 2 (ÿ ÿ

ÿÿ
mi
Machine Translated by Google

54 Introducción a la econometría espacial

y, finalmente, el log-verosimilitud se puede expresar como

22 1 norte ÿ ÿ

T
l ( , )ÿ=e r constante ÿ ÿÿ ÿ

en( ÿ) 2
mi 1 en (IW
) (IW
)r2 r

1 ÿ

1 (3.12)
ÿ ÿÿ ÿ ) ( T) yI WIW 1 T
rr y
ÿ ÿ

2
2ÿ mi
(ÿ ÿ

Esta expresión no es lineal en los parámetros y requiere una


maximización numérica.

Ejemplo 3.1 Autorregresión espacial del índice de precios en


las 20 regiones italianas

Consideremos nuevamente el ejemplo de las 20 regiones italianas que se


muestran en el mapa de la Figura 2.3, y consideremos la distribución espacial de
la variación del índice de precios que se muestra en el Ejemplo 2.4. Aquí
deseamos estimar un modelo autorregresivo puramente espacial con un término
constante, y = b0 + lWy + e (con y = variación del índice de precios) para probar
si la variación del índice de precios en una región afecta las variaciones en la
vecina. regiones a través de un mecanismo de contagio de la inflación. Como
criterio de vecindad se consideró el criterio de distancia umbral máxima para incluir las dos isla
que de otro modo estaría aislado empleando un criterio de contigüidad simple.
Los resultados de la estimación del modelo autorregresivo espacial utilizando el
criterio ML (por maximización numérica del log-verosimilitud) se muestran a
continuación:

Parámetro Error estándar prueba t valor p

b0 1.841545 0.037795 48.724 2.2e–16

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

l=–0,56091 Prueba LR = 0,94661 (valor p = 0,33058)


Log-verosimilitud = –2,065929 AIC = 10,132

La tabla muestra la prueba t habitual para el término de intersección y una prueba de razón
de verosimilitud para el parámetro espacial l. Los resultados muestran que solo el término
constante es significativamente diferente de cero y por lo tanto no existe una transmisión
geográfica significativa de las variaciones de precios a nivel regional.
Machine Translated by Google

Modelos de regresión lineal espacial 55

3.3 El modelo clásico con regresores no


estocásticos retrasados espacialmente

Cuando l = r = 0, si además suponemos que mi X iidN .. (0,


ÿ . tanto 2 sennyo ) , ese
X como W no son estocásticos y la matriz de todos los regresores
ZX WX ,= de rango completo, entonces el modelo solo posiblemente contiene un espacio
[ ] es

rezago de algunas o todas las variables independientes. En esta situación no surge


ningún problema particular de estimación y el modelo puede estimarse simplemente
usando el procedimiento OLS.

3.4 El modelo de error espacial (SEM)


3.4.1 Introducción

Cuando l = 0 y r ÿ 0 el modelo se convierte en:

y = Zb + tu (3.13)
1 u Wu = + r er < (3.14)

con los regresores Z y los pesos W no estocásticos. Este modelo se conoce en la literatura como
el modelo de error espacial (SEM) (Anselin,

1988; Arbia, 2006; LeSage y Pace, 2009). Si ) mi X iidN . . . (0,


ÿ 2 sennyo

entonces tenemosque 1 uIW


=( ) r ÿ ÿ

mi
como en la Ecuación (3.5) para que podamos escribir:

UE
( )=0
Euu T
ÿÿ
2
IWIW ÿ
ÿ

1 12 T ÿ

= ÿÿ ÿ (3.15)
( )= ( ) ( ÿ )
ÿ ÿ

una formulación que considera tanto términos de error heteroscedásticos


como autocorrelacionados. En estas circunstancias, el procedimiento GLS
sólo puede aplicarse si se conoce a priori el valor del parámetro r ,
circunstancia que ocurre muy raramente en los casos empíricos. Note que
de la Ecuación (3.14) tenemos

(I – rW)u = e

y el modelo (3.13) (3.14) también se puede escribir como:

( Yo
) = Wy
( ) +(
Yor rb
WZr Yo Wu )
ÿÿ ÿ

= r Z WZ + b
y Wy
ÿ

rb e +

= Z WZ +
y Wy b ge ÿ r + (3.16)
Machine Translated by Google

56 Introducción a la econometría espacial

con ÿ =rb y se puede pensar en estimar el modelo (3.16) directamente.


Sin embargo, surgen dos problemas. En primer lugar, la Ecuación (3.16) está
sobreparametrizada debido a la restricción ÿ=ÿÿ. En segundo lugar, el término Wy
se correlaciona con el término de error, lo que produce endogeneidad. Para
convencernos de esto consideremos que, de la Ecuación (3.16):

( IW
b yge
ÿ

Z WZ) r
= ÿ

y entonces

1 1
=(
ÿ ÿ

ÿ ÿÿ r )( IWZ WZ )(+IW
g re ) por
(3.17)

de modo que la covarianza entre la variable rezagada Wy y el término de


error se puede expresar como:

T 1
= EWIWZ
ÿ

ÿ
() ÿ
E Wy mi ÿ
ÿ
ÿ
(WZ
ÿ
ÿ

r bg ) ) ( ÿ

1
+WI W ÿ T=
ÿ

( ÿ

r ee ) ÿ
1 T (3.18)
= WIWZ
ÿ

( WZE
r )( ÿ ÿ

( mayor ) )
ÿ

1 T
+ rCON
()
NOSOTROS ÿ ee ÿ =
ÿ

ÿ ÿ
1
= se _2 WI WI
ÿ

( ÿ

r ) ÿ 0

Entonces, el error es endógeno, en el sentido de que está correlacionado con la


variable espacialmente rezagada Wy. Como consecuencia de la endogeneidad de los
errores, el procedimiento OLS pierde sus propiedades óptimas.
En principio, se podría haber adoptado un procedimiento de variable
instrumental para acomodar la endogeneidad. Sin embargo, Kelejian y
Prucha (1998) demostraron que tal procedimiento no es consistente
debido a que no es posible identificar instrumentos para Wy que sean
linealmente independientes de los otros dos regresores, Z y WZ.
En consecuencia, a menos que se conozca el parámetro r , hay dos
alternativas viables de estimación:

(i) Máxima Verosimilitud (ML), y


(ii) GLS factible (FGLS)

Estos dos procedimientos se discutirán en las próximas dos subsecciones.


Machine Translated by Google

Modelos de regresión lineal espacial 57

3.4.2 Estimador de Máxima Verosimilitud


De la Ecuación (3.13) derivamos

u = y – Zb (3.19)

y, dado que u se distribuye normalmente con una matriz de varianza-covarianza


dada por la Ecuación (3.15), podemos obtener fácilmente la función de verosimilitud
dada por:

1 ÿ
ÿ
ÿ
ÿ

22 1 2 uuconstante
2 T
ÿ

L (rb 1 ÿ ÿÿ ÿ exp (3.20)


ÿ

, ÿ, mi) = ÿ
mi ÿ

ÿÿ
2ÿ mi ÿ
ÿ

Sustituyendo la expresión (3.19) en esta última ecuación obtenemos:

ÿ ÿ
1 ÿ
1 ÿ

2 2
ÿ

T 1
L ( rb
, ,ÿ )= constante ÿ ÿ 2 experiencia ÿ ÿÿ
ÿ

( ) segundo
yZ segundo
( ÿ ÿÿ yZ(3.21)
ÿ

)ÿÿ
mi mi
2ÿ 2 ÿ
mi

y, al sustituir la expresión explícita por la matriz ÿ reportada en la


Ecuación (3.15), podemos escribir:

norte 1
L (rb (IWIW
ÿ ÿ

22 1 ÿ mi
)( )r T
, , )= constante ÿ mi ) 2 r 2
ÿ ÿ
ÿ ÿ

( ÿÿÿ

" experiencia 1 (y) Zÿÿ ÿb T (3.22)


ÿÿÿ
2
ÿ IWIW
ÿ ÿÿrr ÿbyZ
( ) "1( ( ) 1
}
ÿ

) ÿ

T
ÿÿ

Finalmente, la log-verosimilitud se puede expresar como

norte

l (rb, ÿ,ÿ2)ee21
constante
= ÿ ÿÿ ÿ

en( ) 1 en IW IW
)r )(
ÿ

r
ÿ

T
2 (2
(3.23)
1 yZ
ÿ ( IWIW
( ( br)TryZ 1
b
ÿ

ÿÿ ÿ

) ÿ

1 ÿ

) ÿ

T ÿ
( ÿ

)
ÿ2 ÿ

Esta expresión corresponde a derivar la función de verosimilitud del


modelo de regresión

y *Z=ser*T +
Machine Translated by Google

58 Introducción a la econometría espacial

con mi X iidN . . . (0,


ÿ 2 sennyo ) , para las variables transformadas:

*
y ( rr)= y Wy
ÿ

Z * ( rr)= Z WZ ÿ

Lee (2004) prueba formalmente las condiciones que aseguran que el ML


los estimadores son consistentes y asintóticamente normales en el modelo (3.13) y (3.14).

La ecuación (3.23) no se puede maximizar analíticamente debido al alto grado de no


linealidad. Sin embargo, puede maximizarse numéricamente para producir estimaciones de
los parámetros. Sin embargo, debemos tener en cuenta que los procedimientos
computacionales empleados en el software disponible son todos aproximados en el sentido
de que se basan en la pseudoverosimilitud.
Un problema para maximizar el logaritmo de la verosimilitud está representado por la
término ln IW ÿ r en que el determinante tiene que ser evaluado repetidamente

para cada valor del parámetro ÿ en una búsqueda numérica. Si n es muy grande, esta
operación puede ser exigente. Una salida, sugerida en la literatura, consiste en explotar la
llamada descomposición de Ord (Ord, 1975):

norte

en IW r ÿ ÿ = ln ÿ
ÿr (1
ÿÿ
ÿ ÿ

i ÿÿ)
(3.24)
i =1 ÿÿ

donde F i representa el i-ésimo vector propio de la matriz de pesos W. Esta descomposición


simplifica enormemente el cálculo pero, si n es muy grande, no elimina por completo los
problemas de precisión porque la descomposición espectral también se aproxima en
matrices muy grandes, como lo señala Kelejian y Prucha (1998). Volveremos a estos temas
computacionales con más detalle en el Capítulo 5. Para abordar el problema de evaluar un
determinante logarítmico en muestras muy grandes, Kelejian y Prucha (1998) sugirieron una
estrategia de estimación alternativa que se presentará en el siguiente capítulo. sección.

Si se conoce r , entonces los estimadores ML coinciden con los estimadores GLS


presentados en la sección 1.2 obtenidos al sustituir la expresión explícita (3.15) de la matriz
de varianza-covarianza en la Ecuación (1.47).

3.4.3 GLS factible

Volvamos al modelo (3.13) (3.14) presentado aquí por simplicidad

yZ=tu+ b (3.13)
Machine Translated by Google

Modelos de regresión lineal espacial 59

u Wu = 1 + r er < (3.14)

Se puede obtener un procedimiento GLS factible (FGLS) siguiendo los


siguientes pasos (Kelejian y Prucha, 1998):
~
Paso 1: en primer lugar obtener una estimación consistente de b, digamos b
Paso 2: use esta estimación para obtener una estimación de u, digamos uˆ
Paso 3: use uˆ para estimar r en la Ecuación (3.14), digamos rˆ
Paso 4: use rˆ para transformar el modelo (3.13) como

ˆ ˆ
( Yo
) = Wy
(r Yo WZ ser ) + r
ÿ ÿ

Paso 5: finalmente, dado que el modelo transformado ahora contiene


perturbaciones estocásticas que satisfacen los requisitos, estimar b vía MCO
sobre los datos transformados correspondientes al procedimiento GLS.

Estos pasos se discutirán ahora en detalle.

Paso 1: Como estimador de b considere el estimador MCO de la Ecuación


(3.13):
! ÿ

1
= ZZZy
(b T
)
T
(3.25)

Kelejian y Prucha (1998) demostraron que este estimador es consistente.

Paso 2: De la Ecuación (3.13) derivamos una estimación de los residuos:

ˆ !

uyZ = ÿ b (3.26)

Paso 3: Para obtener un estimador consistente del parámetro r, Keleijan


y Prucha (1998) sugirieron un procedimiento GMM que introduce las
siguientes suposiciones adicionales:

4
(i) mi( ) mi < ÿ.
1
(ii) ambas matrices W y ( ) Yo Wr ÿ ÿ

son “absolutamente sumables” en el


norte norte

sentir que ÿ wcyo =<1 y =1


yo ÿ baño
j < yo , con c una constante no
1
dependiendo de n, y de manera similar para ( ) Yo Wr ÿ
ÿ

.
Machine Translated by Google

60 Introducción a la econometría espacial

(iii) Qz, Q1 y Q2 son matrices no singulares con q z = límitenÿÿ ZZT ;

T T ÿ

1
Q ZZ = límite
1 nÿÿ ÿy ZZ= límite
Q norte ÿÿ 2 ÿ .

Asumiendo las condiciones anteriores, escribamos el modelo (3.13) (3.14) en


términos de cantidades escalares. Tenemos:

=
yZ tu ii yo + segundo

norte

=
tu iwu r ij j mi ÿ + i (3.27)
i =1

Definamos ahora

norte norte
norte

= = =
tui wu ÿ ; yo j u i wu ÿy yo j
yo
_ mi ÿw yo j (3.28)
i =1 i =1 i =1

Por lo tanto, de la Ecuación (3.27), tenemos:

norte

tu
ÿ

=
uui wu iji j = i
yo ÿ rr mi ÿ (3.29)
i =1

tuyo
ÿ iire = tu (3.30)

Tres condiciones de momento se derivan de la siguiente manera. Cuadrando


y promediando las ecuaciones (3.29) y (3.30) tenemos:
norte norte

1 2 1
- r ii ii ) =
ÿ ( uu ee 22
ÿ = mi ( )
(3.31)
norte
yo = 1
norte
i =1

1
norte
2 1
norte

2)
( ÿ 2 uu = ii yo ) ( ÿ ÿ r een
= mi i (3.32)
norte
yo = 1 =1
yo

Además, multiplicando la Ecuación (3.29) por la Ecuación (3.30) y


promediando obtenemos una tercera condición de momento:

1 norte

( ÿ - tutuuu
i mi r ii i )( ÿ

r )= (ee ii ) (3.33)
norte
i =1
Machine Translated by Google

Modelos de regresión lineal espacial 61

Darse cuenta de:

T
Segunda Guerra
2
mi ( yo)_ 2 = s ;mi ; MI( e ei yo )
mi ( yo _ ) 2 = ÿe
Mundial
=0 (3.34)
norte

como lo demuestran Kelejian y Prucha (1998). Además, sustituyendo en las Ecuaciones (3.31), (3.32) y
(3.33) la contraparte empírica de u, digamos uˆ (que se derivó en la Ecuación (3.26)) las tres condiciones
de momento, obtenidas al igualar los momentos teóricos con sus contrapartes empíricas, volverse:

ÿÿ
1
norte

ˆ ˆ 2
(ÿ 2
r tui ) =
ÿ

ÿ
ÿ

ÿ
tu
ÿ
yo mi

i =1
ÿ norte
ÿ

ÿ
norte
ˆ ˆ 2 T
1
ÿ
Segunda Guerra

( ) =
ÿÿ

Mundial
ÿ tu
yo
ÿ

r tu
yo
ÿ
mi
tr (3.35)
ÿ

i =1
norte norte
ÿ

norte ˆ
ÿ

ÿ 1 ˆ ˆˆ

ÿ
( ÿ tuyotu iituryo ÿ

)( ÿ

r )=0
ÿ

i =1
norte
ÿÿ

con notación obvia y, después de una simple manipulación algebraica:

nn ˆ
1 12 22 2 tu + urr ˆ ˆ
ÿ ÿÿ ÿ ii n nn 1 uuyo =ÿ 2
mi

=1ii
yo = =1

ˆ ˆ ˆ
r Tˆ 22 2
11 2nnn WW 2
ÿ ÿÿ ÿ tu + yo tu uu ii = ÿe tr (3.36)
nnnyo=1ii =1
yo

=1 norte

norte
2 nn ˆ ˆ
1 ˆ ˆˆ ˆ
1 1 ˆ ÿÿ

ÿ ÿtu ÿÿ
+ ii uu ii ÿ ÿÿÿr tu + yo
2 uuyo =0
ÿ ÿ n nn ÿ ÿ ÿÿ

norte
yo = 1 =1ii
yo ÿ =1 =1 ÿ

o:
nnn ˆ
2 12 1r tu yo2 ˆ ˆ ˆ2
r ÿÿ ÿ ÿ ÿÿ ÿe uu ii 2 = tui
nn=1
=1yo=1
yo

ˆ ˆ ˆ WWTuu ˆ
norte norte norte

1 2 1
minuto
2
ÿÿ ÿ ÿÿ ÿ 2
tu yo
r yo tr yo i norte
ÿe
2 = tui
2
(3.37)
yo = 1
nn =1 i =1

n n nˆ ˆ ÿ ÿ ˆ 11 1ˆ ÿ ÿ ÿ ÿ ÿ ÿ ÿÿˆ ÿ ÿ ˆ ˆ
2r _
ÿ ÿÿ
uuii ÿ ÿ

r
2
tu + yo uu ii = ÿ

uuyo
n nnyo=1
nii yo =1 =1 =1
ÿ
Machine Translated by Google

62 Introducción a la econometría espacial

Las tres ecuaciones reportadas en (3.37) se pueden escribir de manera más compacta
en notación matricial como:
AA2 1j - = 0
(3.38)

habiendo definido:

ÿ ˆ2
tu ÿ ˆˆ
uu ii ÿ

ÿ1ÿ
norte
yo ÿ 2 ÿ

1 ÿ

norte
ˆ ˆˆ
= () 12ÿ1 ÿ
2 T
uu ii
UN1
tu yo
ÿ ÿ

tr WW nn (3.39)
n
ÿ ˆˆ
ÿÿ
uu ii ( ˆ2 ˆ ˆii )
uu
1 ÿ 1 tu
yo
+ 0
norte ÿ norte
ÿ

T ÿ
ˆ
111 ˆ 2 2 u uu yo ii yo nn ˆˆ ÿ

UN2 = ÿ ÿÿ

; tu
ÿÿÿ (3.40)
ÿ ÿ

ÿ ÿ

ÿ ÿ=2 j
rr T ÿ ,, e
2 ÿÿ
(3.41)

De esta forma se puede obtener un estimador consistente del vector de


parámetros resolviendo la Ecuación (3.38) con respecto a j obteniendo:

1 22
= ( sí _,, )
ÿ

=
ˆ ˆˆ
12
j Automóvil club británico
(3.42)

Paso 4: Utilizar el estimador rˆ, así obtenido, para estimar los elementos de la
matriz de correlación ÿ reportada en la Ecuación (3.15) como:
ˆ 1 1
ˆ
ÿ
ÿ

ÿÿ ÿ=
) (
) ( ˆ T IW IW rr (3.43)

Paso 5: Finalmente, estimar el parámetro de regresión b vía GLS


sustituyendo la matriz de varianza-covarianza derivada en la Ecuación
(3.43) en la expresión (1.47) obteniendo así:
1
ˆ ˆ ˆ
ÿ

T 1 T 1
= (Z ZZ y ÿ ÿ)
ÿ ÿ

FGLS
b (3.44)

Esta operación corresponde a aplicar el método GLS a los datos transformados ( ) =( ) + r be


ˆ ˆ .
Yo Wy Yo WZ r
ÿ ÿ
Machine Translated by Google

Modelos de regresión lineal espacial 63

Ejemplo 3.2 La relación entre el precio de un auto usado y los


impuestos en 48 estados de EE. UU.

Como ejemplo del modelo de error espacial, consideremos el conjunto de datos relacionado
con el precio de los automóviles usados por estado en 1960 y los impuestos y gastos de
envío de automóviles nuevos por estado en el período 1955–59. Este conjunto de datos
es muy popular en la econometría espacial y se puede descargar fácilmente en el entorno
R utilizando el procedimiento ilustrado en la sección 2.3.5.
El mapa de los 48 estados considerados se muestra en la siguiente figura (se
descartaron Alaska y Hawái por estar aislados del resto. También se descartó el Distrito
de Columbia por sus excepcionales características).

1
38 45 2
46 3
37 sesenta y cinco

47 7 8 10
9 4 1112

17 14 16 15
30 13
28 18 36
32 29 39
40 35 34
41
43 42
49 22
48 23 20

21 24 19
25 26
27

44
Machine Translated by Google

64 Introducción a la econometría espacial

La siguiente tabla muestra los datos.

norte. estados precio de impuestos nm. estados precio de impuestos nm. estados precio de impuestos

1 Washington 129 1461 17 Nebraska 159 1547 33 Maryland 135 1466


2 Maine 218 1601 18 Illinois 139 1510 34 Virginia 171 1468
3 Minnesota 176 1469 19 Georgia 96 1572 35 Misuri 164 1627
4 Michigan 252 1611 20 Carolina del Sur 133 1509 36 Indiana 161 1502
5 Nuevo Hampshire 186 1606 21 Misisipi 82 1586 37 Idaho 174 1555
6 Vermont 153 1465 154 1491 22 Oklahoma 159 1460 38 Montana
7 Wisconsin 92 1536 23 Arkansas 136 1468 39 Virginia Occidental 172 1601
8 Nueva York 150 1517 24 Alabama 196 1631 40 Kansas 133 1463
9 Wyoming 149 1481 25 Texas 178 1511 97 1584 41 Kentucky
10 Massachusetts 168 1659 26 Luisiana 220 1636 42 Carolina del Norte 257 1647
11 Connecticut 96 1539138
43 1515
Tennessee 112 1559
27 florida
12 Rhode Island 89 152052451460
Dakota
28 Utah
del Norte 93 1495
13 Ohio 195 1592 29 Colorado 185 1626 46 Oregón 115 265 1592
14 Iowa 141 1574 30 Nevada 1544 47 Dakota del Sur 105 1470
15 Nueva 144 1418 31 Delaware 122 1477 48 Nuevo México 58 1473
Jersey 16 Pensilvania 165 1509 32 California 153 1609 49 Arizona 188 1655

Comencemos calculando, con fines de comparación, las estimaciones de MCO


de un modelo de regresión simple =+ + x bb
y=e, donde
0 precio
1 en 1960 y
yx = impuestos y gastos de envío en 1955-1959. Los resultados se muestran a continuación
junto con las principales estadísticas de la prueba.

Parámetro Error estándar prueba t valor p

b0 1435.7506 27.5796 52.058 2e–16***


b1 0.6872 0.1754 3.918 0.000294***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. Códigos: 0

Prueba F = 15,35 (valor p = 0,000294***)


AIC = 528,3317 BIC = 533,945 Prueba de Prueba JB = 1,8906 (valor p = 0,3886)
PA = 0,0013 (valor p = 0,971)

La prueba F es altamente significativa y conduce a la aceptación del modelo.


Además, ambos parámetros son significativos al nivel de confianza habitual.
Tanto la prueba JB como la BP no son significativas, por lo que se aceptan las dos hipótesis de
normalidad y homecedasticidad. La siguiente tabla resume el cálculo del estadístico de prueba
de Moran I para la hipótesis de correlación espacial de los residuales. La matriz W utilizada se
basa en la adyacencia simple y está estandarizada por filas.

Prueba I de Moran

Valor observado Valor esperado Varianza prueba z valor p

I de Moran 0,574817771 – 0,030300549 0,008976437 6,38687 8,466e–11***


Machine Translated by Google

Modelos de regresión lineal espacial 65

La prueba muestra que existe evidencia de una correlación espacial residual positiva
altamente significativa. Con todo, el modelo no es satisfactorio y, dada la evidencia de una
correlación espacial residual positiva y significativa, tenemos indicaciones claras de un
modelo de error espacial como marco alternativo. En primer lugar, estimemos el modelo
usando la técnica de máxima verosimilitud (ver sección 3.4.2). Los resultados se muestran
a continuación:

Parámetro Error estándar prueba t valor p

b0 1528.34521 31.96239 47.8170 2e–16***


b1 0.08831 0.11923 0.7406 0.4589

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. Códigos: 0

r = 0,81899 Prueba LR = 40,899 (valor p = 1,603e–10) Estadística de Wald = 122,32 (valor


p = 2,22e–16)
ICA = 489,43 BIC = 496.9174 Prueba JB = 2,0845
(valor p = 0,3527)

Las pruebas ahora muestran que el coeficiente de regresión relacionado con la variable
impuesto no es significativo, mientras que el parámetro r es altamente significativo evaluado
a través de la prueba de razón de verosimilitud (ver Ecuación (1.31)) y a través de la prueba
de Wald (ver Ecuación (1.33)). Entonces, la dependencia espacial entre los residuales
explica la mayor parte de la variabilidad del modelo y el modelo se reduce a una
autorregresión pura (caso de b = 0 y r o l también igual a 0. Consulte la Sección 3.2) donde
el precio en un país se explica simplemente por el precio en los países vecinos.

Para finalizar, estimemos el mismo modelo de Error Espacial usando ahora los
estimadores de Mínimos Cuadrados Generalizados Factibles discutidos en la sección 3.4.3.
Los resultados se muestran en la siguiente tabla:

Parámetro Error estándar prueba t valor p

b0 1512.98359 28.69940 52.7183 2e–16***


b1 0.17802 0.15018 1.1854 0.2359
r 0.65398 0.2184 3.1017 0.00096206***
s2 1672.5

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. Códigos: 0

Prueba JB = 2,85351 (valor p = 0,2423)


Machine Translated by Google

66 Introducción a la econometría espacial

Las estimaciones del FGLS confirman sustancialmente las conclusiones de la


estimación ML: la variable impuesto no es significativa y el precio de los automóviles
usados en un país puede explicarse mediante un modelo autorregresivo espacial
puro. Note, sin embargo, que las estimaciones de b0 y r son diferentes usando los dos
procedimientos y, en particular, el valor de r es mayor si se estima a través del procedimiento ML.
Observe también que el procedimiento ML produce errores estándar que son
diferentes de los producidos por la alternativa FGLS.

3.5 El modelo de retraso espacial (SLM)

3.5.1 Generalidades

Cuando l ÿ 0 y r = 0 el modelo se convierte en:

= Z u 1+lb
y Wy +l < (3.45)

ÿ ..
con u X iidN . (0, 2 sun nyo ) . Este modelo se conoce en la literatura como
el modelo de retraso espacial (SLM) (Anselin, 1988; Arbia, 2006).
En este caso, surge un problema de endogeneidad en el sentido de que el valor
retrasado espacialmente de y está correlacionado con la perturbación estocástica.
De hecho, usando el mismo argumento presentado en la Ecuación (3.18), tenemos que
1 1
=(
ÿ ÿ

- yo Z upara +
(I Wy ) = +que
y b el y I WZ
) ( l bl
I Wu ÿ ÿ

) la correlación entre el término rezagado WY y el error se puede expresar como:

T
ÿ

1 ÿ

1 T
E ÿ(Wy
ÿ ÿÿ
ÿ = ÿ uu (
u )EWIWZIW
ÿ
ÿ
ÿ

) ( l bl+ ÿ )
1 1
= WIWZE ( )T T
ÿ ÿ

( (ulb
WIWE
)l uu
ÿ

+ ÿ

) ÿ
ÿ
ÿ
ÿ
1
= 2 WI
ÿ

se
_ (WI ÿ

yo
) ÿ 0

por lo tanto, en presencia de endogeneidad, no se puede emplear un procedimiento GLS.


En la literatura se han sugerido dos estimadores alternativos:

(i) Máxima probabilidad


(ii) Mínimos cuadrados de dos etapas (2SLS)

3.5.2 Estimador de máxima verosimilitud

Z ÿulibras
En primer lugar, observe que al reescribir la Ecuación (3.45) como ( )= + I Wy
tenemos:

1 ÿ

1
=( ÿ

) +(I lWu
y I WZ bl ÿ ÿ

)
Machine Translated by Google

Modelos de regresión lineal espacial 67

así que eso:

1 11
ÿ ÿ ÿÿ ÿ ( ) ( ) (
Ey EIWZIW u = += l bl l ÿ ÿ ÿÿ ÿ ) (IWZ b ) (3.46)

T 2 1 T
( ) = IWIW( sl l ÿÿ ÿ ) (
ÿ

)
ÿ

E yy mi
= segundos
2

mi (3.47)

Por lo tanto, la probabilidad de y se puede expresar como:

1
2
ÿ

1 1 T
2 2 ÿ ÿ ( l ) y IWZ
ÿ

L ( , lb ) =constante
ÿ y;, ÿ mi ÿ ÿÿ ÿ experiencia ÿ
ÿ ÿÿ

2 b
ÿ ÿÿ
2ÿ mi
ÿÿ

(3.48)
" ÿ ÿÿ ÿ yI
ÿ (WZ
l)
ÿ

1
ÿÿ
ÿ

1
b }

y, por lo tanto, la log-verosimilitud como:

2 21 1
T ÿ ÿ ( ÿÿ ÿ ÿ l ) y IWZ
ÿ

l (ÿ ÿ,milb ;, ) =constante
y ÿ

1 en
2 b
2 2ÿ ÿÿ

(3.49)
mi

1 ÿ

1
" ÿ ÿÿ ÿ yI
ÿ (WZ
l) b
ÿÿ

Usando la expresión reportada en la Ecuación (3.47), el determinante de


la matriz s2 eÿ se puede escribir como:

1
)( s e T
)( 1 T
ÿÿ ÿÿ

ÿÿ - = ( IW IW IW IW ) = ( )
2 2 2 norte

mi
s sl lmi ÿ

yo
ÿ

yo

1 T T
)
ÿ ÿ

(
y, puesto que ( IW IW l )
ÿ

)
ÿ

( ÿ

yo 1 = (IW
) IW l
ÿ ÿ

yo
, puede ser

también expresado como:

2
ÿ

2
2
=
ssmilÿn IW mi
( ÿ

) (3.50)
Machine Translated by Google

68 Introducción a la econometría espacial

Volvamos ahora al log-verosimilitud y sustituyamos las Ecuaciones


(3.47) y (3.50) en la Ecuación (3.49). Obtenemos:

1 en ( ÿ 2 IW
ÿ

yo ( ÿ
2
, libras
, y; )constante
=
ÿ

mi
norte
ÿ

yo )2
2
1 ÿ ÿ ( ) lbl l T ÿ

1
( IWIW) 1 1( T
yI WZ ÿ ÿ
ÿ ÿÿ
ÿ ÿÿ ÿ ÿ

2ÿ 2 mi
ÿÿ ÿ ÿ

1 b
"ÿ
yI WZ
ÿ ÿ ( yo ) ÿ
ÿÿ

= constante
norte
1 yI
ÿ ÿWZ
ÿÿ ÿ ÿ ( ) l libra T
ÿ

ln +
ÿ miln
2
IW
ÿ

1
ÿ2 2ÿ 2 mi
ÿ

(3.51)
T
IWI Wy IWZ
ÿ
ÿ ÿÿ ÿÿ("l)()()
l libra
ÿ

1
ÿÿ

y, dado que l ÿ) ÿÿ
(Yo WyÿIWZ
ÿ ( )(ÿ) l libra ÿ ÿ1= I Wy Z b, eventualmente
ÿ ÿ

obtenemos:

2
2 norte

ln +
; ), =, s lb y
l (constante ÿ

s ln l IW ÿ

2
mi

1 T
(3.52)
[() I Wy ZI Wy Z ] [ ]( ) l bl b
ÿ ÿÿ ÿÿ

2
2s mi

una expresión que se puede maximizar numéricamente para obtener los


estimadores de los parámetros desconocidos, s2
l y b.

3.5.3 Estimadores de mínimos cuadrados en dos etapas


Como alternativa a los estimadores ML , para eliminar el problema de la
endogeneidad, también podemos utilizar una estrategia de mínimos cuadrados en
dos etapas. Para implementar el método necesitamos, en primer lugar, identificar los
instrumentos apropiados que puedan eliminar el problema de endogeneidad que
surge del término espacialmente retrasado Wy. En otras palabras, necesitamos
identificar instrumentos que estén correlacionados con Wy (relevancia) y no
correlacionados con el término de error (exogeneidad).
Considere el hecho de que, de (3.46) tenemos:

ÿ ÿ uÿÿIWZ
Ey EIWZIW ÿ ( )b(1ÿ)11ÿ( (ÿÿ
) =ÿ += l bl) l
(3.53)
Machine Translated by Google

Modelos de regresión lineal espacial 69

ahora, como |l|<1 podemos desarrollar la matriz inversa en (3.53) y escribir:


ÿ

1
(IW IW
ÿ
)
l ll lWW
=++ 22 33 + ...

Por lo tanto

22 33
() = ÿ ll lb + ...ÿÿ
Oye IWWWZ
+ÿ+ 22
= Z bWZ (3.54)
+ WZ libras + libras +...

por lo que E(y) puede expresarse como una función lineal de Z,WZ,W2Z,….
Esto sugiere el uso de los primeros tres elementos de la expansión (3.54), es
decir Z,WZ,W2Z, como instrumentos relevantes para eliminar la endogeneidad
de Wy. Nos referiremos a este conjunto de instrumentos como la matriz n-by-3k
ÿ2
HZ WZ knnnk
WZ ÿ 3 =, , nknkn nn ÿ ÿ.
Escribamos ahora la ecuación (3.45) de la siguiente manera:

yM= tu
+q (3.55)

+1 [n n n n n 1 , ] yk _ +1 1 = k
M Y Z=
con el conjunto de regresores nk lb el , [ ] 1 q
vector de parámetros desconocidos.
En la primera etapa del procedimiento de dos etapas, las variables
independientes M se retroceden sobre los instrumentos H a través de la
regresión instrumental:

M H= + gh (3.56)

con h un término de error. Los parámetros en la Ecuación (3.56) luego se


estiman a través de OLS produciendo:

T 1-
ˆ
gramo ) HH HM T =( (3.57)

por el cual derivamos el valor estimado de M, digamos Mˆ, que está dado por:

ˆ T 1-
ˆ
MH=HH
=( )HHM Tg (3.58)
Machine Translated by Google

70 Introducción a la econometría espacial

En la segunda etapa del procedimiento de dos etapas, estimamos vía


MCO la relación entre y y los regresores instrumentados, es decir:
ˆ
yM=tu ÿ + (3.59)

obteniendo los estimadores en dos etapas de los parámetros ÿ dados por:


ˆˆˆ ÿ

1
ÿ2 = (mmT mi ) T (3.60)
SLS

Ejemplo 3.3 Determinantes del precio de la vivienda en Boston

Consideremos un ejemplo del modelo Spatial Lag. Los datos que estamos
utilizando fueron recopilados por Harrison y Rubinfield (1978) e integrados por
Gilley y Pace (1996) y son muy populares en econometría espacial. Están
R procedimiento
contenidos en el conjunto de datos Boston y se pueden descargar utilizando el
ilustrado en la sección 2.3.5. Los datos se refieren al precio medio de la vivienda
observado en 506 distritos censales del área de Boston junto con una serie de
variables que pueden considerarse determinantes potenciales del valor de la vivienda.
El mapa de las 506 secciones censales, representadas a través de sus centroides, se
muestra en el gráfico a continuación, mientras que la lista de variables, contenidas en la
base de datos, se muestra en la siguiente tabla.

4690

4680

4670

4660

310 320 330 340 350


X
Machine Translated by Google

Modelos de regresión lineal espacial 71

Variable Descripción de variables

1 MEDV Valor medio de la vivienda ocupada por sus propietarios expresado


en miles de USD
2 CRIMEN Valor de los delitos per cápita
3 RM Promedio de cuartos por vivienda
4 INDUS Proporción de acres comerciales no minoristas por ciudad
5 NOX Valor de la concentración de NOX (óxidos nítricos) (partes por 10
millones) por localidad
6 EDAD Proporción de unidades ocupadas por sus propietarios construidas antes de 1940
7 DIS Distancia ponderada desde cinco centros de empleo de Boston
8 RAD Índice de accesibilidad a vías radiales por municipio
9 PTRATIO Ración de alumnos a maestros por ciudad
10 B Una proporción transformada de negros
11 LSTAT Porcentaje de población de menor estatus
12 IMPUESTO
Impuesto a la propiedad de valor total por USD 10,000 por ciudad

Comencemos calculando un modelo de regresión simple estimado a través de MCO.


Deseamos probar si el precio de la casa se puede expresar en función de los 11 posibles
factores enumerados en la tabla anterior. Los resultados de una estimación OLS simple
se muestran a continuación, junto con las estadísticas de prueba.

Parámetro Valor estimado Error estándar prueba t valor p

Interceptar 37.308337 5.199690 7.175 2.66e–12***


CRIMEN – 0,103402 0,033339 – 3.102 0.002035**
RM 4,074379 0,420639 4,074379 9,686 < 2e–16***
INDUS 0,018212 – 0,062015 0.294 0.769138
NOX 17,829176 – 3,889690 – 4.584 5.79e–06 ***
EDAD 0,002647 – 0,013353 –0,198 0,842957
DIS 1,210182 0,186123 –6,502 1,94e–10***
RAD 0.304603 0,066878 4,555 6,62e–06***
PTRATIO – 1.131146 0,126079 – 8.972 < 2e–16***
B 0,009853 – 0,002735 3.603 0.000346 ***
LSTAT 0,525072 – 0,051543 – 10.187 – < 2e–16***
IMPUESTO 0,010901 0,003710 2.939 0.003452**

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

Prueba F = 121 (valor p = 2,2e–16 ***)


AIC = 3045.227 BIC = 3100.172 Prueba JB =936,7417
(valor p =2,2e–16***)
Prueba de PA = 59,2137 (valor p = 1,297e–08***)
Machine Translated by Google

72 Introducción a la econometría espacial

La prueba F es altamente significativa y conduce a la aceptación del modelo.


Además, todas las variables, excepto INDUS y AGE, también son significativas al nivel de
confianza habitual. En particular, las variables RM, RAD y B son significativamente positivas,
mientras que CRIME, NOX, DIS, LSTAT y TAX presentan signo negativo.
Nótese que tanto la prueba JB como la BP son significativas, lo que nos lleva a rechazar las
hipótesis de normalidad y homocedasticidad. Empleamos una matriz de peso basada en la
distancia estandarizada por filas, considerando a los vecinos como dos sitios si la distancia
entre sus centroides era inferior a 3,99 unidades en el gráfico anterior.
La siguiente tabla resume el cálculo del estadístico de prueba Moran I para la hipótesis de
correlación espacial de los residuos.

Prueba I de Moran

Valor observado Valor esperado Varianza valor p de la prueba z

I de Moran 0,0780022170 – 0,0071438650 0,0001598831 6,7338 8,262e–12***

La prueba muestra que existe evidencia de una correlación espacial positiva y altamente
significativa en los residuos de la regresión que motiva un análisis posterior. En nuestro caso,
dado que nos estamos refiriendo a unidades de área muy pequeñas (las secciones censales),
ciertamente es razonable especular que el valor de la casa cambia suavemente a través del
espacio, en el sentido de que los barrios caros tenderán a concentrarse en ciertas zonas de la
ciudad, por lo tanto mostrando una correlación espacial positiva. Por estas razones, podemos
probar si un modelo de retraso espacial logra un mejor ajuste a nuestros datos mientras elimina
la correlación residual.
En primer lugar, estimemos el modelo usando la Máxima Verosimilitud
técnica (Sección 3.5.2). Los resultados se muestran a continuación:

Parámetro Valor estimado Error estándar prueba t valor p

Interceptar 28,378 5,8225 4,8739 1,094e–06***


CRIMEN – 0,097501 0,032606 –2,9902 0,0027877***
RM 3,8432 0,41351 9.2941 < 2.2e–16***
INDUS – 0.00071563 0,060617 –0.0118 0.9905805
NOX – 13.602 4,0537 –3,3555 0,0007921***
EDAD 0.0016953 – 0,013242 0,1280 0,8981255
DIS 1.1782 0,18339 –6,4249 1,320e–10***
RAD 0,29274 0,065501 4.4693 7.848e–06***
PTRATIO – 0,97610 0,13042 –7,4845 7,172e–14***
B 0,0098041 0,0026659 3,6776 0,0002354***
LSTAT – 0,52343 0,050249 –10,4167 < 2,2e–16***
IMPUESTO – 0.010491 0,0036223 –2,8962 0,0037769***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0
Machine Translated by Google

Modelos de regresión lineal espacial 73

l = 0.22019 Prueba LR= 12.492 Estadísticas de Wald = 13.16


(valor p=0,00040864***) (valor p=0,00028602***)
AIC = 3034,7 BIC = 3093,906 Prueba JB = 1144,455 (valor p = 2,2e–16***)

Prueba LM para residuos = 13,341 (valor p = 0,00025969***)

Las pruebas t muestran que, nuevamente como en el caso de MCO, todas las variables
excepto INDUS y EDAD son significativas, con un signo que está de acuerdo con la estimación
de MCO. El coeficiente de regresión relacionado con la variable TAX no es significativo,
mientras que tanto la prueba de razón de verosimilitud como la prueba de Wald muestran que
el parámetro l es altamente significativo.
Sin embargo, la especificación del retraso espacial, aunque enfatiza la característica
importante de una dependencia espacial de los precios de la vivienda, no ha eliminado por
completo el problema de la autocorrelación espacial residual. De hecho, la prueba LM para
residuos muestra que todavía existe una correlación residual positiva y significativa.

Estimemos, finalmente, el mismo modelo de Rezago Espacial usando la técnica de Mínimos


Cuadrados en Dos Etapas presentada en la sección 3.5.3. Los resultados se muestran a
continuación:

Parámetro Valor estimado Error estándar prueba t valor p

yo 0,22047 0.068558 3,02158 0,0013008***


Interceptar 28,367 – 5.8399 4,8574 1,189e–06***
CRIMEN 0,097493 0.032978 – 2,9563 0,0031137***
RM 3,8429 0.04.2163 9.1145 < 2.2e–16***
INDUS – 0,00073982 0.061532 – 0,0120 0,9904070
NOX – 13.597 4.0608 – 3,3484 0,0008129***
EDAD 0,0017009 – 0.013257 0.1283 0.8979109
DIS 1,1782 0,29273 0.18409 – 6,4001 1,553e–10***
RAD 0.066155 4.4248 9.651e–06***
PTRATIO – 0.97590 0.13355 – 7,3073 2,727e–13***
B 0,0098041 0.0027008 3,6300 0,0002834***
LSTAT – 0,52343 – 0.050909 – 10.2818 < 2.2e–16***
IMPUESTO 0,010490 0.0036662 – 2,8614 0,0042179***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

Prueba JB = 1144,613 (valor p = 2,2e–16***)

Los mínimos cuadrados en dos etapas confirman sustancialmente las conclusiones de la


estimación ML en términos tanto del signo como de la significancia de las variables.
Machine Translated by Google

74 Introducción a la econometría espacial

En particular, confirma que la proporción de acres comerciales no comerciales por


ciudad (INDUS) y la presencia de edificios antiguos en el área (AGE) no tienen
efectos significativos en el precio medio de la vivienda. Finalmente, se confirma la
significación del parámetro l y su valor estimado es muy similar al estimado por
Máxima Verosimilitud. Obsérvese, sin embargo, que a diferencia del método ML, la
técnica 2SLS no requiere que se satisfaga la hipótesis de normalidad, por lo que
en este caso (dada la evidencia de no normalidad proporcionada por la prueba de
Jarque-Bera) proporciona una mayor fiabilidad estimados. Ambos métodos de
estimación, sin embargo, conducen a modelos que no son del todo satisfactorios
debido a la presencia de una correlación significativa positiva persistente entre los
residuos. Si en un modelo espacial la inclusión del retraso espacial no es suficiente
para eliminar la falta de esfericidad entre los residuos, podría ser necesario incluir
algunos componentes espaciales adicionales. Esto proporciona un alcance a la
teoría que desarrollaremos en la siguiente sección.

3.6 El modelo general SARAR(1,1)


3.6.1 Generalidades
Para empezar, consideremos el caso donde, en las Ecuaciones (3.1) y (3.2),
establecemos ÿ = 0. Tenemos:

= yoti
y por + yo < 1 (3.61)

u Wu = 1 + r er < (3.62)

así tenemos:

= ÿ

1
()Yo Wy ul
ÿ

() yo y= yo tu
ÿ

(3.63)

1
( I) Wu
= tuIW
= (r ) e re (3.64)
ÿ

ÿ ÿ

Combinando (3.63) y (3.64) tenemos:

1 1
() IW yo ÿ)y= (
IWestoy (3.65)
ÿ

ÿ
Machine Translated by Google

Modelos de regresión lineal espacial 75

y, como consecuencia

T 1 1 T Tÿ
=
ÿ ÿ

( EIWIWIWIW
) ) ( )
ÿ ÿ

E yy yo rr ()
ÿÿ ÿ ÿ

ÿÿ ( () l camiseta _

2
ÿ ÿ

T T
( sl r1 IW IW IW )IW ) ( ) (3.66)
ÿ ÿ

= ÿÿÿ ÿ
mi (1
yo ( r )
= ÿs 2 mi

de modo que la inversa de ÿ es ahora:

1 T T
= ( lIWIWI
)( ÿÿ( ÿr WI
rl)( )W )
ÿ

ÿ ÿ

= IW WW + señor T T+T ÿ
ÿ()
ÿÿ señor ÿ (3.67)
T T+T T
ÿ " IW
lr WW
( yo
) ÿ

+ ÿÿ ÿ

donde los dos parámetros l y r están presentes en forma de suma y de


producto y por tanto no pueden ser identificados unívocamente. Este
hecho ha sido considerado en la literatura para sugerir que un modelo
completo del tipo reportado en las Ecuaciones (3.61) y (3.62) no es factible
en la práctica. Sin embargo, Kelejian y Prucha (1998) demostraron que
esto solo ocurre cuando ÿ= 0 y no ocurre lo contrario cuando ÿÿ 0, que es
lo que suele ocurrir en la generalidad de los casos de interés en
econometría espacial. En este caso, podemos definir un modelo espacial
más general que abarque los modelos de Rezago espacial y Error espacial
discutidos previamente en las secciones 3.4 y 3.5. Este modelo, como ya
se ha dicho, fue denominado modelo SARAR(1,1) por Kelejian y Prucha
(1998), pero también se le conoce en la literatura como General Spatial
Model por Anselin (1988) o como modelo SAC por LeSage y Kelly (2009).
Si consideramos el modelo general SARAR tenemos entonces

y Z=Wy
+ tu licenciado en Derecho
+ yo < 1 (3.68)

1 u Wu = + re r < (3.69)

con mi . . .yo
2 Xÿ iidN (0,) ÿe nn .
Los modelos (3.68) y (3.69) presentan dos problemas importantes de estimación.
Primero, similar al caso del SLM examinado en la sección anterior, tenemos
un problema de endogeneidad asociado a la presencia del término rezagado
Wy. En segundo lugar, debido a la presencia de la autorregresión en la
perturbación estocástica en la Ecuación (3.69), no podemos emplear un GLS
Machine Translated by Google

76 Introducción a la econometría espacial

estrategia a menos que se conozca el parámetro ÿ. En este caso podemos explotar


las siguientes alternativas de estimación:

(i) Máxima probabilidad


(ii) Una versión espacial de los mínimos cuadrados de dos etapas (GS2SLS)
(iii) Estimadores de variables instrumentales de Lee (LIV)

La máxima verosimilitud es factible, pero presenta la limitación de que actualmente


no existe una prueba formal de que los estimadores posean las propiedades óptimas
habituales de muestras grandes. Los estimadores GS2SLS no son totalmente eficientes.
El estimador LIV logra estimadores más eficientes que GS2SLS, incluso
si la ganancia en eficiencia es limitada. Los tres estimadores alternativos
se discutirán ahora a su vez.

3.6.2 Estimador de máxima verosimilitud


Consideremos nuevamente el modelo completo contenido en las Ecuaciones
(3.1) y (3.2)

Z= tu+y
Wy bl + yo < 1 (3.70)

u Wu = 1 + r er < (3.71)

De la Ecuación (3.70) tenemos

1
() (IWZb
Ey= ) ÿl (3.72)

y también

T 1 1 T T
())l ()
ÿ ÿ

()
ÿ ÿ

r () r
ÿ ÿ

E (yy
= EIWIWIWIW
yo
ÿ
ÿÿ ÿ

camiseta _
ÿ

ÿ ÿÿ

(3.73)
T
= ÿ mi1 21
()IW2()IW
( lrl IW
r IW
T
ÿ ÿ

) ( )= ÿ
ÿ ÿ

ÿÿÿ ÿ

ÿ
mi

por tanto, manteniendo la hipótesis de normalidad sobre las perturbaciones,


tenemos:

2
ÿ

1
ÿe
ÿ

ÿ ( ÿ lby) NI WX
ÿÿ ÿ;ÿÿ (3.74)
ÿ
Machine Translated by Google

Modelos de regresión lineal espacial 77

2
Ahora, recordando la simplificación del determinante ÿe ÿ reportado en la
Ecuación (3.50), la probabilidad se deriva fácilmente como:

2
ÿ

norte 2

L (ÿ 2 IWIW
( rl b ;y cuesta
, ,, )= ÿ
mi
) yo
ÿ ÿ

1 T
ÿÿÿÿ
" Exp ÿ
ÿÿ ÿ r WZ 1
ÿ ( ) yI
ÿ

b
2
ÿ ÿÿ
2ÿ mi
ÿ ÿ

" ÿ ÿÿ1 ÿÿyI


ÿ

ÿ()
ÿ WZ
r
ÿ

1
b}

y la log-verosimilitud como:

norte

yo (
ÿ
2
, lrb
, y ,costo
;)=
ÿ ÿÿ

ln +
ÿ 2ln 2
mi
en l +
IWIW r

1 T
ÿ
( IW ) ( 1l bl ÿÿ
)T
ÿ

yI WZ
ÿ ÿÿ ÿ

2ÿ 2
mi
ÿ
(3.75)
)( r rlWI W) T(
" ( IWI )
ÿ ÿÿ

" ÿ yI
ÿ ( yo )
ÿ ÿ WZ ÿÿ
ÿ

1
b

ÿ ÿÿ ÿ ( )( ) 1
I Wy Z b, eventualmente ÿ
ÿ

I Wy IWZ lobtenemos:
lb = ( y, ya que l ) ÿ
ÿ ÿ

norte
2
l (ÿ , , costo
; ) =, lrb y ÿ ÿÿ

ln +
ÿ 2ln 2
mi
en l +
IWIW r

1 T
ÿ
ÿ( ÿÿ
) r ÿbl
IW
ÿ()
y Z Wy
(3.76)
2ÿ 2
mi
ÿÿ

ÿ
( " ÿÿr() IW
)bl y Z Wy
ÿÿ ÿ ÿ

Esto, como de costumbre, solo se puede maximizar numéricamente para


derivar los estimadores de los parámetros desconocidos. La expresión anterior
se puede escribir de otra forma considerando las siguientes transformaciones
conocidas en la literatura como transformada espacial de Cochrane-Orcutt:

y *I Wy =() - r

ZI*WZ =( ) - r
Machine Translated by Google

78 Introducción a la econometría espacial

Expresado de esta manera, la log-verosimilitud se convierte en:

yo (
ÿ
2
,lrb, ,; ) =costo
y n ln +ÿ 2ln l
ÿ

mi
IW
ÿ

2
1 T
ÿ + entrada
IW yr Z Wy
ÿÿ ÿÿ

licenciado en Derecho
ÿ

(3.77)
2ÿ ÿÿ2
mi
ÿÿ

ÿ ÿ
"ÿ
y Z Wy ÿ
ÿÿ

ÿ segundo

ÿÿ

Como ya se mencionó, actualmente no existe una prueba formal de que el


estimador ML anterior posea las propiedades óptimas habituales de muestra
grande de un estimador ML . Por esta razón (y también para superar los
problemas computacionales que surgen del cálculo del log-determinante en
muestras grandes), la literatura ha sugerido una versión espacial de los mínimos
cuadrados en dos etapas que se discutirá en la siguiente sección.

3.6.3 Los mínimos cuadrados espaciales generalizados en dos etapas (GS2SLS)


Kelejian y Prucha (1998) introdujeron los mínimos cuadrados espaciales
generalizados en dos etapas (GS2SLS) y explican tanto el problema de la
endogeneidad de Wy como el problema de la correlación espacial entre las
perturbaciones estocásticas. Es una extensión de la metodología 2SLS ya
ilustrada en la sección 3.5.3 para modelos de Rezago espacial, pero se combina
con el estimador GMM presentado en la sección 3.4.3 para tener en cuenta la
estructura de correlación espacial en las perturbaciones.
El procedimiento GS2SLS se puede obtener siguiendo los siguientes pasos:

Paso 1: en primer lugar ~


obtener~una estimación consistente de los parámetros b
y yo, digo b y yo
Paso 2: use estas estimaciones para obtener una estimación de u en la Ecuación
(3.70), digamos uˆ
Paso 3: use uˆ para estimar r en la Ecuación (3.71), digamos rˆ
Paso 4: use rˆ para transformar el modelo (3.70) como

ˆ ˆ
( I)Wy
=( )I +WZ r ser r
ÿ ÿ

Paso 5: finalmente, estimar los parámetros de tal modelo transformado


usando 2SLS con las variables transformadas ÿ ZI
rˆ WZ =( ) ;
* y 2 WZ * 2
WIWZ =( ) ÿ ÿˆ WZ WI WZ=( ) ÿ ÿˆ como instrumentos.
Machine Translated by Google

Modelos de regresión lineal espacial 79

Estos pasos se discutirán ahora en detalle.

Paso 1: Estime los parámetros de (3.70) teniendo en cuenta de manera


consistente el problema de la endogeneidad a través del estimador 2SLS
usando Z y WZ como instrumentos. La motivación de esta elección sigue el
mismo argumento ya utilizado en~ el apartado 3.4.3. Remitámonos a las
obtenido con los símbolos b estimaciones así y l ~.

Paso 2: De la Ecuación (3.68) derivar


ˆ
= ÿ ÿ" " Z
azul
WY (3.78)

y en consecuencia definimos:
ˆ ˆ
tu =wu (3.79)

ˆ
2 u wu = (3.80)

Paso 3: Use los términos en las Ecuaciones (3.78) a (3.80) para obtener un
estimador consistente de r a través del procedimiento Método de los
Momentos generalizado presentado en la sección 3.5.3 y en particular
usando las condiciones de momentos contenidas en la Ecuación (3.38).
Llamemos a rˆ un estimador consistente de r.

Paso 4: Utilice la estimación rˆ obtenida en el Paso 3 para transformar el modelo original


de la siguiente manera:

ˆ ˆ
( IW y IWZ
( ) =( ) Wy ÿ ÿ ÿÿ ÿ ) ble + (3.81)

Paso 5: Finalmente, estime b y l en la Ecuación (3.81) usando un procedimiento 2SLS


ÿ ÿDe 2
instrumentos.
=, , con ÿHX
ÿ
WX WX
como
esta manera obtenemos:

" ˆ * **T ˆ
T
ÿGS2SLS = Q QQ
ÿÿ

yÿÿÿ
ÿ (3.82)

* ˆ * 1* T T-
donde ÿ ÿ [ ] segundo l, , QZ Wy
, [ ],= y ) ÿ QI
ÿ" WQ =( Q HH =( HQ
) .
Kelejian y Prucha (1998) demostraron que, bajo los supuestos del modelo,
los estimadores GS2SLS son consistentes con una varianza asintótica igual a:

ˆˆ
ÿ

1
2** ÿ mi T
qq
ÿ ÿ

ÿ
ÿ ÿÿ
(3.83)
Machine Translated by Google

80 Introducción a la econometría espacial

3.6.4 Los estimadores de Lee completamente eficientes

Incluso si los estimadores GS2SLS son consistentes, se ha demostrado que no


son totalmente eficientes asintóticamente. Para eliminar este problema, Lee
(2003) sugirió un estimador alternativo asintóticamente eficiente, conocido en la
literatura como Best Factible GS2SLS o BFGS2SLS para abreviar.

En el procedimiento sugerido, la matriz de instrumentos óptima se define de la


siguiente manera:

" "
* "
1
QIW=(ZW IWZ
ÿ bÿ ÿ) , ÿyo ( )
ÿ

(3.84)
ÿ
ÿ ÿ

ÿ
ÿ

con los símbolos ya utilizados en el apartado 3.6.3. El estimador BFGS2SLS se


define como:

ˆ
= QQT Qy ÿ 1ÿ ÿ ÿT
ÿ

ÿÿ
* * **

ÿBFGS2SLS (3.85)

Este estimador alcanza el límite inferior teórico de la varianza en muestras


grandes. Sin embargo, el cálculo del instrumento en la Ecuación (3.84) involucra
una operación que puede ser numéricamente desafiante en muestras muy
grandes. Por esta razón, incluso si el propio Lee (2003) deriva un algoritmo
numérico, también sugiere un estimador alternativo, mucho más simple en
términos de cálculo. Kelejian et al. (2004) muestran con un estudio de simulación
que en muestras pequeñas tanto el BFGS2SLS como su versión simplificada no
difieren sustancialmente en términos de eficiencia del GS2SLS.

Ejemplo 3.4 Determinantes del precio de la vivienda en Boston (continuación)

En el ejemplo 3.3, estimamos un modelo de retraso espacial que busca explicar la


variabilidad espacial de los precios de la vivienda entre 506 distritos censales en
Boston. La fase de estimación no fue del todo satisfactoria en el sentido de que, tanto
con las técnicas de ML como con las de 2SLS, todavía existía cierta correlación
espacial positiva significativa entre los residuos de la regresión. Volvamos a estimar el
mismo modelo especificándolo como SARAR(1,1).
En primer lugar, como de costumbre, comencemos estimando el modelo con
la técnica de máxima verosimilitud (sección 3.6.2). Los resultados se muestran
en esta tabla:
Machine Translated by Google

Modelos de regresión lineal espacial 81

Parámetro Valor estimado Error estándar prueba t valor p

yo 0.072404 0.093996 0.77029 0.44113


r 0.52612 0.1141 4.611 4.0068e-06***

Interceptar 38,2472606 – 6.0539170 6.3178 2.654e-10***


CRIMEN 0,1164539 0.0325364 –3,5792 0,0003447***
RM 3,8363958 – 0.4074820 9.4149 < 2.2e-16***
INDUS 0,0069422 0.0617867 –0,1124 0,9105396
NOX –19,4589672 – 4,1417000 –4.6983 2.623e-06***
EDAD 0,0177129 – 0,0140407 –1,2615 0,2071146
DIS 1,4637506 0,2609413 –5.6095 2.029e-08***
RAD 0,3216872 – 0,0726696 4.4267 9.568e-06***
PTRATIO 1,0251807 0,1379809 –7.4299 1.088e-13***
B 0,0098786 – 0,0026440 3,7362 0,0001868***
LSTAT 0,5162812 0,0496707 –10.3941 <2.2e-16***
IMPUESTO –0.0112292 0.0038528 –2,9145 0,0035622***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

r = 0,52612 Prueba LR = 26,375 Prueba JB = 1085,642 (valor p = 1,8734e–


06***) (valor p = 2,2e–16***)
AIC = 3022,9 BIC = 3086,249

Los resultados son comparables a los de los modelos estimados en el Ejemplo 3.3 en cuanto
a la significación y el signo de las variables. El parámetro r
relacionado con la autocorrelación espacial residual es positivo y significativamente diferente
de cero, mientras que el parámetro l también es positivo, pero no significativamente diferente
de cero. Consideremos más a fondo los resultados relacionados con el mismo modelo, pero
estimados usando la técnica de Mínimos Cuadrados Espaciales Generalizados en Dos
Etapas presentada en la sección 3.6.3. Estos resultados se muestran en la siguiente tabla:

Parámetro Valor estimado Error estándar prueba t valor p

yo 0.1685872 0.0824706 2,0442 0,0409328**


Interceptar 33.8711396 5.9812413 5,6629 1,488e–08***
CRIMEN – 0,1096767 0,0329242 – 3,3312 0,0008648***
RM 3,8187552 – 0,4155824 9.1889 < 2.2e–16***
INDUS 0,0064382 – 0,0624589 – 0,1031 0,9179000
NOX 17,1885687 – 4,1399033 – 4.1519 3.297e–05***
EDAD 0,0112438 – 0,0138795 – 0,8101 0,4178827
DIS 1,3975787 0,2282525 – 6.1229 9.186e–10***
RAD 0,3156587 0,0713019 4.4271 9.552e–06***
PTRATIO – 1,0002552 0.1384726 – 7.2235 5.067e–13***
B 0,0098127 – 0.0026849 3,6548 0,0002574***
LSTAT 0,5195838 – 0.0505312 – 10.2824 < 2.2e–16***
IMPUESTO 0,0110596 0.0038402 – 2,8800 0,0039772***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0
Machine Translated by Google

82 Introducción a la econometría espacial

r = 0,35868

Prueba JB = 1129,996 (valor p =2,2e–16***)

Las estimaciones basadas en Mínimos Cuadrados en Dos Etapas confirman


sustancialmente las conclusiones de la estimación ML en términos tanto del signo
como de la significancia de las variables. En particular, confirma que la proporción de
acres comerciales no comerciales por ciudad (INDUS) y la presencia de edificios
antiguos en el área (AGE) no tienen efectos significativos en el precio medio de la
vivienda. Finalmente, se confirma la significación del parámetro r. La presencia de una
no normalidad significativa de los residuos indica que deberíamos usar el método
GSTSLS que no requiere tal hipótesis. Usando este estimador alternativo, el parámetro
ÿ, que no fue significativo usando el estimador ML, también es significativamente diferente de cero.

3.7 Prueba de autocorrelación espacial entre los


residuos con una hipótesis alternativa explícita
En la sección 2.3.4 discutimos un procedimiento de prueba para la hipótesis de
ausencia de correlación espacial entre los residuos de la regresión de OLS
basados en las estadísticas I de Moran (Moran, 1950). Una trampa de esta
estadística de prueba es que no se considera explícitamente ninguna hipótesis
alternativa para contrastar la nulidad de la no correlación. En este capítulo
hemos introducido algunas formulaciones alternativas al modelo de regresión
lineal clásico basadas en varias formas de tener en cuenta la dependencia
espacial que es probable que se observe al tratar con muestras espaciales.
Estos modelos pueden considerarse como hipótesis alternativas explícitas al
caso de no correlación en un procedimiento de prueba. Por lo tanto, el problema
ahora se puede abordar de una manera más integral.
Cuando podemos expresar explícitamente la hipótesis alternativa ya sea en
forma de Rezago Espacial o de Error Espacial, y se ha seguido una estrategia
de Máxima Verosimilitud en la fase de estimación, se puede seguir una
estrategia de prueba del Multiplicador de Lagrange (ver sección 1.1).
Además, para todos los modelos espaciales tratados en este capítulo, se puede
considerar una versión modificada de las estadísticas I de Moran. Estas dos
alternativas serán ahora revisadas en las secciones 3.7.1 y 3.7.2 respectivamente.

3.7.1 Probar la autocorrelación espacial entre los residuos usando


SEM o SLM como alternativas

Para comenzar, consideremos la forma general de una prueba del Multiplicador de


Lagrange (ver Ecuación (1.35)):

LM s=( ) syo
ÿÿT(ÿ00
- (0)) 1
(3.86)
Machine Translated by Google

Modelos de regresión lineal espacial 83

ÿ ÿL ( )
donde ÿ es un vector de parámetros, 0 s ( )= ÿ es la función de puntuación y
ÿÿ
ÿ ÿ L( )ÿ
ÿÿ2

ÿ ÿ ÿÿÿÿ ÿ ÿ
IE( )= es la matriz de información de Fisher asociada con el
0 T
ÿÿ

función de verosimilitud L( ) ÿ bajo el valor nulo de no correlación espacial.


Cuando la hipótesis alternativa se especifica como un modelo de error espacial, la función
logarítmica de verosimilitud asume la expresión derivada de la ecuación (3.23). En
consecuencia, en este caso, la Ecuación (3.86) asume la expresión explícita:

ˆ ˆ
norte
2
ÿ
mi T Nosotros 2
ÿ

LM = ÿ

SEM
tr WW TWW +
ˆˆ

eeT (3.87)
( ) ÿ

ÿ ÿÿÿ

que es simplemente el cuadrado de la prueba de Moran I como lo demuestra Burridge (1980).


Entonces, usar la prueba I de Moran o la prueba LM conducirá a las mismas conclusiones
inferenciales.
Por el contrario, en caso de que la hipótesis alternativa se especifique en la forma del
Modelo de retardo espacial, el logaritmo de la verosimilitud se especifica en la Ecuación
(3.52), por lo que la Ecuación (3.86) se convierte en:

2 T 2
= ÿ n Wy ÿ ÿ ÿ
mi
ÿ

LM ÿÿ

ˆˆ
(3.88)
RETRASO
q eeT
ÿ

T ˆ
con b ˆ ) WX2 b =( )T
= ( MI ) (
T
, , T = tr(WTW+WW)
Q WX ÿ
X
ÿˆ
+ T M XXXXX
ˆ mi

2
y con by de los ÿˆe denota los estimadores de máxima verosimilitud
parámetros correspondientes de la Ecuación (3.45). A veces, se considera una hipótesis
alternativa adicional con una estructura de error que sigue una estructura de media móvil y
autorregresiva espacial.
Sin embargo, no se presenta aquí una revisión detallada de esta alternativa.
Tanto LMSEM como LMLAG se distribuyen asintóticamente, bajo el nulo, como c2 con 1
grado de libertad. Sin embargo, las dos estadísticas de prueba no son independientes entre
sí, por lo que solo se puede probar la hipótesis alternativa de que los errores siguen un
modelo SEM suponiendo que no hay un componente de retraso espacial y viceversa. Por
esta razón
Machine Translated by Google

84 Introducción a la econometría espacial

Anselin et al. (1996) propusieron una versión robusta de ambas pruebas que se puede
expresar como:

T
ˆˆ ˆ

T 2
1 ÿ nSemana
RLM = ˆˆ 1 ÿ nˆˆWy ÿ ÿ
TQ
ÿ

SEM (3.89)
TT
ÿ (1Q
)ÿ ÿ camiseta _ eeT

para la hipótesis alternativa de un Modelo de Error Espacial y respectivamente:

ˆˆˆ 2
1 ÿ ÿcamiseta
n W n _Wy ÿ ÿT
RLM = ˆˆ ˆˆ ÿ

(3.90)
RETRASO
QTÿ ÿ ÿ camiseta _ eeT

utilizando el modelo Spatial Lag como alternativa.

3.7.2 Probando la autocorrelación espacial entre los residuales


usando un modelo espacial como alternativa: la prueba de Moran I modificada
En la sección 2.2 consideramos la estadística introducida por Moran (1950)
y estudiada por Cliff y Ord (1972) para probar la hipótesis de ausencia de
correlación espacial entre los residuos de regresión. La estadística se
informa aquí nuevamente para comodidad del lector:
ˆ ˆ
WTÿ ÿ
n ee
yo =
ˆˆ
ÿ (3.91)
camiseta _
ÿ ÿi ÿ w ÿ ij
j
ÿ

siendo eˆ los residuos del modelo. Más recientemente, Kelejian y Prucha


(2001) han criticado esta medida, argumentando que el factor de
normalización utilizado por Cliff y Ord (1972) para derivar su valor esperado
y la varianza bajo el valor nulo de ninguna correlación espacial no está
justificado teóricamente. De hecho, el denominador de (3.91) representa el
estimador de la desviación estándar de la forma cuadrática que aparece en
el numerador y se puede demostrar que esto es inconsistente. Por esta
razón, propusieron un factor de normalización diferente que elimina esta
inconsistencia y logra el objetivo de normalizar la varianza a la unidad. La
prueba alternativa de Moran, en general, asume la siguiente expresión (ver Kelejian y Pru

ˆ ˆ
mi TW mi
yo = (3.92)
ÿ" 2

con 2 ÿ"un factor de normalización que depende del modelo particular elegido como hipótesis
alternativa. En particular, si la alternativa
Machine Translated by Google

Modelos de regresión lineal espacial 85

hipótesis está constituida por un modelo de Error Espacial, el factor de normalización asume
la expresión:

ÿ 1
ˆˆ
T+ 2
"
2 =
camiseta _
{ÿ en( WWW
ÿ

ÿ
ÿ
) ÿÿ
}
ÿ (3.93)
norte

con el término tr(A) indicando la traza de la matriz A, que es la suma de sus principales
elementos diagonales. Como consecuencia, las estadísticas de prueba se pueden definir
como:

ˆ ˆ
eeToeste
norte
yo =
ÿ 1
ˆˆ
2 (3.94)
camiseta _ {ÿ en( WWW
ÿ

ÿ
ÿ
T + ÿÿ
) }

Las dos expresiones reportadas en las Ecuaciones (3.91) y (3.94) coinciden si la matriz de
pesos tiene entradas dicotómicas (0 y 1) en cuyo caso
ÿ 1
2
= y, por lo tanto,ÿ ÿi
2 ww ij ij
=
w tr WWW +(j
yo
{ ÿ

ÿ
ÿ
T
) ÿ

ÿ
ÿ
} .

Por el contrario, en el caso de un modelo SARAR(1,1), el factor de normalización


se puede derivar de la siguiente manera. Considere nuevamente las dos ecuaciones
de un modelo SARAR:

= X WX+u lb b ÿ +
y Wy yo < 1
(1) + = Q + tu (2) (3.95)

tu Wu
re= + 1r< (3.96)

donde ahora establecemos ,QZ = ÿbrÿ ÿÿ,


ÿ WX = ] ,como de costumbre, T TT y
[ [ Wy ];= ZX
= ÿ ÿ ÿ , (1) (2)
TTT
ÿ bbb y supongamos de nuevo la validez de los supuestos
ÿÿ

detrás del procedimiento GMM descrito en la sección 3.4.3. Considere además los
Estimadores de Mínimos Cuadrados Espaciales Generalizados en Dos Etapas derivados
de la Ecuación (3.82)

" ˆ * ** ˆ
= Q QQ T
ÿÿ

y ÿ ÿTÿ (3.97)
ÿGS2SLS ÿ

ˆ
con Q *HH
=(HQ
) T T 1- * y H la matriz de instrumentos
ˆ "

HX ANX ANX =, , ÿ2ÿ ,


ÿÿ
e indiquemos además con mi
= y Qÿ ÿ la
Machine Translated by Google

86 Introducción a la econometría espacial

Residuos de GS2SLS . Para probar la hipótesis nula de que no hay correlación espacial
entre los residuales (es decir, ÿ = 0) contra la hipótesis alternativa de que ÿ ÿ 0, Kelejian y
Prucha (2001) derivaron el siguiente factor de normalización:

2
"
=
2 ÿ norte
ÿ

2
{ () (ÿ tr WWW norte) ÿ ÿ + (
ˆˆ

camiseta _
ÿ

ÿ
ÿ
T+ ÿ

1 TT ee
ˆˆˆˆ

) CC
}1
2
(3.98)

que, sustituida en la Ecuación (3.92), conduce a la siguiente modificación de los estadísticos


de prueba de Moran I:

ˆT ˆ
(mi W mi )
yo =
ˆˆ 2 1 ˆˆTT
(3.99)
norte
ÿ

{ () (
2 camiseta _ T tr WWW n + )+ ÿ ÿÿ
ÿ

ÿ
ÿ
(
ÿ

ee
ˆˆ

) CC
}1
2

donde, además del simbolismo previamente introducido, definimos


ÿ

1 ˆ ˆˆ
* **
ÿ

1 ˆ*
ˆ ÿÿ TTT ÿ ÿ T
ˆ = HH HQ QQ ˆ
= Q WW
(+T)ˆ
ÿ
ÿ
mi
y . En
ÿ

c CV
= ÿ ˆaˆ, PAG
ÿ

ÿ
ÿ

ÿ
un
ÿ ÿ ÿ ÿÿn nn ÿ

norte
ÿ ÿ ÿÿ ÿ
ÿ ÿ

su contribución, Kelejian y Prucha (2001) prueban que la prueba I de Moran modificada


converge en distribución a una distribución normal estandarizada incluso cuando no se
satisface el supuesto a priori de normalidad de los errores. Incluso si en muestras grandes I
es N(0,1), en muestras pequeñas su valor esperado y su varianza pueden ser diferentes. Sus
expresiones formales se derivan del artículo citado de Kelejian y Prucha (2001).

Ejemplo 3.5 Curva de Phillips (continuación)

Consideremos nuevamente la curva de Phillips estimada para las 20 regiones italianas ya


discutidas en el Ejemplo 2.4. La estimación OLS conduce al modelo
Los residuos
unempl de regresión
= 9.827 + 8.746 ÿÿ ÿ
precios y la prueba de Moran (0.3212607) en el
(utilizando una matriz W basada en la contigüidad) no se consideraron significativamente
diferentes de cero al 94 %. Como sabemos, la prueba I de Moran no tiene una hipótesis
alternativa explícita. Probemos ahora la hipótesis de ausencia de correlación espacial en los
residuales utilizando el Rezago espacial y el Error espacial como alternativas explícitas a la
hipótesis de ausencia de correlación espacial residual.
Machine Translated by Google

Modelos de regresión lineal espacial 87

dependencia. Los resultados obtenidos se muestran a continuación junto con sus versiones
robustas.

Estadística de prueba Valor de prueba valor p

LMERRR 2.8633 0.0906235


LMLAG 12.7722 0.0003518***
RLMRR 1.7170 0.1900785
RLMLAG 11.6260 9.0006504***

La tabla revela claramente que, si se compara con el modelo de error espacial (como se
esperaba por la equivalencia demostrada por Burridge, 1980), la prueba LM con firma el
hallazgo de la prueba I de Moran en la detección de correlación espacial residual no
significativa. Sin embargo, si se compara con un modelo de retraso espacial, no se puede
aceptar la hipótesis de la independencia espacial del error. Las versiones robustas de las
dos pruebas confirman sustancialmente estos hallazgos.

3.8 Interpretación de los parámetros en modelos econométricos


espaciales

En un modelo de regresión lineal estándar, los parámetros de regresión tienen


una fácil interpretación, ya que representan la derivada parcial de la variable
dependiente y con respecto a las variables independientes:

ÿ
bi = yi (3.100)
ÿX
i

por lo tanto, pueden interpretarse directamente como la variación inducida


en la variable y de un aumento unitario en la única variable independiente Xi .
Sin embargo, en los modelos econométricos espaciales presentados en este
capítulo, la interpretación de los parámetros es menos inmediata y requiere
alguna aclaración. De hecho, una variación de la variable X observada en la
ubicación i no solo tiene un efecto sobre el valor de la variable y en la misma
ubicación, sino también sobre la variable y observada en otras ubicaciones.
Considere, por ejemplo, el modelo de la Ley de Okun presentado en el Ejemplo
2.3. El modelo predice que un aumento en el nivel del PIB produce una
disminución en el nivel de desempleo. Considere también, por simplicidad, un
modelo de retraso espacial. El modelo se puede expresar de la siguiente manera:

norte

=+ + bb l PIB w i desempleo ÿ
ÿ ÿÿ desempleo (3.101)
yo 0 1
yo j
j =1
Machine Translated by Google

88 Introducción a la econometría espacial

En este caso, un aumento del PIB en la región i produce como efecto inmediato una
disminución del nivel de desempleo en esa región.
Sin embargo, dado el mecanismo autorregresivo espacial considerado en este marco, la
variación del nivel de desempleo en la región i, también produce un efecto sobre el nivel de
desempleo en otras regiones vecinas por lo que todos los impactos deben evaluarse
simultáneamente.
Este tema ha sido tratado en la literatura por Kelejian et al. (2006) y LeSage y Pace (2009)
entre otros. La solución formal al problema consiste en evaluar la derivada parcial (3.100) en
cada modelo específico. Considere, por ejemplo, el caso del modelo Spatial Lag:

= X u 1 +lb l < +
y Wy (3.102)

que también se puede escribir en forma reducida como:

1 ÿ

1
=( WX I)Wu
+( l bl y I ) (3.103)
ÿ ÿ

así que eso:

1
Ey( )=(
IWX) ÿb ÿ l (3.104)

El impacto de cada variable X en y se puede describir a través de


ÿ E y( )
las derivadas parciales ÿX que se puede organizar de la siguiente manera

matriz:

()
ÿ ÿ Oye 1 () ÿi
ÿ ÿOye
ÿÿ ...
X1 ÿX norte

ÿ E y( ) =
S= ... ... ... (3.105)
ÿX
ÿ Oye
() ÿ ÿ Oye
() ÿ
norte

... norte

ÿ
X1 X norte ÿ

cuya única entrada se define como:

(ÿ )
s = Ey i (3.106)
yo
ÿX
j
Machine Translated by Google

Modelos de regresión lineal espacial 89

Sobre esta base, LeSage y Pace (2009) sugirieron las siguientes medidas
de impacto que se pueden calcular para cada variable independiente Xi
incluido en el modelo:

1. Una medida global, denominada Impacto Directo Promedio. Esta medida se


refiere al impacto total promedio de un cambio en Xi sobre yi para cada
observación, que es simplemente el promedio de todas las entradas diagonales en la matriz S:

norte
ÿ E(y) i
= S n 1 ( )=
IDA n tr ÿ ÿ

1
ÿ (3.107)
yo = 1
ÿX i

2. Una medida relacionada con el impacto producido en una sola observación


por todas las demás observaciones, denominada Impacto Total Promedio
en una observación. Para cada observación esto se calcula como la suma de
la i-ésima fila de la matriz S:

E(y) iÿ
norte norte

ATIT n j = ÿ

1
ÿ ÿsn = ÿ

1
(3.108)
yo
ÿX
yo = 1 yo = 1 j

3. Una medida relacionada con el impacto producido por una sola observación
en todas las demás observaciones, denominada Impacto total promedio de
Una observación. Para cada observación esto se calcula como la suma
de la j-ésima columna de la matriz S:

norte norte
ÿE
(yi)
=
ATIF norte 1
ÿ ÿsn =
ÿ ÿ

1
i yo
ÿX (3.109)
j =1 j =1 j

4. Una medida global del impacto medio obtenido de las dos medidas anteriores:

norte norte

ATI ni== 11T1ÿÿ ÿ ij


Si=nATIF ÿ ATIT norte ÿ (3.110)
j=1 j =1

que es simplemente el promedio de todas las entradas de la matriz S.


5. Una medida del impacto indirecto medio obtenido como diferencia entre ATI y ADI:

= ATI ADI
TODO ÿ

(3.111)

que es simplemente el promedio de todas las entradas fuera de la diagonal de la matriz S.

Las medidas de impacto relativo para un modelo SARAR general se pueden


obtener de manera similar sustituyendo las expresiones de forma reducida
apropiadas en la Ecuación (3.103).
Machine Translated by Google

90 Introducción a la econometría espacial

Ejemplo 3.6 Ley de Okun en Italia (continuación)

Como ilustración de las medidas de impacto descritas en la última sección,


consideremos nuevamente la Ley de Okun en las 20 regiones italianas descritas en
el Ejemplo 2.3 en el Capítulo 2. En el ejemplo, estimamos el modelo con un estimador
OLS simple despreciando los efectos espaciales, pero observamos una correlación
residual significativa. Ahora, sobre la base de la misma matriz W utilizada para
calcular el I de Moran en el ejemplo 2.3 (es decir, una matriz W estandarizada por
filas basada en la mera adyacencia entre regiones corregida para incluir las islas),
reestimemos el modelo como un Retraso espacial y calculemos las medidas de
impacto descritas en la sección 3.8. Los resultados se muestran en la siguiente tabla
junto con los basados en MCO a efectos de comparación.

MCO Modelo de retraso espacial

Interceptar 10.971*** – 3.12275***


PIBl 3.326*** –1.13532***
– 0.7476***
IDA – –1.542448
TODO – –2.95571
ATI – –4.498159

En el marco OLS, la interpretación es sencilla: si observamos un aumento de 1


unidad en el PIB en una región, esperamos una disminución de -3.326 unidades en
el desempleo de la misma región. Dentro del marco de trabajo de Retraso espacial,
sería incorrecto interpretar la pendiente de regresión de la misma manera. El efecto
“directo” de aumentar el PIB de 1 unidad NO es una disminución de 1,13532 unidades
de desempleo, sino una disminución de 1,542448 (ver ADI en la Tabla). Además,
dada la presencia de efectos “indirectos” producidos por el desbordamiento del
aumento del PIB de una región a todas las demás regiones (lo cual es connatural
con el mecanismo de Rezago Espacial), un aumento de 1 unidad de PIB en una
región produce un “ total” impacto que, en promedio, es una reducción de 4.498159
unidades de desempleo (ATI). Así, el impacto es mayor si consideramos un modelo
de Rezago Espacial en lugar del modelo aespacial tradicional debido al mecanismo
de transmisión geográfica que se incorpora en el primero.

3.9 Códigos R: estimación de modelos espaciales lineales

Todos los comandos R relacionados con los procedimientos descritos en este


capítulo se encuentran en la biblioteca spdep. Todos los comandos son muy similares
a los comandos estándar para regresiones descritos en la sección 1.4 y son muy
sencillos de aplicar. En todos los casos suponemos que
Machine Translated by Google

Modelos de regresión lineal espacial 91

quiero estimar el modelo básico =+ + + 01 2y xz bb be (con el correspondiente

adición de un retraso espacial o un error espacial, o ambos) utilizando una matriz de


ponderación W que se genera mediante uno de los procedimientos descritos en la sección 2.3.
Suponemos también que las observaciones de las variables y, x y z se almacenan en un
archivo llamado filename. Si los datos se almacenan en la sesión R activa, se pueden omitir
todas las opciones, incluida esta especificación. Una vez que se estima un modelo (por
ejemplo, modelo), se puede obtener un resumen del resultado de la estimación, como de
costumbre, escribiendo:

> resumen(modelo)

Para empezar, si queremos estimar los parámetros de un sistema puramente autorregresivo


modelo, el comando

> modelo0<-sautolm(x~1 , datos=nombre de archivo, listw=W)

proporciona la solución ML al problema de estimación.

Si queremos estimar un Modelo de Error Espacial a través del criterio de Máxima Verosimilitud
(ML) (sección 3.4.2) utilice el comando

> modelo1<-errorsarlm(formula= y~x + z, data=nombre de archivo,


listaw=W)

Por el contrario, para estimar el modelo de error espacial por el procedimiento de mínimos
cuadrados generalizados factibles (GLS) (sección 3.4.3) usamos, en cambio, el comando:

> model2<-GMerrorsar (formula= y~x + z, data=nombre de archivo, listw=W)

Cuando se trata de un modelo de retraso espacial , si deseamos emplear el ML


método (sección 3.5.2), use el comando:

> model3<-lagsarlm(formula= y~x+z, data=nombre de archivo, listw=W)

si añadimos la opción

> model3<-lagsarlm(formula= y~x+z, data=filename, listw=W, type=”mixed”)


Machine Translated by Google

92 Introducción a la econometría espacial

consideramos el caso de un modelo de retraso espacial con el retraso espacial adicional


de todas las variables independientes.
En cambio, si queremos estimar el modelo de Rezago espacial con el estimador de
mínimos cuadrados en dos etapas (2SLS) (sección 3.5.3), utilice el comando:

> model4<-stsls (fórmula= y~x+z, data=nombre de archivo, listw=W)

Finalmente, para estimar los parámetros de un modelo SARAR por ML (sección 3.6.2)
utilice el comando:

> model5<-sacsarlm(formula= y~x+z, data=nombre de archivo, listw=W)

y para estimar el mismo modelo utilizando el método de mínimos cuadrados espacial


generalizado en dos etapas (GS2SLS) (sección 3.6.3), escriba el comando:

> modelo6 <- gstsls(Y~x+z, listaw = w)

Para el cálculo de la prueba de autocorrelación para residuos de una regresión


especificando la hipótesis alternativa, utilice el comando:

>lm.LMtests(Modelo1, listw=W, test=”all”)

mediante el cual calculamos la prueba LM utilizando como alternativas el modelo Spatial


Error o Spatial Lag (LMSEM y LMLAG en la sección 3.7), sus versiones robustas
(RLMSEM y RLMLAG) o la prueba Moran I modificada (In).

Tenga en cuenta que si hemos estimado un modelo de retraso espacial y queremos


probar si todavía hay una autocorrelación espacial residual, aparece un procedimiento de
prueba LM de forma predeterminada en la salida del procedimiento lagsarlm sin comandos
adicionales.
Finalmente, para el cálculo de las medidas de impacto descritas en la sección 3.8, la
biblioteca spdep contiene un comando con referencia al modelo Spatial Lag. Si dicho
modelo ha sido estimado (digamos model3) y tenemos disponible una matriz utilizada en
el proceso de estimación, podemos W

obtener las medidas de impacto escribiendo el comando:

> impacto <- impactos(modelo3, listw = W)


Machine Translated by Google

Modelos de regresión lineal espacial 93

Términos y conceptos clave introducidos

• Autocorrelación espacial
• Autorregresión espacial pura
• Modelo de error espacial
• Modelo de retraso espacial
• Autoregresivo espacial con modelo de error autoregresivo (SARAR)
• Modelo de variables independientes rezagadas
• Solución de máxima verosimilitud para la estimación del modelo de error espacial
• Descomposición de Ord
• Solución factible de mínimos cuadrados generalizados para el modelo de error espacial
Estimacion
• Estimación del Método Generalizado de Momentos

• Solución de Máxima Verosimilitud para la estimación del modelo de Rezago Espacial


• Solución de mínimos cuadrados de dos etapas para la estimación del modelo de retraso espacial
• Solución de Máxima Verosimilitud para la estimación del modelo SARAR
• Solución espacial generalizada de mínimos cuadrados en dos etapas para SARAR
estimación del modelo
• Estimadores de variables instrumentales de Lee
• Transformación Cochrane-Orcutt

• Mejores estimadores de mínimos cuadrados en dos etapas espaciales generalizados factibles


• Prueba de puntuación de Rao (multiplicador de Lagrange) para residuos de regresión con
variables espacialmente rezagadas
• Prueba Robusta del Multiplicador de Lagrange
• Prueba de Moran I modificada

• Medidas de impacto

Preguntas

1. ¿Cuál es una de las principales limitaciones del uso de las estadísticas I de Moran para probar la
hipótesis de que no hay autocorrelación espacial entre los residuos de la regresión? ¿Cómo se
puede abordar esta limitación? que alternativa
hay pruebas disponibles?

2. ¿Cuáles son las ventajas y desventajas relativas de emplear una estrategia de Máxima Verosimilitud
y una estrategia de Mínimos Cuadrados Generalizados al estimar un modelo SARAR?

3. ¿En qué sentido se describe el procedimiento de la sección 3.4.3 como “viable”?


4. ¿Por qué es necesario dentro del GLS Viable considerar un procedimiento de Método de Momentos?

5. ¿Cómo podemos definir una transformación de Cochrane-Orcutt en el espacio? ¿Cómo puede


ayudar esta transformación en el proceso de estimación del modelo?
Machine Translated by Google

94 Introducción a la econometría espacial

6. ¿Cuál es el objetivo de la descomposición de Ord?


7. ¿Por qué podemos usar el I de Moran en lugar de una prueba del Multiplicador de Lagrange
para la dependencia espacial obteniendo las mismas conclusiones inferenciales?
8. ¿Por qué necesitamos considerar las versiones robustas de Lagrange?
¿Pruebas multiplicadoras de dependencia espacial?

Ejercicios

Ejercicio 3.1 El siguiente mapa muestra los límites de los 27 países que eran miembros de la
Unión Europea en julio de 2012.

País no perteneciente a la Unión Europea


País de la Unión Europea el 1 de julio de 2012

Mapa de los 27 Estados miembros de la UE en julio de 2012. (Cortesía de Carrie Dolan).

Usando el procedimiento ilustrado en la Sección 2.3.2, prepare un archivo .GAL y construya


la matriz W estandarizada por filas con el criterio de adyacencia (unir la isla al país más cercano,
es decir, Irlanda al Reino Unido, Reino Unido a Francia, Malta a Italia y Chipre a Grecia. También
se suman Finlandia a Estonia y Dinamarca a Suecia). La siguiente tabla muestra los datos
relacionados con el crecimiento per cápita del Producto Interno Bruto en el período 2010-11 y el
porcentaje del PIB dedicado a la educación en 2009.
Países
Bajos HU LT CY ESO FR ES ES
DECIR EE.UU. Delaware no
sé CZ BG SER CÓDIGO PAÍS
Países
Bajos Hungría Lituania Chipre Italia Francia España Irlanda Estonia Alemania DinamarcaRepublica
checa Bulgaria Bélgica PAÍS
Gastos
2009 %
Educación
40.5 23,9 40.6 44.7 19 43.2 39.4 35,9
48,9 29.4 40.7 17,5
27,9 42
Crecimiento
2010–
2011
PAÍS
1.045751634
1.0838709681.1911764711.059574468 1.04296875
1.0696721311.070247934 1.170068027
1.09 1.0740740741.072413793 1.058252427
1.0412371131.046931408
MONTE BT LU EL Reino
Unido SE FI SK SI RO PT ES EN CÓDIGO
Malta letonia luxemburgo Grecia Reino
Unido Suecia Finlandia Eslovaquia Eslovenia Rumania Portugal Polonia Austria PAÍS
Gastos
2009 %
Educación
21 30.1 46.6 41,5
26,5 43,9 17,6
45,9 31.6 16.8 32,8
21,1 23.5
1.020202 1.149606 1.098333 1.045249 1.084615 1.099291 1.107807 1.05848 1.118227 1.054054 1.037234 0.992958 1.057823 2010-2011 Crecimiento
95
Machine Translated by Google
Machine Translated by Google

96 Introducción a la econometría espacial

Pruebe la hipótesis de que el crecimiento es fomentado por la educación. Como podemos


conjeturar que los gastos en educación presentan algún patrón espacial, en principio también
podemos incluir los valores rezagados de la variable educación entre los regresores. Usando
una estrategia de Máxima Verosimilitud, comience estimando un modelo SARAR y luego, en
base a los resultados obtenidos, elija el mejor modelo entre el Rezago Espacial, el Error
Espacial y el SARAR completo.

Ejercicio 3.2 Muestre que un modelo de error espacial = +; i ii y Xu b


ÿ j 1 wuj j =
norte

= r 2
tu
i ejem ; +<; i1 yo
_ id N ÿe(0, )
norte. .
se puede expresar como un
ÿ =1 w
norte

yo j

Modelo de retraso espacial con una variable independiente adicional retrasada


espacialmente. Explique por qué, incluso si el término de error e es "bien
comportado", el criterio OLS no proporciona estimadores confiables para los
parámetros desconocidos.

Ejercicio 3.3 Muestre que en el modelo de error espacial, si el parámetro de correlación


espacial r y la varianza del error s2 mi
ambos son conocidos, el ML
estimadores de ÿ coinciden con los estimadores GLS . Derive la expresión explícita de la
solución GLS y de sus varianzas de error.

Ejercicio 3.4 Muestre que un modelo de Rezago Espacial

ÿ
norte

wyyo j
j =1 ui X iidN .. .(0,ÿ
y i = l bl ++; 1;
2
X tu < ÿ tu nnyo ) puede ser
i i
ÿ
norte

w
j=1 i

expresada como una autorregresión pura de la variable independiente y con un término de


error (media distinta de cero) que incorpora la variable independiente (no estocástica).

Ejercicio 3.5 Considere el modelo SARAR:

ÿ j =1 wyij j ÿ j 1 wuj j =
norte norte

yi = yo l +; 1;
tu
i
< tu
i
= r + ;ejem
i
< 1
ÿ =1 w ÿ =1 w
norte norte

yo j yo j

mi . . .yo
2 Xÿ iidN (0,) ÿe nn y considere el caso de lr = ÿ . Demuestra que en este

En caso de que el modelo se reduzca a un caso particular de un modelo de


Rezago espacial, analice el espacio de parámetros y comente la forma de la matriz W.
Machine Translated by Google

Modelos de regresión lineal espacial 97

Luego derive la matriz de varianza-covarianza de y y la función de verosimilitud asociada.

Ejercicio 3.6 Considere nuevamente el conjunto de datos discutido en los Ejemplos 3.3 y 3.4
relacionado con el determinante del precio medio de la vivienda observado en 506 distritos
censales del área de Boston. Para descargar el tipo de conjunto de datos:

>datos(boston)

Estime el modelo utilizado en los Ejemplos 3.3 y 3.4, pero especificando el componente
espacial en el formulario Error espacial. Utilice tanto el procedimiento de Máxima Verosimilitud
como el de GLS Factible. Compare los resultados obtenidos con los presentados en los
ejemplos 3.3 y 3.4.

Referencias al Capítulo
Anselin, L. (1988) Econometría espacial: métodos y modelos, Dordrecht: Kluwer
Editores Académicos.
Anselin, L., Bera, A., Florax, R. y Yoon, M. (1996) 'Pruebas de diagnóstico simples para la
dependencia espacial', Regional Science and Urban Economics, 26, 77–104.
Arbia, G. (2006) Econometría Espacial: Fundamentos Estadísticos y Aplicaciones a la
Crecimiento económico regional, Heidelberg: Springer-Verlag.
Burridge, P. (1980) 'Sobre la prueba de Cliff-Ord para la autocorrelación espacial', Journal of
la Sociedad Real de Estadística, Serie B, 42, 107–8.
Cliff, AD y Ord, JK (1972) Autocorrelación espacial, Londres: Pion.
Gerschgorin, S. (1931) 'Über die Abgrenzung der Eigenwerte einer Matrixi', Izv.
Akád. Nauk. URSS Otd. Fiz.-Mat., 7, 749-54.
Gilley, OW y Pace, RK (1996) 'Sobre los datos de Harrison y Rubinfeld', Journal
de Economía y Gestión Ambiental, 31, 403–5.
Harrison, D. y Rubinfeld, DL (1978) 'Precios de vivienda hedónicos y la demanda de aire
limpio', Journal of Environmental Economics and Management, 5, 81–102.

Kelejian, HH y Prucha, I. (1997) 'Estimación del parámetro autorregresivo espacial mediante


el procedimiento de mínimos cuadrados en dos etapas: un problema serio', International
Regional Science Review, 20, 103–11.
Kelejian, HH y Prucha, I. (1998) 'Un procedimiento espacial generalizado de mínimos
cuadrados en dos etapas para estimar un modelo autorregresivo espacial con
perturbaciones autorregresivas', Journal of Real Estate Finance and Economics, 17, 99–121.
Kelejian, HH y Prucha, I. (2001) 'Sobre la distribución asintótica de las estadísticas de prueba
de Moran I con aplicaciones', Journal of Econometrics, 104,
219–57.
Kelejian, HH, Prucha, I. y Yuzefovich, E. (2004) 'Estimación de variables instrumentales de
un modelo autorregresivo espacial con perturbación autorregresiva: resultados de
muestras grandes y pequeñas', en J. LeSage y K. Pace (eds), Advances in Econometrics:
Spatial and Spatiotemporal Econometrics, Nueva York: Elsevier, págs. 163–98.
Machine Translated by Google

98 Introducción a la econometría espacial

Kelejian, HH, Tavlas, GS y Hondronyiannis, G. (2006) 'A Spatial Modeling Approach to Contagion
Among Emerging Economies', Open Economies Review, 17, 4–5, 423–42.

Lee, LF (2003) 'Mejores estimadores espaciales de mínimos cuadrados en dos etapas para un
modelo autorregresivo espacial con perturbaciones autorregresivas', Econometric Reviews, 22,
307–35.
Lee, LF (2004) 'Distribución asintótica de estimadores de máxima verosimilitud para modelos
autorregresivos espaciales', Econometrica, 72, 1899–925.
LeSage, J. y Pace, RK (2009) Introducción a la econometría espacial, Boca Raton,
Florida: Chapman & Hall/CRC Press.
Moran, PAP (1950) 'Notas sobre fenómenos estocásticos continuos', Biometrika,
37, 1, 17–23.
Ord, JK (1975) 'Métodos de estimación para modelos de interacción espacial', Journal of
la Asociación Estadounidense de Estadística, 70, 120–6.
Whittle, P. (1954) 'Sobre procesos estacionarios en el plano', Biometrika, 41, 434–49.
Machine Translated by Google

4
Otros temas en espacial
Econometría

Este capítulo analiza algunos temas especiales avanzados en econometría


espacial que se han introducido recientemente en la literatura. El propósito
principal es hacer que el lector conozca un conjunto de técnicas que representan
la evolución de los métodos presentados en el Capítulo 3 y que constituyen una
parte esencial del conjunto de habilidades que actualmente requieren los
econometristas espaciales. Estos métodos tienen el potencial de tener un
tremendo impacto en el análisis de problemas del mundo real en muchos
campos científicos. En particular, la sección 4.1 discute el caso de varianzas de
innovación no constantes (modelos heteroscedásticos), la sección 4.2 se refiere
al caso donde la variable dependiente asume una forma discreta (en particular,
binaria), la sección 4.3 contiene algunas de las estrategias de modelado en el
campo de los modelos econométricos espaciales diacrónicos estimados sobre
datos de panel y, finalmente, la sección 4.4 analiza los modelos de regresión
que no son estacionarios en el espacio geográfico. Siguiendo la naturaleza
introductoria de la presentación actual, discutiremos los diversos métodos con
menos detalles analíticos en comparación con el resto del libro, mientras
remitimos al lector interesado a la literatura actual para obtener más detalles.

4.1 Innovaciones heteroscedásticas

4.1.1 Generalidades

Hasta este punto del texto, todos los modelos presentados han considerado X
iidN . .esta
. (0, I ) las 2
innovaciones serán así asumiendo
sección 1.2, por muchas mirazones,
datos hipótesis
suposición
espaciales. ÿ(homocedasticidad).
ÿe
como
tipologías
De nn
puede
deesis
ya
realista
hecho, se
considerarse
de
a discutió
datos varianza
cuando Sin
en
diferencia
(por de la
constante
embargo,
poco
la otras
ejemplo,
se trata
de
datos de series temporales), los datos espaciales se observan dentro de
unidades que, en general, son diferentes en términos de

99
Machine Translated by Google

100 Introducción a la econometría espacial

su tamaño y forma. Esta característica, que es propia de todos los datos espaciales
observados en redes irregulares, puede resultar en heteroscedasticidad de las innovaciones
con mayores variaciones en áreas más grandes. Además, incluso si podemos asumir la
cedasticidad del hogar en un nivel dado de agregación espacial (por ejemplo, el nivel de
condado), tal característica generalmente se pierde si agregamos los datos a un nivel más
alto de agregación (por ejemplo, el nivel estatal) debido a a la diferente dimensión de las
distintas áreas geográficas (para una prueba véase, por ejemplo, Arbia, 1989).

Parte de la literatura más reciente se ha concentrado en este aspecto al introducir modelos


econométricos espaciales heteroscedásticos de la clase SARAR (Kelejian y Prucha, 2007,
2010). Discutiremos algunos de estos avances en la presente sección. En particular,
distinguiremos dos enfoques principales de estimación. El primero es un enfoque en el que
se tiene en cuenta la heterocedasticidad de las innovaciones mediante la estimación
paramétrica de su matriz de varianza-covarianza (ver sección 4.1.2). El segundo es un
enfoque no paramétrico en el que se desarrolla un procedimiento de estimación que es
robusto a posibles especificaciones erróneas del proceso de innovación y la estructura de su
matriz de varianza-covarianza se infiere de forma no paramétrica a partir de los datos
observados (sección 4.1.3). .

4.1.2 El modelo SARAR con perturbaciones heteroscedásticas

Consideremos nuevamente el modelo SARAR(1,1) presentado en la sección 3.6 y


que se muestra a continuación por conveniencia.

Wy= tu bl y+ Z + yo < 1 (4.1)

tu Wu = +r <
1 re (4.2)

pero ahora, en lugar del supuesto habitual E( )= mi 2 Xÿ iidN. .. (0, ) yo ÿe , nos deja
2
argumento i ÿ considerado en2 la
ei , supongamos
surge
nn sección
.unen
problema
Debecambio
3.5,
ser el que, al usar el mismo
evidente
de endogeneidad en el que el término Wy está correlacionado con las innovaciones.
Esto motiva el uso de una estrategia en dos etapas. Además, surge un problema
de ineficiencia como resultado de las innovaciones heteroscedásticas, por lo que
es necesario considerar un procedimiento ponderado.

El procedimiento que ilustraremos fue introducido por Kelejian y Prucha (2010) y utiliza un
enfoque que es similar a los Mínimos Cuadrados Espaciales en Dos Etapas presentados en
la sección 3.6 para el modelo general SARAR(1,1) con innovaciones homecedásticas, con
algunas importantes diferencias. En lo que sigue, intentaremos proporcionar las intuiciones
detrás del procedimiento, sin discutirlo en todos sus detalles matemáticos, mientras remitimos
al lector interesado al artículo de referencia para obtener una comprensión más profunda.
Machine Translated by Google

Otros temas de econometría espacial 101

comprensión en el tema. En particular, hay dos intuiciones. La primera es que, al utilizar un


enfoque GLS factible, en el tercer paso del procedimiento ilustrado en la Sección 3.4.3, se
obtuvo una estimación GMM imponiendo tres condiciones de momentos. La primera de estas
condiciones fue ÿ 1 ÿ ÿ ÿ
ˆ ˆ
ÿ (uu r = 2
norte

en la varianza, yo
ÿ

ÿ , mi
ÿ ÿ ver Ecuación (3.35) . Sin embargo
ÿ norte
yo = 1 )2 ÿ

en el presente contexto ya no tenemos un solo parámetro se 2 debido


a la relajación de la hipótesis de la homecedasticidad y al hecho de que la
heterocedasticidad no se expresa de una forma específica. Entonces, en
2 como
este nuevo caso, tendremos que considerar las varianzas del error si
parámetros molestos y, en lugar de imponer tres condiciones de momentos para estimar T ÿ
2 mate
= Ecuación
todo 2elÿÿ vector
(3.41)),
de parámetros
j rr ÿ solo (ver
impondremos dos condiciones de momentos estimación
y estimaremos
ÿ en
único el ÿ fase
mi esta
,, parámetrovector
de de
reducido
ÿ se jparámetros
concentrará
rr . Por
interés r. Lalosegunda
que
en la
el
intuición es que, descartando la hipótesis de homecedasticity (por analogía con la discusión
T ÿ=ÿ 2 , reportada en la sección 1.2), la estimación
GMM del parámetro r del modelo, aún proporcionará
varianza estimadores
que manera
ya no será mínima.
similar consistentes,
a la corrección pero
En consecuencia,
de con
MCO deuna
empleada en la sección 1.2, también necesitaremos corregir la estimación de GMM con un
procedimiento ponderado.

La fase de estimación es bastante compleja y se mueve secuencialmente a través de


diferentes pasos, haciendo uso de instrumentos y condiciones de momento. En este caso, se
puede obtener un procedimiento GS2SLS modificado siguiendo estos pasos secuenciales:

Paso 1: en primer
~ lugar,
~ obtener una estimación consistente de los parámetros b
y yo, digo b y yo

Paso 2: utilice las estimaciones obtenidas en el primer paso para obtener una estimación
inicial de u en la Ecuación (4.1), digamos û

Paso 3: use û para obtener una estimación inicial del parámetro autorregresivo r en la
Ecuación (4.2), digamos r ~, imponiendo condiciones de momentos. Esta estimación es
consistente, pero ineficiente debido a la falta de constancia de las varianzas,

Paso 4: se obtiene una estimación eficiente del parámetro r utilizando un procedimiento


GMM ponderado; llame a rˆ una estimación tan eficiente.

Paso 5: use la estimación eficiente rˆ para transformar el modelo (4.1) como


ˆ ˆ
( I) Wy
=( )I +WZ r ser r
ÿ ÿ
Machine Translated by Google

102 Introducción a la econometría espacial

Paso 6: estimar los parámetros de dicho modelo transformado usando una


*
estrategia 2SLS usando las variables transformadas ÿ ÿˆ ZI WZ
=( )=(
ÿ rˆ
) ;yWIWZ
WZ
2 WZWI
*
WZ =( ) ÿ rˆ como instrumentos.
cuadrados *
Llame
de dos
a
2
esto
etapas
un estimador
espacial generalizado
de mínimos
factible (FGS2SLS).

Paso 7: Defina los nuevos residuos GS2SLS.

Paso 8: Finalmente, obtenga una estimación GMM eficiente de r basada en


los residuos del procedimiento FGS2SLS discutido en el Paso 6.

Estos pasos ahora serán discutidos en detalle.

Paso 1: estimar los parámetros de (4.1), teniendo en cuenta de manera consistente


el problema de la endogeneidad a través del estimador 2SLS utilizando Z y WZ
como instrumentos. La motivación de esta elección es la misma utilizada en las
secciones anteriores. Llamemos a las estimaciones así obtenidas b˜ y l˜.

Paso 2: De la Ecuación (4.1) derivar


"

uy=ZÿWY
ÿ" " bl

Paso 3: Utilice los términos de la ecuación (4.2) para obtener un estimador inicial
de r a través de un procedimiento GMM no ponderado análogo al considerado en
la sección 3.6.3, pero basado en condiciones de solo dos momentos ya que ahora
no se puede derivar ninguna condición de la parámetro s2. En otras palabras, dado
que la heteroscedasticidad no se expresa en una forma preespecificada, los
procedimientos GMM solo pueden enfocarse en la estimación del parámetro desconocido r.
Llamemos a rÿ el estimador inicial de r así obtenido. Kelejian y Prucha (2010)
sugieren que este estimador puede interpretarse como un estimador de mínimos
cuadrados no lineal no ponderado (Greene, 2011). Este estimador, en nuestras
hipótesis, es consistente, pero ineficiente debido a la heterogeneidad de las
varianzas de las perturbaciones.

Paso 4: Partiendo del resultado obtenido en el Paso 3, un GMM eficiente


El estimador de r puede definirse como una versión ponderada del estimador de
mínimos cuadrados no lineal discutido anteriormente con pesos proporcionados
por los elementos de una matriz (a la que nos referiremos con el símbolo ÿ) que
representa un estimador de la matriz de varianza-covarianza de la distribución
límite de los momentos muestrales normalizados. Dado el papel crucial que juega
la matriz ÿ en el procedimiento de estimación, primero definámosla formalmente como:

= 1
T nH H ÿ ÿnn nn
22 2 ÿ 2 (4.3)
Machine Translated by Google

Otros temas de econometría espacial 103

2 =
n el tamaño deTla muestra,ZÿWZy = una
ÿ[ ]E, uu
nH la matriz
matriz de instrumentos
de varianza-covarianza
de n por 2 conde
además las perturbaciones
instrumentos de la
al elemento genérico de ÿ elementos genéricos
matriz ÿ como
ÿ
Observeÿij ÿque
ÿ . la
Refiramos
matriz de
ÿ

años
, rs , = 1,2.
H ahora tiene dimensión n-by-2 porque solo imponemos dos condiciones
de momentos.
En su trabajo Kelejian y Prucha (2010) proponen el siguiente párrafo
estimador métrico para el elemento genérico de yrs

y"
rs
ÿ = (2AAAA
ÿ

) n tr + ÿ ÿ
1
( rr ss )( ) ÿ ÿ1 ÿ
TTT ÿ ÿÿ + + naars
" ""
ÿ

"
r
"
s
, = 1,2 (4.4)

Aclaremos el significado de los muchos elementos contenidos en la


expresión anterior. En primer lugar, definamos i°j como el j-ésimo elemento
de la matriz identidad y w°j como el j-ésimo elemento de la matriz de pesos W. " "

En segundo lugar, definamos los residuos transformados como " =(Yo


) Wu
r - y
e , en consecuencia, el estimador de los elementos "
diagonales de la varianza
=1 mi i) .
norte
"
=
ÿ diagi
de2las perturbaciones como ( matriz de covarianza
Dadas tales definiciones, ahora podemos definir los elementos restantes de la
Ecuación (4.4) de la siguiente manera:

norte

TTT
1 =
A WW iwwij =1ÿÿ j # #jjj ##

OA 2
=

"" "
ÿ

1 "
r r
r un )
=( un IW HP
ÿ

1
"" "

r =
T
ÿ ÿ ÿ ( )( + ) ( ÿÿ n QIWAAI
r Wu
r ÿ ÿ ar r ÿ ÿ
T " "
[]y
con ÿ ÿ

) , QZWy, =
" 1 11T TTT T 1 1 11
(
ÿ ÿÿ ÿ ÿ ÿÿ

P n=( ÿ )n(HH n HQ ) ÿ ÿ
HH n HQ n QH ÿ)ÿÿ
) )( .
( El resultado del procedimiento GMM ponderado descrito anteriormente
es un nuevo estimador del parámetro r. Kelejian y Prucha (2010) han
demostrado que dicho estimador es consistente y eficiente. Llamemos a
este nuevo estimador rˆ.
Paso 5: utilice la estimación de rˆ obtenida en el Paso 4 para transformar el
modelo original de la forma habitual, premultiplicando cada lado de la Ecuación
(4.1) por el término ( IW :ÿ rˆ)

ˆ ˆ
IW y IWZ Wy r bl e ÿ ÿÿ r ( ) ( ) =( ) + (4.5)
Machine Translated by Google

104 Introducción a la econometría espacial

Paso 6: estimar b y l en la Ecuación (4.1) utilizando un procedimiento 2SLS


Espacial Generalizado con H como instrumentos, obteniendo así:

ˆ ˆ * ** ˆ
= ÿQ QQ
ÿÿ
T
y ÿ ÿTÿ
ÿGS2SLS (4.6)

ˆ
) *ÿWQ
, = ],QI
[ donde, como antes, QZ Wy rˆ =( y Q *HH
=( )HQ T T1
- *

Paso 7: Defina los nuevos residuos GS2SLS como:


ˆ ˆ
= ÿd
uyQ GS SLS 2

Paso 8: Producir un estimador GMM final y eficiente de r basado en los residuos


del procedimiento GS2SLS presentado en el Paso 7. Dicho estimador eficiente
se obtiene como un procedimiento GMM ponderado que usa los elementos de
la matriz ÿ como pesos.

4.1.3 Estimadores HAC espacial


Como se ve, un elemento crucial en el procedimiento ilustrado en la sección
anterior está representado por la matriz de varianza-covarianza de la distribución
límite de los momentos muestrales normalizados (el término ÿ). En un artículo,
en el que basamos la discusión de la sección anterior 4.1.2, Kelejian y Prucha
(2010) sugirieron un estimador paramétrico para los elementos de dicha matriz.
En otro artículo, los mismos autores (Kelejian y Prucha, 2007) sugieren estimar
la matriz ÿ de forma no paramétrica utilizando un estimador consistente de
heteroscedasticidad y autocorrelación (HAC) . Los estimadores HAC son
bastante populares en econometría y se han estudiado durante años,
especialmente en la literatura de series de tiempo después de las contribuciones
fundamentales de Grenander y Rosenblatt (1957) y Newey y West (1987). En
el contexto espacial, los primeros intentos de estimar de forma no paramétrica
una matriz de varianzas-covarianzas a partir de una muestra espacialmente
dependiente se remontan a la contribución de Conley (1999), con respecto a
un espacio continuo, y de Driscoll y Kraay ( 1998) y Pinkse et al. (2002) para
unidades espaciales discretas. En la siguiente discusión, resumiremos
brevemente este método de estimación que se puede usar en los pasos 4 y 8
del procedimiento descrito en la sección 4.1.2.
En lugar de estimar paramétricamente los elementos de la matriz ÿ, como se
muestra en la Sección 4.1.2, Kelejian y Prucha (2007) sugieren que, bajo una
serie de supuestos de trabajo, se pueden obtener estimadores consistentes y
eficientes de los elementos de la matriz ÿ sin - paramétricamente.
En primer lugar, considere que, como ya se muestra en la Ecuación (4.3), la verdadera
Machine Translated by Google

Otros temas de econometría espacial 105

1 T
matriz de varianza-covarianza se define como ÿ nH=H ÿ ÿ = 1,2 , de manera que la
rs,
expresión algebraica de su elemento genérico yrs , es dado por:

nn
= 1
y rs hh ÿ ir
norte
ÿ ÿÿ es ij (4.7)
yo =1j =1

con hir, his el i-ésimo elemento del vector de (respectivamente) el r-ésimo y el s-ésimo instrumento.

Por analogía, el estimador HAC espacial del elemento genérico del ÿ

matriz se puede expresar como:

nn
ˆ *
ÿ1 ÿÿ
ˆˆ

= hh uuK dd ir es ij( /)
ij
y rs norte
(4.8)
yo=1 =1

En la expresión anterior, û es un estimador de las perturbaciones u, K( °) denota una función kernel, dij representa la

distancia (como sea que se mida) entre la i-ésima y la j-ésima observación espacial, la distancia que incluye un
dd = denota
+u
posible error de medida uij, independiente de las perturbaciones e y tal que 0 < < u ÿ. Finalmente, ij ijtérmino
el ij d
*
representa una distancia de estandarización correctamente seleccionada tal que para n ÿ ÿ, d ÿ ÿ.
yo

En cuanto a la función kernel K(°), que incorpora varias formas de suavizar la función, son posibles varias

especificaciones. Algunas de las especificaciones más comunes se muestran a continuación:

1. Uniforme

ÿÿ 0.5 para 1 ÿ de lo
norte

()=
ÿ

k norte
ÿ
ÿ
0 contrario
ÿÿ

2. Bartlett (triangular)

ÿÿÿ 1 norte
para 1 ÿ de lo norte

()=
ÿ

k norte
ÿ
ÿ
0 contrario
ÿÿ

3. Epanechnikov (cuadrático)

3
ÿÿ

norte(1ÿ ÿ ÿ ) 2 para
ÿ
norte
1ÿ
k ( ) =4
norte

ÿÿ
0 de lo contrario

4. Cuadrático (bi-peso)

15
ÿÿ
ÿ

ÿÿ (1 ÿ ÿ )2 2 por norte
1ÿ
k ( ) = 16
norte

ÿÿÿ
0 de lo contrario
Machine Translated by Google

106 Introducción a la econometría espacial

5. Cuadrático (tri-peso)

35
ÿÿ

norte ÿ - 1
ÿ

( )3 2 por norte
ÿ 1
k
( ) = 32
norte
ÿ
ÿ

0 de lo contrario
ÿÿÿ

6. Gaussiano

1 ÿ1 ÿ
2
()=
ÿ

k norte ÿ mi
XP ÿ ÿ
norte
ÿ

1 ÿ

2 ÿ2 ÿ
(2 ) pag

7. Tukey-Hanning

ÿÿ 1
ÿ 1+ porque ÿ
(pn 1
ÿ

por norte
ÿ
()
ÿ )ÿ
k norte = 2ÿÿ
ÿ

0 de lo contrario
ÿÿ

8. coseno

ÿÿ
ÿÿpÿÿ ÿ ÿ ÿÿÿ
pag
ÿ ÿ

porque ÿ ÿ

por norte
ÿ 1
()
ÿÿ ÿ

k norte ÿ ÿÿ=4ÿÿ nº 2 ÿ
ÿ

ÿ0 de lo contrario
ÿÿÿ

9. Partzén

ÿÿ
2 q
ÿ 3ÿ 1ÿÿ6 + 6 nn n
ÿ

por ÿ2

k
()=norte
ÿ
ÿ

ÿ
3 q
ÿ 2(1
- norte ) ÿq _
por norte

ÿÿÿ
2

10. Espectral cuadrática

ÿ ÿ 25 sen(6pn
) cos(6 ) pn
()=
ÿ

k norte
ÿ

ÿÿÿ22
12 peniques ÿ 6p _ 5 ÿ

En el artículo citado, Kelejian y Prucha (2007) probaron la consistencia de los estimadores (4.8) y derivaron sus distribuciones asintóticas.

Ejemplo 4.1 Un estudio urbano: Los determinantes del


crimen en Columbus (Ohio)

Un conjunto de datos muy popular en econometría espacial se refiere a un estudio urbano sobre los determinantes del crimen en Columbus

(Ohio). Este conjunto de datos fue recopilado y estudiado por primera vez por Anselin (1988) y luego utilizado varias veces
Machine Translated by Google

Otros temas de econometría espacial 107

en la literatura para probar nuevos procedimientos. Tanto los datos como los mapas
necesarios para un análisis geográfico están disponibles enRformato . Para recuperarlos
teclee session Las
datos (colon) y datos (coldis) en un R siguientes figuras muestran
el mapa de los 49 barrios en planificación correspondientes a las secciones censales
de Columbus (Ohio) junto con sus centroides.
(a) Mapa de los 49 barrios de Columbus (Ohio) (b) Mapa de los
centroides de los 49 barrios de Columbus (Ohio)

2
3
4
6
85
7
13 1111 9 10
14 12
19 15
dieciséis 17
18 25 26 22
24 20 23
27
21
31 30 29 28 33
32
34 37 38 35
36
39 43 44 40 41
42
46 45 48
49 47

(un)

40

35

30

25
25 30 35 40 45 50
(b) colón$X
Machine Translated by Google

108 Introducción a la econometría espacial

Además, la siguiente tabla muestra los datos relacionados con una medida de
delincuencia (la variable dependiente “crimen”, digamos y, definida como el total
de robos residenciales y robos de vehículos por cada mil hogares), y de las dos
variables independientes “ingreso ” (diga la variable X) y “valor de la casa” (diga la
variable Z) observados en los 49 vecindarios.

BARRIOS DELITO VALOR DE LA CASA INGRESO

1 15.726 80.467 19.531


2 18.802 44.567 21.232
3 30.626 26.350 15.956
4 32.387 33.200 4.477
5 50.731 23.225 11.252
6 26.066 28.750 16.029
7 0.178 75.000 8.438
8 38.425 37.125 11.337
30.515 52.600 17.586
9 34.000 96.400 13.598
10 11 62.275 19.700 7.467
12 56.705 19.900 10.048
13 46.716 41.700 9.549
14 57.066 42.900 9.963
15 48.585 18.000 9.873
16 54.838 18.800 7.625
17 36.868 41.750 9.798
18 43.962 60.000 13.185
19 54.521 30.600 11.618
20 0.224 81.267 31.070
21 40.074 19.975 10.655
22 33.705 30.450 11.709
23 20.048 47.733 21.155
24 38.297 53.200 14.236
25 61.299 17.900 8.461
26 40.969 20.300 8.085
27 52.794 34.100 10.822
28 56.919 22.850 7.856
29 60.750 32.500 8.681
30 68.892 22.500 13.906
31 17.677 31.800 16.940
32 19.145 40.300 18.942
33 41.968 23.600 9.918
34 23.974 28.450 14.948

(continuado)
Machine Translated by Google

Otros temas de econometría espacial 109

Continuado

BARRIOS DELITO VALOR DE LA CASA INGRESO

35 39.175 27.000 12.814


36 14.305 36.300 18.739
37 42.445 43.300 17.017
38 53.710 22.700 11.107
39 19.100 39.600 18.477
40 16.241 61.950 29.833
41 18.905 42.100 22.207
42 16.491 44.333 25.873
43 36.663 25.700 13.380
44 25.962 33.500 16.961
45 29.028 27.733 14.135
46 16.530 76.100 18.324
47 27.822 42.500 18.950
48 26.645 26.800 11.813
49 22.541 35.800 18.796

Comencemos por estimar, en aras de la comparación, el homecedastic


Modelo SARAR definido por bb01
y =+ +bl
2conXZ Wy
una + ; u wu
tu
varianza + =error
de + reiconstante
filas ei ÿ ÿ2 yen
( )=basada con
la W
distancia
una matriz
umbral
de peso
de 3.5.
E estandarizada
Estimamos el por
modelo mediante el procedimiento de mínimos cuadrados espaciales generalizados en
dos etapas ilustrado en la Sección 3.6.3. Los resultados se muestran a continuación.

Parámetro Error estándar prueba t valor p

b0 40.285663 8.912493 4.5201 6.18e–06***


b1 – 0.860819 0.324179 – 2.6554 0.0079218**
b2 – 0.286200 0.085272 – 3.3563 0.0007899***
yo 0.492052 0.167476 2.9381 0.0033028**
r 0.27048
s2 85.65

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

Todos los coeficientes son significativamente diferentes de cero, incluido el efecto espacial
l, que muestra que el número de delitos en un tramo censal está significativamente
relacionado con el de los tramos censales vecinos.
Machine Translated by Google

110 Introducción a la econometría espacial

Sin embargo, como se desprende del mapa, los diversos vecindarios son muy
diferentes en cuanto a su área, por lo que la hipótesis de la varianza del error
constante es poco plausible. De hecho, podemos esperar que la varianza sea
diferente de un área a otra con una mayor variabilidad en áreas más grandes. Por
y para estimar el mismo modelo SARAR que antes bb01bl
=+2 + esta
u razón + queremos
+ XZ Wy u ;
Wu = r + e, pero considerando ahora una varianza del error variable en 2.
E( )= ei yo ÿ
el espacio Consideremos primero la estimación paramétrica obtenida a través del
procedimiento de mínimos cuadrados espacial generalizado en dos etapas modificado
ilustrado en la sección 4.1.2. Los resultados del procedimiento de estimación se muestran
en la siguiente tabla.

Parámetro Error estándar prueba t valor p

b0 40.22132 6.41924 6.2657 3.710e–10***


b1 – 0.85734 0.43197 – 1.9847 0.04718*
b2 – 0.28657 0.14316 – 2.0017 0.04531
l 0.49257 0.11578 4.2543 2.097e–05 ***
r 0.27881 0.20754 1.3434 0.17914

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

Prueba de Wald para q y k ambos cero

Valor observado valor p


prueba de Wald 15.697 7.4348e–05

Los resultados de la estimación revelan que aún existe una relación significativa de
la variable “delito” con la variable “ingresos”, pero, ahora que consideramos un
efecto de heterocedasticidad, la relación con la variable “valor de la vivienda” ya no
es significativa (parámetro b2 ). Se confirma que el efecto de contagio en el crimen
(l ÿ0) es significativo en este nuevo escenario mientras que no se encuentra una
correlación espacial significativa en los residuales (r = 0). La prueba de Wald
rechaza la hipótesis de que ambos parámetros son iguales a 0. Nótese que en el
modelo SARAR heteroscedástico ya no estimamos el parámetro de varianza única
s2 como se aclaró en la sección 4.1.2.
Finalmente, estimemos nuevamente el modelo usando la estimación no
paramétrica de la matriz de varianza-covarianza discutida en la versión espacial
heteroscedástica autocorrelación consistente (HAC) del modelo SARAR (ver
sección 4.1.3). En particular, para estimar de manera no paramétrica la matriz
de covarianza de varianza reportada en la Ecuación (4.8), consideramos una
función kernel triangular.
Machine Translated by Google

Otros temas de econometría espacial 111

Parámetro Error estándar prueba t valor p


b0 41.79910 7.14254 5.8521 4.853e–09***
b1 – 0.94449 0.46596 –2.0270 0.042665*
b2 – 0.27756 0.15375 –1.8053 0.071031..
l 0.47802 0.12523 3.8172 0.000135***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

Los resultados son sustancialmente similares a los obtenidos con el estimador


paramétrico aunque con errores estándar mayores. Observe que en esta nueva
configuración no aparece ninguna estimación del parámetro de correlación de errores
porque ahora toda la matriz de correlación de errores (y no el único parámetro r) se
estima de forma no paramétrica.

4.2 Modelos espaciales para variables de respuesta binaria

4.2.1 Introducción

En todas las secciones anteriores del libro (capítulo 3 y sección 4.1), hemos considerado
el caso de una regresión espacial relacionada con variables dependientes continuas;
sin embargo, en muchos casos, la variable dependiente de un modelo de regresión
puede asumir solo un número discreto de resultados posibles. Por ejemplo, podríamos
estar interesados en la presencia o ausencia de cierta tecnología en una región en
función de una serie de variables independientes. Surgen situaciones similares al
explicar la elección del consumidor entre diferentes centros comerciales, al modelar
datos de conteo, al estudiar la interacción espacial o al modelar el comportamiento
electoral o las elecciones de los pacientes en economía de la salud, al explicar el
comportamiento criminal y en muchas otras situaciones. Todos estos casos entran
dentro de la categoría de lo que se conoce en la literatura como modelos de elección
discreta (ver Greene, 2011). Cuando la variable dependiente es discreta en lugar de
continua, los modelos que hemos discutido hasta ahora no pueden emplearse y deben
ajustarse para seguir su naturaleza estadística. Como la naturaleza de este libro es
introductoria, nos limitaremos solo al caso de elecciones binarias y, dentro de este
contexto, solo consideraremos algunas de las posibles especificaciones del modelo. A
pesar del enorme interés de estos modelos bajo una perspectiva aplicada, han recibido
comparativamente menos atención en la literatura con respecto a los modelos de
variable dependiente continua discutidos en el Capítulo 3 y la sección 4.1.

Esto se debe en parte a la mayor complejidad analítica de los modelos, la necesidad de


técnicas de estimación más sofisticadas y la mayor
Machine Translated by Google

112 Introducción a la econometría espacial

obstáculos computacionales cuando consideramos tamaños de muestra medianos a grandes.


El lector interesado puede consultar el libro de LeSage y Pace (2009) para
un punto de vista bayesiano sobre el tema y artículos como Beron y
Vijverberg (2004), Fleming (2004) y Smirnov (2010) para revisiones.
Las diversas especificaciones de los modelos espaciales de elección discreta siguen
la estrategia general utilizada en la literatura para tratar con modelos discretos
aespaciales, pero adaptados para dar cuenta de la dependencia espacial empleando
los dos paradigmas fundamentales de un retraso espacial o de un error espacial
discutidos extensamente. en el capítulo 3 que, por ahora, debería ser familiar para
el lector. En la siguiente sección, comenzaremos a presentar algunos modelos de
elección binaria aespaciales que formarán la base de las especificaciones espaciales
que se analizarán más adelante en este capítulo.

4.2.2 Los modelos a-espacial logit y probit


Comencemos considerando el siguiente modelo de regresión lineal:

y •Xser
= + (4.9)

donde y• es una variable continua a la que asociamos una variable binaria


definida como y Iy = ( 0) • > con I(.) la función indicadora tal que ÿÿÿ 0) = ÿ
1 si un > 0
I (a > . La ecuación (4.9) representa sustancialmente la base
ÿ
0 de lo contrario
ÿÿ

modelo de regresión presentado en la sección 1.1, pero expresado ahora en


términos de una variable, y• que no se puede observar (y, por esta razón, se
denomina variable latente ), mientras que la única variable observable y puede
tomar el valor 1 (por ejemplo, presencia) o 0 (por ejemplo, ausencia). En la
ecuación (4.9), la variable no observada y• puede considerarse como una utilidad:
cuando la utilidad es positiva, el evento económico se materializa (por ejemplo,
una compra en la elección del consumidor). En este nuevo escenario, la ecuación
(4.9) se denomina regresión latente, mientras que el término Xb se denomina
función de índice (Greene, 2011). De los supuestos anteriores y de la Ecuación (4.9) tenemos:

Py( =1
X Py ( PX X • > 0 )= ( )
)= X
yo yo
ser>
metro
i
(4.10)
( mi < FX i b
( =PXX fd )= i
=
b )mm ÿ ()
ÿÿ

similar:

Py( =0
X Py)= X
yo yo
( 0PX () • <
)= X ser<
metro
i
(4.11)
= PXX
( FX b
i
>i )=1
mi
ÿ

( segundo )
=1
ÿÿ (milímetro
f.d. )
ÿÿ
Machine Translated by Google

Otros temas de econometría espacial 113

En las expresiones anteriores F es la función de distribución de probabilidad acumulada de


las perturbaciones, f fX = ( ) b , la función de densidad asociada
ÿÿ

ÿF ÿÿ

=
ÿÿ

tal que ÿ

f y mb = X el componente sistemático de la
ÿ ÿX ÿÿÿ

i ÿ segundo

modelo. Se pueden definir diferentes modelos especificando diferentes funciones de


distribución acumulativa en las expresiones anteriores. En particular, dos especificaciones
son muy populares en la literatura econométrica, lo que lleva a dos modelos de elección
binaria diferentes: (i) la logística estandarizada 2

distribución con valor esperado cero y varianza p y (ii) el 3


distribución normal estandarizada. Dado que el valor de lo dicotómico
La variable y depende únicamente del signo de y• y no de su valor absoluto, no se ve afectada
por la cantidad de la varianza del error por lo que no es una limitación para estandarizarla a
1. Si asumimos la hipótesis de una distribución logística para las perturbaciones (con función
de distribución de probabilidad acumulada, por ejemplo, ÿ) las ecuaciones (4.10) y (4.11)
definen el llamado modelo Logit. Por el contrario, si especificamos que las innovaciones se
distribuyen normalmente (con una función de distribución acumulativa, por ejemplo, ÿ), las
ecuaciones (4.10) y (4.11) definen el modelo Probit. Aunque se han sugerido otros modelos,
los modelos Logit y Probit son, con mucho, los marcos más utilizados en econometría
(Greene, 2011).

Un método de estimación popular para los modelos (4.10) y (4.11) se basa en la estrategia
de Máxima Verosimilitud que ahora se describirá brevemente.
En primer lugar, considere que, dado que la variable dependiente es binaria,
podemos construir una función de verosimilitud considerando la probabilidad de
extraer una muestra aleatoria de tamaño n de una distribución de Bernoulli, lo que lleva a:

( b) = ( = ) = 1( = )...1(,...,
= L PY=
nn y Y y X PY y X PY
1 y X1) norte norte
(4.12)

debido a la independencia y, dadas las definiciones (4.10) y (4.11):

L ( )= ÿ
bb bb ÿ ÿ ÿÿ()i ()
efectos especiales Efectos
1 ÿ

ÿ
i (4.13)
yi =1 yi =0

donde ÿyi =1 representa el producto de todos los valores de y tal que yi = 1 y de manera similar para ÿyi =0.

La ecuación (4.13) se puede reescribir como:

norte

LX FX ) = ÿ ÿ ( )( yi [1 )] bb b yi 1
ÿ

( (4.14)
ÿ

efectos especiales
ÿ

i i
yo = 1
yi =0
Machine Translated by Google

114 Introducción a la econometría espacial

y en consecuencia la log-verosimilitud como:

norte

ÿ ( y{ FX
[L) ÿ ÿÿ] l ( ) = ln ( ) = ln bb b +(1 )ln 1 ii i ÿ i FX( y segundo )
ÿ

ÿ
} (4.15)
i =1

Aparte de algunos casos prácticamente irrelevantes, la ecuación (4.15) no es


lineal y no puede maximizarse analíticamente, por lo que debe identificarse
una solución numérica. Para obtener la solución de máxima verosimilitud,
consideremos la función de puntuación:

ÿ
norte

Fi
ÿ

ÿ yfyoÿ
ÿ ÿ segundo ( ) = +(1 ) l yx
i ÿ yo= 0 (4.16)
ÿ

segundo 1
ÿÿ
yo = 1
yo
_ ÿ ÿFyo

En particular, si asumimos que los errores se distribuyen de acuerdo con la


distribución logística , para las funciones de puntuación tenemos (Greene, 2011):

ÿ
norte

( ()=
yX ÿ lsegundo
segundo ÿ ÿÿ
yo ii ) =0 (4.17)
i =1

con = ( ÿ) ÿ yo Xbi . En este caso la segunda derivada es igual a:

ÿ2
norte

T
2 yob (ÿÿ
)=ÿÿ i (1 ) XX
yo ii (4.18)
ÿ
segundo i =1

y la expresión se puede utilizar en la estimación de intervalos de confianza y


pruebas de hipótesis.
Por el contrario, bajo la hipótesis de innovaciones normalmente distribuidas,
tenemos que la función puntuación es igual a:

ÿ ÿÿ
ÿ ÿ
ÿ

i i
XX
( b)==0
l i + i (4.19)
ÿ b ÿÿ yo 1 yo
yyo=0 yi =1 _

con = ( ) ÿ ÿ yo X b
i , la función de densidad normal estándar tal que
ÿ ÿ ( t)
ÿ = mientras que, en este caso, la segunda derivada es:
ÿt

ÿ2
norte

T
( )=
segundo
kk ÿÿ ( 2
lb i i i ii )+
XXX (4.20)
ÿ
segundo i =1
Machine Translated by Google

Otros temas de econometría espacial 115

T
ÿ (2 i1)ii (2yX
yÿ 1) ÿ
ÿ ÿ

segundo ÿ

con k =
yo . Cabe señalar que, tanto en
ÿ ÿ 1)
ÿ ÿy (2
Yob
ÿ

X i ÿ

ÿ en el caso de los modelos Logit y Probit, la interpretación de los parámetros no es tan sencilla
como en el caso del modelo de regresión lineal (a-espacial). En este caso, de hecho, el efecto
marginal de un aumento unitario de las variables independientes sobre la variable dependiente
binaria no es simplemente el coeficiente de regresión ÿ, sino que asume el valor:

ÿ EyX
( ) = (4.21)
bb( ) f X
ÿX

Entonces, para el modelo Logit el efecto marginal es igual a:

EyX
()ÿ
= ÿ ( X b 1 ÿ ÿÿ ÿ ) ( X bbÿ )ÿ
(4.22)
ÿX

mientras que para el modelo Probit es:

ÿ (EyX
)
= (ÿX )
cama y desayuno (4.23)
ÿX

Para juzgar la importancia de las estimaciones de los parámetros, la mayoría de las herramientas
discutidas en un marco de regresión lineal todavía están disponibles. En particular, al probar la
importancia de las estimaciones de un solo parámetro, podemos usar la prueba t (empleando
los errores estándar derivados de la matriz de información (4.18) o (4.20)) o la aproximación de
puntajes z, explotando la propiedad de normalidad asintótica de los estimadores ML .

Además, también están disponibles todas las pruebas basadas en la probabilidad (como la prueba de
razón de verosimilitud, la prueba de Wald y el multiplicador de Lagrange) discutidas en la sección 1.1.
Finalmente, para medir el grado de ajuste del modelo a los datos observados, mientras que el
criterio R2 obviamente no está disponible (al estar basado en la descomposición de la varianza
de la variable y que ahora es binaria), aún podemos usar el AIC y Criterios BIC (ver Ecuaciones
(1.27) y (1.28)).

Ejemplo 4.2 Explicación de los precios de las casas de lujo en Baltimore

Para ilustrar los modelos de elecciones discretas descritos en esta sección, examinemos un
conjunto de datos (preparados por Anselin y originalmente disponibles
Machine Translated by Google

116 Introducción a la econometría espacial

por Dubin, 1992) sobre el precio de la vivienda y una serie de variables relacionadas
con su valor observadas en 211 localidades de Baltimore. Los datos se pueden
descargar desde R usando el comando data(baltimore) como se ilustra en la Sección
2.3.5. El conjunto de datos también contiene las coordenadas X, Y de las casas. El
mapa de su ubicación se muestra en la siguiente figura.

580

560

540

520

860 880 900 920 940 960 980


baltimore$X

El conjunto de datos contiene las siguientes variables: precio de la casa (PRICE),


número de habitaciones (NROOM), número de baños (NBATH), edad de construcción
(AGE), pies cuadrados (SQFT) y otras variables cualitativas relacionadas con la
presencia o ausencia de características importantes (como, por ejemplo, chimenea,
patio, aire acondicionado, garaje, etc.). Para nuestros propósitos, transformamos la
variable precio en una variable binaria que clasifica una casa como “cara” si su precio
es superior a $40 000. Nuestro modelo se construye con el propósito de probar si las
variables NROOM, NBATH, AGE y SQFT tienen una influencia significativa en la
clasificación de una casa como cara. En otras palabras, queremos probar
Machine Translated by Google

Otros temas de econometría espacial 117

si la utilidad derivada de comprar una casa cara puede explicarse por estas
características. Consideraremos las especificaciones Logit y Probit del
modelo. Los resultados de las estimaciones de ML se muestran a continuación.

registro probit

Interceptar –3,78782 (0,000201***) 0,52624 –2,162195 (0,000136***)


SALA N (0,023392*) 0,56735 (0,106308) 0,252867 (0,048217*)
NBATH –0,05183 (1,97e–05***) 0,10725 0.365626 ( 0.072704)
EDAD (0,002539**) 226,63 –0,021129 (0,000775***)
pies cuadrados 0,057961 (0,003452**)
AIC 232.45

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

Los dos modelos obviamente conducen a diferentes estimaciones de los parámetros,


sin embargo, las conclusiones inferenciales son muy similares: la EDAD y la
dimensión de la casa (SQFT) son los factores más significativos para explicar la
clasificación de una casa cara, seguida por el número de habitaciones (NROOM)
mientras que el número de baños (NBATH) parece ser menos relevante. Aunque
diferentes en los valores absolutos, el signo de los parámetros es siempre el mismo
en las especificaciones de los dos modelos y están en la dirección esperada. Los
valores de AIC también son comparables con solo una ligera ventaja relativa en el modelo Probit.

4.2.3 El modelo probit espacial


4.2.3.1 Generalidades

Cuando observamos datos espaciales, los modelos binarios analizados


en la sección anterior deben adaptarse para tener en cuenta la dependencia
espacial. En la literatura de econometría espacial, la especificación Probit
es ciertamente más popular que la versión Logit, debido también a una
severa crítica hecha por Anselin (2002), quien notó que en la versión
espacial Logit el término de error es analíticamente intratable. Por otro
lado, Smirnov (2010) notó que el Probit espacial presenta la limitación de
que no puede extenderse fácilmente a más de dos alternativas (Probit
multivariante, ver Greene, 2011). Un modelo que es particularmente
popular en la literatura de econometría espacial es el modelo Spatial Lag
Probit que se puede expresar a través de la ecuación:
• • lby
u = ++ Wy Z (4.24)

con y Iy = ( 0) • .>. . (0,


, umatriz
X iidN
ÿ
de nn , ) usual (como sea que se defina),
IWponderación
la
y• un vector n-por-1 de la variable continua no observable, l el coeficiente
autorregresivo espacial, y el observado
Machine Translated by Google

118 Introducción a la econometría espacial

variable binaria y Z la matriz de regresores, tanto actual como spa [ ] ). Como


ya ,se
1 para evitar problemas denotó
identificación
(ZXen
WX la =sección
la varianza
sin pérdida
anterior,
delde
error
potencialmente
generalidades.
2 ÿu se normaliza
rezagada,
En el a
caso descrito, por analogía condependientes
variables el caso del modelo Spatial
continuas Lag para
descritas lassección
en la
3.5, surge un problema de endogeneidad en el sentido de que el valor retrasado
espacialmente de y• está correlacionado con las perturbaciones estocásticas
en la ecuación (4.24), sin embargo, este no es el único problema de estimación.

De hecho, cuando se estiman sobre observaciones espacialmente dependientes,


los estimadores ML estándar también son inconsistentes debido a la
heteroscedasticidad inducida por la dependencia espacial (Case, 1992; Pinkse y Slade, 1998).
Además, también observamos ineficiencia como consecuencia de que
descuidamos la información contenida en los términos fuera de la diagonal
de la matriz de varianzas-covarianzas no esféricas (Fleming, 2004). El
modelo (4.24) se expresa en la denominada forma estructural (Fleming,
2004). Bajo el supuesto habitual de que todos los elementos de la diagonal
de W son cero y que l < 1, también se puede expresar en forma reducida como sigue:
• IWZ tu () +1)=(
11 ) b IWZIW uZ *ser
+ (4.25)
y +( )=
ÿ ÿ ÿ

yo yo
ÿ ÿÿ

=( libras

con mi
) ÿ1 MVN(0,
Yo Wu ÿ
=( yo
ÿ

* que ÿcomo
y mi ÿ ) y ) ÿ ZI WZ =( ÿ l . Dado
expresa se 1
proceso
un
autorregresivo espacial, tenemos que, a partir de los resultados presentados
en la sección 3.5.2.
ÿ

1
T TE
ee(IWIW
ÿ

)= = ll ÿÿ (ÿ
ÿ )(
ÿ

) (4.26)
ÿ ÿÿ

En el modelo Probit a-espacial describimos la probabilidad ( = 1) P yi


metro i

a través de la integralPy( =
i 1) = (
FZ ) =y
i mm ÿm fdb
=((I) – lW) y• – Zi b
ÿÿ

y de manera similar para ( = 0) P yi (véanse las Ecuaciones (4.10) y (4.11)) y


estas expresiones definen la probabilidad de la observación única. De manera
similar, en un modelo Probit espacial, podemos definir la probabilidad de una
sola observación como:

Py( =i 1) = ( 0Py Zi• >


wy *,
iij yo

)

= Pz *ser
( + 0yo i
> , , i• )
Z i*wy (4.27)
PAGS
ÿ ÿ iji= ( eb ÿÿ i*Z, ,) ( i•
Z i*Zwy *b )
i

Se puede derivar una expresión similar para P(yi = 0). La aproximación


en la expresión anterior se debe a la presencia de heterocedasticidad
Machine Translated by Google

Otros temas de econometría espacial 119

que hay que tener debidamente en cuenta. De hecho, generalizando el resultado obtenido
para el modelo Probit a-espacial (ver Ecuación (4.10)), en este caso tenemos:

ÿ
*b ÿ

i
Py( z=1
wy•
*
)= ÿÿi ij, i
yoz ÿ

ÿ
ÿ

ÿ
(4.28)
ÿ ÿ ÿÿ
ÿ ÿ yo

donde ÿii es el i-ésimo elemento diagonal de la matriz de varianzas-covarianzas (4.26).


Entonces, incluso si los términos de error u son homecedásticos, los términos de error
transformados e son heteroscedásticos.
En el modelo Probit a-espacial, aprovechando la independencia, las probabilidades
marginales se combinan multiplicativamente en la función de verosimilitud (4.13). Sin
embargo, en el contexto espacial esta simplificación no es posible y, para construir la
probabilidad, tenemos que evaluar simultáneamente las probabilidades conjuntas en cada
ubicación:

( =11, = 1,...,
2 = 1); Py yy norte
yo0;1
{ } y= (4.29)

En principio esta probabilidad debería evaluarse a través de la integral n-dimensional:

mmm
1 2 norte

( =11, = 1,...,
2 = 1;) = Py y yn ÿÿ ÿ... ÿd(milímetro
) (4.30)
ÿÿ ÿÿ ÿÿ

con ÿ( ) m ahora representando la función de densidad de la n-dimensional


Distribución Normal multivariada expresada por:

ÿ
norte
1 ÿ

( ) = (2 ) ÿpag
metro ( Tÿ ÿ
2 ÿ ÿ ÿÿ ÿ exp mm ) (4.31)
2 ÿÿÿ

Sin embargo, no existe una solución analítica para una función de distribución de probabilidad
normal univariante y el problema se vuelve aún más grave en el caso multivariante. Dado
que la integral múltiple contenida en la Ecuación (4.30) no puede evaluarse analíticamente,
la única solución es obtener aproximaciones numéricas.

Como problema adicional, la presencia de dependencia espacial también introduce


problemas en la interpretación de los efectos marginales que en este caso para la i-ésima
observación es:

(, ) Z yo j•
ÿ EyXwy ÿ
* *
yoÿ yo
bb ÿ

= ÿ ÿ

(4.31)
ÿX
ÿ

ÿ ÿÿ
i ÿ ÿ ÿ ÿÿ ÿ mi,yo ÿ ii

la notación ahora obvia, hemos establecido ÿ *


i ÿ =( IW
segundo lb .- donde,
) 1
ÿ

con i
ÿ ÿ ii
Machine Translated by Google

120 Introducción a la econometría espacial

Como se ha dicho, existen dos problemas principales al definir una estrategia de estimación
óptima: un problema de endogeneidad y un problema de no esfericidad (tanto en forma de
autocorrelación como de heteroscedasticidad) de la matriz de varianza-covarianza. En la
literatura, se propusieron varias alternativas basadas en probabilidades y momentos, a partir
de las primeras contribuciones de McMillen (1992), Pinkse y Slade (1998) y Klier y McMillen
(2008), entre otros (ver Fleming, 2004 para una revisión). ). En particular, aquí discutiremos
las siguientes estrategias de estimación:

(i) Máxima verosimilitud (ML), (ii) Método


Generalizado de Momentos (GMM), y
(iii) Una versión linealizada del GMM (LGMM)

No se puede encontrar analíticamente un estimador de máxima verosimilitud, mientras que los


procedimientos numéricos pueden ser computacionalmente muy exigentes.
El enfoque GMM reduce, pero no elimina por completo, los problemas de cálculo, especialmente
cuando se trata de conjuntos de datos muy grandes. Su versión linealizada representa un
compromiso entre precisión y eficiencia computacional.

4.2.3.2 Estimación de Máxima Verosimilitud

En el modelo Probit a-espacial estándar, los estimadores de máxima verosimilitud se pueden


derivar maximizando la Ecuación (4.15), un procedimiento que requiere optimización numérica
debido al alto grado de no linealidad en los parámetros. Sin embargo, si consideramos datos
espaciales, al asumir erróneamente errores independientes, la maximización de la función de
verosimilitud produce estimadores que aún son consistentes, pero que ya no son eficientes
debido al hecho de que ignoran la información contenida en los términos fuera de la diagonal
de la varianza. Matriz de covarianza. A partir de la Ecuación (4.15), considerando la hipótesis
de perturbación normal y la especificación del Rezago espacial expresada en la Ecuación
(4.24), la función log-verosimilitud Probit espacial para una muestra de dimensión n se puede
expresar como:

ÿ • T ÿ

víaij jZ +
norte

ÿ yo
ÿ
ÿ
norte

i segundo ÿ


ÿ
ÿ

y i en ÿÿ
yo = 1 ÿ

l (Zazul
, Wy , )= ÿ
ÿ

ÿ ii
ÿ
ÿ

ÿ ÿ

yo = 1
ÿ ÿ
(4.32)
ÿ •
ÿ ÿ

l víayoZj +
norte
ÿÿ ÿ
norte

Yo
segundo ÿ

yo = 1 ÿ

+ (1
ÿ ÿ ÿÿ ÿ y i ) en 1 ÿ
ÿ

ÿ ii
ÿ
ÿ

ÿ ÿ

yo = 1
ÿ ÿ
Machine Translated by Google

Otros temas de econometría espacial 121

El término y• no es observable y, por tanto, para derivar una función de verosimilitud operativa,
tenemos que explotar la forma reducida del modelo.
Usando (4.25), la función logarítmica de verosimilitud se puede reescribir como:

norte ÿÿZ *T norte ÿ


Z *T ÿ


ÿ
yo b ÿ ÿ
segundo
ÿ

( bll
Wy, Z , i ln ÿ+ ÿÿ
(1 ÿ)lnyo1 ÿ ÿ
= ÿ) y ÿ yi (4.33)
yo = 1 ÿÿ ÿ yo yo = 1 yo ÿ

La expresión (4.33) tiene una estructura complicada que crea problemas de cálculo en la fase de
maximización numérica. Para maximizar tal expresión, McMillen (1992) sugirió el uso del algoritmo
EM . El algoritmo EM (introducido por primera vez por Dempster et al., 1977) es un procedimiento
iterativo que se desarrolla en dos pasos: un paso E (expectativa) y un paso M (maximización). El
paso E consiste en calcular la expectativa de la probabilidad utilizando un valor inicial para los
parámetros desconocidos. El paso M consiste en maximizar la probabilidad esperada encontrada
en el paso E con respecto a los parámetros desconocidos. Los dos pasos se repiten hasta que los
parámetros convergen en una solución estable, que puede demostrarse que coincide con los
estimadores ML de la verosimilitud original. McMillen (1992) sugirió generalizar el algoritmo EM al
caso espacial, reemplazando la variable binaria con la expectativa de la variable latente subyacente
y maximizar la expectativa del log-verosimilitud como si la variable artificial fuera la variable latente
real. En particular, en el caso del modelo Spatial Lag Probit (4.25), el valor esperado puede derivarse
como:

ÿ
Z *b ÿ
ÿ

ÿ ÿ ÿ iÿ ÿ ÿ ii
ÿ

ÿ
ÿ

• * ÿÿÿ
( i ZE yo >ÿ ii iZ b ) +
Oye i = 1) = + ( segundo
ÿ
yo
(4.34)
Z *b ÿ
ÿ

i
ÿ

ÿÿ ÿ

ÿÿ ÿ ÿ ii ÿ

ÿÿ

El valor esperado y• i así obtenido se puede utilizar en un M-paso donde se maximiza la


siguiente verosimilitud logarítmica:

1 1 ( ) en
l = porque T
t ÿ ÿÿ mm 2 2 (4.35)

1 =(en
I b,
Wy Z=(esta
ÿ•) (ml
)ˆ T
elEn
, expresión, última
ÿÿ ÿ IW IW
ÿ ÿ

ÿ ) y yˆ• es el vector de los valores predichos yode la variable latente


yo derivada E-step. i

El uso del enfoque EM presenta dos problemas principales. En primer lugar, la matriz de varianza-
covarianza ÿ que está presente en la Ecuación (4.35) es
Machine Translated by Google

122 Introducción a la econometría espacial

desconocido y necesita ser estimado apropiadamente. Al respecto, McMillen (1992) sugirió


interpretar el modelo Probit como un modelo de mínimos cuadrados ponderados no lineal
condicionado al parámetro espacial (Amemiya, 1985), pero desafortunadamente este enfoque
conduce a estimadores sesgados (Fleming, 2004). En segundo lugar, el proceso de
estimación puede ser muy lento porque el enfoque requiere el cálculo del determinante de la
matriz ÿ en cada iteración del paso M hasta que el proceso converge.

Esta operación no solo puede ser muy pesada desde el punto de vista computacional, sino
que el cálculo del determinante se basa en aproximaciones que pueden volverse inexactas
cuando n es grande y W denso, es decir, contiene una gran cantidad de entradas distintas
de cero.

4.2.3.3 Método Generalizado de Estimación de Momentos

Pinkse y Slade (1998) introdujeron un método de estimación alternativo para una versión
espacial de un modelo de elección binaria, quienes desarrollaron una técnica GMM para un
modelo Probit expresado en forma de error espacial con heterocedasticidad.

Considere el siguiente modelo expresado en forma de variable latente

= • b yZu + (4.36)

tu Wu
r =+ mi (4.37)

Z iid NI. .ÿ 2
con mi
(0, ) ÿe . Similar al modelo (4.24), las ecuaciones (4.36) y (4.37) se
pueden escribir en forma reducida como:

• ÿ

1
yZ IW = +( ) b re (4.38)
ÿ

1 T
donde u MVN = (0, ) ÿ (ver sección 3.4) y (ver Ecuación IW=(
ÿ ) ÿÿ ÿr IW ( r ) 1
ÿ

3.15). Usando la Ecuación (4.15), el modelo Probit de error espacial conduce a la siguiente
función de verosimilitud logarítmica:

norte

y FX [L] ÿ ( l br br ( , ) = ln ( , ) = { b ) ÿ ÿÿ ln +(1
ii i ÿ)ln
i 1 FX( y segundo
) ÿ
(4.39)
ÿ }
i =1

que, en el caso de la distribución normal (modelo Probit) y, utilizando la expresión (4.28) se


puede escribir como:

norte ÿ T ÿ norte ÿ T ÿ

z yo z

ÿ ÿ
ÿ ÿ ÿ ÿ
segundo segundo

Z( brl
,
Wy , )= yo en ÿ y yo + (1 ÿ ÿÿy yo ) en 1 (4.40)
yo = 1 ÿ ÿ ÿyo yo = 1 ÿÿ yo ÿ
Machine Translated by Google

Otros temas de econometría espacial 123

Dado que la noción tradicional de perturbaciones en este nuevo contexto no tiene sentido,

introduzcamos ahora la noción de errores generalizados que, en el contexto de un modelo Probit, se


puede definir como:

ÿÿ

ÿÿ
z iT segundo
ÿ
ÿ

ÿ
ÿ
ÿ

ÿ ÿ
T
ÿ

"
ÿ z
ÿ ÿ
ÿ

ÿ segundo
ÿ
yo
ÿ
yo ÿ
tu
yo ( ÿ) = ÿ ÿÿÿ ÿ y yo ÿ ÿÿ
ÿ ÿ (4.41)
ÿ ÿ ÿÿ zÿÿiT ÿ ÿ 1
ÿ

ÿ ÿ ÿ
ÿ
i
ÿ

b Tz _ b
ÿ ÿ ÿ ÿ

ÿ ÿ ÿ ÿÿÿ ÿ ÿÿ ÿ
ÿ ÿ
i ÿ

ÿÿ ÿÿÿ
yo ÿ ÿÿ ÿ yo

Consideremos además un conjunto de k instrumentos cuyas observaciones están ordenadas en una

matriz H de n por k . Los instrumentos son exógenos por definición, lo que sugiere la condición de
momentos:

) =(0 T EH tu" (4.42)

o, para la única i-ésima condición

ÿ zzÿT
ÿ

ÿ ÿÿ ÿ
ÿ ÿbÿ ii ÿ = 0
T
ÿÿ ÿ
b
ÿÿ ÿÿ ÿÿ ÿi y ÿ
ÿÿ ÿ
yo ÿ ÿÿÿÿ
ÿ
ÿ

ÿ
ÿÿÿ
i
mi hola ÿ ÿ (4.43)
ÿÿz yoTÿÿ ÿ T ÿ
ÿ
bz ÿ ÿ
i b ÿ

ÿ ÿÿ1 ÿ ÿ
ÿ ÿÿ ÿÿÿ ÿ ÿ
ÿÿÿ
ÿÿ ÿÿ yo ÿ ÿÿ yo
ÿÿ

donde hi indica la i-ésima fila de una matriz de instrumentos H. Finalmente, usando la muestra
análoga a la Ecuación (4.43), tenemos el siguiente conjunto de condiciones:

ÿ ÿ

ÿ ÿ zÿÿT ÿ T
ÿ
yo
bz i ÿ ÿ ÿÿ b ÿÿ ÿ ÿ

ÿy i ÿÿ ÿÿÿÿÿ
ÿ
1
norte ÿ

ÿ ÿ
yo i
metro
( hermano
, )= ÿ hi
ÿÿÿ

ÿÿz iTÿÿ segundo ÿ ÿTz _


ÿ
ÿ
ÿ
ÿ
(4.44)
i b
norte
yo = 1 ÿ ÿ

ÿ ÿÿ1 ÿ ÿ
ÿ ÿÿÿ
ÿ
ÿ
ÿÿ ÿÿ ÿ yoÿ i ÿÿ

En un procedimiento GMM el número de condiciones de momentos es mayor que el número de


parámetros a estimar, por lo que los estimadores son las soluciones al problema de minimización:

1
metro
( , ) metro
br ( , ) T= -min
br (4.45)

Siendo M una matriz definida positiva que define los pesos asignados a cada momento muestral m(,)
br . Pinkse y Slade (1998) prueban la consistencia y la normalidad asintótica del procedimiento GMM
y derivan
Machine Translated by Google

124 Introducción a la econometría espacial

la matriz de varianza-covarianza de los estimadores desarrollada dentro


de un marco de Newey y West (1987).
El estimador GMM nos presenta dos grandes ventajas con respecto al
procedimiento de Máxima Verosimilitud ilustrado en el apartado 5.2.3.2. En
primer lugar, no se basa en el supuesto de normalidad de las perturbaciones.
En segundo lugar, no requiere calcular el determinante y el inverso de
matrices de dimensión n-by-n. Sin embargo, la expresión (4.45) no se puede
calcular de forma analítica y, por lo tanto, el estimador GMM solo se puede
identificar resolviendo numéricamente el problema de minimización. Esto
requiere la evaluación de la matriz de varianza-covarianza ÿ repetidamente
para cada valor candidato del parámetro r en una búsqueda numérica y
esta operación puede ser un desafío computacional debido a la forma compleja de ÿ.

4.2.3.4 Una versión linealizada del GMM


Para superar las dificultades computacionales relacionadas tanto con el ML
y los enfoques GMM , más recientemente Klier y McMillen (2008)
propusieron una versión linealizada del enfoque GMM de Pinkse y Slade
que evita el problema de invertir matrices n-by-n . El artículo aplica la
metodología a la estimación de un modelo Logit espacial, en lugar del
modelo Probit considerado por Pinkse y Slade (1998). Los autores parten
de la consideración de que un modelo espacial es siempre una
aproximación ya que generalmente se desconoce la verdadera estructura
de dependencia de las perturbaciones. Por lo tanto, sugieren hacer
explícita la aproximación y linealizar el modelo no lineal expandiéndolo
alrededor de un punto de partida razonable. Este procedimiento se describirá ahora.
Considere, para comenzar, el modelo Spatial Lag Logit:

• lby Wy Z
u•= ++ (4.46)

u X iid
ÿ .Logistic
2 con expresado . . en forma
(0, reducida:
) oYo ÿun n

u•IWZIW
=( uZ b )1 (11+* )=(
yo
ÿ ÿÿ

lb +() y IWZ
ÿ

yo )=+
ÿ

ser (4.47)

como en (4.25). En (4.47) tenemos que los errores transformados ya no son ˆˆ

homocedástico tal que Var( )= ei i2ÿ o en notación matricial ( )= Var ÿ ÿT e


con ÿˆ una matriz diagonal tal que:

ÿ 1 0 00 0 ÿ

ÿÿ0 ÿ 2 0
ˆ
ÿ =
(4.48)

00ÿ ÿ norte

ÿ
Machine Translated by Google

Otros temas de econometría espacial 125

Definamos ahora la probabilidad de éxito como:

**
Exp( Z i b )
= ( = 1)1= 1+
Pi Py
exp( Z i** segundo )
(4.49)

debido a la hipótesis de que los errores se distribuyen de acuerdo con la ley logística y con Z**
representando la variable Z transformada como en la Ecuación (4.25) (es decir ) ÿ ÿ l ZI WZ =( ),
*
pero también normalizada a las varianzas heteroscedásticas como
1
ˆ
ZZ**
= ÿÿ . * 1

En esta nueva configuración, los residuos Logit generalizados se pueden definir


simplemente como:

=ÿ
uyP "yo ii (4.50)

Klier y McMillen (2008) sugieren un procedimiento GMM que se desarrolla a lo largo de los
siguientes pasos:

Paso 1: Asuma un valor inicial para el vector de parámetros, digamos ÿ =


llame a estos valores iniciales = ,) bl ÿ0 00 ( ) , ( ) bl y

Paso 2: Use estos valores iniciales en la Ecuación (4.49) y calcule a través de ellos los residuos
generalizados dados por la
"
Ecuación (4.50). Llame a estos residuos generalizados u yP
= i 0

i0
ÿ

yo

Paso 3: Calcular los términos de gradiente definidos como:

ÿ 0
Gÿ0 =
Pidÿ0

Paso 4: Regresión de los valores así obtenidos de Gd0 en un conjunto de instrumentos,


digamos H, definida como

HIW=(WZ ) ÿ ÿ yo 1 **

llamemos GRAMO
0_ las estimaciones de los gradientes así obtenidos.

Paso 5: Construya las nuevas estimaciones de los parámetros utilizando la expresión


de actualización

ˆˆ ˆ
"
T 1 T 0
ÿ ÿ (=1+ 0 00 0) GG
ÿ

Gu
Machine Translated by Google

126 Introducción a la econometría espacial

En su contribución, Klier y McMillen (2008) derivan las expresiones explícitas para los gradientes
de b y l, dadas por:

GP PZ
= (1
ÿ

) ** (4.51)
bi yo ii

Z
i
**b ÿ

GP PH ii
= (1 ÿ ÿ ÿÿ ÿ ) ÿb ÿ

(4.52)
yo
i i 2 yo
ÿ
i ÿ

1
1 =(IW
l ) WI W ) (
ÿ ÿ

yo
con ÿii el i-ésimo elemento diagonal de la matriz ÿÿ ÿ
( IW ÿEl) ÿ l 1 .
procedimiento GMM descrito anteriormente todavía es computacionalmente pesado debido
al hecho de que cada paso de la iteración requiere la inversión de la matriz . Por esta razón, en
el mismo artículo, Klier ) ÿ l 1 alrededor
( IWyÿMcMillen (2008) dan
delunpunto
pasodemás y proponen
partida linealizar
l0 = 0. En el modelo
este punto de partida,
de hecho, no es necesario invertir ninguna matriz porque . Habiendo hecho tales supuestos ÿ l
( )= IW I , los términos del gradiente se simplifican sustancialmente. De hecho, expandiendo ( )
ÿ0 00 , bl y analizando el error generalizado alrededor de 1
delas
la estimaciones
expansión,
en el iniciales
tenemos:
primer deteniéndonos
término lineal
ÿ

" "
0 uuG ( ÿ +
0)
i ÿÿÿ (4.53)
i

Ahora defina los errores generalizados transformados:


"
ÿ =ii +00uG GRAMO
norte ÿ- (4.54)

y deja = M HHT
( - ) 1 . La función objetivo a minimizar se convierte en:

norte TTT (HHHH ) norte


(4.55)

De esta forma, no se requiere inversión de la matriz y el procedimiento se


reduce a una estimación logit espacial seguida de un procedimiento de mínimos
cuadrados en dos etapas.
Si la verdadera estructura del modelo es capturada por el modelo (4.46) y (4.47), Klier y
McMillen (2008) muestran que la linealización proporciona estimaciones precisas siempre que
el parámetro l sea pequeño. De hecho, cuando l < 0,5 no hay sesgo, aunque cuando l > 0,5 las
estimaciones están sesgadas al alza. En general, los estimadores obtenidos mediante el modelo
linealizado proporcionan una buena aproximación a la incógnita
Machine Translated by Google

Otros temas de econometría espacial 127

parámetros aunque una cierta pérdida de eficiencia es el precio a pagar por el aumento
del rendimiento computacional.

4.2.3.5 Otras soluciones computacionales


La necesidad de procedimientos computacionalmente eficientes todavía se considera un
tema importante en el modelado de opciones binarias, incluso con las potentes máquinas
informáticas actuales (véase también el capítulo 5). Para reducir la carga computacional,
LeSage y Pace (2009) sugieren el uso de técnicas bayesianas para simular las
probabilidades en un contexto de Cadena de Markov de Monte Carlo (MCMC) . Los
autores informan que el uso de un muestreador Gibbs para estimar un modelo Probit
espacial con solo 2 variables independientes es una operación computacionalmente
intensiva. En un experimento de simulación, LeSage y Pace (2009) informaron que con
un tamaño de muestra de n = 400 y 1200 sorteos del muestreador MCMC (cada uno
repetido m veces en el paso m del procedimiento de Gibbs), los cálculos requirieron 20
minutos para m = 10 y 5 minutos para m = 2. El aumento de tiempo es proporcional a n.
Por lo tanto, si, por ejemplo, el tamaño de la muestra aumenta a n = 10,000, el tiempo
requerido aumenta a 8 horas y 49 minutos. Además, también informan que el tiempo de
cálculo es menos que proporcional a m , por lo que, incluso reduciendo el paso m a,
digamos, m = 1 (a expensas de la precisión), el tiempo sigue siendo 1 hora y 21 minutos,
que no es despreciable. . Por lo tanto, el enfoque se limita a muestras pequeñas porque
no elimina el problema de invertir las matrices W n por n . Beron y Vijverberg (2004)
propusieron otra alternativa basada en el simulador GHK para evaluar la integral de n
dimensiones, pero sin lograr reducir sustancialmente la carga computacional. Wang et
al. (2013) sugieren el uso de una probabilidad bivariada parcial, un enfoque que se
analizará con mayor profundidad en la sección 5.4.

4.2.3.6 Otros modelos espaciales de elección discreta


Además de los modelos binarios simples de elección discreta considerados en esta
sección, en la literatura econométrica encontramos varias otras especificaciones de
modelos de elección discreta, incluidos Probit y Logit bivariados y multivariados, Probit
y Logit ordenados, truncamiento, censura, selección de muestras y modelos para
recuento. datos y duración (ver Greene, 2011). Algunos de estos temas se han tratado
en el contexto espacial (por ejemplo, por Wang y Kockelman, 2009), pero el campo aún
está en gran parte inexplorado.

Ejemplo 4.3 Precios de casas de lujo en Baltimore (continuación)

Volvamos ahora al conjunto de datos considerado en el Ejemplo 4.2 y probemos si hay


efectos espaciales en la clasificación de casas “caras” en
Machine Translated by Google

128 Introducción a la econometría espacial

Baltimore. En la siguiente tabla mostramos los resultados de la estimación de un modelo Probit


espacial utilizando las tres metodologías presentadas en la sección anterior (Máxima Verosimilitud,
GMM y GMM linealizado). En los tres casos, utilizamos una matriz W estandarizada por filas basada
en la distancia umbral mínima y definiendo como vecinos los puntos que se encuentran dentro de

una distancia < 22. Para facilitar la comparación, también mostramos nuevamente los resultados de
la estimación del modelo Probit a-espacial ya considerado en el ejemplo 4.2. Observe que los
modelos espaciales ahora incluyen el parámetro adicional l que captura los efectos debido a la
dependencia espacial en la variable latente.

A-espacial Espacial Espacial Espacial


probit Probit (ML) Probit (GMM) Probit
(linealizado
GMM)

Interceptar –2.162195 –1.02618685 –0.99759055 –1.73088


(0.000136***) (0.0930688) (0.04417*) (0.00163***)
SALA 0.252867 (0.048217*) 0.21958292 0.18258271 0,22432
(0.2186963) (0.1712854) (0,04927*)
NBATH 0.365626 –0.06945085 0.01589953 0.21695
(0.072704) (0.7766100) (0.9363988) (0.27898)
EDAD –0.021129 –0.02364809 –0.02040384 –0.01437
(0.000775***) (0.000***) (0.01461387*) (0.03206*)
pies cuadrados
0,057961 0.04463416 0.04038605 0,04102
(0,003452**) (0.08450417.0) (0.02747669*) (0,04998*)
yo 0,81640265 0,78396376 1,04295
(0,000***) (0,0000014***) (0,00002***)

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

La primera observación es que, sin importar qué método de estimación se seleccione, el parámetro
espacial l siempre es altamente significativo. De la comparación entre los cuatro modelos, surge
también un papel dominante de la variable AGE como factor explicativo, mientras que el papel de
variables como NROOM y SQFT se vuelve menos relevante con respecto a la versión aespacial del
modelo. Este efecto se debe a que gran parte del fenómeno ya se explica por las variaciones
espaciales de la variable latente.

4.3 Modelos de datos de panel espacial (Escrito por Giovanni Millo)


4.3.1 Generalidades

Los paneles espaciales son un caso especial de panel donde los datos se observan en dos
dimensiones: a través de unidades espaciales ya lo largo del tiempo. Los modelos de datos de panel tienen
Machine Translated by Google

Otros temas de econometría espacial 129

generalizarse con la disponibilidad de bases de datos que contengan


múltiples observaciones sobre unidades individuales, por ejemplo, registros
administrativos y de países continuamente actualizados, encuestas nacionales
periódicas y mediciones repetidas de varios fenómenos en diferentes
momentos en el tiempo. Comencemos con el modelo de datos de panel a-
espacial que se puede expresar a través de la siguiente ecuación:

y =+X+ab
eso
eT eso eso (4.56)

En la Ecuación (4.56) el índice i = 1, …n se refiere a individuos (grupos,


países, regiones, etc.), el índice t = 1, …, T es el índice
es undevector
tiempo,
noXit
estocástico de observaciones de las variables independientes en el
individuo i y en el tiempo t, eit el término de innovación tal que ayb son
X iidN. . (0,
mi 2
yo ) ÿ ÿe nn parámetros a estimar . Con respecto a las
especificaciones anteriores de los modelos transversales análogos (ver
capítulo 1), en este contexto preferimos indicar la constante a con un
símbolo diferente por razones que se verán más adelante.
Los conjuntos de datos de panel pueden tener una gran cantidad de unidades
transversales observadas en unos pocos puntos en el tiempo (paneles cortos, típicos
de microdatos), un número limitado de series temporales relativamente largas (paneles
largos o series temporales agrupadas, típicas de datos financieros o macroeconómicos ).
datos), o incluso un comportamiento equilibrado entre las dos dimensiones. El panel
espacial típico se inclina hacia series temporales cortas con grandes dimensiones
espaciales, ya que normalmente consiste en observaciones repetidas sobre una sección
transversal considerable de datos referenciados espacialmente, como países del
mundo, regiones dentro de un país o áreas geográficas. En todos estos casos, la doble
dimensionalidad de los datos de panel permite posibilidades de modelado más ricas
que una sola sección transversal o serie temporal. En particular, los modelos de datos
de panel se utilizan para controlar la heterogeneidad no observada relacionada con las
características invariables en el tiempo específicas de cada individuo que son difíciles
o incluso imposibles de observar, pero que pueden conducir a estimaciones sesgadas
o ineficientes de los parámetros de interés si se omiten. Este tema se introducirá en la siguiente sección

4.3.2 Heterogeneidad no observada y efectos individuales


Para modelar la heterogeneidad individual, a menudo se supone que el término
de error tiene dos componentes separados, uno de los cuales es específico del
individuo y no cambia con el tiempo. Esto se llama el modelo de efectos no
observados . Formalmente podemos expresar este modelo de la siguiente manera:

T T
xu x=+aby
eso +=+
i ++(eso i sobre
i mí eso i eso
) (4.57)
Machine Translated by Google

130 Introducción a la econometría espacial

En la expresión anterior, el error total (o compuesto) uit se descompone en dos


términos. El primer término ( mi ) representa el componente de error individual típico
de la ubicación i, mientras que el segundo término (eit) representa el componente
de error idiosincrático y generalmente se supone que se comporta bien y es
independiente tanto de las variables independientes como del error individual.
componente. El método de estimación adecuado para el modelo (4.57) depende
fundamentalmente de las propiedades de las dos componentes del error. El
componente individual puede estar correlacionado o ser independiente de las
variables independientes. Si está correlacionado, el estimador de mínimos cuadrados
ordinarios (OLS) para b sería inconsistente, por lo que es habitual tratar el ÿi como
un conjunto adicional de n parámetros a estimar, como si en el modelo general
tuviéramos n intersecciones diferentes , digamos ait = ai , constante con respecto
t. En este
a
sentido, se supondrá que el componente de error mi incluye el término de
intersección ai . Este modelo se conoce en la literatura como el modelo de efectos
fijos (o dentro de variables ficticias o de mínimos cuadrados ) y generalmente se
estima utilizando OLS en datos transformados, un procedimiento que garantiza
estimaciones consistentes para b (ver Baltagi, 2008). Por el contrario, si se supone
que el componente mi específico del individuo no está correlacionado con los
regresores, tenemos una situación que en la literatura suele denominarse efectos
aleatorios. En este caso, el error global, uit, tampoco está correlacionado con las
variables independientes, por lo que el criterio OLS conduce a estimadores
consistentes. Sin embargo, el componente de error común sobre los individuos
induce una correlación entre los términos de error compuestos, que es responsable
de una pérdida en la eficiencia del estimador OLS , por lo que tenemos que recurrir
a alguna forma de estimadores factibles de mínimos cuadrados generalizados
(GLS). basado en la estimación de la varianza de los dos componentes del error.
Finalmente, si el componente individual falta por completo, un OLS agrupado
la estimación es el criterio más eficiente para b. Este conjunto de suposiciones
generalmente se etiqueta como modelo de combinación, aunque este término se
refiere más formalmente a las propiedades de los errores y al método de estimación
apropiado asociado que al modelo en sí. La literatura de panel ha considerado
recientemente modelos de regresión de panel con una variable dependiente
retrasada espacialmente o perturbaciones autocorrelacionadas espacialmente,
tanto en el contexto de especificaciones de efectos fijos como aleatorios (Lee y Yu, 2011).
Dedicaremos las próximas secciones de este capítulo a discutir algunas de las
especificaciones más utilizadas y técnicas de estimación relacionadas.

Ejemplo 4.4 Modelo de productividad del capital público de Munnell

El modelo de productividad del capital público de Munnell (1990) expresa el nivel


del Producto Interno Bruto (PIB) en cada estado de los Estados Unidos (excluyendo el
Machine Translated by Google

Otros temas de econometría espacial 131

las “islas” Alaska y Hawái y el distrito de Columbia, para un total de 48 estados; véase el ejemplo
3.2 para el mapa) observado a lo largo de los años entre 1970 y 1986, a través de una función de
producción donde las variables explicativas consideradas son la dotación de capital público
(carreteras, instalaciones de agua y otros servicios, codificados como “pcap”), capital privado
(codificado como “pc”) y empleo (“emp”). La tasa de desempleo ("unemp") se agrega para
representar los efectos del ciclo económico. El modelo se puede expresar formalmente de la
siguiente manera:

Iniciar sesión(
PIB it+ ab
log(
) =pcapit
1 23b4 it ) + log( ) +pclog(
empb ser
it
eso
)+ unemp + eso

En este ejemplo, consideramos un subconjunto de los datos originales que incluye solo las
observaciones entre 1970 y 1974. El conjunto de datos utilizado no se muestra aquí para ser

breve. El modelo original propuesto por Munnell (1990) se estimó usando OLS, que equivale a
agrupar todas las observaciones bajo el supuesto de que no hay componentes individuales. Los
resultados se muestran en la siguiente tabla:

Parámetro Error estándar prueba t valor p

Interceptar 1.2054162 0.1151322 10.4698 < 2.2e–16***


log(pcap) 0.2140447 0.0355133 6.0272 6.405e–09***
log(pc) 0,3421465 0.0212932 16.0684 < 2.2e–16***
log(emp) 0,5113731 0.0261593 19.5484 < 2.2e–16***
unemp 0,0118651 0.0047056 2.5215 0.01235*

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

donde el intercepto y todas las variables consideradas en el modelo son significativas.


Sin embargo, como observaron Baltagi y Pinnoi (1995), los MCO son ineficientes si sospechamos
que los errores muestran un componente aleatorio, y los estimadores de efectos aleatorios pueden
proporcionar mejores estimaciones. Un modelo de efectos aleatorios estimado sobre los mismos
datos proporciona los siguientes resultados:

Parámetro Prueba t de error estándar valor p

Interceptar 1,6794841 0.1961392 8.5627 < 2.2e–16***


log(pcap) 0,0946853 0.0525858 1.8006 0.0717678
log(pc) 0,3411077 0.0424213 8.0409 8.915e–16***
log(emp) 0,6272028 – 0.0377440 16.6173 < 2.2e–16***
componente 0,0100228 0.0026808 – 3,7388 0,0001849***
de varianza desemp 17,5966 4.2466 4.1437 3.418e–05***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0
Machine Translated by Google

132 Introducción a la econometría espacial

Resulta que la importancia del capital público es espuria y desaparece si se


consideran los componentes de error individuales (ver también el Ejemplo 3 en Baltagi, 2008).

4.3.3 Modelos de paneles espaciales con efectos aleatorios


En una especificación de efectos aleatorios, se supone que los efectos individuales no observados
no están correlacionados con las demás variables explicativas del modelo y, por lo tanto, pueden
tratarse con seguridad como componentes del término de error (véase, por ejemplo, Wooldridge,
2002). Dentro de este contexto podemos considerar dos especificaciones alternativas: el modelo de
Error Espacial con efectos aleatorios (SEM-RE) y el denominado modelo KKP por las iniciales de
los autores que originalmente propusieron el método (ver Kapoor et al., 2007). A continuación
trataremos las dos especificaciones.

4.3.3.1 Modelo de error espacial de efectos aleatorios (SEM-RE)

Comencemos asumiendo que la componente del error individual es mi ~ iidN(0, sm 2) y que el


término de error idiosincrático e obedece a una formulación de Error Espacial tal que, en cada
momento de tiempo (t = 1,…, T ), podemos escribir:

ya lo=has +
hecho
Wÿ i (4.58)

1
como en la sección 3.4 y, en consecuencia,
y
eso
=( ) IW ÿ r
ÿ

i . Vamos ahora a introducir

duce el símbolo ÿ (conocido en álgebra matricial como el producto de Kronecker) ÿ ÿ ÿ


11 12
Automóvil club británico ÿ
ÿCC
ÿ CA CA 11 12
tal que si UN = ÿ 11 12 y C = ÿ ÿ ÿ ÿ=ÿ CA
ÿ ÿ21ÿ 22
ÿ ÿ CA CA , entonces
Automóvil club británico
21 22
CC 21 22
ÿÿÿ ÿÿÿ
ÿÿ

ÿ
ca11ca11ca ca 11 12 11 11 21 12 ÿ

ÿ ÿ

ca11ca21ca ca 11 22 21 21 21 22
=
. Además, para simplificar la
ca12ca11ca ca 12 12 22 11 22 12

ÿ
ca12ca21ca ca 12 22 22 21 22 22 ÿ

notación, de ahora en adelante también definamos la matriz B = (In ÿ rW), con In una matriz
identidad de n por n , W la matriz de peso espacial habitual y ÿ
el parámetro de dependencia del error espacial. Entonces, para todo el panel
podemos reescribir el error idiosincrático de forma compacta como:

mi ( B ÿÿ -
= TI )1 (4.59)

con h un vector nT por 1 de las perturbaciones tal que + ( ÿ ÿ


2 nidN . . . (0,
ÿÿ
_ ).

i eso )
Como consecuencia, el término de error compuesto = me se puede escribir de forma compacta interfaz de usuario

como:

=
ui yo ( )( )
Tn T m + BI ÿ ÿ
ÿ1
ÿ (4.60)
Machine Translated by Google

Otros temas de econometría espacial 133

con iT un vector de unos de dimensión T e IT una matriz identidad T-by-T .


= T una
JTiiálgebra
poco Ahora, definamos T como
T matrizlaTmatriz
sencilla, × T dedeunos. Después de un
varianza-covarianza
del error compuesto se puede escribir como:

1
= 2
JI ÿ ÿÿ 2+ÿ yo bb T (4.61)
nT nT tu , ÿ metro
( )(T)ÿnorte ÿ T nn

lo que nos permite derivar la función de verosimilitud para la estimación y


fines de prueba de hipótesis (consulte la sección 5.3.5.1 a continuación).

4.3.3.2 La especificación KKP


Una especificación alternativa para las perturbaciones se consideró en
Kapoor et al. (2007) y es conocido por las siglas KKP. En el documento
citado, los autores suponen que se podría aplicar una estructura de
correlación espacial tanto a los efectos individuales como a los demás componentes del er
Aunque los dos procesos de generación de datos parecen similares, implican
diferentes mecanismos de desbordamiento espacial regidos por una estructura
diferente de la matriz de varianza-covarianza implícita. En este caso, se
supone que el término de= ( perturbación
) + compuesto,
autorregresivo espacialui
deI ÿprimer
m e, sigue
ordenun
deproceso
la
T norte
forma:

V wu
( tu yo r ÿ += ) ÿ (4.62)

con todos los símbolos ya definidos. De ello se deduce que la matriz de


covarianza de varianza del error compuesto u ahora se puede expresar como:

ÿ = (IB)(ÿ ÿÿ ÿ 1
IB ÿ

T
) (4.63)
nT nT tu , T mi T

donde ÿ =
+de2 unÿmodelo
JTIITn 2
es ladematriz
ÿ metro típica dedevarianzas-covarianzas
componente error unidireccional.
mi
ÿÿ
Como Baltagi et al. (2013) observan, el significado económico del SEM-
RE y el que implica el KKP
modelo son muy diferentes. En el primer modelo, solo los componentes que varían en el tiempo
se difunden espacialmente, mientras que en el segundo también los efectos secundarios
espaciales muestran un componente permanente.

4.3.4 Modelos de panel espacial con efectos fijos


Como se observó en la sección 4.3.2, si los efectos individuales no están
correlacionados con las variables independientes, pueden considerarse como un
componente del término de error y tratarse en forma de mínimos cuadrados generalizados.
Por el contrario, si relajamos esta hipótesis, esta estrategia conduce a la
inconsistencia. En este caso tenemos que recurrir a los llamados efectos fijos
Machine Translated by Google

134 Introducción a la econometría espacial

métodos: los efectos individuales tendrán que estimarse o, más frecuentemente,


simplemente eliminarse diferenciando primero los datos, un procedimiento a
menudo llamado reducción del tiempo (Wooldridge, 2002). Desde el punto de vista
del muestreo estadístico, la hipótesis de los efectos aleatorios se considera
consistente con el muestreo de individuos de una población potencialmente infinita,
lo que ha llevado a Elhorst (2009) a descartar su utilidad práctica en contextos
econométricos espaciales, donde el muestreo normalmente se lleva a cabo en un
conjunto fijo de países o regiones. Sin embargo, el enfoque moderno del tema
(remontándose a Mundlak, 1978 y resumido, entre otros, por Wooldridge, 2002),
se centra en las propiedades estadísticas de los efectos individuales que, a pesar
de la terminología tradicional, siempre se consideran variables aleatorias, la
distinción crucial se convierte en si se puede suponer que no están correlacionados
con los regresores o no. Por lo tanto, la distinción entre efectos fijos y aleatorios
debería considerarse mejor como una cuestión empírica. La prueba de Hausman
(1978) es el dispositivo estándar para evaluar la hipótesis de no correlación y, por
lo tanto, de utilizar métodos de efectos aleatorios. En un entorno espacial, Lee y
Yu (2012) dan un tratamiento extenso de este tema.

4.3.5 Estimación

Los modelos de panel espacial, expresados en términos de efectos aleatorios o


fijos, se pueden estimar mediante procedimientos de Máxima Verosimilitud (ML) o
Método Generalizado de Momentos (GMM). En términos generales, ML es más
eficiente siempre que se cumplan todos los supuestos de distribución; también es,
con mucho, el método más intensivo desde el punto de vista computacional, ya
que GMM es mucho más fácil de calcular. Con respecto a ML, los estimadores
GMM también relajan el supuesto de normalidad (una excepción se analiza más
adelante) y, por lo tanto, brindan estimaciones más sólidas. Todas las
especificaciones del modelo discutidas en las secciones 4.3.3 y 4.3.4 se pueden
estimar por cualquier método. Se hace una excepción para la especificación
reportada en la Ecuación (4.60), donde los efectos individuales son independientes
entre individuos. De hecho, la única especificación de efectos aleatorios para la
que se dispone de estimadores GMM está representada por el modelo KKP . En
la siguiente Sección 4.3.5.1 tomamos una perspectiva de ML , mientras que dedicaremos la Secc
alternativa.

4.3.5.1 Estimación de máxima verosimilitud

Los procedimientos estándar desarrollados para la estimación de ML de los


paneles Spatial Lag y Spatial Error se deben a Elhorst (2003). Su enfoque se basa
en una combinación de la técnica de degradación del tiempo familiar de
Machine Translated by Google

Otros temas de econometría espacial 135

datos de panel estándar (Wooldridge, 2002), y con el marco de Máxima


Verosimilitud de Anselin. Los datos se transforman a través de una operativa
denominada time-degrading que consiste en restar la media temporal de cada
observación para eliminar los efectos espaciales individuales. Después de
reducir el tiempo, los estimadores estándar de retraso espacial o error espacial
se pueden aplicar a los datos transformados para que las condiciones de primer
orden se simplifiquen a las de MCO, con un filtro espacial adicional en y en el
caso de retraso espacial. A continuación, ilustraremos por separado los dos
casos de efectos fijos y efectos aleatorios.

Modelo de efectos fijos

Desde un punto de vista computacional, de acuerdo con el marco introducido


por Elhorst (2003), la estimación de efectos fijos de los modelos de panel
espacial se logra como una estimación agrupada de datos degradados en el tiempo.
Comencemos considerando la versión de panel del modelo de Rezago
Espacial descrito en la sección 3.5. En este caso, siguiendo a Elhorst (2003),
para estimar los parámetros necesitamos corregir la verosimilitud del modelo
agrupado agregando un filtrado espacial sobre y usando el filtro TI A ÿ con =( ) ,
AI W ÿl y siendo l , como de costumbre, el parámetro de retraso espacial.
norte

También necesitamos considerar la expresión explícita para el término


determinante de la matriz de filtro espacial TI A ÿ que, en este caso, es igual a |
A| a la potencia de T. La validez de los procedimientos de Elhorst se basa ( )( )
en una = , es
que ÿ ÿ ÿÿ I Ay IA y para cada matriz ÿ, de modo quepropiedad
retrasados
degradar que garantiza
espacialmente
los datos norte norte

equivalente a retrasar espacialmente los datos degradados (ver Mutl y


Pfaffermayr, 2011, y Kapoor et al., 2007).

Se puede obtener un procedimiento de estimación iterativo eficiente en dos pasos


de la siguiente manera. En primer lugar, consideremos el vector de los valores
degradados para X e Y definido como:

yyy "eso
=ÿ
eso i (4.64)

contigo = ÿ t=1
y eso

__ la media de tiempo en la ubicación i y de manera similar para X. Esto


T
La operación tiene el efecto de eliminar el término constante de la regresión.
En segundo lugar, considere los residuos derivados del modelo degradado con
un filtro espacial adicional en y, definido como:

ÿ" =( )Yo
T Ay X ÿ ÿ" "b (4.65)
Machine Translated by Google

136 Introducción a la econometría espacial

En tercer lugar, podemos derivar la probabilidad, concentrada con respecto a b


2 y ÿÿ :

nT nT T
= ln( ) +ÿln|
mi
2
| l const -
ejército de reserva
ÿ

ln( " "ÿ ) ÿ (4.66)


2 2

que se puede maximizar con respecto a l. El valor de l así obtenido se utiliza en


un paso de Mínimos Cuadrados Generalizados, imponiendo las siguientes
condiciones de primer orden:

ˆ "" " ÿ

1 "

b = (T XX XI)Ay T ( ÿ ) (4.67)

""
T
2 = ÿÿ
ÿÿ
(4.68)
nT

De esta forma, obtenemos una nueva expresión para los errores a utilizar en
la Ecuación (4.65). Luego se itera el procedimiento hasta la convergencia.
El procedimiento de Elhorst se puede adaptar fácilmente al modelo de error espacial
especificación. Nuevamente, un procedimiento eficiente de dos pasos se
2
puede basar en concentrar la probabilidad con respecto aÿÿbcomo:
y

nT nT
= ÿ
l const + ln|ÿ|ÿ
2
TB ln( ) ÿ

ln( "T )
"ÿÿ (4.69)
2 2

donde los residuos del modelo degradado ahora se filtran a través de:

"
"

ÿ ÿ"=(b) ÿTI Por X (4.70)

con BI W =( )Entonces,
ÿr. la expresión (4.69) se puede maximizar con respecto a r.
Nuevamente como antes, el valor de r obtenido de la maximización de la Ecuación
(4.69) se usa en un paso de Mínimos Cuadrados Generalizados, imponiendo las
siguientes condiciones de primer orden:

ˆ "" ""
ÿ

1
( T
b = XXXy ) (4.71)
Machine Translated by Google

Otros temas de econometría espacial 137

T
""

2 = ÿÿ
ÿÿ
(4.72)
Nuevo Testamento

obteniendo nuevas expresiones para los errores a utilizar en la Ecuación


(4.70), y se puede iterar el procedimiento hasta la convergencia.
Aunque el autor no lo establece explícitamente, la metodología de Elhorst
también se extiende fácilmente a la especificación SARAR (para una aplicación,
consulte Millo y Pasini, 2010).
Si bien aún representa el estándar en la práctica aplicada y en el software disponible, el procedimiento
de Elhorst ha sido criticado por Anselin et al. (2008) porque la operación de degradación temporal altera
las propiedades de la distribución conjunta de errores, introduciendo dependencia serial.

Ver Lee y Yu (2010b) para una discusión sobre el tema, y Millo y Piras (2012) para una evaluación de su
significado práctico a través de la simulación de Monte Carlo. Para resolver el problema, Lee y Yu
(2010a) sugieren una transformación ortonormal diferente de los datos.

Efectos aleatorios

Los algoritmos estándar para la estimación de las versiones SpatialLag y Spatial


Error de paneles espaciales con efectos aleatorios se deben a Elhorst (2003). Su
enfoque se basa en la técnica de degradación parcial en el tiempo (Wooldridge,
2002) con el marco de Máxima Verosimilitud de Anselin: una vez que los datos son
casi degradados en el tiempo para eliminar la estructura de efectos aleatorios,
entonces los estimadores de modelos estándar de Retraso espacial o Error espacial
pueden aplicarse a los datos transformados para que las condiciones de primer
orden se simplifiquen a las de MCO, más un filtro espacial en y en el caso de
Rezago espacial (ver Millo, 2013). Aquí, en cambio, consideraremos datos no
transformados y especificaremos los efectos aleatorios de cualquier tipo como una
característica de la covarianza del error. La función de verosimilitud general para el
modelo de panel de Rezago espacial de efecto aleatorio combinado con cualquier
estructura de covarianza de error ÿ representa la versión de datos de panel de la Ecuación (3.49):

1
Yo=constante
Nuevo Testamento

2
ÿ

ln( ) ÿ+ ÿln| |+ ln| | ÿ ejército de reserva

2 2
T (4.73)
1
ÿÿ ÿ () () ÿ

1 Yo
T Ay
ÿÿ X
ÿ ÿÿ
segundo ÿÿ ÿ nT Yo T Ay X b
ÿ

ÿÿ2
2ÿ
ÿ

con ÿ la matriz de varianza-covarianza del error compuesto. Se puede emplear un procedimiento iterativo,
a la Oberhofer y Kmenta (1974), para
Machine Translated by Google

138 Introducción a la econometría espacial

obtener las estimaciones de máxima verosimilitud de los parámetros desconocidos.


Partiendo de un valor inicial para el parámetro de rezago espacial l y los
2 parámetros
de covarianza del error, obtenemos estimaciones para b y ÿÿ a partir condiciones
de las
de primer orden:
ˆ =( ) T 11 1 T
XXXI Ay T
b ÿ ) ( ÿ ÿÿ ÿÿ (4.74)

y
ÿ ÿÿ ÿ () () 1 T
2 T T
ÿÿ = Yonsegundo
Ay X ÿÿ ÿ ÿÿ ÿ Yo Ay X
segundo ÿ ÿÿ ÿ
T (4.75)

La probabilidad reportada en la Ecuación (4.73) se puede concentrar y


maximizar con respecto a los parámetros contenidos en A y ÿ. Los valores
estimados luego se usan para actualizar la expresión de ÿ ÿ1. Estos pasos se
repiten hasta la convergencia. En otras palabras, para cualquier ÿ específico,
la estimación se puede operacionalizar mediante
2 un procedimiento iterativo
de dos pasos que alterna entre GLS (para b(para
y ÿÿ los
) y parámetros
verosimilitudrestantes)
concentrada
hasta la convergencia. Este esquema general se puede aplicar al caso de
efectos aleatorios. Por ejemplo, el modelo de retraso espacial con efectos
aleatorios (SLM-RE) se puede escribir como una combinación de un filtrado
espacial en la variable dependiente y y una estructura de efectos aleatorios
para las perturbaciones. Más formalmente, tenemos:

T )
Yo Ay X tu ÿ =
( + segundo (4.76)

T
ui =( ÿ µÿ)+ (4.77)

donde la matriz de varianza-covarianza, digamos ÿSLM RE ÿ , ÿ


Se define como
RE SLM = ( Tnt +
) ÿ j JII y el ÿparámetro adicional j se define como:
2
ÿ

j = m2ÿ (4.78)
ÿ

y representa la relación entre la varianza del efecto individual y la varianza


del error idiosincrásico.
Como se mencionó en la sección 4.3.3 anterior, el modelo de Error Espacial
de Efecto Aleatorio da lugar a dos posibles especificaciones, dependiendo del
Machine Translated by Google

Otros temas de econometría espacial 139

interacción entre el efecto autorregresivo espacial y los componentes de


error individuales.
En la primera especificación (SEM-RE), solo se correlaciona espacialmente
el error idiosincrático y el modelo se puede expresar mediante las siguientes
tres ecuaciones:

yX=tu
+b (4.79)

ui =( T ÿ yo)+ (4.80)

ÿ ÿ= ( )+Ter yo yo (4.81)

con la covarianza de los errores escalados expresada por:

1
= JTI BB ) ()T
ÿ

T ÿ 1 T (4.82)
SEM RE T
ÿ
( E
j BB
+(ÿ)+
ÿÿ
norte

J con =j T T .
y EIJ TTT =ÿ

T
En la segunda especificación (KKP) se aplica el mismo modelo espacial
tanto al componente de error individual como al idiosincrásico, y se puede
expresar a través del conjunto de ecuaciones:

yX=tu
+b (4.83)

ui =( T ÿ yo)+ (4.84)

tu yo wu
T =( )+ ÿ r
mi
(4.85)

donde la covarianza de los errores escalados a sustituir en la probabilidad es:

1
= ( JI BB
+ ÿ)j (
ÿ

ÿ
KKP TT
T
) (4.86)

4.3.5.2 Estimación GMM


Los estimadores GMM de modelos de panel espacial se basan en la
estrategia de transformaciones espaciales alternas de C ochrane-Orcutt para
filtrar la dependencia espacial con el GLS estándar (para ER) o
transformaciones de reducción de tiempo familiares para la literatura de datos de panel. lo e
Machine Translated by Google

140 Introducción a la econometría espacial

Las transformaciones de Cochrane-Orcutt se basan a su vez en estimaciones


consistentes de los parámetros espaciales. Como en Kapoor et al. (2007) y Millo y Piras
(2012), en aras de la simplicidad, solo consideraremos aquí un modelo de error espacial,
mientras remitimos al lector interesado a Mutl y Pfaffermayr (2011) y Piras (2011) para la
extensión al modelo completo. .

Efectos aleatorios
Kapoor et al. (2007) extendieron el estimador generalizado de momentos sugerido por
Kelejian y Prucha (1999) para el parámetro espacial de un modelo transversal (ver
sección 3.4.3) al caso del panel. Describen el procedimiento de estimación para el
parámetro autorregresivo espacial del proceso de error (r) y los dos componentes de
varianza de la perturbación y el proceso 2 (definido por los dos términos ÿÿ ). Se definen
2 22
alternativos sobre la base de las siguientes condiciones tres estimadores GMM
1 +m ÿ de momentos:
ÿ ÿÿ =

1 ÿ

eeT q 0 ÿ

1)
ÿ

ÿ (ÿ n T

1 ÿ
ÿ
2 ÿ

T ÿ
mi
q 0mi ÿ ÿ

( n T 1)
ÿ

2 T
1
ÿ
ÿ 1 ( en WW )
T norte
mi
q 0mi
(nT
ÿ

1) 0
mi = (4.87)
1 ÿ
2
eeT 1
( n T 1)
ÿ

2 T
ÿ
1 1 ( en WW )
1
eeT
norte

( n T 1)
ÿ

ÿ
0 ÿ

1
eeT
( n T 1)
ÿ

ÿ ÿ

yo
TT
ÿ

donde, q0 = e IN es la matriz degradante (en el tiempo), de modo que


T
"

Qy y 0= (ver apartado anterior). Además define e , =( u , similar a la Sección 3.4.3,


I Wu r = uu ÿ ÿ T n , mi = u - r ) nosotros y =( u I Wu ÿ) T .n
El estimador implícito en la Ecuación (4.87) se basa en el hecho de que en un modelo
de efectos aleatorios sin rezago espacial de la variable dependiente, el estimador MCO
de b es consistente. Por lo tanto, los residuos de OLS se pueden emplear en el
procedimiento GMM.
El primer conjunto de estimadores GMM se basa solo en las primeras tres ecuaciones
y asigna pesos iguales a cada una de ellas. El segundo conjunto de estimadores GMM
utiliza todas las condiciones de momentos y un óptimo
Machine Translated by Google

Otros temas de econometría espacial 141

esquema de ponderación: el inverso de la matriz de varianzas-covarianzas de los


momentos de la muestra en los valores verdaderos de los parámetros bajo el supuesto
de normalidad (derivado por Kapoor et al., 2007, quienes también discuten su idoneidad
en el caso de no normalidad). Finalmente, el tercer conjunto de GMM
Los estimadores utilizan todas las condiciones de los momentos, pero un esquema de
ponderación simplificado, y pueden resultar útiles en casos de dificultades
computacionales para calcular los elementos de la matriz de varianza-covarianza
asintótica de los momentos de la muestra.
Usando uno de los estimadores anteriores, podemos obtener estimaciones del
parámetro espacial y de los componentes de la varianza. El primer estimador se puede
utilizar para realizar una transformación espacial tipo Cochrane-Orcutt, mientras que,
para eliminar los efectos individuales, los datos se transforman aún más por
ÿÿ1ÿ
ÿ ÿ ÿ v ÿ ÿÿnT
ÿ
ÿÿÿ
premultiplicándolos por el término yo q 0 como en el estándar
ÿ
ÿ 1 ÿ

literatura de datos de panel. El estimador GLS factible se reduce en este caso a un


MCO, calculado sobre el modelo “doblemente” transformado. Finalmente, la inferencia
de muestra pequeña se puede basar en la siguiente expresión para la matriz de
varianza-covarianza del parámetro:

XX* 1*
T ÿ1 ÿ =( ) ÿ

(4.88)
yo

donde las variables X* son el resultado de una transformación espacial tipo Cochrane-
Orcutt del modelo original (ver Capítulo 3), y tanto X* como ÿÿ1
mi
dependen de los valores estimados de r, ÿm y 2 ÿ12.

Efectos fijos
Recientemente se ha sugerido una modificación del procedimiento anterior para el caso
en que no se pueda mantener razonablemente el supuesto de los efectos aleatorios de
falta de correlación entre los efectos individuales y los regresores. Mutl y Pfaffermayr
(2011) señalan que, bajo el supuesto de efectos fijos, la estimación por MCO de la
ecuación de regresión ya no es consistente. Sugieren reemplazar los residuos de OLS
con mínimos cuadrados espaciales de dos etapas dentro de los residuos. En el caso
de error espacial, un estimador intra simple producirá estimaciones consistentes de los
parámetros del modelo.
En el artículo citado, Mutl y Pfaffermayr (2011) reformulan las condiciones de los
primeros tres momentos de Kapoor et al. (2007) en términos de los residuos internos y
luego estimar el parámetro espacial r usando el GMM
procedimiento descrito en Kapoor et al. (2007) basándose únicamente en estas
condiciones de los tres primeros momentos. Luego, los parámetros del modelo se
obtienen mediante OLS después de una transformación espacial adicional tipo Cochrane-
Orcutt de las variables transformadas internas.
Machine Translated by Google

142 Introducción a la econometría espacial

4.3.6 Marcos de modelado adicionales en el modelado de datos de panel espacial


La literatura sobre modelos de datos de panel espacial ha crecido rápidamente en los
últimos años. En una encuesta reciente sobre la literatura de econometría espacial
en el período 2007–11 (Arbia, 2012), este tema se describe como el tema candente
con el mayor número de artículos publicados tanto desde el punto de vista teórico
como aplicado. En consecuencia, el marco básico presentado aquí de manera muy
concisa se ha ampliado y mejorado sustancialmente. La introducción al número
especial de Journal of Applied Econometrics dedicado a los paneles espaciales (ver
Baltagi y Pesaran, 2007), un artículo de revisión de Lee y Yu (2010b) y una larga
posición artículo de los mismos autores (Lee y Yu, 2011). Se remite al lector a estas
encuestas para obtener más detalles sobre la amplia gama de temas cubiertos en la
literatura reciente. Una generalización importante de los temas resumidos brevemente
aquí se refiere al hecho de que estos modelos son estáticos (incluso si se basan en
datos de series temporales), en el sentido de que no tienen en cuenta ningún efecto
dinámico. En este sentido, la literatura trata tanto modelos de datos de panel
dinámicos estables como modelos inestables para incluir el tratamiento de temas
como raíces unitarias espaciales, cointegración espacial y raíces explosivas (Lee y
Yu, 2011).

Ejemplo 4.5 Modelo de productividad del capital público de Munnell


(continuación)

Aunque el enfoque original del artículo de Munnell (1990) estaba en la importancia


del capital público en el área de producción social, el investigador podría estar
interesado en investigar las propiedades espaciales del término de error para detectar
si está gobernado por un error espacial. modelo de tipo SEM-RE o KKP. En este
ejemplo, nos enfocamos en la primera tipología, empleando una matriz de vecindario
estandarizada por filas y estimándola por Máxima Verosimilitud sobre los mismos
datos presentados en el Ejemplo 4.4. Los resultados del procedimiento de estimación
se muestran a continuación:
Modelo SEM-RE

Parámetro Error estándar prueba t valor p

Intercepción 1,6220798 0,2127472 7,6244 2.451e–14***


log(pcap) 0,0382457 0,0512507 0,7462 0.45552
log(pc) 0,3970841 0,0433498 9,1600 < 2.2e–16***
log(emp) 0,6271537 0,0395013 15,8768 < 2.2e–16***
unemp j –0.0066850 0,0026529 –2,5199 0.01174*
componente 25.946903 6.470930 4.0098 6.078e–05***
de varianza
r 0.595470 0.065178 9.1361 < 2.2e–16***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0
Machine Translated by Google

Otros temas de econometría espacial 143

La varianza estimada del efecto individual es mucho mayor que la del error
idiosincrático, mostrando este último una correlación espacial sustancial: la evidencia
a favor de un proceso espacial en los errores es, por lo tanto, fuerte. Las
estimaciones de los parámetros b no son muy diferentes de las obtenidas con el
modelo de efectos aleatorios espaciales a informado en el ejemplo 4.4, pero, dada
la evidencia anterior, podemos confiar en que estas últimas estimaciones sean más
precisas al considerar un componente estadísticamente significativo. consideración
que se descuidó en la especificación a-espacial del modelo.
Si uno está interesado en el efecto del producto social bruto de un estado en los
estados vecinos, entonces una especificación de Retraso Espacial de Efecto Aleatorio
parece más apropiada. Los resultados de la estimación se muestran en la siguiente tabla:

Modelo SLM-RE

Parámetro Error estándar prueba t valor p

Intercepción 1,3671510 0.1970401 6,9384 3.964e–12***


log(pcap) 0,1093629 0.0526096 2,0788 0.0376393*
log(pc) 0,6066125 – 0.0376993 16,0908 < 2.2e–16***
log(emp) 0,0097658 – 0.0026518 – 3,6827 0.0002307***
unemp j 0,0097658 0.0026518 – 3,6827 0.0002307***
componente 18,7043 4.6822 3,9948 6.475e–05***
de varianza
yo 0.038789 0.021832 1.7767 0.07562

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

Resulta que el coeficiente autorregresivo espacial estimado es bajo y no


significativo al nivel de confianza del 5%: la evidencia a favor de un modelo SLM-
RE es, por lo tanto, bastante débil.

Ejemplo 4.6 Panel espacial, análisis de efectos fijos de la


convergencia en las regiones italianas

En este ejemplo, consideramos nuevamente el modelo de convergencia regional à


la Barro y Sala-i-Martin (1992) ya presentado en el Ejemplo 1.1 revisado bajo un
contexto de panel para las 20 regiones italianas (ver Figura 2.3 para el mapa
geográfico). La versión de panel de la ecuación de crecimiento se puede expresar como:

log( ÿ es
b, +itk yy
) registro
y ( ) = +i registro ( ) +
ÿ

eso eso
mi

donde, como ya se explicó en el Ejemplo 1.1, yit representa el PIB per cápita en
el año ty la región i. Por lo tanto, la tasa de crecimiento en un período de k años
para cada región i es una función del nivel inicial de ingreso de la región y de un
intercepto individual. Mirando el problema desde una perspectiva de datos de panel
Machine Translated by Google

144 Introducción a la econometría espacial

enriquece las posibles interpretaciones con respecto al análisis puramente transversal, ya


que permite controlar la heterogeneidad individual, persistente en el tiempo, en las
características de las regiones. Además, al tratar los efectos individuales como parámetros a
estimar en lugar de un componente de error, una especificación de efectos fijos permite
correlacionar dicha heterogeneidad con los regresores de un modelo. Consideramos los datos
del PIB per cápita observados cada 5 años (k = 5) para las 20 regiones italianas en el período
de 1960 a 1995 (los datos no se muestran por brevedad) y hacemos una regresión de las
diferencias entre el logaritmo del PIB real (digamos , PIBV) y el logaritmo del PIB rezagado
cinco años (por ejemplo, l5GDPV) en l5GDPV.
Comencemos como de costumbre, estimando un modelo de efectos fijos aespacial. Los
resultados se muestran en la siguiente tabla:

Parámetro Error estándar prueba t valor p

log(l5GDPV) – 0.199311 0.014445 – 13.798 < 2.2e–16***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

La estimación del modelo arroja un coeficiente negativo y significativo para b, lo que confirma
la convergencia.
Para estimar las diversas especificaciones del modelo espacial, consideramos la matriz
binaria de vecindad de las regiones italianas descrita en la sección 2.3.2. Primero consideramos
el modelo de efectos fijos de retraso espacial, estimado a través de la máxima verosimilitud.
Obtenemos los siguientes resultados:

SLM-FE

Parámetro Error estándar prueba t valor p

l 0,680944 0.053398 12.7523 < 2.2e–16***


log(l5PIB) – 0,068823 0.014291 – 4.8158 1.466e–06***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

El parámetro de retraso espacial l resulta ser muy alto y estadísticamente significativo. Por
lo tanto, el crecimiento en las regiones vecinas tiene un fuerte efecto positivo en el crecimiento
local. La estimación del coeficiente de convergencia b sigue siendo estadísticamente
significativa y tiene el signo negativo esperado, pero ahora tiene un valor absoluto mucho
más bajo (aunque tenga en cuenta que no se puede comparar directamente con modelos sin
retraso espacial). Esto destaca una menor “velocidad de convergencia” en el proceso de
ajuste (ver Ejemplo 1.1).
A continuación, consideramos un modelo con un componente de error espacial, asumiendo
que los choques al crecimiento de las regiones vecinas se propagan a las vecinas, afectando
Machine Translated by Google

Otros temas de econometría espacial 145

su resultado Los resultados de la estimación del modelo de error espacial, efecto fijo
son los siguientes:

SEM-FE

Parámetro Error estándar prueba t valor p

log(l5GDPV) – 0,271102 0.031033 –8.736 < 2.2e–16***


r 0,780552 0.041063 19.008 < 2.2e–16***

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

La estimación del parámetro espacial del error es muy alta y significativa.


El coeficiente de convergencia es mayor que el obtenido con el modelo no espacial
y también es estadísticamente significativo.

4.4 Modelos econométricos espaciales no estacionarios

4.4.1 Generalidades

Todos los modelos que hemos considerado hasta ahora describen las relaciones
entre variables como un mecanismo estacionario sobre las distintas unidades
geográficas. Este enfoque presenta la ventaja de la síntesis: un solo parámetro, el
coeficiente de regresión, resume todos los vínculos complejos entre la variable
dependiente y y la correspondiente variable independiente del modelo. Sin embargo,
esta simplificación es a veces demasiado fuerte. En muchas situaciones empíricas,
no es razonable creer que una relación entre dos variables es constante en toda el
área geográfica y es más sensato conjeturar que varía en el espacio según algún
patrón regular. Por ejemplo, si estamos tratando con un tamaño de muestra grande
observado en un espacio geográfico grande (por ejemplo, un país grande o un
continente), es más sensato construir un mecanismo de regresión flexible donde se
permita que cambie la relación entre las variables suavemente de un lugar a otro.
Considere el caso informado en el Ejemplo 3.2, donde estudiamos la relación entre
el precio de los autos usados y los impuestos sobre la base de los datos observados
en 48 estados de EE. UU. En principio se puede imaginar que tal relación debería
ser diferente en cada estado o, en otras palabras, que es espacialmente no
estacionaria. En muchos aspectos, la heterogeneidad de las relaciones en el espacio
puede considerarse más como la regla que como la excepción, en primer lugar
porque existen variaciones geográficas en las actitudes y preferencias de las
personas, y en segundo lugar porque un modelo es a menudo el resultado de una
especificación errónea debido a la dificultad en
Machine Translated by Google

146 Introducción a la econometría espacial

dar cuenta adecuadamente de las variaciones espaciales observadas basándose


solo en un número relativamente pequeño de variables explicativas. Muchas
variables relevantes que están en la base de la diferenciación espacial pueden
quedar fuera del modelo debido a la imposibilidad de medirlas adecuadamente o
pueden representarse en una forma funcional incorrecta.
En este capítulo presentaremos un marco de modelado alternativo que permite
la consideración de relaciones espaciales no estacionarias. Nos concentraremos,
en particular, en la técnica denominada Regresión ponderada geográficamente
(GWR). Hay dos antecedentes históricos importantes en esta estrategia de
modelado. El primero se refiere al concepto de estadísticas de escaneo y el
segundo a la noción de regresiones ponderadas localmente.
Las estadísticas de barrido tienen una larga tradición en la literatura estadística
(ver Glaz et al., 2001, para una revisión) y son muy populares en muchos campos
aplicados como, por ejemplo, en salud pública (donde los investigadores buscan
factores causales comunes para explicar grupos inusuales de patologías), biología
molecular (donde los grupos en el ADN sugieren posibles causas del origen de la
replicación de virus), telecomunicaciones, control de calidad y muchos otros. Un
caso particular, relevante para las aplicaciones econométricas espaciales, es el
de las estadísticas de exploración bidimensional. En esencia, la idea es muy
simple: en lugar de considerar todas las observaciones disponibles juntas,
seleccionamos submuestras que están cerca geográficamente y realizamos
algunos cálculos estadísticos dentro de estas submuestras. Los primeros ejemplos
de estadísticas de escaneo bidimensional ya se pueden encontrar en el capítulo
3 del libro de Sir Ronald Fisher (Fisher, 1959) quien mostró aplicaciones en el
campo de la astronomía. Arbia (1990) propone el uso de estadísticas de barrido
(refiriéndose a ellas con el término ventanas móviles) para estudiar la no
estacionariedad espacial de los momentos de primer y segundo orden de un campo aleatorio.
Hoh y Ott (2012) brindan un ejemplo interesante de su uso para la detección del
genoma, mientras que Paez et al. (2008) muestran su uso en el estudio de la
estimación de precios hedónicos. La regresión ponderada localmente (LWR) es
una metodología no paramétrica (introducida por Cleveland y Devlin, 1988) que
puede verse como una técnica de análisis estadístico para realizar una regresión
en torno a un punto de interés usando solo un número limitado de datos de
entrenamiento que son algo locales . a ese punto En la regresión ponderada
localmente, los puntos se ponderan por proximidad al punto actual mediante un
núcleo (consulte la sección 4.1.3); luego se calcula una regresión utilizando los
puntos ponderados (McMillen, 1996). El resultado de una regresión ponderada
localmente es, por lo tanto, un conjunto de estimaciones de regresión separadas
para cada observación pero, dado que la técnica utiliza filtros de kernel, produce
una variación uniforme, de modo que las observaciones cercanas tenderán a mostrar resultados
Machine Translated by Google

Otros temas de econometría espacial 147

coeficientes Finalmente, la regresión ponderada geográficamente (GWR) es un caso


particular de LWR (Brundson et al., 1996; Fotheringham et al.,
1998, 2002, 2007; McMillen y McDonald, 1997, 2004) que hace uso del espacio geográfico
como criterio de selección. GWR proporciona un conjunto de estimaciones locales que se
pueden mapear para producir una superficie de parámetros que varía en la región de estudio.
Estos mapas juegan un papel fundamental para explorar la heterogeneidad espacial y
comprender las relaciones espaciales.

4.4.2 Regresión ponderada geográficamente

Para cada ubicación i, (i=1,2,…,n) considere el siguiente modelo de regresión (ver Wheeler y
Paez, 2010):

y iX= bei
yo yo1
+;,....n
= (4.89)

donde yi es la i-ésima observación de la variable dependiente y en la ubicación i, Xi


representa la i-ésima fila de la matriz de observaciones
ÿ1 XX ÿ

ÿ
11 1 k1 ÿ

... ...
X = , bi es vector de (variando geográficamente)
nk
1
1 XX
ÿ norte1 nk ÿ

1ÿ

parámetros desconocidos a estimar y ei la i-ésima observación de una perturbación


estocástica tal que X iidN . (0, ) ÿ .. 2 . La estimación I ÿe n yo
_ norte

La estrategia consiste en estimar n modelos distintos utilizando el siguiente estimador GLS


intuitivo:

ˆ 1
= X GX
ÿ

ÿ T T (4.90)
b ii yo X Gy ÿ
ÿ

donde y es ahora un vector de n por 1 , bˆ i es el estimador MCO de bi y


ÿ 0 0 ... 0
ÿ

ÿ
gramo
i1 ÿ

0 00 gramo
i2
GRAMO
= ... es una matriz diagonal de n por n que especifica la
i

0 0 ... 0
ÿ gramo
en ÿ

conjunto de pesos para cada ubicación. El papel de la matriz G es similar al de la familiar


matriz de pesos W que se usó extensamente en los capítulos anteriores.
De hecho, selecciona, entre las observaciones disponibles, aquellas que son relevantes
para pronosticar el comportamiento de y en la ubicación i asignándoles un valor específico.
Machine Translated by Google

148 Introducción a la econometría espacial

peso inversamente relacionado con la distancia. Sin embargo, existe una diferencia importante
entre las dos matrices en que el número de observaciones
para ser incluido en cada regresión local (es decir, el número de entradas distintas de cero de
la matriz Gi ) tiene que ser lo suficientemente grande para preservar los grados de libertad de
la regresión y permitir una estimación fiable de los parámetros. Los coeficientes estimados
(4.90) pueden interpretarse, como es habitual, como los efectos marginales (locales) sobre la
variable dependiente de una variación unitaria en la variable independiente. GWR , por lo tanto,
modela semiparamétricamente la idea esencial (que está en la base de todos los modelos
econométricos espaciales) de que, para pronosticar el comportamiento de una variable en una
ubicación específica, los mejores predictores son las observaciones cercanas. Además, limitar
el procedimiento de estimación a solo observaciones vecinas probablemente reducirá, si no
eliminará por completo, la mayoría de los efectos negativos de la correlación espacial y la
heterocedasticidad en las estimaciones de parámetros.

El estimador reportado en la Ecuación (4.90), bajo algunas condiciones, coincide con el


obtenido por la maximización de una pseudoverosimilitud ponderada derivada por separado
para cada observación (ver McMillen y McDonald, 2004). El esquema de ponderación
incorporado en la matriz G
es una característica esencial del método y depende de dos elementos cruciales. El primero
se refiere a la elección del kernel considerado y la
segundo, el número de observaciones, cerca de la ubicación i, que son relevantes para estimar
el parámetro (espacialmente variable) en la ubicación i. Este segundo elemento se incorpora
en un parámetro del núcleo denominado ancho de banda.
La elección del ancho de banda apropiado es un elemento esencial del procedimiento. Los
anchos de banda pequeños son preferibles para identificar patrones locales, pero pueden
producir estimaciones poco confiables si se basan en un tamaño de muestra pequeño. Por otro
lado, los grandes anchos de banda, al tiempo que preservan la confiabilidad de los estimadores,
tenderán a cancelar la heterogeneidad local. Cuando el ancho de banda es tan grande que
incluye todas las observaciones (igualmente ponderadas), GWR coincide claramente con la
regresión OLS estándar . La elección más simple de los pesos es considerar que la matriz G
es simplemente la matriz W familiar (no estandarizada) definida de acuerdo con algún criterio
de distancia máxima vecina (ver sección 2.1) sin ningún peso específico. Más formalmente:

ÿÿ
1 si dd < *
g ij =
ÿÿ ij
ÿ
(4.91)
0
ÿ

ÿÿÿ

con dij la distancia entre la observación i y la observación j, y d*


el umbral.
Machine Translated by Google

Otros temas de econometría espacial 149

Aunque en principio se podría utilizar cualquiera de los núcleos presentados en la sección 4.1.3, en la práctica los núcleos

más comunes empleados en GWR son los siguientes:

1. Gaussiano. Este núcleo ya se ha considerado en la sección 4.1.3 y en este nuevo contexto se puede expresar como:

ÿ ÿ re
2 ÿ

1 ÿ ij
ÿÿÿÿÿÿÿ2
ÿ ÿ ÿ g = exp ij ÿ
(4.92)
ÿ
ÿ ÿ
ÿÿ ÿÿÿÿ

con s un parámetro, llamado ancho de banda, a través del cual podemos controlar el rango de observaciones incluidas en

cada una de las submuestras.

2. Bi-cuadrado (generalización de bi-peso, ver sección 4.1.3)

ÿ d 2 ÿ2 ÿ

1 g ij ÿ ÿ =
yo
ÿ
ÿ

2
ÿ

ÿ
(4.93)
ÿ

ÿ ÿ

ÿ ÿ

3. Tri-cubo

3
d 3 ÿÿ

yo
1 g ÿ ijÿ ÿ ÿ =
ÿ

ÿÿ

ÿ
(4.94)
3ÿ ÿ

ÿÿ ÿ ÿ

Los parámetros de ancho de banda pueden elegirse a priori o estimarse a partir de los datos, un proceso que a menudo se

denomina calibración. En este sentido, la estrategia de calibración más popular es el método de validación cruzada, un proceso

de búsqueda iterativo que identifica, mediante ensayos repetidos, el ancho de banda que minimiza la raíz cuadrática media del

error de predicción. (Para un enfoque diferente, véase, por ejemplo, Paez et al., 2002. Véase Wheeler y Paez, 2010 para una

revisión). Una vez que se elige la función kernel y se calibra el modelo, la Ecuación (4.90) está completamente especificada y se

puede usar para estimar los parámetros del modelo. En cuanto a la prueba de hipótesis, consideremos, como de costumbre, los

estadísticos de prueba obtenidos al tomar la diferencia entre el valor de bi bajo la hipótesis nula y bajo la hipótesis alternativa

escalada por su desviación estándar (Ecuación 1.21), es decir:

ˆ
b i
prueba = ˆ
(4.95)
Var ( segundo
i)

donde el factor de escala en el denominador se obtiene usando el GLS

expresión (Ecuación 1.48) que, en este caso, conduce a:

ˆ
Var ( segundo
)= iii ÿe
2 Automóvil club británico
T (4.96)
Machine Translated by Google

150 Introducción a la econometría espacial

T
ÿ

1
Los=GX
habiendo definido. AX ( XG ii i) deT prueba (4.95) se pueden usar para
estadísticos
probar la validez de la hipótesis de regresión en cada observación individual.
En este sentido podemos observar que el efecto de una inde
La variable dependiente de la variable dependiente y es significativa solo en
algunas zonas específicas del área de estudio y, por el contrario, es irrelevante
en otras, lo que sugiere patrones geográficos interesantes.
Una vez estimado el modelo y contrastada la significación de las variables
independientes en cada uno de los n modelos estimados, podemos proceder,
como de costumbre, a contrastar la validez de las hipótesis que subyacen al
modelo. En particular, en el presente contexto, es de interés probar si los
residuos del modelo muestran alguna regularidad geográfica (por ejemplo, en
forma de autocorrelación espacial) que no fue capturada adecuadamente por el
procedimiento ponderado geográficamente. La teoría relacionada con la prueba
de autocorrelación espacial entre residuos GWR ha sido desarrollada por Leung et al. (2000).
El enfoque propuesto parte de la definición del pseudo-residuo del modelo
global, definido como los residuos calculados como la diferencia entre el valor
observado de yi en cada ubicación i y el valor estimado en base al
(espacialmente no estacionario) parámetros Estos residuos no se definen de
forma convencional porque en cada localidad se calculan a partir de un modelo
de regresión diferente. Una vez que se calculan los pseudoresiduos, se utilizan
para detectar posibles regularidades utilizando una versión revisada del familiar
coeficiente I de Moran. Una alternativa a Leung et al. (2000) el procedimiento
fue sugerido por Paez et al. (2002).

4.4.3 Desarrollos posteriores


La metodología GWR básica presentada en esta sección representa solo el
punto de partida para estrategias de modelado más complejas y posteriores.
La literatura en este campo es vasta, crece rápidamente y aún se encuentra
en las primeras etapas de desarrollo en muchos aspectos (para una revisión,
véase Fotheringham et al., 2002; McMillen y McDonald, 2004; Pace y LeSage,
2004; Wheeler y Paez , 2010). Una extensión obvia del modelo básico
presentado en la sección 4.4.2 se refiere al uso de modelos econométricos
espaciales que pertenecen a la familia SARAR en lugar de la regresión local
simple de OLS (ver Brunsdon et al., 1998; Paez et al., 2002; Pace y LeSage,
2004; y Mur et al., 2008). Sin embargo, esta extensión encuentra serios
desafíos computacionales cuando opera con un tamaño de muestra grande.
De hecho, no solo se debe estimar el mismo modelo n veces (enfrentándose
a los problemas computacionales planteados varias veces al presentar los
diversos modelos en el capítulo 3), sino que también la búsqueda iterativa de
un ancho de banda óptimo durante la fase de validación cruzada implica el
cálculo del determinante de una matriz (n–1) por (n–1) repetidamente en cada
paso del procedimiento. Una segunda extensión interesante está representada por un baye
Machine Translated by Google

Otros temas de econometría espacial 151

enfoque de GWR (introducido por LeSage, 2004) para resolver algunas de las
dificultades que surgen en el enfoque estándar en presencia de valores atípicos y
fenómenos heteroscedásticos fuertes. En esencia, el procedimiento mejora el método
al imponer una distribución a priori (dependiendo de un conjunto de hiperparámetros)
a los coeficientes de regresión.
Una extensión adicional se refiere a la aplicación del GWR general
marco ilustrado en esta sección para tratar con modelos de elección discreta (ver
sección 4.2). Por ejemplo, McMillen y McDonald (2004) derivan un enfoque de
Máxima Verosimilitud para la estimación de modelos Probit Ponderados
Geográficamente que muestran que a través de este enfoque gran parte de la
hetorcedasticidad y la autocorrelación, endémicas de los modelos espaciales de
elección discreta (ver sección 4.2.3), pueden ser eliminado reduciendo así los efectos
negativos sobre la consistencia y eficiencia de los estimadores.

Ejemplo 4.7 El determinante del logro


educativo en Georgia

Como ejemplo de regresiones ponderadas geográficas, consideremos un conjunto


de datos (presentado por Fotheringham et al., 2002) que se refieren a los 159
condados de Georgia. El conjunto de datos se puede descargar de la biblioteca R
spgwr con eldatos
comando (consulte la
(Georgia) sección 4.5.4).
siguientes El conjunto
variables: de datos
Proporción contienecon
de residentes las
una licenciatura o superior (Bach), Proporción de personas que viven en barrios
rurales (Rural), Proporción de residentes de edad avanzada (Eld), Proporción de
residentes nacidos en el extranjero (FB), Proporción de residentes que viven por
debajo del umbral de la pobreza (Pov) y Proporción de residentes de etnia negra
(Black). El conjunto de datos también contiene información sobre la población total
de cada condado y una serie de otros datos sobre la geografía del área, como la
latitud y la longitud de los centroides de cada condado. Consideramos un modelo
que tiene como objetivo explicar el porcentaje de licenciatura o títulos superiores en
un condado en función de las otras variables descritas anteriormente (Rural, Eld, FB,
Pov y Black). Los resultados del modelo OLS a-espacial estándar se muestran en la
siguiente tabla:

Parámetro Valor estimado Error estándar prueba t valor p

Interceptar 17,24373 – 1,75329 9,835 < 2e–16***


Rural 0,07032 0,01358 – 5.179 6.93e–07***
Vejez 0,01145 0,12953 0.088 0.929693
pensión completa 1,85247 0,30683 6.037 1.14e–08***
punto de vista 0.25524 0.07248 – 3,522 0,000566***
Negro 0.04911 0.02648 1.854 0.065602

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0
Machine Translated by Google

152 Introducción a la econometría espacial

R-cuadrado múltiple: 0,5884, R-cuadrado ajustado: 0,575


Estadístico F: 43,75 en 5 y 153 DF, valor p: < 2,2e–16

A continuación, se puede estimar un modelo de regresión ponderado geográficamente


utilizando un kernel de Gauss y habiendo identificado el ancho de banda óptimo utilizando el
método iterativo de validación cruzada. En la siguiente tabla se muestran algunos resultados
resumidos para cada uno de los parámetros estimados:

Parámetro Mínimo Primero Tercio medio Rango Máximo Global


Cuartilla Cuartilla (OLS)

Interceptar 14,170000 15,350000 17,050000 18,200000 18,860000 4,69 17.2437


Rural – 0,081350 – 0,073480 – 0,064850 – 0,055110 – 0,051080 0,03027 – 0,0703
Vejez – 0,191200 – 0,094630 – 0,065330 – 0,032360 0,012500 0,2037 0,0114
pensión completa 0,854300 1,282000 2,031000 2,796000 3,138000 2,2837 1,8525
punto de vista – 0,304800 – 0,258100 – 0,196100 – 0,115100 – 0,034210 0,27059 – 0,2552
Negro – 0,016900 0,006347 0,031610 0,060620 0,087210 0,07031 0,0491

En la última columna de la tabla anterior mostramos nuevamente los resultados obtenidos


con OLS a modo de comparación. Los resultados muestran una alta variabilidad de los
coeficientes locales en torno al valor global. Nótese que en algunos casos los parámetros
pueden asumir, en diferentes lugares, el signo opuesto (variables “Eld” y “Black”). Entonces
en algunas zonas del área de estudio existe una relación positiva entre, por ejemplo, la
variable “Bach” y “Black” mientras que en otras zonas esta relación es positiva. A modo de
ejemplo, el mapa que se muestra en la siguiente figura (a) muestra la variabilidad geográfica
de los coeficientes de regresión relacionados con la variable “Black” (los tonos más oscuros
se refieren a coeficientes positivos, los tonos más claros a coeficientes negativos). Es
evidente la falta de homogeneidad de los coeficientes, con un claro patrón decreciente de
suroeste a noreste. Así, la variable “Porcentaje de personas negras” tiene un impacto positivo
en la variable “Porcentaje de solteros” en los condados del sur y del oeste, pero, por el
contrario, un impacto negativo en los condados del noreste. Observe la suavidad del mapa,
que es una característica intrínseca del método que se origina en el uso de un kernel que es
inversamente proporcional a la distancia. La figura (b) muestra la distribución de frecuencias
de los coeficientes GWR estimados para la variable “Porcentaje de personas negras”, que
también destaca la presencia de coeficientes tanto positivos como negativos.
Machine Translated by Google

Otros temas de econometría espacial 153

20

15

10

–0.02 0,00 0,02 0,04 0,06 0,08 0,10


descansos

(un) (b)

4.5 Códigos R

4.5.1 Estimación de modelos espaciales lineales heteroscedásticos


El paquete sphet está diseñado para estimar y probar modelos espaciales con
innovaciones heteroscedásticas. Complementa y se superpone parcialmente con las
funciones econométricas disponibles en la biblioteca spdep. Recuerde escribir el
comando install.packages(“sphet”) por primera vez y luego antes de cada sesión
escriba library(sphet).
Supongamos, para empezar, que estamos considerando un modelo SARAR
heteroscedástico expresado comoy=+ bb +blXZ
+ 01 2 Wy u ; u Wu
queremos + E(
= r con
estimarlo )= eide
utilizandoi ÿel
procedimiento y que
+ mi

2
mínimos cuadrados
la Sección espaciales
y, X4.1.2.
y Z están generalizados
Supongamos
almacenadas
además en
en la
quedos etapas
sesión modificado
las observaciones
R activa y quede ilustrado
selas
generó en
variables
una matriz de peso W con uno de los procedimientos descritos en los capítulos
anteriores. Para estimar el modelo, escriba el comando:

modelo1<- gstslshet(fórmula=y~X+Z, fecha=nombre de archivo, listw=W)

La salida del procedimiento incluye, por defecto, la prueba de Wald de que


ambos coeficientes espaciales ÿ y ÿ son cero.
Si deseamos estimar el modelo HAC espacial (Sección 4.1.3), para evaluar la
matriz de varianza-covarianza contenida en la Ecuación (4.8), necesitamos dos
objetos extra con respecto a los parámetros usuales: i) la matriz de la distancias por
pares entre todas las unidades espaciales (el término dij)
Machine Translated by Google

154 Introducción a la econometría espacial

y ii) la tipología de la función kernel. Llamemos a D la matriz de


distancias y consideremos, por ejemplo, que elegimos la función Kernel
de Epanechnikov (otras posibles alternativas que soporta el paquete son
la Triangular (Bartlett), la Bicuadrada (o cuadrática, o bi-ponderada) , los
kernels Parzen, TH (Tukey–Hanning) y QS (Quadratic Spectral) (Ver
Sección 4.1.3) Con estas especificaciones el comando es:

modelo2<-stslshac(fórmula=y~X+Z,listaw=w,distancia=D,tipo=
"Epanechnikov")

En esta expresión, el ancho de banda es variable. Por el contrario, si deseamos


fijar el ancho de banda en un valor, por ejemplo , B, debemos agregar la opción
ancho de banda = "B". Además, el comando usa por defecto tanto WX como
W2X como instrumentos. Si queremos usar solo WX como único instrumento
tenemos que añadir la opción W2X=FALSE.

4.5.2 Estimación de modelos espaciales probit/logit


En primer lugar, introduzcamos los comandos R para estimar modelos
Probit y Logit a-espacial estándar basados en el modelo +
latente =+ + El
y XZ • bb
01 2b e.
comando es el siguiente:

>modelo0<-glm(y~X+Z, familia=binomial(enlace=”probit”))

y de manera similar para el modelo Logit.


Los comandos R relacionados con los diversos procedimientos para
estimar la versión espacial de los modelos Probit y Logit están contenidos
en la biblioteca McSpatial. Así que recuerde escribir el comando
install.packages ("McSpatial") y luego, antes de cada sesión, escriba
library(McSpatial). En todos los casos asumimos que queremos estimar
un modelo Probit donde la variable latente se expresa como: e y también
• =+bb bl2 XZ Wy +
+ 01 • asumimos que las observaciones +
y de las variables y, X y Z se almacenan en la sesión R activa. En
cuanto a la matriz de pesos W, se tiene que generar con un
procedimiento diferente a los descritos en los capítulos anteriores. En
este caso, de hecho, una vez creada la lista de vecinos (digamos
contnb) mediante el comando poly2nb o dnearneigh, (ver sección 2.3.3),
en lugar del comando nb2listw, tenemos que usar el comando:

W<-nb2mat(continuación)

que transforma una lista de vecinos (nb) en (2) una matriz (mat). Consideremos
ahora los diversos estimadores de un modelo Probit espacial. Para comenzar
Machine Translated by Google

Otros temas de econometría espacial 155

con, si queremos estimar los parámetros de un modelo Probit espacial utilizando la


técnica ML (sección 4.2.3.2), digitamos el comando:

> modelo1<-spprobitml(y~X+Z,wmat=W,stdprobit=F)

Si queremos estimar el mismo modelo usando un enfoque de Método Generalizado de


Momentos (GMM, ver sección 4.2.3.3), necesitamos inicializar el parámetro r antes de
comenzar la búsqueda iterativa de una solución. Entonces, antes de comenzar el
procedimiento, debemos escribir, por ejemplo:

>rho=rho0

siendo rho0 cualquier valor tal que |rho0 |<1. La solidez de los resultados con respecto
a diferentes valores iniciales debe probarse en cualquier circunstancia práctica. Una
vez hecho esto, ahora escriba:

> modelo2 <-gmmprobit(y~X+Z,wmat=W,startrho=rho)

Finalmente, si queremos estimar el mismo modelo usando el método Linealizado


Generalizado de Momentos (LGMM, ver sección 4.2.3.4), escriba en su lugar:

> modelo3<-spprobit(y~X+Z,wmat=W)

4.5.3 Estimación de modelos de panel espacial


Los procedimientos para la estimación de paneles espaciales están contenidos en el
paquete de R denominado splm (Millo y Piras 2012), el cual, como es habitual, debe
instalarse para todos mediante el comando install.packages(“splm”) y luego puede
cargarse al inicio de cada sesión escribiendo library(splm).
Con este comando también cargamos automáticamente el paquete plm (Croissant y
Millo 2008) para la estimación de modelos de panel no espaciales.
Los conjuntos de datos de panel en los paquetes R plm (Croissant y Millo, 2008) y
splm tienen muy pocos requisitos formales. El conjunto de datos se puede almacenar
en un objeto de conjunto de datos regular, siempre que contenga el par necesario de
índices que debe tener cualquier panel (relacionado con personas y tiempo) para que
se identifique sin ambigüedades. Dados estos, no se requiere un orden particular de
los datos. El software asume que el índice individual es la primera columna del
conjunto de datos y el índice de tiempo la segunda. Si los datos están organizados de
manera diferente, entonces se debe especificar el argumento 'índice' como un par de
cadenas que dan los nombres de las variables dentro de la llamada a la función de estimación.
Las dos funciones principales en el paquete splm son spml (estimación de modelos
de Panel Espacial por Máxima Verosimilitud) y spgm (estimación de
Machine Translated by Google

156 Introducción a la econometría espacial

Modelos de Paneles Espaciales por Método Generalizado de Momentos). Los datos de Munnell
usados en los Ejemplos 4.4 y 4.6 están disponibles en el paquete como un conjunto de datos
incorporado, junto con la matriz de ponderaciones para los 48 estados de EE. UU. ya
considerados en el Ejemplo 3.2 (excluyendo Alaska y Hawai y el Distrito de Columbia. Consulte
el mapa en Ejemplo 3.2). Podemos cargar el conjunto de datos a través del comando:

> datos(Produc)

En primer lugar, para estimar el modelo OLS, agrupando todos los datos (espaciales y
temporales), podemos usar la función plm incluida en el plm
paquete añadiendo la opción model=”pooling”

> modelo0<-plm(y ~ X+Z, modelo=”agrupación”)

asumiendo que los datos están en el conjunto de datos activo.


Presentemos ahora los procedimientos para el modelo de efectos aleatorios, a partir del
caso de que no haya componente espacial. En este caso la estimación de ML se puede
realizar mediante el comando spml (acrónimo de Spatial Panel Maximum Likelihood) con las
siguientes especificaciones:

> modelo1 <- spml(y~X+Z, listaw=W, modelo="aleatorio", espacial.


error=”n”, retraso=FALSO)

donde W es la matriz de peso habitual. Para agregar un retraso espacial a la especificación,


se debe establecer el argumento de retraso en VERDADERO:

> modelo2 <- spml(y~X+Z, listaw=W, modelo="aleatorio", espacial.


error=”n”, retraso=VERDADERO)

El modelo SEM-RE (según la especificación de Error Espacial expresada en (4.79) y (4.80)


se puede estimar especificando ningún rezago espacial y un error espacial de tipo “b”:

> modelo3 <- spml(y~X+Z, listaw=W, modelo="aleatorio", espacial.


error=”b”, retraso=FALSO)

mientras que la especificación KKP reportada en las Ecuaciones en (4.83) y (4.84) puede ser
estimada por ajuste espacial de máxima verosimilitud.
error="kkp" como opción:

> modelo4 <- spml(y~X+Z, listaw=W, modelo="aleatorio", espacial.


error="kkp", retraso=FALSO)
Machine Translated by Google

Otros temas de econometría espacial 157

o, alternativamente, usando el método generalizado de momentos usando el comando:

> modelo5 <- spgm(y~X+Z, listaw=W, modelo="aleatorio", espacial.


error="kkp", retraso=FALSO)

Pasemos ahora a considerar la especificación del modelo de efectos fijos .


En primer lugar, el modelo a-espacial de efectos fijos, se puede estimar simplemente
escribiendo:

> modelo6 <- plm(y~X+Z)

Si deseamos agregar un Spatial Lag a la especificación, podemos estimar el modelo de


efectos fijos a través del comando:

> modelo7 <- spml(y~X+Z, listaw=W, espacial.error=”ninguno”, retraso=VERDADERO)

Y, finalmente, la contraparte del error espacial escribiendo:

> modelo8 <- spml(y~X+Z, listaw=W, espacial.error=”b”, lag=


FALSO)

4.5.4 Estimación de modelos de regresión ponderados geográficamente

Para realizar una estimación de regresión ponderada geográficamente, para comenzar,


necesitamos descargar la biblioteca spgwr, usando el comando familiar install.packages
("spgwr") e invocándolo nuevamente al comienzo de cada nueva sesión escribiendo el
comando biblioteca ( spgwr).
Antes de que podamos realizar una estimación de GWR , es necesario tener un sistema de
coordenadas de los centroides de cada polígono. Llamémoslo coordenadas (para la generación
de un sistema de coordenadas ver, por ejemplo, apartado 2.3.3). Consideremos ahora el
siguiente modelo GWR : b be . Para calibrar el ancho de banda, con el fin de iden 0 12 y XZ b
=+ + + comando:
siguiente ii ii tificar el valor óptimo utilizando el método de validación cruzada, escriba el
i

bw <- gwr.sel(y ~ X + Z, coords, gweight=gwr.Gauss, adapt=


CIERTO)

el núcleo gaussiano es el valor predeterminado del comando y se puede omitir.


Si deseamos cambiar el valor predeterminado, podemos usar diferentes kernels, como por ejemplo,
Machine Translated by Google

158 Introducción a la econometría espacial

por ejemplo, gwr.bisquare o gwr.tricube. Finalmente, para ajustar el modelo GWR,


escriba:

modelgwr <- gwr(y ~ X + Z, coords, adapt=bw, hatmatrix=


CIERTO)

y para ver los resultados, escriba:

modelo

Los resultados del procedimiento de modelado ahora están todos almacenados en un


objeto R llamado Marco de datos espaciales (SDF). Así, por ejemplo, los diversos
coeficientes de la variable X estimados en cada ubicación se almacenan en el objeto
modelgwr.$SDF$X. Para visualizarlos en un mapa, con el fin de identificar posibles
regularidades, escriba el comando:

plot(modelgwr.$SDF, col=cols[findInterval(gwr.model $SDF$X, brks, all.inside=TRUE)])

Finalmente, para calcular la prueba I de Moran sobre los residuos, usando la prueba de
Leung et al. (2006) (y teniendo disponible una matriz de peso, digamos W) podemos
escribir el comando:

gwr.morantest(modelogwr, W)

Términos y conceptos clave introducidos

• GS2SLS factible •
Estimación matricial
• Estimadores HAC
• Procedimientos de HAC
espacial • Parámetros molestos
• Estimación del kernel
• Funciones del núcleo
• Variable dicotómica
• Modelos de elección discreta
• Modelos binarios •
Variable latente •
Regresión latente
Machine Translated by Google

Otros temas de econometría espacial 159

• Función de índice •
Distribución logística estandarizada •
Modelo A-espacial Probit y Logit • Efectos
marginales en un modelo Logit y Probit • Forma reducida de
un modelo
• Forma estructural de un modelo
• Modelo Spatial Lag Probit •
Algoritmo EM • Estimador ML del
modelo Spatial Lag Probit • Estimador GMM del
modelo Spatial Error Probit • Perturbaciones generalizadas
de Probit y Logit • Estimador GMM linealizado • Términos
de gradiente • Ordenar y paneles largos • Agrupados
series de tiempo • Término de error individual e
idiosincrásico • Heterogeneidad no observada • Producto
de Kronecker • Efectos fijos

• Efectos aleatorios
• Modelo de error espacial con efectos aleatorios •
Modelo KKP • Modelo de retraso espacial con
efectos aleatorios • Modelo de error espacial con
efectos fijos • Modelo de retraso espacial con
efectos fijos • Tiempo degradante • Dentro de
residuos • Paneles espaciales de dinámica estable
• Paneles espaciales de dinámica inestable • No
-relaciones espaciales estacionarias • Estadísticas
de exploración

• Ventanas móviles •
Regresión ponderada localmente •
Regresión ponderada geográficamente •
Función kernel • Ancho de banda • Kernels
gaussiano, bicuadrado y tricubo • Calibración
• Validación cruzada • GWR bayesiano • GWR de
elección discreta
Machine Translated by Google

160 Introducción a la econometría espacial

Preguntas

1. ¿Por qué la hipótesis de homocedasticidad de errores es a menudo inverosímil en el


caso de regresiones espaciales?
2. ¿Por qué, en una estimación HAC espacial, necesitamos considerar una función de
suavizado del kernel?
3. ¿Por qué en el caso de un modelo SARAR con perturbaciones heteroscedásticas,
necesitamos considerar las varianzas de error como parámetros molestos?

4. ¿Cuál es la diferencia entre un modelo Probit y Logit para binario?


elecciones?

5. ¿Cuáles son las razones por las que no se puede utilizar un enfoque de ML estándar
para estimar un modelo Probit en datos espaciales?
6. ¿Por qué se introduce una versión linealizada de la estimación del método generalizado
de momentos en la estimación espacial Probit/Logit?
7. ¿Cuál es la diferencia entre los efectos fijos y los aleatorios?
efectos en el modelado de datos de panel? ¿Cómo podemos elegir entre los dos
modelos?
8. Describa la especificidad de los dos componentes de error en un marco de datos de
panel. ¿Cómo podemos interpretar el componente de error “individual” e “idiosincrático”?

9. Describa la operación de degradar el tiempo. ¿Cuál es el efecto de degradar los datos en


un modelo de datos de panel espacial?
10. ¿Cuáles son las diferencias entre la especificación SEM-RE y la KKP ?
11. ¿Cuál es la ventaja de usar un modelo de regresión ponderada geográficamente con
respecto a un modelo de regresión tradicional? ¿En qué circunstancias es más adecuado
su uso? ¿En qué sentido puede verse como una alternativa a los modelos econométricos
espaciales para dar cuenta de los efectos espaciales?

Ejercicios

Ejercicio 4.1 Tienes un modelo de regresión lineal simple y =b0


2 +b1x +e Xmi iidN
en cierto. .)nivel
ÿ . (0, observado
de (por ejemplo,
agregación que
I ÿe los
nn (por
datos
ejemplo,
se agregan
países). regiones).
Llame a ayÿun
la nivel
Supongamos
másdependiente
variable alto de
además
agregación
en
este nivel de agregación, de manera similar para x y e. Supongamos además que tenemos
m países y regiones respectivamente en cada país. Especifiquemos ahora el modelo en el
nivel más alto de agregación como: =+ + x bb e.
nn ,n 1 2,..., m

y 0 1
Demuestre que incluso si el modelo de regresión es homecedástico a un nivel más bajo de
agregación, esta propiedad generalmente se pierde a un nivel más alto de agregación.
Machine Translated by Google

Otros temas de econometría espacial 161

agregación. [Sugerencia: use la matriz de agregación mGn tal que y Gy =


y análogamente para las demás variables].

Ejercicio 4.2 Una propiedad de las funciones kernel es que se integran a 1 en su


dominio. Demuestre tal propiedad para los núcleos Uniforme, Epanechnikov y
Cuadrático (Bi-peso).

Ejercicio 4.3 Considere nuevamente el conjunto de datos utilizado en el Ejercicio


3.1 relacionado con los 27 Estados miembros europeos. Estime un modelo SARAR
heteroscedástico que explique el crecimiento en un país en función de los gastos en
educación en el mismo país más términos adicionales de retraso espacial y error
espacial. Estime el modelo usando el enfoque paramétrico (sección 4.1.2).

Ejercicio 4.4 Se le da la siguiente regresión latente yXu = + de la variable • segundo


y Iy = (0)
• > y el siguiente modelo
Derive
de error
para la función
una espacial
logarítmica
muestra specifi
de +de
R e,
dimensión verosimilitud
con e X nidN
n. Probit
I . . .espacial
(0, ).
catión u Wu = ÿ

Ejercicio 4.5 Considere nuevamente los datos relacionados con los 27 Estados miembros
de la UE utilizados en los Ejercicios 3.1 y 4.3. Considere también algunos datos adicionales
relacionados con la intensidad de la exportación Hi-tec (descargable desde el sitio web http://
epp.eurostat.ec.europa.eu/portal/page/portal/region_cities/regional_
estadísticas/datos/tablas_principales). En particular, clasificamos a cada Estado
miembro como de "alta intensidad" si el porcentaje de exportaciones de alta
tecnología es superior al 18 por ciento. Los datos se muestran en la siguiente tabla.

PAÍS País de alta tecnología PAÍS País de alta tecnología

CÓDIGO alta tecnología


Intensidad CÓDIGO alta tecnología
Intensidad
Exportaciones Exportaciones

SER Bélgica 8,8 0 a las 0 0 Austria 11,7 0


BG Bulgaria 4,6 ES Polonia 5,7 0
CZ checo 15,2 PT Portugal 3,7 0
República
no sé Dinamarca 12,3 0 RO 0 0 1 Rumanía 8,2 0
Delaware
Alemania 14,0 0 SI Eslovenia 5,5 0
EE.UU. Estonia 6,9 SK Eslovaquia 5,9 0
ES DECIR Irlanda 22,1 FI Finlandia 13,9 0
ES España 4,8 SE Suecia 14,6 0
FR Francia 19,7 1 Reino Unido Reino Unido 19,0 1

ESO
Italia 6,8 Chipre 20,1 0 EL Grecia 6,6 Luxemburgo 0
CY Lituania 5,8 Hungría 22,2 1 LU 0 41,9 Letonia 5,3 Malta 1
LT Países Bajos 18,4 BT 35,2 0
HU 1 MT 1 1
Países Bajos
Machine Translated by Google

162 Introducción a la econometría espacial

Sobre la base de los resultados del Ejercicio 3.1 y de estos nuevos datos, estime un modelo
Probit que explique la intensidad Hi-tec como un factor de Educación tanto en la versión a-espacial
como espacial utilizando los tres estimadores (ML, GMM y LGMM ) discutido en la sección 4.2.

Ejercicio 4.6 En un panel espacial constituido por n = 3 individuos, tenemos ÿ ÿ 011

ÿÿÿÿW

T = 2 observaciones de tiempo. Dada la siguiente matriz W: =1 0 0


ÿ ÿ ÿ ÿ 100
ÿÿ

2
parámetros TI A ÿ y de la matriz
ÿm =( ÿm
1 y JI
ÿ=0.3,
ÿ . obtenga la forma explícita de la y la matriz de
2
T norte )

Ejercicio 4.7 Desde el paquete splm, cargue el conjunto de datos Seguros y la matriz de
contigüidad binaria para las provincias italianas (itaww). Ver Millo (2014) para más detalles.
Transforme la matriz de contigüidad en un objeto listw como se describe en 2.3.2. Estimar un
modelo de datos de panel de error espacial que explique la variable prima de seguro real per
cápita (codificada como ppcd) en función de la variable PIB real per cápita (rgdp) usando la
estrategia de Máxima Verosimilitud, con efectos aleatorios, ambos en el SEM -RE y en las
especificaciones KKP . Discuta los resultados con especial atención a las estimaciones de los
parámetros espaciales.

Ejercicio 4.8 Considere nuevamente el conjunto de datos R Boston ya presentado en el Ejemplo


3.3 y el Ejercicio 3.6 y estudie la relación entre la variable "Valor medio de la casa" (MEDV) y la
variable "número de habitaciones" (RM). Estime un modelo a-espacial usando el criterio OLS ,
luego estime un modelo de retraso espacial con el procedimiento de máxima verosimilitud,
finalmente estime un modelo de regresión ponderado geográficamente usando un kernel gaussiano
y el ancho de banda especificado usando el método de validación cruzada. Comparar los
resultados obtenidos con los distintos métodos. En particular, compare los coeficientes de
regresión estimados obtenidos con OLS y SLM con el valor mediano de los coeficientes GWR.
Calcule las estadísticas I de Moran para los residuos del modelo GWR.

Referencias al Capítulo
Amemiya, T. (1985) Econometría avanzada, Oxford: Basil Blackwell.
Anselin, L. (1988) Econometría espacial: métodos y modelos, Kluwer Academic Publishers,
Dordrecht.
Anselin, L. (1990) 'Algunos enfoques robustos para probar y estimar en espacial
Econometrics', Regional Science and Urban Economics, 20, 141–63.
Machine Translated by Google

Otros temas de econometría espacial 163

Anselin, L. (2002) 'Under the Hood: Issues in the Specification and Interpretation of Spatial
Regression Models', Agricultural Economics, 27, 3, 247–67.
Anselin L., Le Gallo J., Jayet H. (2008) 'Spatial Panel Econometrics', en L. Matyas, P. Silvestre
(eds), The Econometrics of Panel Data, Fundamentals and Recent Developments in Theory
and Practice, 3.ª edición , Heidelberg: Springer-Verlag, págs. 625–60.

Arbia, G. (1989) Configuración de datos espaciales en el análisis estadístico de datos


económicos regionales y problemas relacionados, Dordrecht: Kluwer Academic Press.
Arbia, G. (1990) 'Sobre la no estacionariedad de segundo orden en redes bidimensionales
Processes', Computational Statistics and Data Analysis, 9, 147–60.
Arbia, G. (2012) 'A Lustrum of SEA: Recent Research Trends After the Creation of the Spatial
Econometrics Association (2007–2011)', Spatial Economic Analysis, 6, 4, 377–96.

Baltagi, B. (2008) Análisis econométrico de datos de panel, 4.ª edición, Nueva York: Wiley.
Baltagi B. y Pesaran, H. (2007) 'Heterogeneidad y dependencia transversal en modelos de
datos de panel espacial: introducción a la teoría y las aplicaciones', Journal of Applied
Econometrics, 22, 2, 229–32.
Baltagi, BH y Pinnoi, N. (1995) 'Crecimiento de la productividad del estado y del capital social
público: evidencia adicional de un modelo de componentes de error', Empirical Economics,
20, 2, 351–9.
Baltagi, B., Egger, P. y Pfaffermayr, M. (2013) 'A Generalized Spatial Panel Data
Modelo con efectos aleatorios', Econometric Reviews, 32, 5, 650–85.
Barro, RJ y Sala-i-Martin, X. (1992) 'Convergence', Journal of Political Economy, 100, 2, 223–
51.
Beron, KJ y Vijverberg, WP (2004) 'Probit in a Spatial Context: A Monte Carlo Approach', en
L. Anselin, R. Florax y S. Rey (eds) Advances in Spatial Econometrics, Heidelberg: Springer-
Verlag, págs. 169–95.
Brundson, C., Fotheringham, AS y Charlton, M. (1996) 'Regresión ponderada geográficamente:
un método para explorar la no estacionariedad espacial', Análisis geográfico, 28, 4, 281–98.

Brundson, C., Fotheringham, AS y Charlton, M. (1998) 'Modelos autorregresivos y no


estacionarios espaciales', Environment and Planning, A, 30, 6, 957–73.

Case, A. (1992) Patrón espacial en la demanda de los hogares, Econometrica, 59, 4, 953–65.
Cleveland, W. y Devlin, S. (1988) 'Regresión ponderada localmente: un enfoque del análisis
de regresión por ajuste local', Journal of the American Statistical Association, 82, 596–610.

Conley, T. (1999) 'Estimación GMM con dependencia transversal', Journal of


Econometría, 92, 1–45.
Croissant, Y. y Millo, G. (2008) 'Panel Data Econometrics in R: The plm Package', Journal of
Statistical Software, 27, 2, 1–43.
Dempster, AP, Laird, NM y Rubin, DB (1977) 'Máxima probabilidad de datos incompletos a
través del algoritmo EM', Journal of the Royal Statistical Society.
Serie B, 39, 1, 1–38.
Driscoll JC y Kraay, AC (1998) 'Estimación de matriz de covarianza consistente con datos de
panel espacialmente dependientes', The Review of Economics and Statistics, 80, 549–60.

Dubin, RA (1992) 'Autocorrelación espacial y calidad del vecindario', Regional


Ciencia y Economía Urbana, 22(3), 433–52.
Machine Translated by Google

164 Introducción a la econometría espacial

Elhorst, JP (2003) 'Especificación y estimación de modelos de datos de panel espacial',


International Regional Sciences Review, 26, 3, 244–68.
Elhorst, JP (2009) 'Modelos de datos de panel espacial', en MM Fischer y A. Getis (eds),
Handbook of Applied Spatial Analysis, Heidelberg: Springer-Verlag.
Elhorst, J.-P. y Fréret, S. (2009) 'Evidence of Political Yardstick Competition in France Using
a Two-Regime Spatial Durbin Model with Fixed Effects', Journal of Regional Science, 49,
5, 931–51.
Fisher, RA (1959) Métodos estadísticos e inferencia estadística, Nueva York: Hafner.
Fleming MM (2004) 'Técnicas para estimar modelos de elección discreta espacialmente
dependientes', en L. Anselin, R. Florax y S. Rey (eds), Advances in Spatial Econometrics,
Heidelberg: Springer-Verlag, págs. 145–68
Fotheringham, AS, Brunsdon, C. y Charlton, ME (1998) 'Regresión ponderada geográficamente:
una evolución natural del método de expansión del análisis de datos espaciales',
Environment and Planning, A, 30, 1905–27.
Fotheringham, AS, Brunsdon, C. y Charlton, ME, (2002) Regresión ponderada geográficamente:
el análisis de las relaciones que varían espacialmente, Chichester: Wiley.

Fotheringham, AS, Brunsdon, C. y Charlton, ME (2007) 'Análisis discriminante ponderado


geográficamente', Análisis geográfico, 4, 376–96
Glaz J., Naus, J. y Wallenstein, S. (2001) Scan Statistics, Springer Series in Statistics,
Heidelberg: Springer-Verlag.
Greene, W. (2011) Análisis econométrico, 7.ª edición, Upper Saddle River, NJ:
Educativo Pearson.
Grenander, U. y Rosenblatt, M. (1957) Análisis estadístico del tiempo estacionario
Serie. Wiley, Nueva York. [2ª ed. (1984), Chelsea, Nueva York.].
Hausman, J. (1978) 'Pruebas de especificación en econometría', Econometrica, 46, 1251–71.
Hoh, J. y Ott, J. (2012) 'Estadísticas de escaneo en el mapeo de genes humanos', Am J Hum
Genet, 91, 970.
Kapoor, M., Kelejian, H. y Prucha, I. (2007) 'Modelo de datos de panel con componentes de
error espacialmente correlacionados', Journal of Econometrics, 140, 1, 97–130.
Kelejian, H. y Prucha, I. (1999) 'Un estimador de momentos generalizados para el parámetro
autorregresivo en un modelo espacial', International Economic Review, 40, 2, 509–33.

Kelejian, H. y Prucha, I. (2007) 'Estimación de HAC en un marco espacial', Journal of


Econometrics, 140, 1, 131–54.
Kelejian, H. y Prucha, I. (2010) 'Especificación y estimación de modelos autorregresivos
espaciales con perturbaciones autorregresivas y heteroscedásticas', Journal of
Econometrics, 157, 1, 53–67.
Klier, T. y McMillen, DP (2008) 'Clustering of Auto Supplier Plants in the United States:
Generalized Method of Moments Spatial Logit for Large Samples', Journal of Business and
Economic Statistics, 26, 4, 460–71.
Lee, L. y Yu, J. (2010a) 'Estimación de modelos de datos de panel autorregresivos espaciales
con efectos fijos', Journal of Econometrics, 154, 2, 165–85.
Lee, L. y Yu, J. (2010b) 'Algunos desarrollos recientes en datos de panel espacial
Models', Regional Science and Urban Economics, 40, 5, 255–71.
Lee, LF and Yu, J. (2011) 'Estimation of Spatial Panels', Foundation and Trends in
Econometría, 4, 1/2, 1–164.
Lee, LF y Yu, J. (2012) 'Paneles espaciales: componentes aleatorios versus fijos
Effects', International Economic Review, 53, 4, 1369–412.
Machine Translated by Google

Otros temas de econometría espacial 165

LeSage, J. (2004) 'A Family of Geographically Weighted Regression Models', en L. Anselin,


RJ Florax y S. Rey (eds), Advances in Spatial Econometrics: Methodology, Tools and
Applications, Springer Verlag, Berlín, págs. 241–64.
LeSage, J. y Pace, K. (2009) Introducción a la econometría espacial, Boca Raton, FL:
Chapman & Hall/CRC Press.
Leung, Y., Mei, CL y Zhang, WX (2000) 'Pruebas de autocorrelación espacial entre los
residuos de la regresión ponderada geográficamente', Environment and Planning, A, 32,
5, 871–90.
McMillen, DP (1992) 'Probit with Spatial Autocorrelation', Journal of Regional
Ciencia, 32, 3, 335–48.
McMillen, D. (1996) 'Ciento cincuenta años de valores de la tierra en Chicago: un
Enfoque paramétrico', Journal of Urban Economics, 40, 100–24.
McMillen, D. y McDonald, JF (1997) 'Un análisis no paramétrico de la densidad de empleo
en una ciudad policéntrica', Journal of Regional Science, 37, 591–612.
McMillen, D. y McDonald, JF (2004) 'Estimación de máxima verosimilitud ponderada
localmente: evidencia de Monte Carlo y una aplicación', en L. Anselin, RJGM
Florax y S. Rey (eds), Advances in Spatial Econometrics: Methodology, Tools and
Applications, Berlín: Springer Verlag, págs. 225–39.
Millo, G. (2014) 'Estimación de máxima verosimilitud de paneles correlacionados espacial y
serialmente con efectos aleatorios', Estadística computacional y análisis de datos, 71,
914-33
Millo, G. y Pasini, G. (2010) '¿Reduce el capital social el riesgo moral?
Un modelo de red para la demanda de seguros de no vida', Fiscal Studies, 31, 3, 341–72.
Millo, G. y Piras, G. (2012) 'splm: Modelos de datos de panel espacial en R', Journal of
Software estadístico, 1–43. URL http://www.jstatsoft.org/v47/i01/.
Mundlak, Y. (1978) 'On the Pooling of Time Series and Cross-Section Data', Econometrica,
46, 69–85.
Munnell, AH (1990) '¿Por qué ha disminuido el crecimiento de la productividad? Productividad
e inversión pública', New England Economic Review, 30, 3–22.
Mur, J., López, F. y Angulo, A. (2008) 'Síntomas de inestabilidad en modelos de dependencia
espacial', Análisis geográfico, 40, 2, 189–211.
Mutl, J. y Pfaffermayr, M. (2011) 'La prueba de Hausman en un panel de Cliff y Ord
Modelo', Econometrics Journal, 14, 1, 48–76.
Newey, W. y West, K. (1987) 'A Simple Positive Semi-Definite Heteroscedasticity and
Autocorrelation Consistente Covariance Matrix', Econometrica, 55, 703–8.
Oberhofer, W. y Kmenta, J. (1974) 'Un procedimiento general para obtener estimaciones de
máxima verosimilitud en modelos de regresión generalizados', 42, 3, Econometrica, 579–
90.
Pace K. y LeSage, J. (2004) 'Estimación local autorregresiva espacial', en A. Getis, J. Mur
y H. Zoller (eds), Recent Advances in Spatial Econometrics, Nueva York: Palgrave
Macmillan, págs. 31– 51.
Paez, A., Long, F. y Faber, S. (2008) 'Enfoques de ventanas móviles para la estimación de
precios hedónicos: una comparación empírica de técnicas de modelado', Urban Studies,
45, 8, 1565–81.
Paez, A., Uchida, T. y Miyamoto, K. (2002) 'Un marco general para la estimación e inferencia
de modelos de regresión ponderados geográficamente', Environment and Planning, A,
34, 4, 733–54.
Pinkse, J. y Slade ME (1998) 'Contacto en el espacio: una aplicación de estadísticas
espaciales a modelos de elección discreta', Journal of Econometrics, 85, 125–54.
Machine Translated by Google

166 Introducción a la econometría espacial

Pinkse, J., Slade, M. y Shen, L. (2006) 'Probit espacial dinámico con efectos fijos utilizando GMM
de un paso: una aplicación a las decisiones operativas de la mina', Análisis económico
espacial, 1, 53–99.
Pinkse, J., Slade, ME y Brett, C. (2002) 'Competencia de precios espaciales: un enfoque
semiparamétrico', Econometrics, 70, 1111–53
Piras, G. (2011) 'Estimación de modelos de datos de panel espacial de efectos aleatorios: alguna
evidencia adicional', documento de trabajo.
Smirnov, O. (2010) 'Modelado de elección espacial discreta', Regional Science & Urban
Economics, 40, 5, 292–8.
Wang, H., Iglesias, EM y Wooldridge, JM (2013) 'Estimación de máxima verosimilitud parcial de
modelos probit espaciales', Journal of Econometrics, 172, 77–89.

Wang, X. y Kockelman, KM (2009) 'Inferencia bayesiana para datos de respuesta ordenados con
un modelo probit ordenado espacial dinámico', Journal of Regional Science, 49, 5, 877–913.

Wheeler, DC y Paez, A. (2010) 'Regresión ponderada geográficamente', en M. Fischer y A. Getis


(eds), Handbook of Applied Spatial Analysis: Software Tools, Methods and Applications, Berlín:
Springer Verlag.
Wooldridge, J. (2002) Análisis econométrico de datos de panel y de sección transversal,
Cambridge, MA: MIT Press.
Machine Translated by Google

5
Especificaciones de modelos alternativos para
grandes conjuntos de datos

5.1 Introducción

En los Capítulos 3 y 4 hemos presentado una serie de técnicas de


estimación para el modelo lineal econométrico espacial general que
básicamente se remontan a los dos paradigmas de Máxima Verosimilitud
y Mínimos Cuadrados Generalizados en Dos Etapas. En particular, cuando
discutimos el enfoque de Máxima Verosimilitud, señalamos que las
funciones de verosimilitud no pueden maximizarse analíticamente debido
a un alto grado de no linealidad en los parámetros, por lo que tenemos
que usar aproximaciones numéricas. Sin embargo, la función de
verosimilitud involucra el cálculo del determinante de una matriz cuya
dimensión depende del tamaño de la muestra y que debe evaluarse
repetidamente para cada valor de prueba del parámetro de correlación espacial en una
es muy grande, como suele ocurrir en muchas aplicaciones empíricas con
una cantidad masiva de datos, esta operación puede ser muy exigente, si
no prohibitiva. La descomposición de valores propios sugerida por Ord
(1975) y utilizada durante muchos años en la literatura (ver sección 3.4.3)
también tiene algunas limitaciones. De hecho, Kelejian y Prucha (1998)
informan que el cálculo de valores propios mediante subrutinas estándar
para matrices no simétricas generales también es aproximado y puede
ser muy impreciso para matrices W que son del orden de 400 por 400, es
decir, para tamaños de muestra relativamente pequeños. La precisión
mejora si la matriz de peso es simétrica, pero desafortunadamente este
no es el caso cuando se trata de versiones estandarizadas por filas. En la
literatura se propusieron muchas otras aproximaciones (ver Arbia, 2006
para una revisión). Tales aproximaciones suelen ser precisas si la matriz
de pesos es escasa (es decir, contiene un alto porcentaje de entradas
cero), pero no si son muy grandes. Al respecto, Bell y Bockstael (2000) reportan precisió

167
Machine Translated by Google

168 Introducción a la econometría espacial

problemas en la determinación de los valores propios de matrices dispersas del


orden de 2000 por 2000. El problema se agrava si las matrices son muy densas
(es decir, si contienen un alto porcentaje de entradas distintas de cero) como las
que se encuentran con frecuencia, por ejemplo, en las aplicaciones de interacción
social.
Los problemas computacionales asociados con la maximización de la
probabilidad fueron un tema relevante en la década de 1970, en tiempos de
computadoras de baja velocidad y memoria pequeña, pero incluso en la situación
actual de aumento del poder de cómputo, la carga del cálculo puede volverse
insoportablemente exigente en términos de tanto del tiempo de cómputo como
del almacenamiento informático requerido porque la disponibilidad de bases de
datos muy grandes también ha ido aumentando a un ritmo acelerado. Por
ejemplo, muchos datos de salud proporcionados por el Centro Nacional de
Estadísticas de Salud de los EE. UU. están disponibles a nivel de condado e
involucran, por lo tanto, más de 3000 observaciones y, por lo tanto, requieren el
inverso de una matriz W de dimensión 3000 por 3000 en cualquier econometría espacial. mode
Sin embargo, esto no es nada en comparación con muchos otros datos
económicos georreferenciados como, por ejemplo, las observaciones relacionadas
con los establecimientos de EE. empresas Otros ejemplos incluyen imágenes
satelitales utilizadas en la evaluación de la cobertura terrestre o imágenes
médicas de alta resolución en las que las técnicas econométricas espaciales
tienen que adaptarse a millones de observaciones espacialmente dependientes
compuestas de imágenes pixeladas. Además, los datos disponibles en el mapeo
del genoma humano muestran dependencia espacial e involucran millones de
observaciones para las cuales un enfoque de probabilidad conjunta es
completamente inviable. Hemos citado sólo algunos de los muchos ejemplos
posibles que están surgiendo en diferentes campos. Es fácil predecir que la
demanda futura de grandes datos espaciales seguirá aumentando, al igual que
la demanda de desarrollar métodos apropiados para analizar estas nuevas
fuentes de datos.

La relevancia continua de los problemas computacionales en el modelado


econométrico espacial es atestiguada por la gran cantidad de soluciones
aproximadas sugeridas en la literatura en los últimos años (por ejemplo, Smirnov
y Anselin, 2001; Griffith, 2000, 2004; Pace y LeSage, 2004) . Estas contribuciones
se han introducido para acelerar el cálculo de los procedimientos presentados
en los Capítulos 3 y 4, pero parte de la literatura más reciente se ha concentrado,
en cambio, en la especificación de modelos alternativos que se apartan de la
clase autorregresiva espacial convencional con el objetivo específico de reducir
los obstáculos computacionales. Estas contribuciones tienen algunas
características comunes: son teóricamente
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 169

muy simples, producen soluciones de forma cerrada para los estimadores ML


y mejoran dramáticamente el desempeño numérico.
En este capítulo revisaremos algunas de estas especificaciones alternativas.
En particular, en la sección 5.2 consideraremos la Especificación espacial
exponencial matricial (MESS), la sección 5.3 está dedicada a la aproximación
unilateral de modelos espaciales y, finalmente, en la sección 5.4
presentaremos la técnica de codificación bivariada y el máximo marginal
bivariado asociado. estimación de probabilidad.

5.2 La especificación MESS

5.2.1 Una especificación de retraso espacial MESS


Para introducir la especificación MESS, consideremos nuevamente el modelo de
Rezago espacial definido en la sección 3.5:

= 1 lb l <+ y+ Wy Z u (5.1)

iidN
ÿ .. .(0,a )menudo
2 con unoXestocásticos yW
y, filas
(aunque
expresión en(5.1)
lasnoaplicaciones
denecesariamente
empíricas.
la siguiente ) estandarizados
forma Reescribamos
alternativa: por la

(Yo Wy
) +ÿlb = Z tu (5.2)

Como se dijo, los problemas computacionales que surgen cuando se analizan bases
de datos muy grandes se derivan principalmente de la inversión de la matriz de
ÿ

1
IWÿl la Ecuación
covarianza de varianza del modelo ( (consulte ) la Ecuación
3.47). Ahora
(5.2)generalicemos
y
especifiquemos un nuevo modelo de Rezago espacial generalizado como:

=
sy zu + segundo (5.3)

siendo S una matriz definida positiva real. La especificación de la matriz S


de diferentes maneras tiene un efecto sobre la matriz de varianzas-covarianzas
y, como consecuencia, produce la especificación de diferentes modelos
econométricos espaciales. Siguiendo un procedimiento sugerido por Chiu et
al. (1996), LeSage y Pace (2007), propusieron la siguiente especificación de
matriz exponencial para la matriz S:

S mi =aW (5.4)
Machine Translated by Google

170 Introducción a la econometría espacial

Antes de revisar las ventajas computacionales de esta especificación,


reescribamos la matriz S explotando la siguiente expansión en serie de potencias:

ÿ
W
yo

S =e W =
un ÿa (5.5)
i =0
i!

En esta expresión encontramos los términos2 1W W, ,...... que requieren explicación.


En econometría espacial, por analogía con el análisis de series temporales,
podemos definir niveles de vecindad de orden superior ampliando la noción de
retraso espacial presentada en la sección 2.1. En particular, hemos definido la
matriz W de tal manera que sus entradas distintas de cero se refieren a pares de
unidades espaciales vecinas. Podemos referirnos a ellos como “vecinos de primer
orden”. Los elementos distintos de cero de la matriz W 2 se refieren deamanera
similar aquellos
pares que son vecinos de los vecinos de primer orden. En este sentido pueden ser
considerados vecinos de segundo orden. Las matrices W de orden superior se
definen de manera similar. Como alternativa, los vecinos de orden superior también
se pueden definir considerando varios niveles de distancia.
Chiu et al. (1996) enumeran una serie de ventajas de la transformación (5.5). En
en particular, se mantienen las siguientes propiedades útiles:

Propiedad 1. Para cualquier matriz real definida positiva S, siempre existe


aW
una matriz real simétrica ÿW tal que S e = Propiedad 2. Para cualquier
matriz real simétrica W, S es una matriz definida positiva

Propiedad 3. El inverso de S es
ÿ

1S = mi
ÿ

aW

Propiedad 4. El determinante de S es . Dado


= (Sque todos
etr Wa ) los elementos diagonales
de una matriz W son cero por definición (Wii = 0, consulte la sección 2.1), esta
expresión se simplifica aún más como = etr=()wa=1
Ver 0 .

Las propiedades anteriores aseguran que:

1. Siempre es posible utilizar este enfoque.


2. El enfoque conduce a matrices de varianza-covarianza bien definidas.
3. La inversa de la matriz S es muy sencilla de calcular.
4. El determinante de la matriz S siempre es igual a 1.

Como consecuencia, el log-verosimilitud del modelo MESS no requerirá el


cálculo del log-determinante que es la principal fuente de problemas
computacionales en el caso del modelo Spatial Lag.
El parámetro a en la ecuación (5.5) está relacionado con el parámetro l en la
especificación de retraso espacial (5.1) y controla el nivel de espacial
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 171

ÿaW
correlación. De hecho, a partir de la ecuación, SIWe)=
=(ÿltomando la norma de
suma máxima de filas de las dos matrices e igualándolas obtenemos:

1 = ÿ cada uno (5.6)

o inversamente:

ll = ln(1 ) ÿ (5.7)

De la Ecuación (5.7), dado que l <1, deducimos que el rango de a es


ÿÿ < a ÿ 0, para l positivo y 0 0.693147
= 0,
para
entonces
l negativo.
también
En particular,
a = 0, y cuando
cuandol l
Æ 1 , entonces a ÿ ÿÿ
aunque podemos alcanzar valores de l muy cercanos a 1 ya para a = ÿ5
(l = 0,99).
Para propósitos de estimación y prueba de hipótesis, consideremos ahora
la verosimilitud logarítmica de esta nueva especificación. En primer lugar
nótese que en la Ecuación (3.47) si reemplazamos el término tenemos:()IW ÿl por S,

1 T
E (yy ÿ )ÿ =IWIW SS
= 2ÿ ( =
ÿ ÿ

T 2 21 T
) l ÿÿ)(- l (5.8)
ÿÿ

mi mi mi

Entonces, la log-verosimilitud en la Ecuación (3.49) ahora se puede expresar como:

1
2
ÿ,, rb ; ) constante
=y
1 2 1 ln ÿSS
e ÿÿ

T ÿ ÿÿ ÿ ÿ 1ÿÿ ÿb T
ÿ

T ÿ

1
b
y SX SS y SZ
ÿ ÿÿ ÿ

yo (
2 2ÿ 2
mi

1
(5.9)
= constante 1 2en
1 T T
ÿ ÿÿ ÿ

ÿ SS
ÿÿ

[Sí
][ ]Z Sí Zyo yo
2 mi
2ÿ 2
mi

T = 1 T
1 Observe que a partir de la Ecuación (3.50), tenemos
SS
a partir
SS ÿÿ de
ÿ ÿlay,Propiedad
4 de la matriz exponencial informada anteriormente, esto simplifica 1 = 1 T
como SS ÿ ÿ . Como consecuencia tenemos:

2 2
1 T
yo (
ÿ , libras
, =; yc
) ÿÿ ÿ

1 en ÿ
mi Sí Z Sí Z [ segundo
]
ÿ

(5.10)
2ÿ mi2
[ ] segundo

siendo S una función de l y por lo tanto de a. Como no está presente ningún


determinante en la Ecuación (5.10), al estimar los parámetros b y a, maximizar
la verosimilitud logarítmica es equivalente a minimizar el término [ ]
T
Sy Z Sy ][Z b que corresponde
- segundo
ÿ

, a la suma de los errores cuadrados de


el modelo transformado.
Machine Translated by Google

172 Introducción a la econometría espacial

Desde un punto de vista práctico, la expansión infinita mostrada en (5.5) obviamente


tiene que ser truncada a, digamos, q términos que conduzcan a la aproximación:

ÿ ii ii q
W = un WW un
=
Se (5.11)
un ÿ ÿÿ
yo =0
yo !
i =0 i!

LeSage y Pace (2007) han demostrado que el papel de parada q depende de la cantidad
de correlación espacial (positiva o negativa), mientras que no depende del tamaño de la
muestra. También muestran, a través de datos simulados, que cuando el valor absoluto de
la correlación espacial no es muy alto (inferior a 0,95, como suele ocurrir en circunstancias
prácticas), un truncamiento en q = 16 produce una muy buena aproximación. Para niveles
más altos de l se necesitan más términos en la expansión.

Si la matriz W es escasa, los cálculos son bastante simples y no requieren un esfuerzo


computacional particular. Sin embargo, si la matriz de peso es muy densa (como sucede,
por ejemplo, en las redes sociales
i
ÿ yo un W
aplicaciones) entonces la transformación ÿ i =0
también será denso
i!
y el cálculo de la matriz S podría ser prohibitivo en términos de la memoria requerida y del
tiempo de cómputo, anulando así los beneficios computacionales del procedimiento. Sin
embargo, observe que el procedimiento no requiere el cálculo de S, sino solo del producto
de matriz Sy
(ver Ecuación (5.10)), y esta operación es significativamente más simple.
LeSage y Pace (2007) muestran que otra ventaja del MESS
especificación es la posibilidad de derivar soluciones de forma cerrada para las estimaciones
de parámetros, algo que no es posible para los modelos autorregresivos tradicionales
examinados en el Capítulo 3 debido al alto grado de no linealidad de la función de
verosimilitud. Para derivar tales soluciones de forma cerrada, necesitamos expresar la
transformación (5.5) en forma matricial. Para lograr este objetivo, introduzcamos algunas
definiciones.
En primer lugar defina una matriz que contenga todos los valores de la variable
dependiente y y de sus términos rezagados de varios órdenes:

2 q ÿ 1ÿ
Y y=Wy,W y W
, y ÿ ,...., (5.12)
ÿ

donde q es el valor de parada elegido en la aproximación de expansión de potencia (5.11).


Si y es, digamos, un vector n por 1 , entonces la matriz Y es una matriz n por q . En segundo
lugar, definamos una matriz diagonal (q-por-q) ,
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 173

digamos G, que contiene los primeros coeficientes q de la expansión de potencia


en la Ecuación (5.11):

ÿ1
ÿ 0!
0... 0 ÿ

0 1 ... 0
= 1!
GRAMO
(5.13)
... ... ... 0

0 00 1
ÿ (1)!
qÿÿ

Finalmente, defina un vector, digamos u(a)T, que contenga la potencia del


parámetro a que controla la correlación espacial:

T 2 q aa a ÿ ÿ1
tu ÿ ( ) = 1, , ÿ ,..., (5.14)
ÿ

Usando las definiciones contenidas en la Ecuación (5.12), (5.13) y (5.14) podemos


reexpresar la Ecuación (5.5) como:

Sy YG ÿ ( ) a (5.15)

la aproximación se debe al truncamiento en la expansión de potencia.


Premultiplicando ambos lados de (5.15) por la matriz de proyección idempotente
T 1 T,
PI =
XX() XX expresado en
ÿ

podemos derivar las sumas de los cuadrados de los residuos


función de los elementos transformados, es decir:

TTT
tú _ () (ul = GYP PY Gua ) () (5.16)

o, más simplemente, como:

T
tú _ Q ÿ ua ua () () (5.17)

TT
habiendo definido =( QGYP PYG ) , para que al final:

T T
min( ) min(
( )) ( ) uu ÿ ua ua Q (5.18)

LeSage y Pace (2007) demostraron que la Ecuación (5.18) es un polinomio en a que admite
una solución de forma cerrada y probaron que tal solución es única y representa un mínimo.
Además, las condiciones de segundo orden proporcionan una forma alternativa de evaluar
el Hessian y, como consecuencia, los errores estándar en los que podemos basar la
inferencia y la prueba de hipótesis sobre los parámetros.
Machine Translated by Google

174 Introducción a la econometría espacial

La Especificación Espacial Exponencial Matricial es una técnica aproximada


(debido al truncamiento en la Ecuación (5.11)) que reduce drásticamente el
tiempo computacional y el almacenamiento en la computadora requerido para
estimar modelos econométricos espaciales. Sin embargo, los defensores de la
metodología muestran a través de algunos análisis empíricos (LeSage y Pace,
2009) que esta aproximación es muy buena. Utilizando un conjunto de datos
sobre los precios de la vivienda de 506 distritos censales en el área de Boston
(véanse los Ejemplos 3.3. y 3.4), los autores estiman un modelo espacial
utilizando tanto un Rezago espacial de verosimilitud total como la especificación
MESS y luego comparan los resultados obtenidos en términos de la estimaciones
de los parámetros s2, b y l (comparándolo con el valor de a implícito en las
Ecuaciones (5.6) y (5.7)). Los resultados empíricos proporcionan una indicación
clara de que la inferencia es idéntica, tanto en términos de estimación puntual de
los parámetros de regresión como en términos de los valores p de los procedimientos de prueb
Además, la estimación de l en el método de verosimilitud total aplicado al modelo
Spatial Lag es coincidente con la derivada de la estimación de a en la
especificación MESS. Por lo tanto, los beneficios computacionales no son a
expensas de la precisión de la estimación, al menos en el conjunto de datos
relativamente pequeño examinado.

5.2.2 Una especificación de error espacial MESS y extensiones adicionales


De manera similar, podemos considerar una especificación MESS
correspondiente a un modelo autorregresivo de error espacial. Supongamos
ahora, como en la Ecuación (3.13) del Capítulo 3.4, el modelo:

yZ=tu + b (5.19)

pero ahora, en lugar de modelar los residuos como en la Ecuación (3.14) como
u Wu = 1 + r ,er < , Consideremos el siguiente modelo más general:

mi ÿ ÿ N(0, ) (5.20)

con ÿ una matriz de varianza-covarianza genérica para las perturbaciones de


regresión.
Si en la Ecuación (5.20) suponemos ÿ = eaW, entonces tenemos un MESS específico

ficación de un error espacial, que se puede expresar como W


= =miÿ a ÿ
ÿ wa
yo

o:
i =0
i!

ÿ ÿ

un W
yo

ÿ ÿ

1 = mi
ÿ

W = (5.21)
un ÿ i!
i =0
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 175

= (IW
ÿ

1 ÿ

T
Si, por el contrario, ÿÿIWÿ rr )( ) , o

= (Yo WI W rr T
ÿÿ ÿ1
ÿ

)( ) (5.22)

volvemos a tener el modelo de error espacial convencional. Note que podemos


expresar la Ecuación (5.22) como:

T
ÿÿ ÿ1rr=rr(Yo WI WI)(
ÿ

WI W ) =( ÿ

)( ÿ T
)
(5.23)
= IWWrrrWW
ÿÿ T+ 2 T

1 +
ÿ ÿ =2 22 (5.24)
Yo WW rr
ÿ

que puede interpretarse como un caso particular de la Ecuación (5.21) cuando


2
ÿ ÿ un r = 2, ÿun = r 2y la expansión se trunca en q = 2.
2
LeSage y Pace (2009) utilizaron análisis de datos reales basados en los 3107
condados de EE. UU. y el análisis de datos simulados (colocados en la misma
partición geográfica) para demostrar que la especificación MESS proporciona
una muy buena aproximación de los parámetros estimados al máximo. como
estimadores del modelo de error espacial de vida.
Se pueden considerar ponderaciones espaciales más generales que
extiendan la flexibilidad de la especificación MESS. Esto se logra al incluir
un parámetro adicional en la transformación exponencial de la matriz que
controla la velocidad con la que la correlación decae en las vecindades de
orden superior. En particular, LeSage y Pace (2009) sugieren la siguiente
expresión para la matriz W que se utilizará en la Ecuación (5.4):

mi yo _
= ÿ
Wÿÿ (5.25)
metro
i
yo = 1
i =1
ÿ

En esta expresión, Wi es una matriz de ponderación espacial que contiene


elementos distintos de cero para el i-ésimo vecinoÿ de más cercano,deesdistancia
disminución un parámetro
tal
que 0 1 ÿ ÿ y eldefinición,
ÿtérminoprincipal
enla el denominador
nueva matriz
y es W es
tal que laun
tiene factor
cero
suma de normalización.
elementos
de cada en igual
fila es aPor
la diagonal
1. Por
supuesto
Machine Translated by Google

176 Introducción a la econometría espacial

la mayor flexibilidad de esta especificación es el precio que se paga por un


mayor esfuerzo computacional, también debido a la presencia de dos
del método a estimar (myFodology)
parámetros
sugieren
más). un
Porenfoque
esta razón,
bayesiano
los proponentes
para la
fase de estimación y prueba de hipótesis especificando los antecedentes
apropiados para los parámetros.

Ejemplo 5.1 Planificación de la salud en México

Consideremos ahora, como ejemplo, el caso de un modelo de Rezago


Espacial estimado mediante la aproximación MESS. El conjunto de datos
que estamos utilizando en este ejemplo se refiere a algunos datos de estados
mexicanos en 2010. Sin el objetivo de contribuir sustancialmente al problema,
pero solo para ilustrar el procedimiento MESS, imaginemos que, para fines
de planificación, desean estimar una relación que explique el número de
médicos por cada 1.000 habitantes en cada estado en función del número
de personal sanitario por cada 1.000 habitantes, el porcentaje de población
mayor de 65 años y el gasto sanitario per cápita en 2000 y en 2010. Los
shapefiles de los 32 estados mexicanos se pueden descargar en http://
www.gadm.org/ mexico, y el mapa se muestra a continuación junto con los
datos necesarios para el análisis.

5
6
10

27

26
4 9
28
8
21
12 19
29
18
14 24 31
11 13 0 2525
2022 22 30
3 23
dieciséis

1
17 15
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 177

Estados de código Número Per cápita Per cápita Personal de % de


de médicos Salud Salud Salud por 1.000 Población
por cada 1.000 Gastos 2010 Gastos 2000 habitantes mayor de 65 años
habitantes

0 Distrito 3.1 9.437522 0.7521 15.3 7.771425


Federal
1 Guerrero 1.4 2.572524 0,427321 5,5 6.917765
2 México 1 2.780234 0,435988 4,7 4.911075
3 Morelos 1.4 2.974519 0,629462 6,1 6.992579
4 Sinaloa 1.7 3.271296 0,700082 7,1 6.616576
5 Baja 1.2 3.420365 0,574503 5,5 4.457112
California
6 Sonora 1.9 3.424168 0.770872 8.6 5.950505
7 Baja 2.1 5.02135 0.667388 9.3 4.272824
californiasur
8 Zacatecas 1.7 2.897978 0.640509 6.4 7.450485
9 Durango 1.8 3,45163 0,556376 7.2 6.429409
10 chihuahua 11 1.2 3,622121 0,691472 6.2 5.67107
Colima 2,2 3,983012 0,672654 9 6,205932
12 Nayarit 2,2 3,329873 0,732461 8.1 7,12659
13 Michoacán 1,4 2,164095 0,642803 5.1 7,266681
de ocampo
14 Jalisco 15 1,5 2,974531 0,702626 6,4 6,269595
Chiapas 1 2,139129 0,496826 4,1 4,898949
16 Tabasco 17 2,2 4,03974 0,493174 9,3 5.190782
Oaxaca 1,4 2,532036 0,526933 5,3 7.787479
18 Guanajuato 1,4 2,532267 0,529055 5,4 6.045926
19 Aguascalientes 20 1,9 3,549239 0,529501 8,3 5.092591
Querétaro 21 1,3 2,726577 0,48921 5,1 5.109038
San Luis 1,5 2,654342 0,594948 5,5 7.155858
Potosí
22 Tlaxcala 23 1,4 2.75405 0,399939 5.5 5.957505
puebla 1,3 2.180045 0,501114 4,9 6.295532
24 Hidalgo 1,5 2.566565 0,477279 6,3 6.613051
25 Veracruz de 1,5 2.88041 0,646695 5,9 7.311852
Ignacio de la
Llave
26 Nuevo León 27 1.4 3.52745 0.689333 5.902514
Coahuila de 1.7 3.364743 0.691015 7 7.9 5.691221
Zaragoza
28 Tamaulipas 1,7 3.452093 0,669398 7,6 5.976068
29 Yucatán 1,6 3.754511 0,63864 6,9 6.898322
30 Campeche 31 2,5 4.689265 0,51398 9.3 5.653901
quintana roo 1,2 3.595703 0,299441 6.2 2.978851

Fuente: Datos de población: http:// www.inegi.org.mx/ est/ contenidos/ proyectos/ ccpv/ cpv2010/ Default.aspx
Datos de salud: http:// www.sinais.salud.gob.mx/ estadisticasportema.html.

Consideramos una matriz de peso basada en la distancia (estandarizada por


filas), considerando dos estados vecinos si la distancia entre sus centroides era
menor que un umbral que garantiza que todos los estados tienen al menos un vecino.
Machine Translated by Google

178 Introducción a la econometría espacial

Estimamos un modelo de retraso espacial utilizando tanto la máxima


verosimilitud exacta como la aproximación MESS. La especificación del modelo
y bb
de Rezago Espacial utilizado 33bla44siguiente
fue XXXX Wy =+++b + b+ 0 1122l + e,
siendo y = número de médicos por cada 1.000 habitantes, siendo X1 el número de
personal sanitario por cada 1.000 habitantes, X2 y X3 el gasto sanitario per cápita
en 2000 y, respectivamente, en 2010 y X4 el porcentaje de población mayor de 65 años.

Máximo LÍO
Probabilidad Especificación

Estimado Estándar valor p Estimado Estándar valor p


Valor Error Valor Error

B0 0.139859 0.446938 0.75434 B1 0.186960 0.124292 0.200922 0.54136

0.012195 0.000 *** 0.187352 B2 0.058434 0.031370 0.06250 B3 0,012738 0,000***


0.058685
–0.049681 0.0343388 0.14794 –0.049863 0.04110961010 0.0610 0.033965 0.09545

0.02010 0.0601010101010101TRA 0.01010101TA 0.010101TA 0.037131 0.19049

0.010A 0,024870 0,01475*


l-0.14109 0.19208 0,46263 –0,1365203 0,16331 0.43326

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1.
signif. códigos: 0

Comparando los resultados obtenidos con los dos métodos de estimación, notamos
que la especificación MESS confirma sustancialmente las conclusiones de la
estimación ML en términos tanto del signo como de la significación de los parámetros.
El personal de salud por cada 1.000 habitantes y el porcentaje de población mayor de
65 años parecen ser los factores más significativos para explicar la distribución
geográfica de los médicos en las 32 entidades federativas de México. Las estimaciones
puntuales de los parámetros son todas muy similares con una pequeña subestimación
del procedimiento MESS solo para el parámetro de dependencia espacial l y para el intercepto.
En ambos casos el parámetro l es negativo y no significativamente diferente de cero. Los
errores estándar también son todos notablemente similares. Con un tamaño de muestra
muy pequeño como el empleado en este ejemplo, la diferencia en los tiempos de cómputo
es obviamente insignificante. Sin embargo, el ejemplo muestra que en grandes conjuntos
de datos, la especificación MESS puede reducir sustancialmente la carga computacional
sin pérdida de precisión de las estimaciones.

5.3 El enfoque de aproximación unilateral

5.3.1 La importancia de las asimetrías y anisotropías en la


econometría espacial
Los modelos autorregresivos que hemos discutido en los capítulos 3 y 4
anteriores tienen una característica común. Se basan en la
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 179

definición general de variable retrasada espacialmente dada en la sección 2.1 donde


definimos el valor retrasado espacialmente de, digamos, la variable y en la ubicación i como:

norte

i *
Ly( )=
wy ijjÿ=1
j (5.26)

*
siendo wij la matriz de peso estandarizada (ver Ecuación (2.3)). En otros
términos, el retraso espacial se define como el promedio del valor yj observado
en todas las ubicaciones que son vecinas de la ubicación i. Esta expresión
implica que la dirección no importa ya que todos los vecinos (cualquiera que
sea su posición con respecto a la ubicación i) contribuyen de la misma manera
a la variable rezagada. Esta hipótesis, implícitamente asumida por todos los
modelos presentados hasta ahora, se conoce en la literatura como isotropía
(para una definición formal, véase, por ejemplo, Cressie, 1993).
El concepto de isotropía deriva de la física e implica que la estructura de
dependencia no presenta sesgos direccionales o direcciones preferidas.
La hipótesis de la isotropía se discute comúnmente en muchas ramas de
la estadística espacial. Por ejemplo, cuando se trata de datos espaciales
en meteorología, geología u otros fenómenos físicos (donde la dirección
es de suma importancia; véase, por ejemplo, Schabenberger y Gotway,
2002) o en aplicaciones de imágenes médicas donde, por ejemplo, la
anisotropía es demostró ser un buen predictor del riesgo de cáncer de
mama (Heine y Mahorta, 2002).
Los economistas siempre han sido conscientes de este problema. Por
ejemplo, el premio Nobel Clive Granger (1974) señaló que la suposición
de ausencia de sesgos direccionales es particularmente fuerte y poco
realista en la econometría espacial. Afirma que “si la dirección no importara,
el grado de relación de estas variables dependería únicamente de la
distancia entre los puntos. La relación entre los valores medidos en Oxford
y Londres será la misma que entre los valores medidos en dos pueblos de
Lincolnshire separados por 55 millas aproximadamente. La correlación
entre las cifras de desempleo en Nueva York y Filadelfia será la misma
que entre dos pequeños pueblos del medio oeste a unas cien millas de
distancia. Este supuesto de estacionariedad en el plano es completamente
irreal para las variables económicas” (Granger, 1974, p. 15).
Una manifestación particularmente común de la anisotropía es la asimetría
de las relaciones espaciales. De hecho, en el libro fundacional de la disciplina,
Paelinck y Klaassen (1979) identifican la asimetría como una de las cinco
características fundamentales de la econometría espacial. Un buen ejemplo de
Machine Translated by Google

180 Introducción a la econometría espacial

la asimetría está representada por el modelo centro-periferia (ver, por


ejemplo, Paelinck y Nijkamp, 1975) que asigna una mayor dependencia
del centro a la periferia que en la dirección inversa. Los sesgos
direccionales se pueden observar en muchas circunstancias empíricas,
como en el patrón dinámico de los precios de la vivienda (Holly et al.,
2010), en las muchas variables económicas observadas en los Estados
Unidos con referencia a las dependencias a lo largo de las costas (Norte-
Sur) a diferencia de la de las costas a los estados internos (Este-Oeste),
o en la UE en las diferentes dependencias entre el centro y la periferia y
viceversa, por sólo sugerir algunos ejemplos.
Incluso si la asimetría es el aspecto más intuitivo de la anisotropía, es solo
una de sus muchas manifestaciones. Para aclarar la relación entre los
conceptos de asimetría y anisotropía, consideremos un área de estudio dividida
en solo tres regiones espaciales (llamadas i, l y m) dispuestas en una cuadrícula
de celosía cuadrada regular como en la Figura 5.1, y consideremos, sin pérdida
de generalidad, la hipótesis de que la topología del sistema puede ser capturada
por la estructura vecina de una torre simple.
Definamos ahora en términos generales dos estructuras de dependencia
diferentes entre las regiones a lo largo de las direcciones vertical (V) y
horizontal (H) , respectivamente. De acuerdo con la definición de vecinos de
la torre, tenemos el siguiente sistema de ecuaciones:

ps ps

yyy= ++
r Vl yo r mi
yo Hm

yyl Vi=l re
%

+ (5.27)
yyhola=mr
%

+ mi

ps ps

con H r y v r que representa los parámetros de dependencia espacial a lo


largo de la línea horizontal y, respectivamente, la vertical, y las flechas en
superíndice que indican la dirección de dicha dependencia. La ecuación (5.27)
expresa el hecho de que la ubicación i depende horizontalmente (de izquierda a
derecha) de la ubicación m y verticalmente (de arriba a abajo) de la ubicación l; ubicación l
depende verticalmente (de abajo hacia arriba) de la ubicación i y la ubicación m
depende horizontalmente (de derecha a izquierda) de la ubicación i. Con
ps ps

# VVy HH rr #
referencia a esta situación simple, la asimetría implicarrque

yo

metro i

Figura 5.1 Tres regiones dispuestas en una cuadrícula de celosía regular


Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 181

mientras que la anisotropía (todavía en presencia de simetría) implica


ps % ps

rrrVVV== ==
rrr # Además, que . Así, la asimetría implica anisotropía, pero
no al revés.
HHH
la isotropía implica simetría, pero la simetría no necesariamente implica isotropía.

5.3.2 Prueba de isotropía en modelos de retraso espacial


Para ilustrar un procedimiento de prueba para la hipótesis de isotropía,
consideremos n observaciones de una variable y y una matriz de peso W
( no estandarizada por filas) (como sea que se defina).
Definamos también dos matrices de peso diferentes que no se superponen W1
y W2 refiriéndose a dos direcciones diferentes y tales que W1 + W2 = W. Las
dos matrices incorporan dos direcciones preferentes diferentes de dependencia
espacial. Por ejemplo, en una cuadrícula de celosía cuadrada regular, podemos
asumir la definición de caso de una torre de vecinos y dos matrices que describen
la topología que se muestra en la Figura 5.2.
Definamos ahora un modelo de retraso espacial anisótropo de dos parámetros en el
que la dependencia se desarrolla a lo largo de las dos direcciones especificadas diferentes:

2
= +ZbliidN
yuu ly ZI11)Wy +
22 W + | ÿ . . . (0, ÿ (5.28)

[ En la Ecuación (5.28) ZX WX , = ] es una matriz no estocástica de variables


independientes que pueden incluir términos rezagados, W1 es una matriz de
ponderación (no estandarizada por filas) que incorpora dependencia en una
dirección, W la matriz correspondiente completa (no matriz de peso estandarizada
por filas) derivada bajo el supuesto de isotropía, y W2 = W – W1 representa la
== , el Si
segunda dirección de 1dependencia.
2 modelo (5.28) seIsotropic
ll l parámetro reduce al familiar
Spatial Lag Model
(ver Ecuación (3.54)) definido como:

= bly
Z Wy uu+Z iid NI+ ) | ÿ . . . (0, ÿ
2 (5.29)

yo

metro i j
yo

(un) (b)

Figura 5.2 Dos matrices W diferentes que incorporan dos direcciones diferentes de dependencia espacial. (a) W1 = dependencia
de noroeste a sureste; (b) W2 = dependencia del sureste al noroeste. La celda i depende solo de las celdas l y m que siguen la
matriz de ponderación W1 , y solo de las celdas j y k que siguen la W2

matriz de ponderaciones.
Machine Translated by Google

182 Introducción a la econometría espacial

Dejar tu
( ani ) = y Z Wy Wy ÿÿ ÿ bl l ÿ ÿbly yZ( Wy tuperturbaciones
ISO ) =
en los dos ser el
11 22
modelos en competencia. Las funciones logarítmicas de verosimilitud para
los modelos anisotrópico e isotrópico vienen dadas respectivamente por:

2
, llb IWWtodos
1 2,, ) constante
=
ÿ 1 en
Y YO (
ÿ ÿÿ

yo
11 22
2
1
(5.30)
ÿ

uu
( ANÍ
T
)( ) ANÍ
2ÿ 2

1 1 en (
2, , ÿ ÿÿ l onst IW uuc 2 ( TISO
) ISO )
yo (
ISO ÿ libras ) = (5.31)
2ÿ 2

Dadas estas definiciones, Arbia et al. (2013) desarrollaron una prueba de isotropía
considerando los estadísticos de la prueba de Razón de Verosimilitud (ver Ecuación (1.30)):

ˆˆˆ ˆˆ
Una prueba , llb ÿ, 2) ÿ 1ÿ,2
= 2 (ˆlANI
ÿ ÿ
ÿ ÿ

(ˆ ,2 , ÿ) lb
ÿ ISO ÿÿ (5.32)

ˆˆ ˆ

donde 1l Y2 b 2es la, verosimilitud


ÿYOll (ˆ, lb es la verosimilitud
logarítmicalogarítmica
maximizadamaximizada
de unre , )de
lISO
, ) el
ÿ
ˆˆ

modelo estricto y (ˆ, 2 restringido.


modelo parámetrosEndesconocidos
ambas expresiones,
se reemplazan
los
por los estimadores ML correspondientes , indicados por el sombrero.

La teoría asintótica estándar garantiza que, bajo la hipótesis nula 2


de isotropía, las estadísticas de prueba convergen en distribución a la variable
aleatoria 1c:

d 2 (5.33)
Una prueba ÿ &&&$c 1

En Arbia et al. (2013) los autores reportan los resultados de un estudio


de Monte Carlo que muestra que descuidar el problema de la isotropía
puede conducir a serios sesgos y pérdidas de eficiencia en la estimación de la
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 183

parámetros de regresión en modelos econométricos espaciales. En particular, demostraron


que en modelos mal identificados (es decir, cuando asumimos isotropía cuando esta
hipótesis no es cierta), si la diferencia absoluta entre l1 y l2 es grande (y por lo tanto
estamos muy lejos de la hipótesis de isotropía) tanto el sesgo relativo como los errores
estándar de las estimaciones son mayores. Además, mientras que el ML

los estimadores aún disfrutan obviamente de las propiedades asintóticas habituales,


la tasa de convergencia es más lenta.

Ejemplo 5.2 Anisotropías en el modelo de convergencia


de Barro y Sala-i-Martin

Consideremos nuevamente el modelo de convergencia regional de Barro y Sala-i-


Martin presentado en el Ejemplo 1.1. En su artículo Arbia et al. (2013) se centran
en la detección de posibles sesgos direccionales en el patrón de dependencia
espacial en el modelado de convergencia regional. En particular, consideran la
siguiente especificación de retraso espacial anisotrópico del modelo tradicional:

= Z iidN 2
yuu + IZ)11
bl ly Wy22W+ + | ÿ . . . (0, ÿ

X
con y = ln ; ZXi =
eso

X
yo 0 , Xit el ingreso per cápita en la región i en el momento t y
yo 0

u el componente de error.
Los datos empíricos considerados se refieren a la renta per cápita en las 20 regiones
italianas ya consideradas en el ejemplo 1.1 en un período de tiempo que va desde el
año 2000 hasta el año 2008. Para identificar un sesgo direccional significativo, los
autores definieron 20 matrices W1 diferentes considerando a su vez cada región como
la que origina el sesgo direccional y las otras regiones siguen de manera similar al
tiempo satisfaciendo la restricción de contigüidad. Entonces, por ejemplo, la matriz W1
que se refiere a la región de Lombardía como origen del sesgo direccional se construye
de acuerdo con el esquema que se muestra en la siguiente figura. Así, en el gráfico,
Lombardía se codifica como “región 1” y no depende de ninguna otra región, las 4
regiones codificadas como “región 2” dependen únicamente de Lombardía, las 6
regiones codificadas como “región 3” dependen únicamente de las regiones codificado
como "región 2" y así sucesivamente.
Machine Translated by Google

184 Introducción a la econometría espacial

2
3
3
1
2
2
2
3

3 3
4

4
5
5
6
6
10 7

Fuente: creación del autor utilizando el software "R" y archivos de forma disponibles en ISTAT que se
pueden descargar en la página web http:// www.istat.it/ it/ archivio/ 44523
Nota: Relación espacial anisotrópica procedente de la región de Lombardía. Cada región depende
únicamente de aquellas regiones con un número de código más bajo. La región 1 (Lombardía) es aquella
donde se origina el sesgo direccional y no depende de ninguna otra región.

La región que origina el sesgo direccional juega un papel análogo a las


observaciones iniciales en una serie de tiempo. Luego, las matrices W2 se
derivan como W2 = W–W1 para satisfacer los requisitos de la prueba. Luego
se calculó la prueba A en las 20 especificaciones diferentes. Los resultados de
este análisis se muestran en la siguiente tabla:

Región Anisotropía valor p

Una prueba

Lombardía 8.894 0.002


Friuli Venecia-Giulia 8.502 0.003
Trentino Alto Adigio 9.483 0.003
toscana 6.736 0.009
Valle de Aosta 6.437 0.011
liguria 5.666 0.017

(continuado)
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 185

Continuado

Región Anisotropía valor p

Una prueba

Umbría 2.793 0.094


Marcas 2.772 0.095
Emilia Romaña 1.301 0.254
Cerdeña 1.189 0.275
campania 1.032 0,309
calabria 0.719 0,396
Lacio 0.497 0,480
Véneto 0.337 0,561
basilicata 0.316 0,573
Apulia 0.315 0.574
Sicilia 0.207 0,648
Abruzos 0.065 0,798
Molise 0.003 0.954
Piamonte 0.002 0.956

(Los números en cursiva se refieren a la detección de anisotropía significativa).

El análisis revela que existen anisotropías significativas en el crecimiento


regional y destaca importantes sesgos direccionales que se originan en seis
regiones, a saber, Lombardía, Friuli, Trentino-Alto Adigio, Toscana, Valle de Aosta
y Liguria. La mayor significación de la prueba A se obtiene para Lombardía (la
región de Milán), que por lo tanto aparece como una región líder en el proceso de
difusión del crecimiento. Este resultado es consistente con el conocimiento común
y con la evidencia empírica ya que Lombardía es la región con mayor concentración
de actividad industrial en Italia.

5.3.3 Inferencia para un modelo de Rezago Espacial unilateral


Si se rechaza la hipótesis de isotropía usando la prueba A, entonces se deben
considerar modelos anisotrópicos apropiados del tipo presentado en la sección
anterior. Por el contrario, si esta hipótesis puede aceptarse sobre la base de datos
empíricos, entonces esta propiedad puede explotarse para simplificar los cálculos
y sortear algunas de las dificultades computacionales relacionadas con el uso de
la Máxima Verosimilitud en
modelado econométrico espacial convencional. Este objetivo puede lograrse
considerando las llamadas aproximaciones unilaterales introducidas en la literatura
por Besag (1974). De hecho, si un modelo es isotrópico, entonces la dirección no
importa y podemos aproximarnos a sus propiedades especificando un modelo
unilateral que es más simple de tratar y proporciona la misma información
inferencial. Para identificar tal modelo, primero tenemos que seleccionar una
dirección preferida convencional y luego construir
Machine Translated by Google

186 Introducción a la econometría espacial

una estructura temporal de dependencia para las variables involucradas. La


elección puede ser puramente subjetiva ya que la dirección no importa. En este
caso, similar a lo que sucede en el análisis de series de tiempo, la verosimilitud
del modelo se puede factorizar fácilmente como el producto de las densidades
condicionales de cada una de las variables, condicionadas a un conjunto de
variables denominadas predecesoras-vecinas (denotadas como PN , ver Besag,
1974 y Arbia, 2006) definidos como los vecinos a lo largo de una dirección
preferida designada (por ejemplo, una de las dos direcciones descritas en la
Figura 5.2). Como se mencionó anteriormente, si el modelo es isotrópico, este
procedimiento es inferencialmente equivalente a un enfoque de verosimilitud
total. Para introducir este método, consideremos el siguiente modelo de retraso espacial unilate

y Z=+
Wy+ bl
11l 22
Wy u + (5.34)

donde y es un vector de observaciones de la variable dependiente, X una matriz de regresores exógenos


no estocásticos; b un vector de parámetros desconocidos a estimar yu un vector de perturbaciones
estocásticas tal que . (0, u Z iidN I )
2
| ÿ .. ÿ . Además, sea W1 la matriz de peso unilateral asociada
(no estandarizada por filas) tal que w W ÿ 1; ij wij = 1 si i PN j ( ) y 0 en caso contrario. En otraswij
palabras,
= 1 si
ÿ
j es vecino de i en la dirección preferida
al esquema elegida.
de tres En este
ubicaciones caso, refiriéndonos,
mostrado en la Figura sin
5.1,pérdida dede
y al caso generalidad,
un único
regresor, la verosimilitud del modelo unilateral se puede expresar como:

norte

L fyÿ2lbÿ ( , , )= m,
yyyoyy
( | ,
yyfilmando
estoy ) (5.35)
i =1

donde lm PN
, i () modo
ÿ de que cada densidad en el lado derecho solo está condicionada a los predecesores-

vecinos.
Usando los resultados estándar en distribuciones condicionales multinormales (ver, por ejemplo,
Anderson, 2003) y suponiendo que no hay covarianza cruzada entre las variables Z e y en diferentes
ubicaciones (es decir, ( )= ( )=0 Cov Z y Cov Z y im ), la expresión genérica para la función de densidad
condicional
Illinois 2 del lado derecho de (5.35) será ÿ con media condicional y varianzas dadas por:
(,) Nmc c

ÿ norte

lb ( + µ wym mm ij j l (1+ ) ÿ
C
=
ÿ
ÿ

ÿ ÿÿ)
ÿ

ÿ
2
zi ÿ

z )
yo
ÿ

j =1 + (1 ÿ ()
(5.36)
2 22 ÿ
2 litros
b z
ÿÿ
22
C
= ÿ

ÿ
ÿ

ÿ
2 2
(1 yo ) (1 yo )
ÿ ÿ
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 187

donde l¢ denota la correlación entre yl e ym, que es la correlación entre los predecesores de yi
que son vecinos de segundo orden entre sí (ver sección 5.2.1).

Finalmente, la probabilidad asociada con la distribución (5.36) se puede expresar como:

norte

L fy
2
( ÿ yy, ll, b ÿ , )= (
ÿ m,
yyyoyy yo|estoy, )
i =1
ÿ ÿ
(5.37)
1
norte ÿ norte ÿ
ÿ
ÿ

ÿ2ÿ
= constante ÿ ( 2 )2 ÿ exp
C
ÿ

2ÿ 2
ÿ

ÿ (y ic ÿ

metro ) ÿ
ÿ

ÿÿ
ci ÿ =1 ÿ ÿ

y la log-verosimilitud como:

2
norte 1 ÿ
norte
ÿ

, ÿ , ) = c onst
l (ÿ, ll segundo en (ÿc _2 ) (y ic
ÿÿ ÿ ÿ ÿ

ÿ metro )2
2 2 ÿ ci2 =1
ÿ ÿ

y, sustituyendo las Ecuaciones (5.36) en (5.37), finalmente tenemos:

2 22 ÿ
ÿ n ÿ ln 2 2 litros
b z ÿ

, ll, b , ÿ) =
2 2
ÿ constante ÿÿ ÿ

ÿ ÿ

yo ( ÿ2 ÿ2
(1 yo ) (1 yo )
ÿ ÿ

ÿ ÿ

1 ÿ

ÿ '2
ÿ

2 ÿ2
ÿ ÿÿ" 2ÿ(1 ÿ
ÿ ÿ ÿÿ

yo ) 2 (1 )l libra
2 ÿ 22
ÿ ÿ

z ÿ

ÿ
norte
ÿ
yo
ÿ
norte ÿ
(5.38)
ÿ ÿ ÿ ÿ yo
yÿ m +
ÿ
ÿ

ÿ ( por
yo j
ÿ

metro ÿ ÿ )

yo = 1 (1+) yo
ÿj
=1
ÿÿÿ
ÿÿ

2
ÿÿ
b
+
ÿ

ÿÿÿ
ÿ2 ( zi µ z ) ÿ
ÿ

(1 yo )
ÿ

ÿÿ ÿ

Esta expresión no contiene ninguna inversión de matriz, por lo que su cálculo se puede ejecutar
de forma sencilla, incluso con un tamaño de muestra muy grande.

Ejemplo 5.3 Planificación de la salud en México (continuación)

En este ejemplo, deseamos ilustrar los desempeños de la aproximación unilateral con respecto a
un enfoque de verosimilitud total. También compararemos los resultados con los obtenidos con la
especificación MESS discutida en la sección 5.1. Por esta razón, examinaremos nuevamente el
conjunto de datos sobre salud en los 32 estados mexicanos. Dado que en un modelo isotrópico
la dirección de proximidad no
signif.
códigos:
0 b0
b1
b2
b3
–0b4
l .049681

0.14109 Valor
estimado
0.064011 0.058434 0.186960
0.012195 0.139859
0.446938
'***' Máxima
verosimilitud
0.001
error Estándar
0.19208 0.025163 0.034338 0.031370
'**'
0.01
'*'
0.05
'.'
0.1
0.46263 0.01096* 0.14794 0.06250 0.000*** 0.75434
valor
p
''
1.

0.136520 –
0.049863 Valor
estimado
0.064794 0.058685 0.187352 0.124292
Especificación
MESS
error Estándar
0.16331 0.024870 0.037131 0.033965 0.012738 0.200922
0.43326 0.01475* 0.19049 0.09545 0.000*** 0.54136 valor
p

0.069582 –
0.047028 valor Estimado
0.066109 0.050829 0.184956 0.036752
Aproximación
Unilateral
error Estándar
0.046159
0.1317 0,023256
0,004473*** 0.034094
0.167774 0.031676
0.108572 0.011789
0.000*** 0.229270
0.872646
valor
p
188
Machine Translated by Google
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 189

no importa, una interpretación particular del método de aproximación unilateral es


considerar un vecindario en el que cada unidad espacial tiene un solo vecino, definido
según el criterio del vecino más cercano (ver Ejemplo 2.1 en la sección 2.1). El modelo
presentado en el Ejemplo 5.1 se vuelve a estimar utilizando esta especificación particular
del modelo unilateral. Los resultados se muestran en la siguiente tabla donde, para facilitar
la comparación, también mostramos nuevamente los resultados de la máxima verosimilitud
y el de la aproximación MESS.
Los tres métodos conducen a resultados notablemente similares en cuanto a las
conclusiones inferenciales asociadas a los parámetros, coincidiendo todos en identificar
al personal de salud y al porcentaje de personas mayores (variables x1 y x4) como
variables significativas. El signo de las estimaciones es siempre el mismo y los valores
absolutos son muy similares usando los tres métodos, con la única excepción del intercepto
y el parámetro de dependencia l que está subestimado por la aproximación unilateral más
que por la especificación MESS.
Como ya se comentó en el ejemplo 5.1, las diferencias en términos de tiempo de cálculo
y almacenamiento requerido pueden convertirse en un factor muy relevante a la hora de
elegir una de las dos técnicas aproximadas en muestras muy grandes.

5.4 Un enfoque de probabilidad compuesta


5.4.1 Generalidades

En esta sección consideraremos un enfoque inferencial basado en una forma particular


de probabilidad compuesta denominada probabilidad por pares (Lindsey, 1988; Varin et
al., 2011), un método que se está volviendo cada vez más popular en la literatura
estadística como una solución viable. a aquellos casos en que
un enfoque de probabilidad conjunta es computacionalmente inviable. Una verosimilitud
compuesta (una subclase de la pseudoverosimilitud más general , véase Pace y Salvan,
1997) se define como una función que, aunque no es una verosimilitud completamente
especificada, disfruta de algunas de sus propiedades. La literatura reporta algunos
ejemplos de inferencia de verosimilitud compuesta en econometría de series de tiempo
(Davis y Yau, 2011) y en econometría espacial (ver Arbia, 2012 para modelos transversales
espaciales y Wang et al., 2013 para modelos Probit espaciales).

5.4.2 Un enfoque bivariado de probabilidad marginal para la estimación del


modelo de error espacial

Consideremos un modelo de regresión lineal:

yi ii= Z+ b mi
(5.39)
Machine Translated by Google

190 Introducción a la econometría espacial

i=1…n, como en el modelo (3.13), pero ahora, en lugar de especificar el error en forma
autorregresiva como en (3.14), supongamos la siguiente distribución gaussiana bivariada conjunta
para cada par de perturbaciones, digamos i y l :

ÿmi
ÿ
i
( ) 2 ÿÿ0 ÿ il l Ni,
ÿ

ÿ
MVN ÿ ÿ 1 , () ÿÿÿ =yo l ni (5.40) ( )
ÿ

mi
ÿ ÿ ÿÿyo ÿ ÿ

Esta definición es muy general y similar a la adoptada en la Ecuación (5.20) en la sección 5.2.2;
sin embargo, aquí no pretendemos modelar simultáneamente el comportamiento aleatorio conjunto
de todas las n perturbaciones como en los modelos econométricos espaciales convencionales y
en la aproximación MESS , sino solo sus relaciones de 2 por 2 . Nótese que N(i), como siempre,
representa el conjunto de vecinos de la ubicación i y que la elección del criterio de vecindad no es
esencial para el método. En la Ecuación (5.40),

ÿ1ÿ
ÿy
ÿ ÿ =ÿ
ÿ

representa la matriz de correlación y y es un parámetro


ÿ

ÿ 1ÿ
ÿ

ÿy
controlando por la correlación espacial del error tal que y ÿ ÿ( 1; 1) + . El símbolo y se usa
intencionalmente en lugar del símbolo r más comúnmente usado en un contexto de error espacial
para resaltar las diferencias en su significado. La hipótesis (aparentemente restrictiva) de que la
correlación entre todas las unidades en un vecindario es la misma sin importar la dirección, se
deriva de la suposición de isotropía (implícitamente) hecha en toda la literatura de econometría
espacial (ver sección 5.3).

Antes de presentar un procedimiento de ML compuesto para la estimación de los parámetros


desconocidos del modelo (5.39)–(5.40), primero presentemos la definición de una codificación
bivariada . Este concepto fue introducido por Arbia (2012, 2014) ampliando el trabajo de Besag
(1974). Solo con fines ilustrativos, supongamos que las n observaciones están disponibles en una
cuadrícula de celosía cuadrada regular y marquemos las celdas interiores de dicha cuadrícula con
una cruz "x" como se indica en la figura 5.3.

xx xx xx

xx xx xx

Figura 5.3 Patrón de codificación bivariado en una cuadrícula de celosía cuadrada regular
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 191

En particular, codifiquemos con una cruz, un subconjunto de q de las n


observaciones espaciales disponibles, (q ÿ Q) y codifiquemos también con una
cruz, un conjunto de q ubicaciones adicionales elegidas al azar en la vecindad
de la ubicación i. Se supone que espacialmente
las perturbaciones
} ,il ee
ei yy el
{ }, ,jk
coneel Ni ÿ ( ), son
dependientes debido a su proximidad mientras que los pares { (con k
Nj ÿ ( ) ) se suponen estocásticamente independientes siempre que { } ÿ (, )= () , habiendo
, de clasificación
definidoNil
anterior
Nil(,)Niÿ Nl
campana
define
() como
una
de
elbivariante
vecino
i y l. El conjunto
esquemajk

patrón de codificación.
Se pueden introducir fácilmente esquemas de codificación similares en esquemas espaciales
irregulares con una definición adecuada de vecindad. El objetivo de este procedimiento es
bastante claro: seleccionando pares de observaciones siguiendo el criterio de incluir dos unidades
espaciales vecinas, podemos retener la información espacial contenida en la muestra. Sin
embargo, al seleccionar pares de unidades espaciales que son, por definición, independientes
entre sí evitamos incurrir en problemas de estimación, típicos de los modelos econométricos
espaciales presentados en el Capítulo 3. La hipótesis de pares independientes, que puede
parecer demasiado restrictiva en a primera vista, tiene que ser considerado con referencia a la
definición de un barrio. De hecho, siempre podemos definir una vecindad de tal manera que
aquellos pares que no pertenecen a la vecindad estén lo suficientemente lejos para ser
independientes. Finalmente, considerar pares de perturbaciones aleatorias no es esencial para
el método y uno podría considerar igualmente tripletes y grupos de orden superior, siendo la
única justificación teórica para esta elección el teorema de Hammersley-Clifford y la consiguiente
restricción a la interacción por pares asumida por los modelos discutidos. por Besag (1974).

Bajo estos supuestos, tenemos que la densidad conjunta de cualquiera de los


q pares de perturbaciones incluidas en la codificación bivariada viene dada por:

ÿ ÿ

1 ÿ
1 ÿ

ÿy yoÿ2 2 2 +
Feeil ( eeil ÿ yo l si
ÿ
ÿ
)=2 experiencia ÿ ÿÿ ÿÿ

2 pags ÿ
1 ÿ

y 2 2 1 2ÿ ( ÿ

y 2)
ÿÿ

(5.41)

si l Ni ÿ ( ), i=1,…,q

Entonces se puede derivar una probabilidad compuesta como el producto de las q


funciones de densidad bivariadas reportadas en la Ecuación (5.41) que se supone
que son independientes. Entonces podemos tratar tal probabilidad compuesta como una
Machine Translated by Google

192 Introducción a la econometría espacial

verosimilitud adecuada y basar nuestra inferencia en ella. En particular,


multiplicando las q ecuaciones (5.41), tenemos:

q
2 =
L(,ÿ, )por ÿfe e Illinois
( ee ) Illinois

i =1

q ÿ ÿ

1 ÿ
1 2
ÿ

= ÿ ÿ exp 2
ÿ
ÿee
ÿ 2 ey
2

yo +
enfermo ÿ
ÿÿÿ

yo = 1 2pags 2 1 ÿ
ÿy 2 ÿ2 1( ÿ

años
2
) ÿ

ÿ ÿ

ÿ
q
= (2 )
ÿ

q 2
ÿ

q 22
(ÿ ) (1 y )
ÿ

pag

ÿ
ÿ
1
q ÿ
ÿ (5.42)
" experiencia ÿ ÿ
ÿ

2 ÿ ÿy yoÿ2 2 2 si
ÿ yo l + ÿ
ÿÿÿ

2 ÿ2 1 ( ÿ

y ) i =1
ÿ ÿ

y correspondientemente la log-verosimilitud es igual a:

2 22
Const
q
,
l ( , ) ÿ= por q ln( )ÿ en(1 y )
ÿ ÿÿ

2
q (5.43)
1
ÿ
ÿy yoÿ2 2 2 si
+ enfermo ÿ

2 2 ÿÿ )
2 ÿ1 ( ÿ

y i =1
ÿ

Introduzcamos ahora algunos símbolos nuevos. Sea un , 6, aaaaaa


12345 , , y ,
conjunto de estadísticos definido de la siguiente manera:

qqq 2 qqq 2
22 2 il 22 2 il
1 =+= j 2 =+=
a ÿÿÿ yy y j
a ÿÿÿ ZZ Z =1j =1 =1
=1 =1 il j =1 yo

qqq 2 q q
3 =+= Zy yo
= Illinois +
a ÿÿÿ Zy Zy yo yo
jj a ÿ4 ÿ Zy Zy (5.44) yo i
=1il j
=1 =1 yo = 1 yo =1

q q
= =
un5 ÿZZ Illinois
un6 ÿyy i yo

i =1 i =1

Nótese que en las definiciones anteriores, por conveniencia notacional, con


q
ÿÿ
norte

ZZ
ÿ ZZ la por brevedad que es la suma
expresión que indicamos yo = 1
Illinois yo = 1 mal
ÿ Ni ( )

de los productos entre las dos observaciones pertenecientes


Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 193

al mismo par (y de manera similar para las otras expresiones en las Ecuaciones
(5.44)). Emplearemos consistentemente esta simplificación notacional. Arbia (2014)
ha demostrado que, bajo los supuestos del modelo, la Ecuación (5.43) admite un
máximo, que este máximo es único y que se logra en los puntos obtenidos como
solución del siguiente sistema de ecuaciones no lineales:

ˆ
ˆ LMB 4
ÿÿ

ÿ
BML = Ay 3
ÿ

(5.45)
ÿ
segundo ˆ
ÿ
1 2 BML 5
ya
ÿ

q
ÿ

ÿ
ÿ ˆ 2
ÿ yo = 1
( 2

ojo ee 2 2
yo ÿ
ˆ
BML enfermo + )
BML =
ÿ ˆ 2
BML
ÿ

2 ( 1q y )
ÿ

ˆ2 ˆ ˆ2 ˆ
ÿÿ

ÿ ˆˆ ˆ
ÿ 21+3 BML 2 BML 2 BML 6 2 BML BML 5 +2 BML BML 4
aba ba ya yba yba
ÿÿ ÿ

=
ÿ

( ˆ 2
BML )
ÿ

ÿ
21q ÿ

y
ÿ

q
(5.46)
ÿ

ˆ
ÿ yo
i yo
6 45
ˆ
BML +
ˆ2
LMB
eea baba (5.47)
ÿ

BML = =
ÿ

y ˆ =1
2ÿ ˆ2
ÿ

BML BML
ÿÿÿ
q qÿ

Arbia (2012) denominó a este estimador el estimador marginal de máxima


verosimilitud bivariado (o BML).
Observe que, si y = 0 (caso de independencia espacial bivariada por pares
de las perturbaciones de regresión), en la Ecuación (5.45) tenemos:

2
ˆ ÿ

ya aaa 43 3
ÿ j =1q xyjj ˆ
b BML = == = 2q b ML (5.48)
2 ya un un
ÿ j
ÿ

51 1 2x _
j=1

mientras que en la Ecuación (5.46) tenemos:

q 2q
ˆ2 1 1 2
ÿ = ÿee
2 +ÿ yo 2
= ÿ mi
2
=ˆ (5.49)
BML
2q
ÿÿ litros ÿ
2q ÿj ML
yo = 1 j =1

de manera que las soluciones correspondan a los estimadores ML familiares de,


respectivamente, b y s2 en el caso de errores independientes (ver Capítulo 1).
Note también que el estimador ˆy derivado en
BMLla Ecuación (5.47)
Machine Translated by Google

194 Introducción a la econometría espacial

corresponde al estimador intuitivo de la correlación espacial entre las perturbaciones.

En el artículo citado, Arbia (2014) demuestra que los estimadores BML se distribuyen normalmente,
son insesgados en muestras pequeñas y débilmente consistentes.
La matriz exacta de información de Fisher y los errores estándar exactos de
los estimadores también se derivan para ser utilizados en la estimación de intervalos de confianza y

pruebas de hipótesis. Además de las ventajas analíticas y computacionales, los estimadores BML
también brindan algunas ventajas interpretativas interesantes. De hecho, considere nuevamente la
expresión formal del estimador BML del parámetro de regresión b derivado en la Ecuación

ˆ
= un ya 3 4
ÿ

(5.45): segundo . El numerador en esta expresión representa el


un
ÿ

2 ya
1 5
covarianza entre Z e y (el término a3) aumentada con el término adicional –ya4 que representa el
desbordamiento espacial de la variable Z en una ubicación sobre la variable y en una ubicación vecina
que pertenece al mismo par (el término a4), ponderada con el parámetro de correlación espacial y. De
manera similar, el denominador representa la varianza de la variable independiente (el término a1)
aumentada con el término –2ya5 que representa la autocovarianza espacial de la variable Z (el término
a5), ponderada con la correlación espacial del término de error. La interpretación es bastante sencilla.
En el caso de correlación espacial de error positivo (y >0), si el desbordamiento espacial entre Z e y y
la autovarianza espacial de Z son de diferente signo, podemos monitorear el efecto multiplicativo de
un cambio en la variable Z sobre la variable y. En particular, si el desbordamiento espacial (a4) es
negativo y la autocovarianza espacial de Z (a5) es positiva, se enfatizará el efecto multiplicativo. La
expresión formal del estimador BML bˆ también muestra que, en presencia de una fuerte correlación
espacial positiva de la variable independiente, el efecto sobre y de una variación en la variable
independiente es más pronunciado en presencia de un desbordamiento positivo entre la variable
independiente dos variables Este resultado tiene una explicación intuitiva. De hecho, una ubicación se
beneficia no solo de un aumento de Z en la misma ubicación, sino también del aumento de Z en las
ubicaciones vecinas. Del mismo modo, la expresión formal de la BML

El estimador de ÿ (ecuación (5.45)) también muestra que podemos tener un mayor impacto de la
variable independiente en la variable dependiente incluso si no hay un desbordamiento espacial entre
las dos. De hecho, cuando a4 = 0, el efecto sobre y de una variación en la variable independiente será
más pronunciado si a5 > 0, es decir, en presencia de una correlación espacial positiva en la variable
independiente.

Como ya se mencionó, dado que la matriz de información de Fisher exacta se puede derivar
formalmente, la prueba de hipótesis estándar basada en la probabilidad
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 195

xx xx xx
xx xx xx
xx xx xx
xx xx xx

xx xx xx
xx xx xx
xx xx xx
xx xx xx

Figura 5.4 Cuatro esquemas de codificación bivariados diferentes para los datos de la Figura 5.3

se pueden aplicar procedimientos a esta nueva especificación. Sin embargo, este marco
de trabajo también permite un mayor enfoque para la evaluación del error estándar y para
la prueba de hipótesis basadas en la idea de remuestreo. Los métodos de remuestreo para
conjuntos de variables aleatorias dependientes tienen una larga tradición en estadística
que se remonta a las contribuciones anteriores de Solow (1985), Künsch (1989), Arbia
(1990) y Sherman (1996). La técnica de codificación bivariada presentada en esta sección
se basa en la identificación de una submuestra de pares de unidades.
Sin embargo, en cualquier situación empírica dada, el esquema de codificación bivariante
no es único. Incluso en el ejemplo muy simple que se muestra en la Figura 5.3 podemos,
de hecho, producir cuatro codificaciones diferentes (y, en consecuencia, cuatro estimaciones
diferentes de los parámetros del modelo) como se muestra en la Figura 5.4.
El número de configuraciones posibles podría ser incluso mayor cuando se trata de
datos espaciales irregulares, como los que se encuentran en aplicaciones prácticas. Al
tratar con un tamaño de muestra muy grande, podemos derivar muchos esquemas de
codificación bivariados posibles y, en consecuencia, muchas estimaciones diferentes de
los parámetros, lo que permite la derivación de una distribución de remuestreo. A este
respecto, el enfoque de codificación bivariada sugiere una forma formal de arrancar datos
espaciales en un contexto de regresión que preserva la condición de independencia entre
las submuestras sin destruir las características de dependencia espacial de los datos.

Ejemplo 5.4 Evaluación Monte Carlo del método de


estimación BML

Arbia (2014) evalúa el rendimiento del método BML examinando tanto datos generados
artificialmente como conjuntos de datos reales. En particular, en Arbia (2014), el autor
muestra, por medio de algunos experimentos de Monte Carlo, que las estimaciones de
BML son muy precisas mientras que el tiempo de cómputo es insignificante: con un procesador Intel
Machine Translated by Google

196 Introducción a la econometría espacial

procesador core i7 trabajando a 2,7 GHz, el tiempo requerido para los cálculos oscila entre
0,9 milisegundos cuando el tamaño de la muestra es n = 100 a 831 milisegundos cuando n =
2500.

5.5 Códigos R

Cuando se trata de la especificación MESS, la biblioteca R Matrix contiene la función expm


que permite el cálculo de la exponencial de una matriz (consulte la Ecuación (5.5)). En primer
lugar, como de costumbre, necesitamos descargar el paquete con el comando install.packages
("Matrix")
y luego necesitamos volver a llamarlo en cada nueva sesión con el comando
biblioteca (matriz). La exponencial de una matriz A, digamos, se puede ejecutar mediante el
comando

>exp(A)

siendo A una matriz definida positiva real. Incluso si la exponencial de una matriz se define
como la serie infinita de Taylor, se aproxima utilizando la aproximación diagonal de Padé de
Ward (Moler y Van Loan, 2003).
El paquete R spdep también contiene una rutina para estimar un modelo de retraso espacial
utilizando la especificación MESS . El comando es muy simple y refleja de cerca el comando
para el modelo de retraso espacial correspondiente presentado en la sección 3.8. La sintaxis
del comando es la siguiente:

> model1<-lagmess(formula=y ~ X+Y, data=filename, listw=W)

con W una matriz de peso.


Para la aproximación unilateral, una vez que se especifica explícitamente una verosimilitud
(como, por ejemplo, en la Ecuación (5.38) para un modelo de Rezago espacial unilateral), solo
es necesaria una rutina para maximizarla con respecto a los parámetros. Para ello, podemos
utilizar la biblioteca R específica maxLik que se puede instalar escribiendo el comando install.

paquetes ("maxLik") la primera vez y luego, al comienzo de cada sesión, la biblioteca de


comandos (maxLik)
Una vez instalada la biblioteca, tenemos que escribir una función de verosimilitud
logarítmica (llámela, por ejemplo, loglik) en función de un conjunto de parámetros (por ejemplo,
beta, sigma, lambda, rho, etc.). El comando R para la maximización de probabilidad es:

> mle <- maxLik(logLik = logLikFun, inicio = c(beta = 0, sigma = 1, lambda=0.2, rho=0.1))
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 197

con beta = 0, sigma = 1, lambda = 0.2, rho = 0.1 valores iniciales arbitrarios para la búsqueda
numérica del máximo y mle un nombre convencional para el modelo. Los resultados del
procedimiento de maximización se pueden visualizar escribiendo:

> resumen(mle)

Además, una interpretación posible de la aproximación unilateral es considerar, para cada


unidad, solo su primer vecino más cercano (ver Ejemplo 2.1) en la definición de la matriz W
(ver Ejemplo 5.3). En este caso, teniendo a mano un shapefile (digamos poli) empezamos a
derivar las coordenadas de los centroides (como hemos ilustrado en la sección 2.3.3):

coords<-coordenadas(poli)

luego identificamos para cada unidad el primer vecino más cercano a través del comando:

knn<-knearneigh(coords, k=1)

Observe que el comando se puede generalizar a la búsqueda de un número k de vecinos. En


el siguiente paso, derivamos un sistema de vecindad sobre la base de nuestra definición de
vecindad a través del comando:

nn<-knn2nb(knn)

y, finalmente, derivamos la matriz W , como de costumbre, mediante el comando:

W<-nb2listw(nn)

La aplicación de los comandos habituales para la inferencia en un modelo espacial conducirá


a una aproximación unilateral que producirá la salida en mucho menos tiempo.

No se requiere una rutina específica para el enfoque de codificación bivariada en la


estimación de un modelo de error espacial. Para implementar el procedimiento, solo
necesitamos un programa para seleccionar aleatoriamente pares de unidades espaciales no
adyacentes y luego usar la información contenida en esta submuestra para calcular las
soluciones de forma cerrada de los estimadores reportados en la Ecuación (5.45) a (5.47) .
Machine Translated by Google

198 Introducción a la econometría espacial

Términos y conceptos clave introducidos

• Big data •
Matrices de peso escasas y densas • Tiempo
de computación y limitaciones de almacenamiento •
Transformación exponencial de matriz • Vecinos de
primer orden • Vecinos de orden superior • Expansión
de potencia de matriz • Especificación espacial
exponencial de matriz • Isotropía y anisotropía • Sesgo
direccional de las relaciones espaciales • Asimétrico
relaciones espaciales • Modelos centro-periferia •
Prueba de isotropía • Modelo de rezago espacial
anisotrópico • Aproximación unilateral • Modelo de
rezago espacial unilateral • Predecesores-vecinos •
Verosimilitud compuesta • Verosimilitud por pares

• Pseudoprobabilidad
• Técnica de codificación bivariada •
Estimador de máxima verosimilitud marginal bivariada • Remuestreo
espacial y bootstrap espacial

Preguntas

1. ¿Qué problemas surgen cuando se usa un enfoque de Máxima Verosimilitud con un


tamaño de muestra muy grande?
2. ¿Por qué los problemas son más dramáticos en el caso de una matriz W densa y, por el
contrario, menos dramáticos cuando se considera una matriz W dispersa ?

3. ¿Cuáles son las ventajas de usar la especificación MESS de un modelo de Rezago


Espacial con respecto a un enfoque de estimación de Máxima Verosimilitud?
4. Ilustrar las diferencias entre el concepto de asimetría y el
concepto de anisotropía.
5. Dadas las ventajas computacionales, ¿cuál es el mayor escollo de usar el enfoque de
Máxima Verosimilitud Marginal Bivariada con respecto al enfoque de Máxima
Verosimilitud completo?
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 199

Ejercicios

Ejercicio 5.1 Considere nuevamente los límites de las ocho regiones


NUTS 2 rumanas reportadas en el Ejercicio 2.1 y obtenga las matrices
W de segundo y tercer orden , digamos W2 y W3. Utilizando estas
aproximación de la transformaciónmatrices,
(5.11) S derivar
e= aW y desarrollar la
q
Wi
para l = 0.9502, el parámetro de correlación espacial y
yo un
S ÿ ÿ i =0 yo !

q = 3.
Ejercicio 5.2 Considere el caso de un modelo isotrópico y considere un
vecindario en el que cada unidad espacial tiene solo un vecino que no es
vecino de ninguna otra unidad. Derive la matriz W en esta hipótesis para
una muestra de dimensión n. Derive también la matriz (I – lW) y su
inversa. Recuerde la expresión formal de la matriz de varianza-covarianza
ÿ de un modelo de Rezago Espacial unilateral y derive su determinante |ÿ|.

Ejercicio 5.3 Dado el conjunto de datos utilizado en los ejemplos 3.3 y 3.4 y en los
ejercicios 3.6 y 4.8, y utilizando una matriz W estandarizada por filas , vuelva a estimar
un modelo de retraso espacial utilizando la especificación MESS. En los mismos
conjuntos de datos, defina una matriz W unilateral estandarizada por filas basada en
el primer vecino más cercano y estime nuevamente un modelo de retraso espacial unilateral.
Compare los resultados obtenidos con los tres métodos.

Ejercicio 5.4 Considere un sistema de cuatro unidades espaciales dispuestas en una


cuadrícula de celosía cuadrada regular de 2 por 2 y un modelo de Rezago espacial
descrito por el siguiente sistema de ecuaciones:

= ++ 1 y
y 1aw
1 12y2bw 1 13 3
mi

=++
y 2aw y2bw
21 1y 2 24 4 2
mi

=++ 31
y 3aw
3 34y34bw
3 1y
mi

=++
y 4aw y4bw43 3y 4 42 2 4
mi

Derive las condiciones de los parámetros bajo las cuales el modelo es


simétrico y aquellas bajo las cuales el modelo es isótropo sin simetría.
Escriba las ecuaciones en una notación de matriz compacta en el caso de
isotropía y simetría.

Ejercicio 5.5 La hipótesis de normalidad no es esencial para el estimador


de Máxima Verosimilitud Marginal Bivariada (BML) ilustrado en la sección
5.4.2. Considere, como alternativa, la hipótesis de que los errores
Machine Translated by Google

200 Introducción a la econometría espacial

siguen una distribución exponencial bivariada Tipo II (Gumbel, 1960). En


este caso, tenemos el siguiente modelo:

yi ii = x+ ser

y, para cada par de perturbaciones, digamos i y l, tales que l Ni ÿ ( ):

un
Fee ( eeil ) = ÿ ÿ ÿ ÿ mi 1+ (2
yo _ ÿ

yo
ÿ

el

Illinois
yo
un mi _ ÿ

1)(2 1) , = 1, , e iq
_ ÿ
ÿ

ÿ
!

; =r 4

con r el parámetro de error espacial. Bajo estas hipótesis, derivar la


función de verosimilitud y las condiciones para los estimadores BML de la
vector de parámetros b.

Referencias al Capítulo
Anderson, T. (2003) Introducción al análisis estadístico multivariante, 3.ª edición,
Hoboken, Nueva Jersey: Wiley.
Arbia G., (1990) 'Sobre la no estacionariedad de segundo orden en redes bidimensionales
Processes', Computational Statistics and Data Analysis, 9, 147–60.
Arbia, G. (2006) Econometría espacial: fundamentos estadísticos y aplicaciones a la convergencia
regional, Heidelberg: Springer-Verlag.
Arbia, G. (2012) 'Simplificación de las fases de estimación y prueba de hipótesis en el modelado
econométrico espacial de grandes bases de datos', discurso de apertura de la 6.ª Conferencia
Mundial Anual de la Asociación de Econometría Espacial, Salvador Bahía, Brasil, 11 al 13 de julio.

Arbia, G. (2014) 'Inferencia de probabilidad por pares para regresiones espaciales estimadas en
conjuntos de datos muy grandes', Estadísticas espaciales, 7, 21–39.
Arbia, G., Bee, M. y Espa, G. (2013) 'Pruebas de isotropía en econometría espacial
Models', Spatial Economic Analysis, 8, 3, 228–40.
Bell, KP y Bockstael, NE (2000) 'Aplicación del enfoque de estimación de momentos generalizados a
problemas espaciales relacionados con datos de micronivel', Review of Economics and Statistics,
82, 72–82.
Besag, J. (1974) 'Interacción espacial y análisis estadístico de sistemas de celosía (con discusión)',
Journal of the Royal Statistical Society B, 36, 192–236.
Chiu, YM, Leonard, T. y Tsui, K. (1996) 'The Matrix-Logarithmic Covariance Model', Journal of The
American Statistical Association, 91, 198–210.
Cressie, N. (1993) Estadísticas para datos espaciales, Nueva York: Wiley.
Davis, RA y Yau, CY (2011) 'Comentarios sobre la probabilidad por pares en series temporales',
Statistica Sinica, 21, 255–77.
Granger, CWJ (1974) 'Análisis de series temporales y datos espaciales', en A. Scott (ed.),
Estudios en Ciencias Regionales, Londres: Pion.
Griffith, DA (2000) 'Propiedades de función propia y aproximaciones de matrices de incidencia
seleccionadas empleadas en análisis espacial', Álgebra lineal y sus aplicaciones, 321, 95–112.

Griffith, DA (2004) 'Funciones propias extremas de matrices de adyacencia para gráficos planos
empleados en análisis espacial', Álgebra lineal y sus aplicaciones, 388, 201–19.
Machine Translated by Google

Especificaciones de modelos alternativos para grandes conjuntos de datos 201

Gumbel, EJ (1960) 'Distribución exponencial bivariada', Journal of the American Statistical Association,
55, 698–707.
Heine J. y Mahorta, T. (2002) 'Tejido de mamografía, riesgo de cáncer de mama, análisis de imágenes
en serie y mamografía digital: tejido y factores de riesgo relacionados', Acad. Radiol., 9, 298–316.

Holly, S., Pesaran, MH y Takashi Y. (2010) 'A Spatio-Temporal Model of House


Precios en EE. UU., Journal of Econometrics, 158, 1, 160.
Kelejian, H. y Prucha, I. (1998) 'Procedimiento de mínimos cuadrados espacial generalizado en dos
etapas para estimar un modelo autorregresivo espacial con perturbaciones autorregresivas', Journal
of Real Estate Finance and Economics, 17, 99–121.
Künsch, H. (1989) 'The Jackknife and Bootstrap for General Stationary Observations', The Annals of
Statistics, 17, 1217–41.
Lesage J. y Pace, K. (2007) 'A Matrix Exponential Spatial Specification', Journal
of Econometrics, 140, 1, 190–214.
LeSage, J. y Pace, K. (2009) Introducción a la econometría espacial, Boca Raton, FL:
Wiley.
Lindsay, BG (1988) 'Métodos de probabilidad compuesta', Matemáticas contemporáneas,
80, 221–39.
Moler C. y Van Loan, C. (2003) 'Diecinueve formas dudosas de calcular el exponencial de una matriz,
veinticinco años después', SIAM Review, 45, 1, 3–49.
Ord, JK (1975) 'Métodos de estimación para la interacción espacial', Journal of the
Asociación Estadounidense de Estadística, 70, 120–6.
Pace, K. y LeSage, J. (2004) 'Aproximación de Chebyshev de los determinantes logarítmicos de las
matrices de peso espacial', Estadísticas computacionales y análisis de datos, 45, 179–96.
Pace, L. y Salvan, A. (1997) Principios de inferencia estadística, Singapur: World
Científico.
Paelinck, JHP y Nijkamp, P. (1975) Teoría y métodos operativos en el análisis regional, Farnborough:
Saxon House.
Paelinck, JHP y Klaassen, LH (1979) Econometría espacial, Aldershot, Reino Unido:
Gower.
Schabenberger, O. y Gotway, CA (2002) Métodos estadísticos para datos espaciales
Análisis, Boca Raton, FL: Chapman & Hall/CRC.
Sherman, M. (1996) 'Estimación de varianza para estadísticas calculadas a partir de datos de celosía
espacial', Journal of the Royal Statistical Society, Serie B, 58, 509–23.
Smirnov O. y Anselin, L. (2001) 'Estimación rápida de máxima verosimilitud de modelos autorregresivos
espaciales muy grandes: un enfoque polinomial característico', Estadística computacional y análisis
de datos, 35, 301–19.
Solow, A. (1985) 'Datos correlacionados de arranque', Journal of the International
Asociación de Geología Matemática, 17, 769–75.
Varin, C. y Vidoni, P. (2009) 'Inferencia de probabilidad por pares para modelos generales de espacio de
estado', Econometric Reviews, 28, 1–3, 170–85.
Varin, C. (2008) 'Sobre la probabilidad marginal compuesta', Avances en estadística
Anal., 92, 1–28.
Varin, C., Reid, N. y Firth, D. (2011) 'An Overview of Composite Likelihood Methods', Statistica Sinica,
21, 5–42.
Wang, H., Iglesias, EM y Wooldridge, JM (2013) 'Estimación parcial de máxima verosimilitud de modelos
probit espaciales', Journal of Econometrics, 172, 77–89.
Machine Translated by Google

6
Conclusiones: ¿Qué sigue?

Como se mencionó en el prefacio, concebimos este texto no como un libro


completo, sino como un puente entre la literatura de libros de texto de
econometría no especializada y los libros de texto de econometría espacial más
avanzados. Por lo tanto, imaginamos a nuestro lector típico como alguien que
ha estudiado un libro de texto de econometría general (como, por ejemplo,
Greene, 2011), ha dedicado algún tiempo al estudio de la presente monografía
y ahora está esperando ansiosamente instrucciones sobre dónde ir a
continuación. . En este sentido, podemos sugerir direcciones diferentes (aunque
no necesariamente excluyentes entre sí).
De manera similar a lo que ocurre en la econometría de series temporales
con la teoría de los procesos aleatorios (Hamilton, 1994), en la base de los
modelos econométricos espaciales tratados en este libro se encuentra la noción
de campos aleatorios. Si el lector quiere profundizar en los fundamentos de la
estadística inferencial y las raíces probabilísticas de los modelos aquí tratados,
puede remitirse a Arbia (2006) que contiene una descripción exhaustiva de los
modelos de campos aleatorios que son la base
del paradigma SARAR , además de una serie de otros campos aleatorios que
pueden ser potencialmente muy útiles en la econometría espacial y aún no se
exploran adecuadamente en la literatura actual. Un ejemplo está representado
por una especificación alternativa de los modelos Spatial Lag y Spatial Error
basados en una distribución de probabilidad condicional, en lugar de marginal.
Este enfoque fue introducido originalmente por Besag (1974) y ha sido
considerado recientemente en la literatura de econometría espacial por Sain y
Cressie (2007) e Ippoliti et al. (2013). Para el lector que esté interesado en
explorar las raíces profundas del modelado econométrico espacial, éstas se
pueden encontrar en la literatura estadística espacial. Se pueden encontrar
buenas introducciones al tema en libros como Ripley (1981), Cressie (1993),
Gaetan y Guyon (2009) y Cressie y Wikle (2011).

202
Machine Translated by Google

Conclusiones: ¿Qué sigue? 203

En este sentido, en estadística espacial es tradicional distinguir entre métodos


diseñados para datos observados en puntos, líneas y áreas. Los métodos de
datos puntuales están diseñados para estudiar las regularidades observadas
en la distribución de individuos en el plano; se definen métodos de datos
lineales para explicar las interacciones espaciales entre individuos que se
observan a lo largo de las redes (como flujos de bienes, individuos e información
en el espacio geográfico); finalmente, los métodos de área se refieren a datos
observados como agregados dentro de porciones de espacio, generalmente países o regiones
En el presente libro hemos optado por concentrarnos principalmente en el
tratamiento de los datos regionales, dejando de lado las otras dos tipologías de
datos espaciales. Los lectores que, tras consultar este libro, estén interesados
en profundizar sus conocimientos en estas áreas, pueden consultar la literatura
existente (todavía dispersa en econometría) sobre el llamado análisis de patrón
de puntos (ver, por ejemplo, trabajos como Marcon y Puesch , 2003; Duranton
y Overman, 2005 y Arbia et al., 2008, 2010, 2012) para datos puntuales y libros
como LeSage y Pace (2009) y Patuelli y Arbia (2014) para modelos de
interacción espacial.
Incluso si este libro de texto cubre una parte sustancial de los modelos
econométricos espaciales, todavía hay una serie de temas omitidos
intencionalmente para mantener la discusión limitada a lo esencial y lo más
simple posible. Si los lectores desean ampliar su visión sobre la variedad de
alternativas de modelado disponibles, pueden consultar el libro de Anselin
(1988) que, aunque fechado, aún representa una fuente de referencias en el
tema. Aquí el lector encontrará referencias, entre otros, a temas como el análisis
de la heterogeneidad espacial, métodos de estimación robustos, regresiones
espaciales aparentemente no relacionadas, pruebas previas y arranque en un
contexto espacial, pruebas no anidadas, métodos de expansión espacial,
efectos de borde , y otros. Además, a lo largo de este libro hemos seguido
consistentemente un enfoque frecuentista-fisheriano para modelar la inferencia.
El enfoque bayesiano no se trata aquí y el lector puede remitirse nuevamente a
Anselin (1988) y al extenso relato que se da en LeSage y Pace (2009).
Finalmente, un tema emergente interesante en la econometría espacial, omitido
en el presente contexto, está representado por modelos de regresión de
cuantiles espaciales para los cuales se remite al lector al libro completo reciente
de McMillen (2013).
Si el interés es principalmente práctico, el lector deberá desarrollar un
conocimiento y una práctica más profundos en el software disponible para tratar
datos espaciales y relaciones espaciales. Como se aclara en el prefacio, incluso
si este libro de texto presenta una serie de tutoriales de computadora y ejercicios
prácticos sobre R, ciertamente no puede considerarse un curso integral sobre
el uso de R en econometría espacial. Una rica fuente de referencias en este
Machine Translated by Google

204 Introducción a la econometría espacial

respeto es el libro de texto de Bivand et al. (2008). Además, el software


comercialmente disponible que es muy útil en el modelado econométrico
espacial es Matlab, STATA y GeoDa. Matlab contiene cajas de herramientas
para el análisis econométrico espacial desarrolladas por Pace y por LeSage
(consulte el sitio web http://www.mathworks.com/products/matlab/ y el sitio
web www.spatialeconometrics.com). De manera similar, el software STATA
ha desarrollado recientemente un conjunto muy rico de procedimientos de
econometría espacial (consulte el sitio web http://www.stata.com/ y artículos
como Drukker et al., 2013a, 2013b, 2013c). Finalmente, el software GeoDA y
PySAL, desarrollado por Luc Anselin y sus colaboradores, contienen una de
las bibliotecas de procedimientos más extensas en análisis espacial y
econometría espacial (ver https://geodacenter.asu.edu/software).
Finalmente, si el objetivo de nuestros lectores es tener una comprensión
familiar de la investigación en curso y de vanguardia en el tema, tanto desde
el punto de vista teórico como aplicado, pueden consultar el artículo de Arbia
(2012) (quien examina 230 artículos publicados en el período 2007–11) y a
una serie de números especiales de varias revistas científicas dedicadas al
tema que aparecieron en los últimos años, como las que se encuentran en
revistas como Journal of Econometrics (ver Baltagi et al., 2007 ), Economía
empírica (ver Arbia y Baltagi, 2008), Papers in Regional Science (ver Arbia y
Fingleton, 2008), Regional Science and Urban Economics (ver Arbia y Kelejian,
2010), Journal of Regional Science (ver Partridge et al. , 2012), Modelado Económico
(ver Arbia et al., 2012), Análisis Económico Espacial (ver Arbia y Prucha,
2013) y Análisis Geográfico (ver Arbia y Thomas, 2014).

Referencias al Capítulo
Anselin, L. (1988) Econometría espacial: métodos y modelos, Dordrecht: Kluwer
Editores Académicos.
Arbia, G. (2006) Econometría espacial: fundamentos estadísticos y aplicaciones a la
convergencia regional, Heidelberg: Springer-Verlag.
Arbia, G. (2012) 'A Lustrum of SEA: Recent Research Trends After the Creation of the Spatial
Econometrics Association (2007–2011)', Spatial Economic Analysis, 6, 4, 377–96.

Arbia, G. y Baltagi, B. (2008) 'Introducción al número especial sobre espacial


Econometría', Economía empírica, 34, 1–4.
Arbia, G. y Fingleton, B. (2008) 'Nuevas técnicas y aplicaciones econométricas espaciales
en ciencia regional', Papers in Regional Sciences, 87, 3, 311–17.
Arbia, G. y Kelejian, H. (2010) 'Avances en Econometría Espacial', Regional
Ciencia y Economía Urbana, 40, 5, 253–4.
Arbia, G. and Prucha, I. (2013) 'Introducción al Número Especial sobre Terapéutica
Econometrics', Análisis económico espacial, 8, 3, 215–17.
Machine Translated by Google

Conclusiones: ¿Qué sigue? 205

Arbia, G. y Thomas, C. (2014) 'New Developments in Spatial Econometrics', Geographical


Analysis (próximamente).
Arbia, G., Espa, G. y Giuliani, D. (2013) 'Aglomeración industrial condicional frente a
incondicional: desenredar la dependencia espacial y la heterogeneidad espacial en el
análisis de la distribución de las empresas de TIC en Milán (Italia)', Journal of Geographical
Systems , 15, 31–50.
Arbia, G., Espa, G. y Giuliani, D. (2014) 'Weighting Ripley's K-function to Account for the
Firm Dimension in the Analysis of Spatial Concentration (para aparecer en International
Regional Science Review)', publicado por primera vez el 9 Noviembre de 2012 como
doi:10.1177/0160017612461357.
Arbia, G., Espa, G. y Quah, D. (2008) 'A Class of Spatial Econometric Methods in the
Empirical Analysis of Clusters of Firms in Space', Empirical Economics,
34, 1, 81–103.
Arbia, G., Lopez-Bazo, E. y Moscone, F.(2012) 'Frontiers in Spatial Econometrics Modeling
(with Enrique Lopez Bazo and Francesco Moscone)', Economic Modelling, 29, 1, 1–2.

Arbia, G., Espa, G., Giuliani, D. y Mazzitelli, A. (2010) 'Detecting the Existence of Space-
Time Clusters of Firms', Regional Science and Urban Economics, 40, 5, 311–23.

Arbia, G., Espa, G., Giuliani, D. y Mazzitelli, A. (2012) 'Clusters of Firms on an Inhomogeneous
Space: The Case of High-Tech Industries in Milan in 2001', Economic Modelling, 29, 1 , 3–
11.
Baltagi, B., Kelejian, H. y Prucha, I. (2007) 'Análisis de espacialmente dependiente
Data', Journal of Econometrics, 140, 1, 1–4.
Besag, J. (1974) 'Interacción espacial y análisis estadístico de sistemas de celosía', Journal
of the Royal Statistical Society, Serie B, 36, 192–236.
Bivand, R., Pedesma, J. y Gomèz-Rubio, V. (2008) Análisis de datos espaciales aplicados
con R, Heidelberg: Springer-Verlag.
Cressie, N. (1993) Estadísticas para datos espaciales, edición revisada del original de 1991,
Nueva York: Wiley.
Cressie, N. y Wikle, C. (2011) Estadísticas para datos espacio-temporales, Hoboken, NJ:
Wiley.
Drukker, DM, Prucha, I. y Raciborski, R. (2013a) 'Estimadores de máxima verosimilitud y
mínimos cuadrados espaciales generalizados en dos etapas para un modelo autorregresivo
espacial con perturbación autorregresiva espacial', Stata Journal, 13, 2, 221– 41.

Drukker, DM, Prucha, I. y Raciborski, R. (2013b) 'Un comando para estimar modelos
autorregresivos espaciales con perturbaciones autorregresivas espaciales y variables
endógenas adicionales', Stata Journal, 13, 2, 287–301.
Drukker, DM, Peng, H., Prucha, I. y Raciborski, R. (2013c) 'Creación y gestión de matrices
de ponderación espacial con el comando spmat', Stata Journal, 13, 2, 242–86.

Duranton G., Overman HG (2005) 'Pruebas de localización mediante datos microgeográficos',


Rev Econ Stud 72, 4, 1077–106.
Gaetan, C. y Guyon, X. (2009) Modelado y estadísticas espaciales, Nueva York:
Springer-Verlag.
Greene, W. (2011) Análisis econométrico, 7.ª edición, Upper Saddle River, NJ: Pearson
Education. Hamilton, JD (1994) Análisis de series temporales, Princeton, NJ: Princeton
University Press.
Machine Translated by Google

206 Introducción a la econometría espacial

Ippoliti, L., Romagnoli, L. y Arbia, G. (2013) 'A Gaussian Markov Random Field Approach to
Convergence Analysis', Estadística espacial, 6, 78–90.
LeSage, J. y Pace, K. (2009) Econometría espacial introductoria, Boca Raton, FL:
Chapman & Hall/CRC Press.
Marcon E. y Puech, F. (2003) 'Evaluación de la concentración geográfica de industrias
utilizando métodos basados en la distancia', Journal of Economic Geography, 3, 4, 409–
28.
Marcon E. y Puech, F. (2010) 'Medidas de la concentración geográfica de industrias: mejora
de los métodos basados en la distancia', Journal of Economic Geography,
10, 5, 745–62.
McMillen, D. (2013) Regresión cuantil para datos espaciales, SpringerBriefs en
Ciencia Regional, Heidelberg: Springer-Verlag.
Partridge, MD, Boarnet, M., Brakman, S. y Ottaviano G. (2012) 'Introducción: ¿Adónde va la
econometría espacial?', Journal of Regional Science, 52, 2, 167–71.
Patuelli, R. y Arbia, G. (2014) The Spatial Econometrics of Spatial Interaction Models,
Heidelberg: Springer-Verlag (próximamente).
Ripley, B. (1981) Estadística espacial, Nueva York: Wiley.
Sain, SR y Cressie, N. (2007) 'A Spatial Model for Multivariate Lattice Data', Journal of
Econometrics, 140, 1, 226–59.
Machine Translated by Google

Soluciones a los ejercicios

'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''


1
En todos los ejercicios, Signif. Los códigos son: 0

Ejercicio 1.1

1. Modelo 1

Estimación estándar valor t Pr(>|t|)


(Interceptar) –22,31118 Error – 6,589 0.000100***
negocio 0,27750 3,38594 5,191 0.000571***
laboral 0,42239 0,05346 0,47243 0,894 0.394567
estadística F 43.99 2.59e–06***

R-cuadrado múltiple: 0,9072, R-cuadrado ajustado: 0,8866

2. Modelo 2

Estimación estándar valor t Pr(>|t|)


(Interceptar) – 21,38866 Error – 6.700 5.36e–05***
Mano de obra 0,31460 3.19237 0.03335 9.432 2.71e–06***
*F-estadística 88,97 2.71e–06***

R-cuadrado múltiple: 0,8431, R-cuadrado ajustado: 0,8274

modelo 3

Estimación estándar valor t – Pr(>|t|)


(Interceptar) –16.0547 Error 5.9992 2.676 0.02325*
negocio 2.3264 0.5646 4.121 0.00208**
estadística F 16.98 0.00208***

R-cuadrado múltiple: 0,6293, R-cuadrado ajustado: 0,5923

3. El mejor modelo es el modelo 2 que alcanza el nivel de significación más alto de las estadísticas F con
un valor alto del R-cuadrado ajustado.

4. Modelo 4

Estimación estándar valor t Pr(>|t|)


(Interceptar) 22.546 Error 18.718 1.205 0,25613
negocio 6.861 1.761 3.895 0,00298**
Estadística F: 15.17 0.00298**

R-cuadrado múltiple: 0,6027, R-cuadrado ajustado: 0,563

207
Machine Translated by Google

208 Soluciones a los Ejercicios

5. Residuos del modelo 1

Gales – 0.6329899
Escocia – 0.8822571
Irlanda del Norte – 1.1388039
norte de Inglaterra – 3.1397582
Noroeste de Inglaterra 2.5364883
Yorkshire y Humberside 1.2721572
Midlands Orientales – 0.5921008
West Midlands 0.4511717
anglia oriental – 0.2855529
Gran Londres – 1.0219450
Sudeste de Inglaterra 2.3965191
Sudoeste de Inglaterra 1.0370716

6. Prueba de Breusch-Pagan: BP = 1,5183, gl = 2, valor de p = 0,4681


Prueba de Jarque Bera: JB= 0,092, gl = 2, p-valor = 0,9551

7. El modelo 1 sobreestima el VAB (residuos negativos) en las regiones Este (Este


de Inglaterra, East Midlands y Londres) y en el Norte (Norte de Inglaterra, Noroeste
de Inglaterra, Escocia e Irlanda del Norte) y lo subestima en el centro. Por lo tanto,
parece haber un patrón geográfico distinto de residuos.

Ejercicio 2.1

Ordenamos las 8 regiones de la siguiente manera: (RO11,RO12,RO21,O22,RO31,RO32,RO41,RO42)

Matriz W no estandarizada:

01100001
10111011
11010000
01101000
01010110
00001000
01001001
11000010

Matriz W estandarizada:

0 0,333333 0,333333 0 0 0 0,333333 0


0,166667 0 0,166667 0,166667 0,166667 0 0,166667 0,166667
0,333333 0,333333 0 0,333333 0 0 0 0
0 0,333333 0,333333 0 0,333333 0 0 0
0 0,25 0 0,25 0 0,25 0,25 0
0 0 0 0 1 00 0
0 0,333333 0 0 0,333333 0 0,333333 0
0,333333 0,333333 0000 0,333333 0

Porcentaje de entradas distintas de cero =26/64= 40,625 %


Machine Translated by Google

Soluciones a los Ejercicios 209

Ejercicio 2.2 Variable espacialmente rezagada:

Ly = (9,6999903 9,7666862 10,0333233 10,1666565 9,1 10,3 9,7666569


9.3666573)

Ejercicio 2.3

L(X) = (26, 15,67, 23,67, 17, 24,5, 25,33, 27,25, 14, 26, 29, 25, 16, 24, 21,25, 20,33, 14,67, 17,5, 14,5,
20,5, 16, 14,5, 15, 20.67, 14, 21.5)

Ejercicio 2.4 A continuación mostramos el archivo .GAL

0 12 Reino Unido Reino

Unido_reg 1 4

3 5 8 12
22
34
32
12
43
256
551
467863
457

75
5 6 8 9 11 8
5 1 5 7 11 12
9 2 7 11 10 1
11 11 5 7 8 9
10 12 12 3 1 8
11

Ejercicio 2,5 L(VAB) = (6,7, 2,75, 5,95, 8,233, 5,44, 6,3, 9,42, 8,34, 10,45, 14,7, 10,3, 8,53)
Machine Translated by Google

210 Soluciones a los Ejercicios

Ejercicio 2.6 Diagrama de dispersión de Moran:

14

12

10

5 10 15 20
VAB

Existe una relación positiva entre el VAB y su valor espacialmente rezagado (LGVA) mostrando correlación
espacial para esta variable.

Ejercicio 2.7

I de Moran observado = –0,17589503


Expectativa = –0,16886659 Varianza =
0,03307571
I de Moran estandarizado = –0,0386
valor p = 0,5154

La falta de correlación espacial de los residuos debe aceptarse con un nivel de confianza del 49 %.
Machine Translated by Google

Soluciones a los Ejercicios 211

Ejercicio 2.9

Ejercicio 3.1 A continuación mostramos el archivo .GAL

0 27 UE UE_países 1 4
5 9 14 25 2 2 18 24

34
5 15 16 20 4
2
5 22
581
3 4 9 14 15 16 25 6 2

21 26
7 1 23
829
17
Machine Translated by Google

212 Soluciones a los Ejercicios

96
1 5 8 10 23 25
10 4
9 15 19 27
11 1
24
12 2
16 26
13 4
15 18 19 20
14 2
15
15 6
3 5 10 13 19 20
16 4
3 5 12 20
17 1
8
18 2
2 13
19 3
10 13 15
20 4
3 13 15 16
21 2
6 22
22 2
4 21
23 2
79
24 2
2 11
25 3
159
26 2
6 12
27 1
10

modelo SARAR

Estimación estándar valor z Pr(>|z|)


(Interceptar) 0,31168102 Error 1,6017 0.1092
educar 0,00094883 0.19459931 0.00055511
1,7093 0.0874 .
lambda 0,6819 3,6192 0.00029551***
Rho: –0.47147 –1,6595 0.097007 .
Prueba 4.2047 0.12217
LR: AIC: –91.606
Machine Translated by Google

Soluciones a los Ejercicios 213

SEM
Estimar estándar valor z Pr(>|z|)
(Intercepción) 1.0294194 Error 35,9273 < 2e–16***
Valor de la 0.0014198 0.0286529 0.00079871,7776 0.07546 .
prueba educ 0.32931 1,7495 0.080209 .
Rho LR: 2.6041 0.10659
Estadística de Wald: 3,0607 0.080209 .
AIC: –92,005

SLM
Estimación estándar valor z Pr(>|z|)
(intersección) 0,66359077
0,00132915
educ Error 3,4780 0.0005052***
Lambda 0,34291, valor LR:
de3,1194
prueba 1,8712
0.19079632 0.00071032 0.0613180 .
Estadística de Wald: 3,5943
92,521AIC: – 1,8959 0.057977 .
0.077367 .
0.057977 .

El mejor modelo es SLM. Rho no es significativo en SARAR y SEM y SLM logra


el AIC más alto.

Ejercicio 3.2 Escribiendo el modelo como:

= +; i ii y Xu bu Lu yo=ii( re
)+ ;

la segunda ecuación se puede escribir como

u yo
Luii ( )= ÿ r mi

(1)ÿ=L ui r mi
i

y la primera ecuación como

(1 )) =ÿÿyo
(1ÿLy
ii) +
r (1 rb r LX Lu

por=+
Ly+XeLX
iii iir rb
ÿ

y Ly=+Xr+LX
ii e
bg
ÿ

yo ii

Este es un modelo de retraso espacial con una variable independiente L(X) retrasada espacialmente.
No se puede emplear una estrategia OLS simple porque el coeficiente g está sujeto a la
restricción gr = b.
Machine Translated by Google

214 Soluciones a los Ejercicios

Ejercicio 3.3 Escribiendo el modelo como:

yx= tu
+ segundo

u wu = r ;

la segunda ecuación se puede escribir como

(1 -) r= tu
mi W

y la primera ecuación como

(1 ) = Wy
(1 ) WX
+ (1 Wu
ÿ ÿÿ r br r )

y X =+ segundo mi

que se puede estimar con el MCO minimizando la expresión

T
Tee = (por Xy X ÿ

)( ÿ

b ) = min

T
(y( XIWI
ÿ

) ) ( ) Wy
ÿ) (ÿÿXbr rb T = min

con y=(
) ÿConsidere
ry IXI
WyWX
=( ahora
) ÿ r la un modelo .
deprobabilidad
SEM (Ecuación 3.23)

norte

yorb
2 21
( , ÿ,ÿ )ee= constante ÿ ÿÿ ÿ

en( ) 1 en ( IW IW
)r2 )(
ÿ

r
ÿ

T
2
1 IWIW
ÿ ( ) ( yX 1
b
ÿ

br Tr
yX ) (1 ) T ÿ
(
ÿ ÿ
ÿÿ ÿ ÿ ÿ

ÿ2 ÿ
)

Para r y se conocidos2 esta expresión es un máximo para b si

T 1 T
ÿ

1
yX IWIW
ÿÿ ÿ

yXr ÿ
) ÿ br
ÿ ( ) ( ( segundo
ÿ

) ÿ

ÿ
( ÿ

) = min

( ) ( ) ( WyT br ry XIWI
ÿ ÿÿ T )( ) = min
ÿ

Xb

lo que coincide con la expresión anterior obtenida para MCO.


Machine Translated by Google

Soluciones a los Ejercicios 215

De la solución GLS tenemos de la Ecuación (1.47):


T ÿ

1 * *T TT TT ÿ ÿ

1 ÿ

( XXX
* y XP*)PX XP Py =( )
ˆ
T ÿ ÿ ÿÿ
11ÿ1 T
= (X XX y ) = b GLS

1 T
puesto ) ÿ r y 1como
P IWconsecuencia.
=( habiendo
1 T PAG ÿÿ ÿÿ = ( )( yo WI W ) rr . = ÿ ÿ

Entonces, el estimador ML del coeficiente b en un modelo SEM se puede expresar como:

ˆ ÿ

1
T T
b GLS
rrr = XIWI
ÿÿ
( WX
ÿ

)(
ÿ

)
ÿÿ

T T
" r ÿWy
) ( XIWI
( r
ÿ ÿ

ÿ)
ÿ ÿ

con varianzas de error que se pueden obtener de la diagonal principal de la matriz (ver
Ecuación 1.48)

ˆ T T
ÿ

1
2 11 T = ÿ mi2 XIWI
Var b( )=GLS ÿÿ
( WX rr )( )
ÿ ÿ

( ÿ XX ÿÿ ÿ mi ) ÿÿ

Ejercicio 3.4 Como la variable X no es estocástica, podemos reescribir el modelo como


ÿ
norte

1 wyij ii =
yi = yo + ÿ i ; con ÿi ii= + b X u . Además, dado ese
ÿ
norte

yo j=1 w
2
ui X iidN
ÿ . .(0, ÿ tu nnyo ) entonces:

mi( ÿi
)= ( EX u EX
yo+Eu
)=X( )+
yo (bb
)= b i i

Var X u Var u+ii)=


i ( )= 2
Var ( yo)=_ ( segundo ÿ tu

Entonces la ecuación describe un modelo puramente autorregresivo con un error ÿ i


yo ,ÿ tu 2 .. . ( b XI
X iidN
)ÿ .

Ejercicio 3.5 El modelo se puede reescribir como:

= +tiÿr
y por

tu Wu
r =+ mi

(+ )=r yo por ti
( )= Yo Wu ÿ r mi
Machine Translated by Google

216 Soluciones a los Ejercicios

Así que eso

1
y Yo Wu =()ÿ +r
ÿ

1 uI W =( ) ÿ r mi

y por lo tanto:

=(IW
yIW + ) r re ) (
ÿ

1 ÿ
ÿ

1 = I WI W )( + ) ÿ r re
ÿ

1
[](

1 **
ÿ

1
= (IW ÿ r 2 2 = (IW ÿ r
ÿ

) mi ) mi

Este es un SLM

= ** *
y Wy Z ur br < + + 1

* * *
con matriz de peso 2 W W= y parámetro De 2r= . Dado que r <1, Después también r <1.

(Ecuación 3.47) la matriz de varianza-covarianza de y es:

T
)=ÿ
T 2 IWIW 1
( )( )
ÿ ÿ

(
E yy mi
r
ÿ ÿ

r
1 T
=
ÿ ÿ

2 22IW
ÿ 22
_
( ÿ

IW
re )( ÿ

r )

y de la Ecuación (3.48) su verosimilitud:

1
2 2
ÿ

L (ÿ , libras
, ; y)=constante ÿ ÿ 2
mi

ÿ ÿ
ÿ
1 T
ÿ ÿ ( ÿ ÿÿ yI WZ
2 21yI WZ ÿÿ ÿ

ÿ 1 ÿ 2 21
" rb rb ( ) )
ÿ ÿÿ

ÿ ÿ

2ÿ
experiencia ÿ ÿ
2 ÿÿ ÿ ÿ ÿ

mi ÿÿ

Ejercicio 3.6

estimación ML

Estimación estándar valor z Pr(>|z|)


(Interceptar) 40,6458123 – Error 7.6781 1.621e–14***
CRIMEN 0,1188867 5.2937581 –3,6632 0,0002491***
RM 3,8507202 – 0.0324540 9.4789 < 2.2e–16***
INDUS 0,0059026 – 0.4062432 –0,0954 0,9239678
NOX 20,4193252 – 0.0618481 –5,1033 3,338e–07***
EDAD 0,0195181 – 4.0011873 –1,3923 0,1638451
DIS 1,4560840 0.0140191 –5.3579 8.419e–08***
RAD 0,3219532 – 0.2717635 4,3924 1,121e–05***
PTRATIO 1,0407873 0.0732975 –7,6178 2,576e–14***
B 0,0098856 – 0.1366262 3.7391 0.0001847***
LSTAT 0,5149470 – 0.0026439 –10,3780 < 2,2e–16***
IMPUESTO 0,0112409 0.0496189 0.0038685
–2,9058 0,0036637***
Machine Translated by Google

Soluciones a los Ejercicios 217

Rho: 0,57191 Valor de prueba LR: 6.3752 1.8267e–10***


25,792 Estadística de Wald: 40,644 3.8025e–07***
1.8267e–10***
AIC: 3021.4

estimación FGLS

Estimar estándar valor z Pr(>|z|)


(Interceptar) 40.5245582 Error 5.2994923 7,6469 – 2.065e–14***
CRIMEN –0.1180917 0.0325913 3,6234 0.0002907***
RM 3.8591297 0.4082023 9.4540 < 2.2e–16***
INDUS –0,0044561 – 0.0620706 –0,0718 – 0.9427686
NOX 20,2981368 – 4.0071806 5,0654 – 4.075e–07***
EDAD 0,0186184 – 0.0140273 1,3273 – 0.1844113
DIS 1,4431412 0.2636080 5,4746 4.386e–08***
RAD 0,3217374 – 0.0731746 4,3968 – 1.098e–05***
PTRATIO 1,0462088 0.1365008 7,6645 1.799e–14***
B 0,0098673 – 0.0026561 3,7149 – 0.0002033***
LSTAT 0,5156174 – 0.0498751 10,3382 – < 2.2e–16***
IMPUESTO 0,0112381 0.0038747 2,9004 0.0037267***

Rho: 0.53872 0.60881 0.88488***

Ejercicio 4.1 La matriz de varianza-covarianza del error se puede escribir como:

T TT
= ee e 2
= GG T.
Var ( )=
mi mi GG ÿe

Ahora defina la matriz de agregación G como:

ÿ1ÿ ... 1 ÿ

'
n1veces
ÿ

ÿ
norte
1
ÿ

ÿ ÿ

1 ... 1
2
'
norte

2
norte veces
GRAMO
= y GG T =

norte
ÿ metro ÿ
1 ... 1
ÿ
norte
metro
'veces ÿ

Entonces Var( ) e tiene términos diagonales no constantes y eÿ es heteroscedástico.

Ejercicio 4.2

Uniforme:

ÿ 1

ÿ Kdnorte
ÿre ( nn
) = 0.5 = 0.5 [ norte ]
1
ÿ

1
=1
ÿÿ ÿ

1
Machine Translated by Google

218 Soluciones a los Ejercicios

Epanechnikov (cuadrático)

1 1 1
ÿ 3
3 3 ÿ 4ÿ3ÿÿ3ÿÿ ÿ ÿÿ
ÿÿKd(ÿnn) ( =( 2 norte

1 ÿ

norte
2
) dn = 1 ÿ

norte ) d norte
= norte =1
ÿÿ ÿ

1
4 4 ÿ

1
ÿ

Cuadrático (bi-peso)

ÿ 1 1
15 2 15 2 2
ÿÿK ddd
(ÿ)
nn =
16
( (1 ÿ

norte
2
) norte
=
dieciséis
1 ÿ

norte ) norte

ÿÿ ÿ

1 ÿ

1
1
15
=
dieciséis
ÿ (1 2 + rennn ÿ
2 4
)
ÿ

1
ÿ 15 ÿ 2 norte
5

= += 1 norte
ÿ

norte
ÿÿ3

16 ÿ 3 5
ÿ ÿ

Ejercicio 4.3

Estimar estándar valor t Pr(>|t|)


(Interceptar) 0,4923310 Error 0,7793 0.4358
educ 0,0014920 0,6317384 1,2361 0.2164
lambda rho 0,4967469 – 0,0012071 0,7983 – 0.4247
0,5638543 0,6222546 0,43523501,2955 0.1951

Prueba de Wald de que rho y lambda


son cero 0.013056 0.90903

Ejercicio 4.4 Considere el modelo:

yXu =
• segundo +

u wu = + re

Tenemos

1 uI W =( ) ÿ ÿ l mi

y consecuentemente:

mi ( )=0

T
ÿ

1
= ÿ- ÿl IWIWl
TE uu ( ( )= ÿÿ
ÿ
)( ÿ)ÿ
ÿ
Machine Translated by Google

Soluciones a los Ejercicios 219

La probabilidad de la única observación es

Pi( =Py
1) X ( iii yo• 0 >
= wy , •)
Ji

= (PX
0 ,u)=
Xb wy
yo +) (Pu
(yo ÿÿ>XX
yo segundo
wy X, • ÿ b , , i• )
yo i i i yo i

con ÿ(ÿ)MVN (0, ÿ)


y la probabilidad, de la Ecuación (4.30):

norte

milímetro
12 metro

L = ÿÿ ÿ... ()
jm m d
ÿÿ ÿÿ ÿÿ

norte
1
con (p.a.
) = (2 ) 2 ÿ ÿ ÿÿ ÿ exp ÿÿdonde
ÿT = X yb
ÿ

ÿ ) , yo
2 ( ÿ mmmm yo ÿ ÿ ÿ i

T
ÿ

1
ÿÿ =
- l (IWIW
ÿ

ÿ
l )( )
ÿ
.
ÿ ÿÿ

Ejercicio 4.5

Probit estándar

Estimación estándar valor z – Pr(>|z|)


(Interceptar) –2,88609 Error 2.513 0.0120*
educar 0,06724 1.14867 0.03067 2.192 0.0284*

AIC: 31.126

Probit ML

Estimación estándar valor z Pr(>|z|)


(Interceptar) –3,22362474 Error –1,6421824 0,1005522
educ rho 0,07365255 – 1.96301263 1.6191556 0.1054138
0,16447635 0.04548824 0.65983415
–0,2492692 0,8031525

Probit GMM

Estimación estándar valor z Pr(>|z|)


(Interceptar) –3,43547076 Error –2,1074481 0,03507876*
educar 0,07741729 1.63015676 0.03519487
2.1996756 0.02782992*
WXB –0.26053582 0.58076446 –0,4486084 0,65371417

Probit LGMM

Estimación estándar Error valor z – Pr(>|z|)


(Interceptar) –3.37481 1.45691 2.31641 0.02054*
educar 0.07637 – 0.03393 2,25085 – 0.02439*
WXB 0.27239 0.65782 0,41408 0.67882
Machine Translated by Google

220 Soluciones a los Ejercicios

Ejercicio 4.6

ÿ ÿ ÿ ÿÿ 100 011 1 ÿÿ

ÿ todos
ÿ ÿÿ ÿ1 00 1ÿ ÿÿ ÿ; ÿ ÿ ÿ ÿÿ =(

TI = AI W )= 0 1 0 1 0 0 = l l
norte
ÿ ÿÿ

ÿ10

ÿÿÿ
001 100 0 1 ÿ ÿÿ
ÿ

yo

ÿ
1 000 ÿÿ

todos ÿ

ÿ ÿ

yo 10000
ÿ

yo 01000
TÍ Aÿ
=
0001 ÿÿ

todos
000 10 ÿ

yo

ÿÿ
000 01 ÿ

yo

ÿ ÿ 100100
ÿÿ

010010

ÿ11ÿÿÿ 001001
T.J.
= ÿÿ11ÿÿ
ÿ yo
j T norte =
100100

010010

ÿÿ
001001

Ejercicio 4.7

SEM-RE

Parámetros de varianza de error:


Estimación estándar valor t Pr(>|
fi ro 39,838568 Error 4.6397 t|) 3.49e–06***
0,094122 8.586543 0.066619 1.4128 0.1577

Coeficientes:
(Interceptar) –5.855669 0.640199 –9.1466 < 2.2e–16***
log(rgdp) 1.126815 0.065639 17.1669 <2.2e–16***

KKP

Parámetros de varianza de error:

Estimación estándar valor t Pr(>|


fi ro 28,727941 Error 5.2361 t|) 1.64e–07***
0,499248 5.486499 0.059529 8.3866 < 2.2e–16***

Coeficientes
(Interceptar) –1,57211 0.78284 –2,0082 0,04462* <
log(rgdp) 0,68644 0.08021 8,5580 2e–16***

Solo el término similar a KKP es significativo: por lo tanto, en el enfoque de efectos aleatorios,
concluimos en contra de la correlación espacial en la parte idiosincrásica del error, pero a favor de
la correlación espacial de los efectos individuales.
Machine Translated by Google

Soluciones a los Ejercicios 221

Ejercicio 4.8

OLS a-modelo espacial


Estimación estándar valor t Pr(>|
(Interceptar) –34.671 Error 2.650 –13,08 t|) <2e–16***
RM 9.102 0.419 21,72 <2e–16***
Estadística F: 471.8 < 2.2e–16***

R-cuadrado múltiple: 0,4835, R-cuadrado ajustado: 0,4825

Modelo de retraso espacial

Estimación estándar valor z Pr(>|z|)


(intersección) –37,75130
7,60451
RM Error –15.378 < 2.2e–16***
Lambda: 0,56252, valor de76,532
LR: prueba 2,45486 18.450 < 2.2e–16***
Estadística de Wald: 96,504 0,41218 9,8236 < 2.22e–16***
< 2.22e–16***
< 2.22e–16***

AIC: 3277.6
Prueba LM para residuos
autocorrelación 0.013478 0.90758

GWR

Resumen de las estimaciones del coeficiente GWR:

mín. 1er cuarto Mediana 3er cuarto máx. – Global


(Interceptar) –120.600 –38.360 –23.130 –5.974 5.059 52.540 –34.6706
RM 3.626 7.443 9.838 21.320 9.1021

I de Moran
estadístico = 12,578, valor p = 0,000597

Ejercicio 5.1

ÿ ÿ 00011010 ÿ ÿ 00000100
ÿÿ ÿÿ

00000100 00000000
00001011 00000100
10000111 00000000
W 2 = ; W =
3
10100001 00000000
01010010 10100001
10110100 00000000

ÿÿ
00111000 ÿÿ
00000100

3 wa
yo
9 27 2 3
Para l = 0.9502, entonces a = 3 ÿ, entonces S ÿ ÿÿi =0ÿ =1 3 + WWW
yo ! 26
Machine Translated by Google

222 Soluciones a los Ejercicios

Ejercicio 5.2 Reordenando las unidades sin pérdida de generalidad:

ÿ 0 1 0 ... 0 ÿ
ÿ ÿ

yo ÿ 0 ... 0
ÿÿ
1
0 0 1 ... 0 ÿ01 ÿ

yo ÿ ... 0

W = ; IW
( yo
ÿ

)=

0 0 ... ÿ ... 0 0 0 ... ÿ ... 1 ÿ


ÿ

ÿ 2 ll l ... norte
ÿ

1 ÿ

1 ÿ

ÿ01 ÿ ... yo
norte
ÿ

1
( IW
)= 00l 1 yo ; 3 IW ÿ l = 1 .
ÿ
ÿ

ÿ
norte

0 0 ... ÿ ... 1 ÿ

Además, la matriz de varianza-covarianza de un modelo de Rezago espacial es:

1 ÿ

T :
IW=(
ÿ )) ÿÿ ÿyoIW ( yo , y, como AB AB =

1 T 1 T
( IW
) ( )IW
yo(IW
) IW ÿÿ ÿ ) =1
yo
ÿÿ ÿ ÿ

= ( yo
ÿ

Ejercicio 5.3

Probabilidad total

Estimación estándar valor z Pr(>|z|)


(Interceptar) 2.8378e+01 Error 5.8225e+00 4.8739 1.094e–06***
CRIMEN –9.7501e–02 3.2606e - 02 –2.9902 4.1351e 0.0027877***
RM 3.8432e+00 – - 01 9.2941 6.0617e - 02
0.0118
– < 2.2e–16***
INDUS 7.1563e–04 – 4.0537e+00 –3.35555 1.3242e 0.9905805
NOX 1.3602e+01 --02 0.1280 1.8339e - 6.4249 0.0007921***
EDAD 1.6953e–03 – 6.55012e --02.4690404904904904
7,4845 0.8981255
DIS 1.1782e+00 2,6659e–03 3,6776 5,0249e– 1.320e–10***
RAD 2.9274e–01 – 02 –10,4167 3,6223e–03
2,8962
– 7.848e–06***
PTRATIO 9.7610e–01 7.172e–14***
B 9.8041e–03 – 0.0002354***
LSTAT 5.2343e–01 – < 2.2e–16***
IMPUESTO 1.0491e–02 0.0037769***

Valor de 0.22019 3.6276 0.00028602***


prueba Lambda LR: 12,492 0.00040864***
Estadística de Wald: 13,1 0.00028602***
AIC: 3034,7
Machine Translated by Google

Soluciones a los Ejercicios 223

LÍO

Estimar estándar valor t Pr(>|t|)


(Interceptar) 2,8457e+01 – Error 5.5421 4.870e–08***
CRIMEN 9,7111e–02 5,1346e+00 3,2922e–02 – 0.0033314***
RM 3,8443e+00 – 2,9497 4,1538e–01 9,2549
6,1239e– < 2.2e–16***
INDUS 6,7227e–04 02 –0,0110 0.9912456
NOX –1.3590e+01 3,8410e+00 –3,5381 1,3186e– 0.0004411***
EDAD 1.4406e–03 – 02 0,1093 1,8379e–016,3998
– 0.91304500
DIS 1.1763e+00 6,6042e–02 4,4351 1,2450e– 3.618e–10***
RAD 2.9290e–01 – 01 –7,8453 2,7004e–03
3,6405 1.135e–05***
PTRATIO 9.7675e–01 5,0898e–02 –10,2719 2.692e–14***
B 9.8306e–03 0.0003009***
LSTAT –5.2282e–01 < 2.2e–16***
IMPUESTO –1.0484e–02 3.6634e–03 –2.8619 0.0043895***

Alfa 0.24305 0.072939 –3.3323 0.00086147***


Implícito
lambda: 0.2157694
Valor de prueba de LR: 12.741 0.00035776***

Aproximación unilateral

Estimación estándar valor z Pr(>|z|)


(Interceptar) 18,5128197 – Error 3,9522 – 7.744e–05***
CRIMEN 0,0819921 4,6841857 2,8447 0.0044446***
RM 3,9028307 0,0288223 10,6961 < 2.2e–16***
INDUS 0,0118638 – 0,3648848 0,2218 – 0.8244892
NOX 11,4646211 – 0,0534946 3,3889 – 0.0007018***
EDAD 0,0050442 – 3,3830255 0,4380 – 0.6614070
DIS 0,8719433 0,0115172 5,3270 9.986e–08***
RAD 0,2530190 – 0,1636842 4,3721 – 1.231e–05***
PTRATIO 0,7405545 0,0578713 6,5727 4.943e–11***
B 0,0078935 – 0,1126720 3,3362 – 0.0008494***
LSTAT 0,3659074 – 0,0023660 7,9284 – 2.220e–15***
IMPUESTO 0,0096598 0,0461518 0,0032010
3,0177 0.0025467***

Valor de 0.30525 12.336 < 2.22e–16***


prueba Lambda LR: 111,79 2.22e–16***
Estadística de Wald: 152,17 2.22e–16***
AIC: 2935,4

Ejercicio 5.4

Condiciones de simetría:

aw ; 1=12 2
21aw bw ; 1=13 3
31aw = aw 3 34 4 43 2 24=4 42 ;
bw bw bw
Machine Translated by Google

224 Soluciones a los Ejercicios

Condiciones de isotropía:

ab ii= yo = 1,...,4 ÿ y ww 12 13 = ; ww = ; 21 24 ww 31=34 ; 43 42 =

ÿy1
ÿÿ
ÿ
0 wow
12 13 0 ÿ ÿ mi 1 ÿ ÿÿ
un1
ÿ ÿ ÿ ÿÿ

y2 21 _ 00 24 _ un
ÿ ÿÿ

= ÿÿ

= = 2
eÿ

= ÿÿ
2
ÿ ÿ ÿ ÿ ab ii ÿ ; ÿ ÿ ÿ = yo = 1,...,4 ÿ
y _
Wÿ ; ; mi ÿ ÿ ÿ un ; ÿ

y3 w 31 00 w 34 un3
ÿ

ÿ ÿ mi
3

ÿ
4
ÿÿÿÿÿÿÿy
0 wow
42 43 0 mi 4 un4
ÿÿÿÿ
ÿ ÿ ÿÿÿ ÿÿÿÿÿ

Expresión compacta:

T
= +
ya Wy e

Ejercicio 5.5

Probabilidad

q
ÿÿ ÿ ÿyoÿ_1 +
ÿ ÿ

el

le e=
yo
yo _ _
(2 un
ÿ

1)(2 mi
ÿ

ÿ 1)
ÿ
i =1

Log-verosimilitud

q
ÿ { ee il
}
ÿÿ ÿ ÿ

yo mi
ÿ = ln 1 + (2 1)(2 lee ee un
_
ÿ
yo
ÿ

ÿ 1)ÿ
ÿ
i =1

q qq

ÿ ÿÿ
ÿ

mi
ÿ

mi
= ÿÿ

ee un i yo
ÿ + ln 1 + (2 ÿ mi
i ÿ

1)(2 mi
yo
ÿ

ÿ 1)ÿ
=1ii
yo =1 =1

Condiciones

ÿÿ
q q
ÿ ÿÿ

ÿÿ ÿÿ ÿ segundo
yXyoyX
ll b ÿ ÿ( )( ) b
ÿÿ yo = 1 i =1
ÿÿÿ

q ÿÿ
ÿÿ

()yXi ()yX i b ÿÿ

yo yo
b ÿÿ

un mi 1)(2 mi
ÿ ÿ

1 +ÿ (2
ÿ +ÿ ln
ÿ ÿ 1) ÿ= ÿÿ
0ÿ
i =1
ÿÿÿ

2 ÿÿ
q q
ÿ ÿÿ

2 ÿÿ ÿÿ ÿ segundo
yXyoyX
ll b ÿ ÿ( )( ) b
ÿÿ yo = 1 i =1
ÿÿÿ

q ÿÿ

"
ÿÿ

()yXi () ib yX
ÿÿ

yo yo
b
1) 0ÿÿ<ÿÿ
ÿ ÿÿ

un mi 1)(2 mi
ÿ ÿ

ÿ ÿ ln+ 1(2 ÿ ÿ
i =1
ÿÿÿ
Machine Translated by Google

Índice

Impacto Directo Medio (IDA), 89 mejor estimador lineal insesgado (AZUL), 2, 22


R2 ajustado , 21
matriz de agregación, 161 grandes datos, 167, 178, 198
Criterio de información de Akaike (AIC), 6, 22 modelos binarios, 99, 111–18, 121, 127, 158

modelo de retraso espacial anisotrópico, 181– núcleo bicuadrado, 149, 159


5, 196 bivariado,
anisotropía, 179–85, 198 técnica de codificación, 169, 190–1, 195–8
soluciones aproximadas, 168 estimador marginal de máxima
a-espacial verosimilitud, 127
modelo logit, 112–15 arranque, 195, 198, 203
modelo probit, 112–13 riesgo de cáncer de mama, 179
relaciones espaciales asimétricas, 179– Prueba de homocedasticidad
80, 198 de Breusch-Pagan, 12, 22
asimetría, 179–81, 198
asintótico calibración, 149, 159
eficiencia, 80 censura, 127
normalidad, 4, 115, 123 distribución chi-cuadrado, 5, 182
imparcialidad, 4 solución de forma cerrada, 169, 172–3, 197
autocorrelación, 11–12, 15, 22–3, Función de producción Cobb-Douglas, 10
26–7, 33, 36–9, 46–7, 49, 51, 73, 81– Transformación Cochrane-Orcutt, 77, 93, 140,
2, 84, 92–3, 104, 110, 120, 150–1 141
coeficiente de determinación (R2), 6
Impacto Directo Medio (IDA), 89 probabilidad compuesta, 189–91
Impacto Total Promedio (ATI), 89 problemas computacionales, 58, 78, 112,
Impacto Total Promedio De (ATIF), 89 120–7, 134, 141, 150, 168–78, 185,
Impacto Total Promedio A (ATIT), 89 189, 194, 198
tiempo de computación, 127, 168, 172, 189, 198
ancho de banda, 148–52, 154, 159, 162
Modelo Barro y Sala-i-Martin, 9, 15, 143, 183 distribución de probabilidad condicional, 2, 186,
203
Núcleo triangular de Bartlett, 105, 154 matriz de conectividad, 28, 47
bayesiano, consistencia, débil, 2, 4, 22, 84, 106, 123, 151
acercamiento, 6, 22, 112, 127, 150, 159, 176,
203 modelos de elección del consumidor, 111–12
acercamiento a la geografia modelos centro-periferia, 180, 198
regresión ponderada (GWR), 150, matriz de correlación, 11, 13–14, 62, 111,
159 198
criterio de información (BIC), 6, 22, 115 núcleo coseno, 106
contar datos, 111, 127
mejores estimadores espaciales generalizados datos transversales, 124, 140, 144, 189
factibles de mínimos cuadrados en validación cruzada, 149, 150, 157, 159, 162
dos etapas, 80

225
Machine Translated by Google

226 Índice

datos mínimos cuadrados generalizados factibles


crimen, colón, 106 (FGLS), 56, 59, 62, 66
económico, 23, 129, 168 mínimos cuadrados espaciales factibles
logros educativos, Georgia, 151 precio de la de dos etapas (FS2SLS), 102
vivienda, Boston, 70 mínimos cuadrados generalizados (GLS),
14–5, 18, 22–3, 26, 91, 96, 138–9,
casas de lujo, baltimore, 46 147, 215
función de producción, de Munnel, 10, 18, 131, método generalizado de momentos
142, 156 (GMM), 59, 78, 85, 101–4, 120–4, 134,
productividad del capital público, 130 139–41, 155, 159, 162
convergencia regional, Italia, 9, 15, 136, 143, variables instrumentales (IV), 17–18, 22–3, 56,
183 76, 93
precio de auto usado, EE. UU., 46, 63, GMM linealizado, 124
66, 145 máxima verosimilitud (ML), 3, 7, 14, 22, 53, 57,
matrices de pesos densos, 122, 168, 172, 198 83, 97, 113, 161, 167, 172, 196, 200

determinantes del delito, 106; método de momentos (MM), 4, 18,


comprobación de diagnóstico, 21 22
variable dicotómica, 113, 158 mínimos cuadrados ordinarios (OLS), 4, 11, 14,
sesgo direccional, 179–80, 183–5 16–17, 22
elección discreta, verosimilitud pseudo-máxima, 58, 148, 189,
modelos, 111–12, 115, 127, 158 198
modelos en regresión ponderada aparentemente sin relación, 203
geográficamente, 151, 159 mínimos cuadrados de dos etapas (2SLS), 17–
distribución, 18, 22, 66, 68, 73, 76, 78, 92, 100, 126, 141
normal, 22, 24, 34–5, 47, 53, 57–8, 76, 86, 113,
120, 122, 124–5, 134, 141 dentro, 130
exogeneidad, 2, 18, 22, 68
chi-cuadrado, 5, 182
t-Estudiante, 5 prueba F, 6
F-Fisher, 6 factible GS2SLS, 56, 59, 62, 66
logística, 113–14, 124, 125, 159 vecinos de primer orden, 170, 198
modelos de duración, 127 enfoque fischeriano, 203;
Prueba de Durbin-Watson, 12, 23, 33, 47 Matriz de información de Fisher, 4, 194
efectos fijos, 133–5, 141, 143, 157, 159–60
efectos de borde, 203
eficiencia, 2, 4, 22, 76, 80, 100, 118, 120, 127, enfoque frecuente, 203
130, 151, 182
algoritmo EM, 121, 159 gaussiano,
endogenidad, 16, 56, 66, 68–9, 73, 78–9, distribución, 22, 24, 34–5, 47, 53, 57–8, 76,
100, 102, 118, 120 86, 113, 120, 122, 124–5, 134, 141
Núcleo Epanechnikov (cuadrático), 105, 154, 161
núcleo, 106
métodos de estimación, generalizado
mejor mínimo cuadrado espacial generalizado criterio de estimación de mínimos cuadrados (o
factible de dos etapas (BFGS2SLS), 80 Aitken) (GLS), 91
método de estimación de momentos, 4, 18, 22
mejor estimador lineal insesgado
(AZUL), 2, 22 perturbaciones probit y logit, 123
Machine Translated by Google

Índice 227

mínima estimación espacial en dos etapas, coseno, 106


78, 92, 153 Epanechnikov (cuadrático), 105, 154
sistemas de informacion geografica estimación, 158
(SIG), 43, 50 Gaussiano, 106, 149, 157
regresión ponderada geográficamente, 146–51 Partzen, 106
cuadrático (bi-peso), 105, 154
geología, 179 cuadrático (tripeso), 106
georreferencia datos económicos, 168 espectral cuadrático, 106, 154
teorema de Gerschgorin, 52 tri-cubo, 149
Muestreador Gibbs, 127 Tukey–Hanning, 106, 154
términos de gradiente, 125–6, 159 uniforme, 105
modelo KKP, 15–16, 132–4, 139, 157, 159
Estimadores HAC, 104–5, 153, 158, 160
planificación de la salud, 111, 146, 168, 176 Producto de Kronecker, 132, 159
heterocedasticidad, 15, 21–2, 55, 99, 100– curtosis, 8
4, 118–22, 125, 148, 151–3, 160–1,
217 modelo de variables independientes rezagadas,
imágenes médicas de alta resolución, 168 52, 93
vecinos de orden superior, 170, 191, 198 Multiplicador de Lagrange (LM),
procedimiento de prueba, 7, 12, 35, 83, 92
homogeneidad, 11 evaluación de la cobertura terrestre, 168
precio de la casa, 70, 80, 97, 115, 127, 174, 180 muestra grande, 4, 58, 76, 78, 80, 86, 112,
145, 150, 187, 195, 198 regresión
genoma humano, 146 latente, 112, 121, 154, 158
variable latente, 112, 121–2, 154, 158
matriz idempotente, 17, 173 cuadrícula de celosía, 80, 100
idiosincrático, término de error, 159–60 método de mínimos cuadrados, 4, 11, 14, 16–17,
medidas de impacto, 87–90, 92–3, 115 22
IDA, 89 Estimadores de variables instrumentales de Lee,
ATI, 89 78, 92, 153
ATI, 89 Factorización de probabilidad, 186
ATIF, 89 Función de probabilidad, 7, 14, 53, 57, 83, 97, 113,
en un modelo Logit y en un Probit, 115 119–22, 133, 137, 161, 167, 172, 196, 200

función de índice, 112, 159 Prueba de razón de verosimilitud, 7, 22, 183


término de error individual, 130, 132, 139 línea de datos, 203
matriz de información, 4, 7, 22, 83, 115, 194 estimador GMM linealizado, 124
regresión ponderada localmente, 146, 113–
variables instrumentales, 17 14, 124–5, 159
instrumentos, 17 distribucion logistica, 129, 159
prueba de isotropía, 179–83 paneles largos, 129, 158
procedimiento iterativo, 121, 135, 138
búsqueda iterativa, 149, 150, 155 efectos marginales, 87–90, 92–3, 115, 194

Prueba de Jarque-Bera, 8 matriz,


especificación espacial exponencial, 169–
función del núcleo, 75, 190, 196, 198–9
Bartlett-triangular, 105, 154 transformación exponencial, 169
bicuadrado, 149, 154 expansión de poder, 170
Machine Translated by Google

228 Índice

criterio de vecindad de máxima distancia, 28, prueba de autocorrelación


47, 118 espacial residual, 33–5, 46–7, 82–3
Máxima verosimilitud, método ventanas móviles, 146
de estimación 3, 7, 14, 22, 53, 57, 83, 97, 113, multivariante,
161, 167, 172, 196, 200 distribución normal, 119, 186
probit, 127
solución para el modelo SARAR
estimación de parámetros, 76 vecino más cercano, criterio, 28, 47, 197, 199
solución para la estimación de parámetros
del modelo de error espacial, 57 criterios de barrio,
solución para la estimación de parámetros orden superior, 170, 175
del modelo Spatial Lag, 66 distancia máxima, 28–9
imágenes médicas, 168 caso de la dama, 27–8, 40, 47 caso
meteorología, 179 de la torre, 27, 40, 47, 128, 180–1
método de estimación de momentos modelos no lineales, 122, 124, 167
método, 4, 18, 22 prueba no anidada, 203
error de especificación, 100, 145 estimación no paramétrica, 100–4
modelos, relaciones espaciales no estacionarias, 145
retraso espacial anisotrópico, 181–5, 196 distribución normal, 22, 24, 34–5, 47, 53, 57–8, 76,
regresión ponderada geográficamente 86, 113, 120, 122, 124–5, 134, 141
(GWR), 146–51
KKP, 133 parámetros molestos, 101, 158, 160
regresión ponderada localmente, 146
logit, 112 Ley de Okun, 35, 87, 90
tablero, 129 descomposición de Ord, 58
probit, 113 Método de estimación de mínimos cuadrados
autorregresión espacial pura, 52 ordinarios, 4, 11, 14, 16–17, 22
SARAR con perturbación
heteroscedástica, 100 Probabilidad por pares, 189, 193, 198
SARAR, 75 Panel,
modelo de error espacial (SEM), 55 datos, 128–9
error espacial con efectos fijos, 141 largo, 129, 158
error espacial con efectos aleatorios, 132 corto, 129
parámetro de interés, 101
HAC espacial, 104 espacio de parámetros, 96
modelo de retraso espacial (SLM), 66 Núcleo de partzen, 106
retraso espacial con efectos fijos, 135 curva de Phillips, 37
retraso espacial con efectos aleatorios, 137 datos puntuales, 203
logit espacial, 124 análisis de patrón de puntos, 203
probit espacial, 127 serie temporal agrupada, 129
variable independiente retrasada expansión en serie de potencias, 170
espacialmente, 55 predecesores-vecinos, 186–7
retraso espacial unilateral, 185 dirección preferida, 179, 181, 185–6
Cadena Montecarlo Markov (MCMC), 127 prueba previa, 203
índice de precios, 37–8
Yo de Moran, propiedades de los estimadores,
prueba modificada, 84–6 asintótica, consistencia, 2, 4,
momentos de, 34–5 22, 106, 123, 133, 151
diagrama de dispersión, 49
Machine Translated by Google

Índice 229

eficiencia, 80 software,
normalidad, 4, 18, 34, 58, 115, GeoDA, 204
123 Matlab, 204
imparcialidad, 4 PySAL, 204
pequeña muestra, R, 20
eficiencia, 76, 80, 101–2, 120, 130, 134– SPSS, 27
6 ESTADO, 204
imparcialidad, 4, 12, 22, 194 matrices de peso disperso, 167–8, 172, 198
pseudo-probabilidad, 5, 148, 189, 198
autorregresión espacial pura, 52 autocorrelación espacial, 11–12, 15, 22–3, 26–
7, 33, 36–9, 46–7, 49, 51, 73, 81–2,
núcleo cuadrático, 84, 92–3, 104, 110, 120, 150 –1
bipeso, 105, 154
espectral, 106, 154 arranque, 195, 198
tripeso, 106 modelos econométricos ver modelos
barrio caso de la reina, 27, 40, 47, 128, 180-1 métodos de expansión, 203
Procedimientos HAC, 104–5, 153, 158, 160

R2 (coeficiente de determinación), 21 modelos de interacción, 111, 203


aleatorio, operador de retraso, 29
efectos, 130, 132–7, 140–1, 156, 159–62 retraso, 26, 29
regresión cuantil, 203
campos, 146, 202 remuestreo, 195, 198
Prueba de puntuación de Rao (multiplicador de Lagrange), 7 estadísticas, 27, 179, 203
forma reducida de un modelo, 88–9, 118, 122, matriz de pesos, 26, 132, 175
124, 158 variable espacialmente rezagada, 29
convergencia regional, 9, 15, 136, 143, 183 perturbaciones esféricas, 2, 11, 13, 119–20

instrumentos pertinentes, 17 derrame, 133, 194


remuestreo, 195, 198 paneles espaciales de dinámica estable, 142,
robusto, 159
estimación, 100, 134, 155, 203 estandarizado,
Prueba del multiplicador de Lagrange, 84, 92–4 distribucion logistica, 113, 159
caso de la torre, 27, 40, 47, 128, 180–1 distribución normal, 86, 113
matriz de pesos, 29, 32, 34, 47–8, 51–2,
muestra, 94, 148, 167, 169, 179, 181, 186
análogo, 123
grande, 4, 58, 78, 80, 86, 167–8 limitaciones de almacenamiento, 168, 174, 189, 198
momento, 102, 104, 123, 141 forma estructural de un modelo, 118, 159
selección, 127 submuestra, 146, 149, 195, 197
estadísticas de escaneo, 146 suma de cuadrados, 6
Criterio de información de Schwartz, 6, 22, 115 sistemas de ecuaciones no lineales, 4–6, 18, 180,
función de puntuación, 3, 7, 22, 83, 114 193, 199

regresión aparentemente no relacionada, 203 Prueba T, 5


sesgo, 8 Serie de Taylor, 7
social, pruebas,

distancias, 28 Breusch–Pagan, 12, 22


redes, 172, 203 chi cuadrado, 12, 23, 33, 47
Machine Translated by Google

230 índice

pruebas – continuación aproximación unilateral, 169, 178, 185, 196–8


Durbin-Watson, 12, 23, 33, 37
F-Fisher, 6 modelo de retraso espacial unilateral, 185–6,
Jarque-Bera, 8 198–9
razón de verosimilitud, 7, 22, 183 heterogeneidad no observada, 129, 132, 159
Moran modificado, 84–6
Morán, 33–5, 46–7, 82–3 variable no observada, 112
de isotropía, 179–83 paneles espaciales dinámica inestable, 142, 159
Rao, 7
T-estudiante, 5
Wald, 7, 115, 153 matriz de varianza-covarianza, 11–14, 26, 57–
modelos de series temporales, 12, 23, 29, 33, 99, 8, 62, 97, 100, 102–5, 118–19, 121,
104, 142, 159, 170, 184, 186, 189, 202 124, 133, 137–8, 141, 153, 169–70,
174, 199
degradante, 134–5, 137, 139–40, 159–60
prueba de Wald, 7, 115, 153
núcleo de tres cubos, 149 consistencia débil, 2, 194
truncamiento, 172–4 peso,
Núcleo de Tukey-Hanning, 106, 154 estandarizado ver pesos estandarizados
mínimos cuadrados de dos etapas (2SLS), 17– matriz ver matriz de ponderación espacial
18, 22, 66, 68, 73, 76, 78, 92, 100, 126, Prueba de White para homocedasticidad, 12
141 dentro del estimador, 130, 141
dentro de residuos, 159
imparcialidad, 4
núcleo uniforme, 105 Producción de Zellner-Revankar, 10, 18

También podría gustarte