Una Cartilla para Espacial Econometría: Giuseppe Arbia
Una Cartilla para Espacial Econometría: Giuseppe Arbia
Una Cartilla para Espacial Econometría: Giuseppe Arbia
Giuseppe Arbia
Machine Translated by Google
PalgraveTexts en econometría
El ritmo de desarrollo de la econometría ha hecho que sea cada vez más difícil tanto para los estudiantes como
para los profesionales ser conscientes de lo que es impotente y probable que sea duradero en la teoría y las
aplicaciones prácticas. Esta serie aborda desarrollos clave importantes dentro de un marco unificado, con
volúmenes individuales organizados temáticamente. La serie es relevante tanto para estudiantes como para
profesionales que necesitan mantenerse al día con los desarrollos econométricos, pero está escrita para una
amplia audiencia con un estilo diseñado para poner los conceptos econométricos a disposición de los
economistas que no son econometristas.
Michael P. Clements
EVALUACIÓN DE PRONÓSTICOS ECONOMÉTRICOS DE VARIABLES ECONÓMICAS Y FINANCIERAS
Lesley Godofredo
PRUEBAS BOOTSTRAP PARA MODELOS DE REGRESIÓN
Terence C. Molinos
MODELIZACIÓN DE TENDENCIAS Y CICLOS EN SERIES TEMPORALES ECONÓMICAS
Kerry Patterson
PRIMER PARA PRUEBAS DE RAÍZ UNIDAD
Kerry Patterson
PRUEBAS DE RAÍCES UNITARIAS EN SERIE DE TIEMPO VOLUMEN 1
Kerry Patterson
PRUEBAS DE RAÍCES UNITARIAS EN SERIE DE TIEMPO VOLUMEN 2
Ampliaciones y Desarrollos
Terence C. Molinos
ANÁLISIS DE DATOS ECONÓMICOS
Una introducción concisa
Giuseppe Arbia
UN PRIMER PARA LA ECONOMÉTRICA ESPACIAL
Con Aplicaciones en R
Puede recibir títulos futuros de esta serie a medida que se publiquen haciendo un pedido permanente.
Póngase en contacto con su librero o, en caso de dificultad, escríbanos a la dirección que figura a continuación
con su nombre y dirección, el título de la serie y el ISBN citado anteriormente.
Giuseppe Arbia
Machine Translated by Google
Cualquier persona que realice cualquier acto no autorizado en relación con esta publicación.
puede ser objeto de enjuiciamiento penal y demandas civiles por daños y perjuicios.
La autora ha hecho valer su derecho a ser identificada como la autora de este trabajo de
conformidad con la Ley de derechos de autor, diseños y patentes de 1988.
Palgrave Macmillan en EE. UU. es una división de St Martin's Press LLC, 175 Fifth
Avenue, Nueva York, NY 10010.
Palgrave Macmillan es el sello académico global de las empresas mencionadas y tiene empresas
y representantes en todo el mundo.
Palgrave® y Macmillan® son marcas registradas en los Estados Unidos, el Reino Unido,
Europa y otros países.
DOI 10.1057/9781137317940
Este libro está impreso en papel apto para el reciclaje y fabricado con
fuentes forestales gestionadas y sostenidas. Se espera que los procesos de tala, pulpa y
fabricación se ajusten a las reglamentaciones ambientales del país de origen.
Un registro de catálogo para este libro está disponible en la Biblioteca del Congreso.
A P, E, F y E
Machine Translated by Google
Contenido
Lista de Figuras ix
Lista de ejemplos X
viii
Machine Translated by Google
viii Contenido
Índice 225
Machine Translated by Google
Lista de Figuras
ix
Machine Translated by Google
Lista de ejemplos
X
Machine Translated by Google
Lista de ejemplos xi
Prefacio
guillermo verde
Escuela de Negocios Stern
Nueva York, agosto de 2013
xi
Machine Translated by Google
Prefacio y Agradecimientos
XIII
Machine Translated by Google
Prefacio y Agradecimientos xv
Este libro está dedicado a mi familia. Si reviso los prólogos que he escrito para mis
libros anteriores, encuentro expresiones de agradecimiento a Paola ya mis tres hijos
por su presencia, paciencia, ayuda y aliento. Han pasado veinticinco años desde la
publicación de mi primer libro y siete desde el último. Los niños han crecido y muchas
cosas han cambiado, pero mi familia todavía está aquí conmigo y para ellos mis
pensamientos están agradecidos en este lluvioso y sombrío día de finales de invierno,
cuando estoy aquí sentado frente a mi computadora escribiendo las últimas palabras
de este libro.
1
La regresión lineal clásica
Modelo
ÿÿ
ÿy 1
...
donde y1 = es un vector de n observaciones del dependiente
norte
...
ÿ
ÿÿÿÿÿÿÿy
norte
ÿÿÿÿÿÿÿ
ÿ1 XX ÿ1
ÿ
11 1k ÿ
... ...
variable y, X = una matriz de n observaciones en k – 1
nk 1
1 XX
ÿ norte1 nk 1 ÿ ÿ
ÿ
b1 ÿÿ
=
regresores exógenos no estocásticos que incluyen un término constante, k b1
ÿ
ÿÿ
segundo
k ÿÿÿÿÿÿÿ
ÿ mi ÿÿ
1
...
mi =
un vector de k parámetros desconocidos a estimar y norte 1 un
ÿ ÿ ÿ ÿ ÿ ÿ ÿ ÿ mi ÿÿÿÿÿÿÿ
norte
1
Machine Translated by Google
n Al ser una matriz identidad n-por-n . La ecuación (1.2) también se puede escribir como:
E(eÿX) = 0 (1.3)
De dónde:
Además, del supuesto de normalidad de las perturbaciones estocásticas también se deduce que
los estimadores alternativos, basados en el criterio de Máxima Verosimilitud (ML), coinciden con
la solución MCO.
De hecho, la perturbación estocástica única se distribuye como:
1 ÿÿ1
ÿÿÿ 2
F ()=
yo
_
yo
_ Exp ÿ ÿ
mi
yo
ÿ 2p _ 2ÿÿ
1 1
norte norte
ÿ
2 2
Lb
(, ÿ ÿ ) =i f( ) =
ÿ mi yo y yo
ÿ
mi _ ÿ ÿ expÿÿ ÿ2ÿ
i =1
ÿ 2p _ 2
yo = 1 mi ÿ
mi ÿ
eeT
norte
norte
= 22 ÿ
ÿ
ÿÿ
(ÿ mi ) ( 2 pag ) 2
ÿ ÿ expÿÿ ÿ2
(1.10)
2 ÿ
mi
ÿ ÿ
ÿ
ÿ norte ÿ 2 eeT ÿ
= porque t (ÿ 2 exp
) ÿÿ 2 mi
2
ÿ
ÿ
ÿ mi ÿÿ
e = y – Xb (1.11)
ÿ norte ÿ 2 T
ÿ ( segundo )( yX yX
segundo )ÿ
ÿ ÿ
ÿ
2
L segundo
ÿ (
mi ( , ) = costo t
2 ÿ exp ÿ
mi ) ÿ
2 (1.12)
2ÿ mi ÿ
y la log-verosimilitud como:
T
( lLyXt ÿÿ
) 22 2segundo ( , segundo ) = 2segundo )( norte yXÿsegundo
ÿ ÿ ee e ) ÿ ÿ
ÿ ÿ
ln en
( , )( = porque
(1.13)
ÿ ÿ
2
2 ÿ
mi
ÿÿ
ÿ dL
ln ( , (segundoÿ 2) ÿ
1 ˆ
ÿÿ
)= ÿ = (X yT XX T
mi
b)=0
ÿ
ˆ
ÿ ÿ
ÿ
sÿ
segundo
2
ÿ b ÿ
mi
ÿ ˆ ˆ (1.14)
ÿ re L 2
( )( n yXbyXTb
ÿ
ÿ
segundo
ln ( , ÿ
mi
) ÿ
ÿ ÿ
2 ÿ
= + )=0
ÿÿ (mi)= re
ÿ
ÿs
ÿ
ÿÿ 22 4 2ˆ 2ˆ
ÿ
ÿ
ÿÿ ee ee
Machine Translated by Google
ˆ
T ÿ
1 T
b ML =( )XXXy
ˆ2 T
ee (1.15)
ÿ =
mi , ML
norte
te
contrario difiere del estimador insesgado 2 s
mi
= y es parcial,
nk -
pero asintóticamente imparcial.
Para asegurar que la solución obtenida es un máximo consideramos la
segundas derivadas:
2
dlb 2
ÿÿ
(, ) ()ÿ 1
dsb
ÿ
ÿ
mi
= = ˆ XXT
2 22
ÿ
ÿ base
de datos
db ÿ
mi
ÿ
22 2
ÿ
dlb (, ) ÿ
mi
ds ( ÿ) norte
ÿ
ÿ
2
= mi
= (1.16)
2 24
ÿ
ÿ
ddÿ ÿÿeee 2ˆ
ÿ
dl2 (,b) ÿÿ 2
ÿ
mi
ÿ =0
ÿ
ddb ÿ
2
ÿÿ mi
ÿ1ÿ ÿ
T
ˆ 2 XX 0 ÿ
ÿ
2 mi
k +1 +1 yo
( b, )=ÿ mi (1.17)
norte
0
ÿ
2ˆÿ 4 mi ÿ
1 T mi
Xe EX=T n ( ) =0 (1.18)
Machine Translated by Google
1 T
XyX( b )=0
ÿ
norte
11
T T
Xy XX
ÿ
b =0
norte norte
= == T
b milímetro ( XX Xy) MCO ML b b (1.19)
H 0 : b=i 0
(1.20)
H ÿ: 1 bi 0
ˆ
H0
prueba = bi ÿ
norte (0,1) (1.21)
ÿS ii
mi
Esto, sin embargo, no es una cantidad fundamental a menos que sepamos el valor de s2. mi
2
n ks
()
ÿ
2
Ya que 2
2
ÿe x ( nk )
ÿ
(con x (n- k)
una distribución chi-cuadrado con n – k
ÿ
mi
(1.22)
ss mi
yo
H 02: 3bb
= =b=! = 0 k
(1.23)
H ÿ: 1 bi 0
Machine Translated by Google
R 2k/( ÿ
1)
F = ÿ ÿÿF (k 1; nk ) (1.24)
2
(1
ÿ
R nk
) /(
ÿ
RSS
R2 = (1.25)
acero inoxidable
En la Ecuación (1.25), SSR representa la suma de los cuadrados de la regresión definida como
SSR = 1 – SSE = 1 – eTe (SSE representa la suma de los cuadrados de los errores), SST = yTy
– ny¯ representa la suma total de los cuadrados y y ¯ la media muestral de y. R2 es el llamado
coeficiente de determinación (0 < R2 ÿ 1), un parámetro que mide el grado de ajuste de los datos
observados a una función lineal. La versión ajustada de R2, que tiene en cuenta el número de
grados de libertad de la regresión, viene dada por:
1
R2 = 1 R2)
norte
(1 (1.26)
ÿ ÿ
nk ÿ
+1
ÿÿ
Camiseta k 2 ÿ ÿ
AIC = ln ÿ ÿ + ÿ ÿ ÿ ÿ
(1.27)
norte norte
ÿ ÿ
ÿ Camiseta
en ÿ
kn ÿ
BIC = ln ÿ ÿ ÿ ÿÿ+ÿÿ
(1.28)
norte norte
ÿ ÿ
Otro enfoque para la prueba de hipótesis en regresión (que podría aplicarse al sistema de
hipótesis (1.20) y que se empleará más adelante en este libro) se basa en el procedimiento de
prueba general conocido como razón de verosimilitud. La razón de verosimilitud de un vector de
parámetros, digamos ÿ, viene dada por:
L ()0()0 0 L ÿ
ÿ = ˆ = ˆ (1.29)
L ÿ( ML ) L ()ÿ
Machine Translated by Google
con el subíndice 0 indicando el valor de los parámetros bajo el nulo. Representa la relación entre la
función de verosimilitud evaluada en el valor del parámetro bajo el valor nulo y la función de
verosimilitud en su máximo. Una transformación monótona del estadístico de prueba l no cambia
las conclusiones inferenciales, por lo que es más común referirse a la prueba de razón de
LR = 2 ln( ) = 2 yo( ) ( )
ÿ ÿÿ
ÿ
ÿ
lÿ ÿ0 lÿ ÿ
(1.30)
ÿÿ
2 "
)1 l()ÿÿ ÿ+(ÿÿ2
ˆˆ ˆ
ÿ
LR = 2 ÿ ÿ ÿ (ÿ 0
¢
0
ÿ
) yo
¢¢
() + ÿ ÿ descanso
ÿ
(1.31)
1 ˆˆ ÿÿÿ ÿÿ ÿ ˆ 2 "
( )() ( ( )+
ÿ
ÿÿÿ=2
ÿÿ ÿ
0 s+2 0 ) no descanso ÿ
ÿ ÿ
~ ~
donde q ÿ(qˆ,q0), s(.) es la función de puntuación y ni(q ) el elemento de la
matriz de información de Fisher. Por definición s(qˆ) = 0, de modo que:
ˆ 2
= (
LR norte ) ) (i +0(1) op ÿÿ ÿ (1.32)
ÿ
La aproximación:
ˆ 2
ÿ norte =
LR W (( yo - ÿÿ) ÿ 0 0 ) (1.33)
¢ 2
=
yo
( ÿ0 )
LR LM
ÿ
( ni 0 0 ) (1.34)
LM =( ) ()ÿ ÿÿ T yo
0( )ÿ 1s 0 (1.35)
que es la expresión general de la prueba del multiplicador de Lagrange que se utilizará más
adelante en este libro. En el caso de la regresión lineal, una forma sencilla de probar hipótesis
sobre los parámetros es definir:
2
ÿ )ÿk s, ) (1.36)
ÿ
k 1 +1 0 ÿ1( ( (ÿ )=
ss segundo 0 ÿ
0 ,e ÿÿ
Yo ÿ (+1
yo
+1kk+1kk0 +1 )=0 0, ( segundo
ÿ, )2mi (1.37)
(K ÿ ÿ3 )2
ÿ
norte
=
JB SK
ÿ
2+
6 4
ÿ ÿ
1 3
ÿ
norte
i =1
(yo
_
ÿ
mi )
con SK = norte
la asimetría y, respectivamente,
ÿ (eeÿÿyo)ÿÿ 32 2
norte
ÿ1
ÿ ÿ norte
i =1
1 4
ÿ
norte
i =1
(yo _ ÿ
)
k = norte
la curtosis de los residuos. Bajo el nulo de
2
2
ÿ
norte
ÿ1
i =1
(yo _ÿ ÿ ÿ) ÿ
ÿ ÿ norte
normalidad, se puede demostrar que esta cantidad se distribuye como c2 con 2 grados de
libertad.
Machine Translated by Google
y eso
log = + ab ey + t = 1, 2,... , T
yo 0 i
y i0
segundo =
T
La tabla muestra el PIB per cápita en el año 2000 y el crecimiento del PIB real per cápita
en el período 2000–08 tal como se observó en las 20 regiones italianas.
Las pruebas t muestran que tanto el intercepto como la pendiente son significativamente
diferentes de cero con la pendiente del signo negativo esperado, mientras que la prueba
F conduce a la aceptación del modelo con una significación superior al 99%.
Además, el coeficiente de determinación (R2) indica que el modelo explica el 59.38%
por ciento de la variabilidad del crecimiento. Finalmente, no se puede rechazar la
hipótesis de normalidad con una probabilidad de 0,5803.
Agregado Agregado
y yo
kl yo
bbyob01ln(
2 ) = + ln( ) + ln( ) +
mi
Machine Translated by Google
siendo yi el valor agregado per cápita en la región i, ki el gasto de capital per cápita en la
región i y li el gasto laboral per cápita en la región i. La estimación OLS de los parámetros
conduce a los resultados que se muestran a continuación en la tabla:
Los valores p de las estimaciones muestran que todos los parámetros son muy
significativos, con la única excepción del término constante. El modelo explica el 92,43% de
la variabilidad total del valor agregado per cápita. La prueba F conduce a la aceptación del
modelo y, finalmente, se puede aceptar la nula de normalidad al nivel de significancia del
5%.
T (EX 2
ee VC)=nnÿÿe =
(1.38)
1
PA = ()ÿ ÿÿ2TT
g TXXXX g ÿ1
ÿ
(1.41)
ÿ!1 = P !T P !1 (1.43)
* = 111 mi * = * =
ÿÿÿ
y PyX PX P mi
(1.44)
11 1 + mi
Py PX =P b
+
y X *= * * ser (1.45)
T ÿ
1 TT ÿ ÿÿ
2PP
1 ÿÿ e T
mi ee
( * * )= ( EP P ee )= (1.46)
de (1.38) y, finalmente:
T 2
mi ee
( * * )= yo soy
*T
*
b MCO = ( XXXy
* *)
tt tt ÿÿ ÿ
1
= ( )XP PX XP Py (1.47)
T 11 1 T ˆ
= ( ÿ ÿ ÿÿ ÿ
X XX y ) = b GLS
Machine Translated by Google
ˆ
2 11 T
Var b( )=GLS
( ÿ XX ÿÿ ÿ mi ) (1.48)
ˆ
El estimador b GLS se denomina estimador de mínimos cuadrados generalizados (GLS)
o estimador de Aitken. Tal estimador disfruta de todas las propiedades de optimización del OLS.
norte
ÿ ÿ segundo ÿ Tÿÿ yX1yX segundoÿ
( )( ) 1 ÿÿ ÿ
ÿ
2
L (b , ÿÿ
) = costo t (ÿ mi2 )2 ÿ 2
experiencia
2 (1.49)
2 ÿ mi
ÿÿ
2 2
ÿ
) = ln ( , Lÿ b
ÿ
libras ( , mi ÿ mi ÿ)
ÿ
T ÿ
n 2 1 ( )( ) y bX ÿ ÿÿ y X segundo (1,50)
= porque t ÿ
en (ÿ mi ) 1 ÿ ÿÿ 2
registro 22 2 ÿ mi
T 1
( ( yX yX ÿ) ÿÿ ÿ bb ) = min
ˆ ˆ
T 11 1 T
b ML =( X XX yÿ GLS
ÿ ÿÿ ÿ
) = b (1.51)
*T
* ee
2
=
segundos
mi
(1.52)
nk -
Machine Translated by Google
ÿ ÿ
segundos
(1.53)
mi
nk ÿ
T
b ÿÿ1 ÿ yy *Xy
TT
nk 1
ÿ ÿ
2
=
segundos
mi ÿ
(1.54)
área_geográfica
centro-sur norte
R2 Lineal = 0.594
5.00
4.00
3.00
2.00
1.00
0.00
PIB_2000
Fuente: Elaboración propia a partir de los datos extraídos de la base de datos del ISTAT denominada
“Indicadores territoriales” que se puede descargar en la página web: http://sitis.istat.it/sitis/html/.
1.3 Endogeneidad
Los estimadores MCO poseen sus propiedades de optimalidad solo si se
satisface el supuesto expresado en la Ecuación (1.3), es decir, cuando E(e|X)
= 0. Esta condición también puede expresarse como E(eX) = 0 (dado que
E( X) es una constante) lo que indica que los regresores X no están
correlacionados con las perturbaciones, p. Esto sucede cuando los desórdenes
están predeterminados exógenamente o son innovaciones. Si no se cumple
la condición expresada en la ecuación (1.3), se dice que algunos o todos los
regresores son endógenos y, en general, los estimadores de MCO estarán
sesgados e inconsistentes. Las variables endógenas pueden estar presentes
en varios casos en econometría como el caso de errores en variables o el caso de simultan
Machine Translated by Google
norte
XH +=g n hh 1 11 norte ÿ
(1.55)
suponiendo que h es iid N(0, s2 h). Los estimadores OLS de los parámetros
del modelo se derivan como:
T1
g =
ˆˆ
MCO T =(HH
) HX ÿ (1.56)
y = Xˆb + e (1.57)
T T
) (1.58)
ˆ T
ˆˆ ˆ
ÿ
1
T T T=
ÿ
1
TT
b 2 SLS = XX Xy) XPPX XPy ( S.S ) H
ÿ
1
T T
= ( (XPX XPy)
H H (1.59)
ÿ
1
ÿ
1 ÿ
1
TT TT TT
= (XHHH (HX XHHH
) Hi ) ( )
HT e = 0 (1.60)
H T ( y – Xbˆ ) = 0 (1.61)
b milímetro
(1.62)
que coincide con (1.59). Dado que la Ecuación (1.60) puede verse como un conjunto
de condiciones de momentos, el estimador derivado de su solución también puede
verse como un estimador del Método de los Momentos.
Se puede demostrar que, en condiciones generales, el mínimo de dos etapas
El estimador de cuadrados se distribuye asintóticamente normalmente con
ˆ
(
mi segundo
) 2=b
SLS (1.63)
y
ˆ
Var ( b SLS TT 21
)=ÿ( HXH HH )Z1)
ÿ
(
ÿ
(1.64)
2 mi
La siguiente tabla muestra los datos originales sobre los cuales se estimó la
función de producción de Zellner-Revankar (1970) (discutida en el Ejemplo 1.2).
Con estos datos, sólo a modo de ejemplo y sin ánimo de contribuir
sustancialmente a la comprensión del fenómeno, estimamos el modelo de función
de producción donde la variable “Valor añadido” se expresa en función de la
variable “insumo de trabajo” utilizando únicamente la variable “número de
establecimientos” como instrumento. El instrumento es “relevante” en el sentido
de que la variable “número de establecimientos” tiene una correlación de 0.839001
con el regresor “trabajo”.
Machine Translated by Google
La estimación muestra un buen ajuste del modelo a los datos empíricos. Sin embargo,
existe fuerte evidencia de no normalidad y heteroscedasticidad en los residuales
(pruebas JB y BP) que sugieren que el modelo debe ser reevaluado.
Machine Translated by Google
x=c(x1,x2,…,xn)
y=c(y1,y2,…,yn)
z=c(z1,z2,…,zn)
o, alternativamente, podemos leer los datos de un archivo externo usando uno de los siguientes
comandos según el formato del archivo de datos de origen:
> dibujar(x,y)
>abline(modelo1)
En el caso de una regresión lineal múltiple, de manera similar, estimamos el modelo con el
comando:
El siguiente comando:
>resumen(modelo2)
Machine Translated by Google
>AIC(modelo2)
>BIC(modelo2)
>confin(modelo2)
Para cualquier otra referencia, los residuos se almacenan automáticamente con el nombre:
modelo2$residuales
Para obtener más diagnósticos sobre el modelo, necesitamos instalar los paquetes "lmtest" y
"tseries". Para hacerlo, escriba los comandos:
> instalar.paquetes("lmtest")
> install.packages("tseries")
Una vez instalados los dos paquetes, al inicio de cada sesión, debemos invocarlos a través de
los comandos:
En los paquetes “lmtest” y “tseries” encontramos varios modelos diagnósticos útiles como, por
ejemplo, la prueba de homocedasticidad de Breush-Pagan (que usa todos los regresores para
explicar la heterocedasticidad):
> bptest(modelo2)
>jarque.bera.test(modelo2$residuales)
Machine Translated by Google
• Coeficiente de determinación. R2
• R2 ajustado
• Criterio de información de Akaike (AIC)
• Criterio de información de Schwartz (o bayesiano) (BIC)
• Prueba de razón de verosimilitud
• Prueba de Wald
Preguntas
1. ¿Bajo qué condiciones los estimadores OLS son equivalentes a los estimadores ML? ¿Es
probable que se encuentren estas condiciones cuando se trata de regresiones sobre datos
espaciales? ¿Cuáles son las implicaciones de tal equivalencia? ¿Cuáles son las
implicaciones de la falta de esta equivalencia?
2. Supongamos que tenemos una variable y = consumo regional, y una variable x = ingreso
regional, ambas expresadas en miles de dólares y supongamos además el modelo de
regresión y = bx + e. ¿Cuáles son las consecuencias sobre el estimador MCO de b
(digamos bˆ) de expresar el ingreso
Machine Translated by Google
=ÿ T 2 T
d ee
t=2
[ t ] -t ÿ
1 ÿ t=1
et = 1,…, T. Tal prueba explota el natural
2
toneladas
Ejercicios
Escocia
Noreste (Inglaterra)
Irlanda del Norte
Noroeste (Inglaterra)
Yorkshire y el Humber
Irlanda
East Midlands (Inglaterra)
Londres
Sudeste (Inglaterra)
Sudoeste (Inglaterra)
Referencias al Capítulo
Barro, RJ y Sala-i-Martin, X. (1995) Crecimiento económico. Nueva York: McGrawHill.
Basmann, RL (1957) 'Un método clásico generalizado de estimación lineal de
Coeficientes en una ecuación estructural', Econometrica, 25, 1, 77–83.
Breusch, TS, Pagan, AR (1979) 'Una prueba simple para heterocedasticidad y
Variación del coeficiente aleatorio', Econometrica, 47, 5, 1287–94.
Greene, W. (2011) Análisis econométrico, 7.ª edición, Upper Saddle River, NJ: Pearson Education.
2
Algunas definiciones espaciales importantes
26
Machine Translated by Google
(un) (b)
Figura 2.1 Autocorrelación espacial y heterogeneidad espacial entre 64 unidades espaciales dispuestas en una
cuadrícula de celosía cuadrada regular de 8 por 8. Diferentes tonos de gris se refieren a diferentes valores de
las variables en estudio que van desde valores bajos (blanco) hasta valores altos (negro). (a) Autocorrelación
espacial. (b) Heterogeneidad espacial. Panel izquierdo: alta variabilidad. Panel derecho: baja variabilidad
(un) (b)
Figura 2.2 Criterios de contigüidad en una cuadrícula de celosía cuadrada regular. (a) El movimiento de la torre
y (b) El movimiento de la dama
Sin embargo, en econometría espacial, casi invariablemente, tenemos que tratar con unidades
administrativas espaciadas irregularmente, como regiones o países, por lo que se requieren
definiciones adicionales.
En el corazón de los métodos de econometría espacial se encuentra la definición de la llamada
matriz de pesos (o matriz de conectividad). La más simple de todas las definiciones es la siguiente:
ÿ
11 _ ... w ÿ
ÿ
norte 1 ÿ
... w
W = yo
(2.1)
nn
w
ÿ1
w
norte nn ÿ
ÿÿ 1 si j niÿ ( )
= ÿ
wij
_
ÿ (2.2)
ÿ
0 de lo contrario
ÿÿ
Siendo N(i ) el conjunto de vecinos de la ubicación j. Por definición tenemos que wii = 0.
Son posibles diferentes conceptos del conjunto vecino N(i ), que van desde el basado en la
mera adyacencia entre las dos unidades territoriales ilustradas en la Figura 2.2, hasta los basados
en una distancia máxima (es decir, j ÿN(i) si dij< dmax, siendo dij la distancia entre la ubicación i y
la ubicación j), a aquellos basados en el criterio del vecino más cercano. También se pueden
especificar matrices W más generales considerando las entradas wij como funciones (negativas)
de distancias geográficas, económicas o sociales entre áreas en lugar de simplemente
caracterizadas por entradas dicotómicas como en la Ecuación (2.2).
12 345678
1 2 3 1 01 111000
2 10 110000
4
3 11 011111
4 11 100000
567 5 10 100100
6 00 101011
7 00 100101
8 8 00 100110
(un) (b)
12345678 12345678
1 01000000 1 01010000
2 00010000 2 10110000
3 00010000 3 01010000
4 01000000 4 11100000
5 00000100 5 00000110
6 00000010 6 00001010
7 00000100 7 00001101
8 00000010 8 00000010
(C) (d)
Muy a menudo, las matrices W se estandarizan para sumar la unidad en cada fila.
En este caso tenemos:
w *
w* =
yo
yo
; * ÿ ij
wW (2.3)
ÿw
norte
j =1 yo
Esta estandarización puede ser muy útil en algunos casos. Por ejemplo, al usar los pesos
estandarizados, podemos definir el producto de la matriz,
Ly( W
)= y* (2.4)
norte norte
wyjnij ÿ jj ÿyo ( )
y
Ly( wy
)=i ÿ ÿ yo* j = = (2.5)
j=1 j=1 ÿ w yoN# ()
j=1 ij
con #N(i ) representando la cardinalidad del conjunto N(i ). El término en la Ecuación (2.5)
representa el promedio de la variable y observada en todas las localidades vecinas a la
localidad i (según el criterio elegido para definir W). Por lo tanto, asume el significado del
valor retrasado espacialmente de yi y, por esta razón, a menudo se indica con el símbolo
L(y) por analogía con el operador de retraso en el análisis de series de tiempo.
Machine Translated by Google
Como ejemplo, podemos derivar la matriz W para las 12 regiones del Reino Unido que se muestran en el Ejercicio 1.1. A continuación se muestra una versión basada en
la contigüidad.
1 2 34 5 6 7 8 9 10 11 12 FILAS
SUMA
Escocia N Irlanda Gales N de noroeste Yorksh y W Midlands E Midlands E Anglia SO Inglaterra SE Inglaterra G Londres
Inglaterra Inglaterra Humber
1 Escocia 0 0 01 0 0 00 0 0 00 1 0 00 1 0 11 0 0 0 0 0 0 0 0 1
2 N Irlanda 0 0 1 0 10 1 0 00 1 0 00 0 0 00 0 0 0 0 0 0 0 0 0 0
3 Gales 0 00 0 0 00 0 0 1 0 0 1 0 0 3
4 N de Inglaterra 0 1 0 0 0 0 0 0 2
5 noroeste de Inglaterra 0 1 1 1 0 0 0 0 5
6 Yorksh y Humber 0 0 1 0 0 1 0 0 0 0 3
7 Oeste de las Tierras Medias 0 0 0 1 0 1 1 0 5
8 Este de las Tierras Medias 0 1 1 0 1 0 1 0 5
9 E Anglia 0 0 0 1 0 0 1 0 2
10 SO Inglaterra 0 0 1 0 0 0 1 0 2
11 SE Inglaterra 0 0 1 1 1 1 0 1 5
12 G Londres 0 0 0 0 0 0 1 0 1
Machine Translated by Google
Tenga en cuenta que una isla (a saber, Irlanda del Norte) no tiene vecinos. La última columna muestra el número de vecinos de cada región. La versión
estandarizada por filas de la matriz W se muestra a continuación. Observe que la suma de las filas ahora es igual a 1.
1 23 4 5 6 7 8 9 10 11 12 FILAS
SUMA
Escocia N Irlanda Gales N de noroeste Yorksh y W Midlands E Midlands E Anglia SO Inglaterra SE GRAMO
El hecho de que Irlanda del Norte no tenga vecinos constituye un problema si queremos
calcular una variable espacialmente retrasada porque, en este caso, el valor de la variable
“espacialmente retrasada” para Irlanda del Norte siempre sería cero. Para abordar este
problema, convencionalmente podemos considerar a la región más cercana (Escocia) como
vecina de Irlanda del Norte, incluso si, estrictamente hablando, las dos regiones no
comparten un límite común. Habiendo hecho esta corrección a la matriz W estandarizada
por filas , se convierte en:
00 0 00 000
0 0 0 0 0,33 0 0,33 0 0 0,33 0 0
0 0 0 0 0,5 0,5 0 00 000
0 0 0.2 0.2 0 0.2 0.2 0.2 0 000
0 0 0 0,33 0,33 0 0 0.33 0 000
W =
0 0 0.2 0 0.2 0 0 0,2 0 0,2 0,2 0
0 0 0 0 0,2 0,2 0,2 0 0,2 0 0,2 0
0000 00 0 0.5 0 0 0.5 0
0000 0 0 0.5 0 0 0 0.5 0
0000 0 0 0.2 0.2 0. 2 0,2 0 0,2
00 0 0 ÿ 00 0 00 0 10 ÿ
y W*y
81,5 91,55
96,9 81,50
82,9 105,83
86,2 86,65
88,6 86,42
84,7 87,96
89,2 101,72
89,1 93,52
96,8 98,70
139,7 98,75
108,3 100,92
89,8 108,3
Machine Translated by Google
La prueba más utilizada para la autocorrelación espacial entre los residuos de regresión de
OLS se basa en una medida general de correlación espacial introducida por Moran (1950) y
propuesta por Cliff y Ord (1972) como una estadística de prueba para la ausencia de
correlación entre residuos de regresión.
Nótese que esta estadística se introdujo en la literatura simultáneamente
análogamente a la medida análoga para los residuos de regresión de series de tiempo: las
célebres estadísticas de Durbin-Watson (Durbin y Watson, 1950) incluso si, como ya se
mencionó, su extensión para tratar con los residuos de regresión se publicó solo más tarde
(Cliff y Ord, 1972). De hecho, la estadística de Durbin-Watson se puede definir como un caso
especial de las estadísticas de Moran simplemente definiendo una matriz W apropiada (ver,
por ejemplo, Arbia, 2006). En esencia, el estadístico de Moran toma la forma de una
correlación entre los residuos de la regresión y sus valores retrasados espacialmente, es
decir:
tenemos
T
Cov LW
(, ) ee ee=
Corre(L
ee
, )= (2.8)
Var ( mi) eeT
Var ()miÿ Var L( ) e (ver Arbia, 1989). Uno de los efectos de esta desigualdad es que la
medida introducida en la Ecuación (2.8) no está limitada por 1 en )
Var L( e
valor absoluto, pero posee límites más estrechos dados por
yo ÿ .
Var ( mi
)
Sin embargo, en parte por razones históricas, y más sustancialmente por la equivalencia que
se puede demostrar con una prueba del Multiplicador de Lagrange (ver sección 3.7), esta es la
definición que prevalece actualmente en la literatura y la que se implementa en las rutinas del
software (alternativas son discutido en Whittle, 1954, en Cliff y Ord, 1972 y más recientemente
en Li et al., 2007). En su definición original, el estadístico I de Moran considera el estimador
sesgado de la varianza en el denominador de la Expresión (2.8) y un factor normalizador para
el numerador igual a la suma de los pesos. Como consecuencia, la contrapartida empírica de
(2.8) se puede expresar como:
T
ne Nosotros
yo =
(2.9)
ÿ ÿi
ÿ
camiseta ÿ_ ÿwÿ
ijj
ÿ ÿ
T
Ewe
yo = (2.10)
T
ee
Cliff y Ord (1972) derivaron la distribución muestral del estadístico I bajo dos hipótesis diferentes:
(i) aleatorización y (ii) normalidad de los residuos. En el primer caso la distribución muestral se
obtiene considerando todas las posibles permutaciones de los datos observados en el sistema
de fronteras y calculando el estadístico Moran I en cada una de ellas. También probaron que la
distribución asintótica es normal con un valor esperado que no depende de la hipótesis particular
elegida y que siempre se expresa por:
IE( Wx ( ) n tr M
)= (2.11)
( Snk
0 ÿ )
Machine Translated by Google
con S0 = w ÿ ÿ Por el
, MI PX XX
IP= ÿ y su varianza
contrario, =(sij )ijXX T 1 T.
depende de la hipótesis de
ÿ
i seleccionada.
los residuos,
X EnXse
particular,
puede expresar asumimos
como:
la normalidad
2 2
ÿ
ÿ ]
ÿ
( xxWx tr MWT tr
n tr2 M WM ) +MW
( )+ ( [
Var (I )= X
IE( ) 2
)ÿ
ÿÿ
ÿ
ÿ
(2.12)
ÿÿÿ
S0ÿÿ
(nknkÿ
)( +
ÿ
2 )
norte Sur
norte Sur
R2 Lineal = 0.469
14.00
12.00
10.00
8.00
6.00
4.00
2.00
.0 .5 1.0 1.5 2.0 2.5
variación del PIB real
Fuente: Elaboración propia a partir de los datos extraídos de la base de datos del ISTAT denominada
“Indicadores territoriales” que se puede descargar en la página web: http://sitis.istat.it/sitis/html/.
Prueba I de Moran
La curva de Phillips (Phillips, 1958) es una relación inversa entre la tasa de desempleo
y la tasa de inflación. Afirma que un menor desempleo está asociado con una mayor
tasa de inflación. Si bien originalmente se propuso para explicar el comportamiento
histórico de las dos variables, también se consideró para explicar sus variaciones
espaciales (Anselin, 1988). La siguiente tabla muestra los datos necesarios para
probar el modelo Phillips en las 20 regiones italianas.
(continuado)
Machine Translated by Google
Continuado
región
norte Sur
R2 Lineal = 0.519
14.00
12.00
10.00
8.00
6.00
4.00
2.00
1.4 1.6 1.8 2.0 2.2 2.4
variación en el índice de precios
Fuente: Elaboración propia a partir de los datos extraídos de la base de datos del ISTAT denominada “Indicadores
territoriales” que se puede descargar en la página web: http://sitis.istat.it/sitis/html/.
(círculos oscuros, correspondientes a residuos positivos) y menor en las regiones del norte
de Italia (círculos oscuros, correspondientes a residuos negativos), lo que posiblemente
podría ser una indicación de autocorrelación espacial residual.
El resultado de la estimación del modelo con el MCO se muestra a continuación:
Prueba I de Moran
En este caso, aunque se detecta una correlación espacial positiva, esta no es significativa
al 5% de confianza.
2.3 Códigos R
>instalar.paquetes(”spdep”)
por primera vez y luego al comienzo de cada nueva sesión, vuelva a llamarlo escribiendo:
>biblioteca(spdep)
donde el tipo se puede especificar como "torre" o "reina" según la tipología de vecindad
elegida.
El comando indica que queremos cambiar nuestros datos de una celda
sistema (celda) a (2) una lista de vecinos (nb).
El objeto Wnb es solo una lista de vecinos. Si tecleamos Wnb obtenemos un resumen
de la información que contiene (el número de regiones, el número de enlaces de
proximidad, el número medio de enlaces y el número y el porcentaje de enlaces distintos
de cero). Una vez creado este objeto, tenemos que transformarlo en una matriz real,
digamos W, a través del comando:
> W<-nb2listaw(Wnb)
El comando indica que queremos cambiar nuestros datos de una lista de vecinos (nb) a
(2) una matriz de peso (listw). Para visualizar los vecinos reales, escriba:
> W$pesos
Una vez que se crea la matriz de peso W , la variable retrasada espacialmente de una
variable X (por ejemplo, WX) se puede obtener fácilmente a través del comando
> WX<-lag.listw(W,X)
4
6
2 3 5
1
8
7
9 11
10
13
12
14
dieciséis
15
17
20
18
19
1. un archivo externo que contiene la lista de vecinos de cada región. Este archivo
debe guardarse como un archivo de texto y nombrarse con la extensión .GAL.
2. una variable interna que contiene solo el identificador de la región (p. ej., 1,
2, …, 20)
Para las 20 regiones italianas que se muestran en la Figura 2.3 anterior, el primero
de los dos archivos tendrá el siguiente formato:
Primera linea
Segunda linea
Archivo: Italia.GAL
0 20 italia ita_regions
11
22
41
3783
4245
8423
5
54
3468
6157
3289
8523
5799
5 7 8 10
11 12 10
5 8 9 11
12 13 11 4 9
10 12 13 12 6
9 10 11 13 14
15 13 3 10 12
14 14 4 12 13
15 16 15 4 12
14 16 17 16 3 14 15
17 17 3 15 16 18
18 2 17 19 19 2 18
20 20 1 19
regiones_ita<-c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,
15,16,17,18,19,20)
o leer desde un archivo externo. Una vez que hemos creado estos dos objetos, se pueden
leer en R a través del comando:
nbitaly<-read.gal("Italia.GAL", region.id=ita_regions)
Tenga en cuenta que la ruta completa del archivo .GAL debe especificarse
completamente para que el procedimiento pueda identificarlo unívocamente.
El objeto nbitalmente así obtenido tiene que ser transformado en un
matriz W real a través del comando (ver sección 2.3.1)
> witaly<-nb2listw(nbitaly)
matriz de la lista de vecinos usando el mismo procedimiento ilustrado en las secciones 2.3.1
y 2.3.2. Estos pasos se describen a continuación.
Paso 1: para importar los archivos de forma (por ejemplo, el archivo de forma, Italia, que
consta de los tres archivos Italia.shp, Italia.shx e Italia.dbf), usamos el comando:
>nombres(Italia)
>parcela(Italia)
>coords<-coordenadas(Italia)
>contnb<-poly2nb(Italia,reina=T)
El criterio de la reina especificado (ver sección 2.1) asegura que dos regiones se consideren
vecinas si tienen un límite común. Él
Machine Translated by Google
El comando indica que queremos cambiar nuestros datos de una lista de polígonos (poly)
a (2) una lista de vecinos (nb).
Sin embargo, este comando no tolera la presencia de áreas aisladas (como, por ejemplo,
el caso del mapa que se muestra en la Figura 2.3) sin ningún vecino. Podemos forzar al
comando a incluir estas áreas agregando la opción
>contnb<-poly2nb(Italia,queen=T,zero.policy=TRUE)
pero en este caso se generará una matriz W con una o más áreas con todo cero en la
línea correspondiente. El problema puede eliminarse generando una lista de vecinos
basada en la distancia de umbral mínima usando el comando:
2.3.4 Cálculo del I de Moran para los residuos de una regresión OLS
Para calcular la prueba de Moran I sobre los residuos de un modelo previamente estimado
(por ejemplo, modelo1), use el comando
> lm.morantest(modelo1, W)
que utiliza una matriz W contenida en el objeto W, obtenida, por ejemplo, mediante los
procedimientos descritos en los apartados 2.3.1 a 2.3.3. Por defecto
Machine Translated by Google
El paquete spdep contiene algunos conjuntos de datos que son muy útiles para la práctica
adicional. Estos conjuntos de datos se considerarán en el resto de este libro para ejemplos y
ejercicios prácticos. En particular, consideraremos cuatro bases de datos llamadas “baltimore”,
“boston”, “columbus” y “used.cars”.
>datos(autos.usados)
>ls()
Como resultado de este comando, verá los dos objetos: (i) used.cars que contiene los datos
reales y (ii) usa48_1960 que contiene la información del mapa en forma de lista de vecinos.
Para visualizar el contenido del archivo de datos escriba el comando:
>str(autos.usados)
lo que muestra que en la base de datos ahora tenemos dos variables llamadas
cargos.de.impuestos.de.autos.usados.y.precio.de.autos.usados$1960. Tenga en cuenta que
el prefijo used.cars$ siempre es necesario cuando tiene más de un conjunto de datos abierto
en la sesión activa.
El objeto usa48_nb es una lista de vecinos a partir de la cual podemos generar
comió la matriz W a través del comando:
W<-nb2listw(usa48.nb)
Se pueden seguir procedimientos análogos para descargar los otros conjuntos de datos.
(baltimore, boston y columbus) mencionado anteriormente.
• Autocorrelación espacial
• Vecindario
• Criterios de vecindad: definición de caso de torre y caso de dama
• Criterio de vecindad: criterio de distancia máxima
• Criterios de vecindad: criterio del vecino más cercano
• Matriz de peso (o conectividad)
• Matriz de peso estandarizada
• Retraso espacial
• Prueba I de Moran de autocorrelación espacial entre residuos de regresión
• Momentos de la prueba I de Moran bajo aleatorización y bajo el
hipótesis de normalidad
Preguntas
Estadísticas T=d ee T
ÿ t=2
[ t
]2 ÿ tÿ 1
ÿ
1
2
y tt
=
t=1,…,T. Reescribe las estadísticas en
notación matricial, haciendo uso de una matriz W adecuada que describa correctamente
la proximidad entre unidades temporales.
Ejercicios
RO21
RO11
RO12
RO22
RO42
RO32
RO31
RO41
Ejercicio 2.2 Dada la matriz de pesos derivada del Ejercicio 2.1 y los datos que se
muestran en la siguiente tabla, calcule la variable espacialmente rezagada de las
tasas de mortalidad infantil.
Fuente: http:// epp.eurostat.ec.europa.eu/ portal/ page/ portal/ region_cities/ regional_statistics/ data/ database.
Machine Translated by Google
Ejercicio 2.3 (a) Utilizando el procedimiento ilustrado en la sección 2.3.1, genere una
matriz de pesos (basada en el caso de la torre) para la siguiente cuadrícula de celosía
cuadrada regular de dimensión 5 por 5 (n = 25).
12345
6 7 8 910
11 12 14 16 17 19 22 24 13 15
18 20
21 23 25
(b) Dados los datos dispuestos en la cuadrícula generada anteriormente, ahora calcule
la variable L(X) retrasada espacialmente de la siguiente variable X.
27 16 –1 23 19
36 21 32 33 26
28 25 3 23 35
14 12 16 14 12
4 15 29 31 –1
Ejercicio 2.4 Dadas las 12 regiones del Reino Unido reportadas en el Ejercicio 1.1,
utilizando el procedimiento ilustrado en la sección 2.3, cree el archivo *.GAL y obtenga
la matriz de peso. Considere que Irlanda del Norte es adyacente a Escocia y Gales.
Ejercicio 2.5 Dados los datos mostrados en el Ejercicio 1.1 y utilizando los resultados
del Ejercicio 2.4, calcule los valores retrasados espacialmente de la variable GVA (Valor
Agregado Bruto) para las 12 regiones del Reino Unido.
Ejercicio 2.6 A partir de los resultados obtenidos en el Ejercicio 2.5, dibuje un diagrama
de dispersión con la variable VAB en el eje horizontal y la variable rezagada L(VAB) en
el eje vertical. Este gráfico representa la herramienta exploratoria denominada “diagrama
de dispersión de Moran” en la literatura (Anselin, 1995). ¿Qué tipo de conocimiento
puedes obtener de él?
Ejercicio 2.7 Dados los resultados del Ejercicio 2.4, vuelva a estimar el modelo 1 del
Ejercicio 1.1 [VAB = f(productividad laboral; tasa de creación de empresas)] y pruebe la
presencia de autocorrelación espacial entre los residuos. ¿Podemos aceptar la hipótesis
de la descorrelación espacial de los residuos?
Referencias al Capítulo
Anselin, L. (1988) Econometría espacial: métodos y modelos, Dordrecht: Kluwer
Editores Académicos.
Anselin, L. (1995) 'Indicadores locales de asociación espacial', Análisis geográfico,
27, 93–115.
Arbia, G. (1989) Configuración de datos espaciales en el análisis estadístico de la economía
regional y problemas relacionados, Dordrecht: Kluwer Academic Press.
Arbia, G. (2006) Econometría Espacial: Fundamentos Estadísticos y Aplicaciones a la
Crecimiento económico regional, Heidelberg: Springer-Verlag.
Burridge, P. (1980) 'Sobre la prueba de Cliff-Ord para la correlación espacial', Journal of the
Royal Statistical Society, B, 42, 107–8.
Burrough PA, Mcdonnell, RA y Lloyd, CD (2014) Principios de los sistemas de información
geográfica, 3.ª edición, Oxford: Oxford University Press.
Cliff, AD y Ord JK (1972) Autocorrelación espacial, Londres: Pion.
Durbin, J. y Watson, GS (1950) 'Pruebas de correlación serial en la regresión de mínimos
cuadrados', I, Biometrika 37, 409–28.
Kelejian, HH y Prucha, I. (2001) 'Sobre la distribución asintótica de la estadística de prueba
de Moran I con aplicaciones', Journal of Econometrics, 104, 219–57.
Li, H., Calder, CA y Cressie, N. (2007) 'Más allá de I de Moran: pruebas de dependencia
espacial basadas en el modelo autorregresivo espacial', Análisis geográfico, 39, 4, 357–75.
3
Modelos de regresión lineal espacial
3.1 Generalidades
(1)=(2)
lb por+Wy X WX
+ u + yo 1< (3.1)
= Zu1
y Wy + lb
+ l< (3.3)
51
Machine Translated by Google
(IW
) = yl bb
ÿ
X WX u +
(1) (2)
+
1ÿ + (3.4)
=( WX
y IWX
ÿ
tuÿ+) lbb
ÿ ÿ(1) (2) ÿ
1 uIWÿ=(
r )ÿ mi
(3.5)
cuando ÿ = 0 o
+<
y Wy = 1 r er (3.7)
(I –rW)y = e
por lo tanto
y = (I – rW)–1 e
E(y) = 0 (3.8)
)= T( ) ( IWIW
E (yy
2
sr r ÿÿ ÿ 1 12 T
)=
ÿ ÿ
mi
se
_ (3.9)
1 ÿ1ÿ
2
L ( , )= rs T 1
ÿ
2 ÿ
ÿ
norte
ÿ
1
L ( r, )= 22 1 constante(ÿÿ e ) 2 ( IWIW
)( r
ÿ
ÿ
r ) T
ÿ
2
mi
ÿ ÿ (3.11)
ÿ
1 1
ÿ
ÿ ÿÿ ÿ ) ( )TyI WIWÿyr
ÿ
" ÿ experiencia ÿ ÿ
ÿ
1 ÿ
T ÿ
2ÿ 2 (ÿ ÿ
ÿÿ
mi
Machine Translated by Google
22 1 norte ÿ ÿ
T
l ( , )ÿ=e r constante ÿ ÿÿ ÿ
en( ÿ) 2
mi 1 en (IW
) (IW
)r2 r
1 ÿ
1 (3.12)
ÿ ÿÿ ÿ ) ( T) yI WIW 1 T
rr y
ÿ ÿ
2
2ÿ mi
(ÿ ÿ
La tabla muestra la prueba t habitual para el término de intersección y una prueba de razón
de verosimilitud para el parámetro espacial l. Los resultados muestran que solo el término
constante es significativamente diferente de cero y por lo tanto no existe una transmisión
geográfica significativa de las variaciones de precios a nivel regional.
Machine Translated by Google
y = Zb + tu (3.13)
1 u Wu = + r er < (3.14)
con los regresores Z y los pesos W no estocásticos. Este modelo se conoce en la literatura como
el modelo de error espacial (SEM) (Anselin,
mi
como en la Ecuación (3.5) para que podamos escribir:
UE
( )=0
Euu T
ÿÿ
2
IWIW ÿ
ÿ
1 12 T ÿ
= ÿÿ ÿ (3.15)
( )= ( ) ( ÿ )
ÿ ÿ
(I – rW)u = e
( Yo
) = Wy
( ) +(
Yor rb
WZr Yo Wu )
ÿÿ ÿ
= r Z WZ + b
y Wy
ÿ
rb e +
= Z WZ +
y Wy b ge ÿ r + (3.16)
Machine Translated by Google
( IW
b yge
ÿ
Z WZ) r
= ÿ
y entonces
1 1
=(
ÿ ÿ
ÿ ÿÿ r )( IWZ WZ )(+IW
g re ) por
(3.17)
T 1
= EWIWZ
ÿ
ÿ
() ÿ
E Wy mi ÿ
ÿ
ÿ
(WZ
ÿ
ÿ
r bg ) ) ( ÿ
1
+WI W ÿ T=
ÿ
( ÿ
r ee ) ÿ
1 T (3.18)
= WIWZ
ÿ
( WZE
r )( ÿ ÿ
( mayor ) )
ÿ
1 T
+ rCON
()
NOSOTROS ÿ ee ÿ =
ÿ
ÿ ÿ
1
= se _2 WI WI
ÿ
( ÿ
r ) ÿ 0
u = y – Zb (3.19)
1 ÿ
ÿ
ÿ
ÿ
22 1 2 uuconstante
2 T
ÿ
, ÿ, mi) = ÿ
mi ÿ
ÿÿ
2ÿ mi ÿ
ÿ
ÿ ÿ
1 ÿ
1 ÿ
2 2
ÿ
T 1
L ( rb
, ,ÿ )= constante ÿ ÿ 2 experiencia ÿ ÿÿ
ÿ
( ) segundo
yZ segundo
( ÿ ÿÿ yZ(3.21)
ÿ
)ÿÿ
mi mi
2ÿ 2 ÿ
mi
norte 1
L (rb (IWIW
ÿ ÿ
22 1 ÿ mi
)( )r T
, , )= constante ÿ mi ) 2 r 2
ÿ ÿ
ÿ ÿ
( ÿÿÿ
) ÿ
T
ÿÿ
norte
l (rb, ÿ,ÿ2)ee21
constante
= ÿ ÿÿ ÿ
en( ) 1 en IW IW
)r )(
ÿ
r
ÿ
T
2 (2
(3.23)
1 yZ
ÿ ( IWIW
( ( br)TryZ 1
b
ÿ
ÿÿ ÿ
) ÿ
1 ÿ
) ÿ
T ÿ
( ÿ
)
ÿ2 ÿ
y *Z=ser*T +
Machine Translated by Google
*
y ( rr)= y Wy
ÿ
Z * ( rr)= Z WZ ÿ
para cada valor del parámetro ÿ en una búsqueda numérica. Si n es muy grande, esta
operación puede ser exigente. Una salida, sugerida en la literatura, consiste en explotar la
llamada descomposición de Ord (Ord, 1975):
norte
en IW r ÿ ÿ = ln ÿ
ÿr (1
ÿÿ
ÿ ÿ
i ÿÿ)
(3.24)
i =1 ÿÿ
yZ=tu+ b (3.13)
Machine Translated by Google
u Wu = 1 + r er < (3.14)
ˆ ˆ
( Yo
) = Wy
(r Yo WZ ser ) + r
ÿ ÿ
1
= ZZZy
(b T
)
T
(3.25)
ˆ !
uyZ = ÿ b (3.26)
4
(i) mi( ) mi < ÿ.
1
(ii) ambas matrices W y ( ) Yo Wr ÿ ÿ
.
Machine Translated by Google
T T ÿ
1
Q ZZ = límite
1 nÿÿ ÿy ZZ= límite
Q norte ÿÿ 2 ÿ .
=
yZ tu ii yo + segundo
norte
=
tu iwu r ij j mi ÿ + i (3.27)
i =1
Definamos ahora
norte norte
norte
= = =
tui wu ÿ ; yo j u i wu ÿy yo j
yo
_ mi ÿw yo j (3.28)
i =1 i =1 i =1
norte
tu
ÿ
=
uui wu iji j = i
yo ÿ rr mi ÿ (3.29)
i =1
tuyo
ÿ iire = tu (3.30)
1 2 1
- r ii ii ) =
ÿ ( uu ee 22
ÿ = mi ( )
(3.31)
norte
yo = 1
norte
i =1
1
norte
2 1
norte
2)
( ÿ 2 uu = ii yo ) ( ÿ ÿ r een
= mi i (3.32)
norte
yo = 1 =1
yo
1 norte
( ÿ - tutuuu
i mi r ii i )( ÿ
r )= (ee ii ) (3.33)
norte
i =1
Machine Translated by Google
T
Segunda Guerra
2
mi ( yo)_ 2 = s ;mi ; MI( e ei yo )
mi ( yo _ ) 2 = ÿe
Mundial
=0 (3.34)
norte
como lo demuestran Kelejian y Prucha (1998). Además, sustituyendo en las Ecuaciones (3.31), (3.32) y
(3.33) la contraparte empírica de u, digamos uˆ (que se derivó en la Ecuación (3.26)) las tres condiciones
de momento, obtenidas al igualar los momentos teóricos con sus contrapartes empíricas, volverse:
ÿÿ
1
norte
ˆ ˆ 2
(ÿ 2
r tui ) =
ÿ
ÿ
ÿ
ÿ
tu
ÿ
yo mi
i =1
ÿ norte
ÿ
ÿ
norte
ˆ ˆ 2 T
1
ÿ
Segunda Guerra
( ) =
ÿÿ
Mundial
ÿ tu
yo
ÿ
r tu
yo
ÿ
mi
tr (3.35)
ÿ
i =1
norte norte
ÿ
norte ˆ
ÿ
ÿ 1 ˆ ˆˆ
ÿ
( ÿ tuyotu iituryo ÿ
)( ÿ
r )=0
ÿ
i =1
norte
ÿÿ
nn ˆ
1 12 22 2 tu + urr ˆ ˆ
ÿ ÿÿ ÿ ii n nn 1 uuyo =ÿ 2
mi
=1ii
yo = =1
ˆ ˆ ˆ
r Tˆ 22 2
11 2nnn WW 2
ÿ ÿÿ ÿ tu + yo tu uu ii = ÿe tr (3.36)
nnnyo=1ii =1
yo
=1 norte
norte
2 nn ˆ ˆ
1 ˆ ˆˆ ˆ
1 1 ˆ ÿÿ
ÿ ÿtu ÿÿ
+ ii uu ii ÿ ÿÿÿr tu + yo
2 uuyo =0
ÿ ÿ n nn ÿ ÿ ÿÿ
norte
yo = 1 =1ii
yo ÿ =1 =1 ÿ
o:
nnn ˆ
2 12 1r tu yo2 ˆ ˆ ˆ2
r ÿÿ ÿ ÿ ÿÿ ÿe uu ii 2 = tui
nn=1
=1yo=1
yo
ˆ ˆ ˆ WWTuu ˆ
norte norte norte
1 2 1
minuto
2
ÿÿ ÿ ÿÿ ÿ 2
tu yo
r yo tr yo i norte
ÿe
2 = tui
2
(3.37)
yo = 1
nn =1 i =1
n n nˆ ˆ ÿ ÿ ˆ 11 1ˆ ÿ ÿ ÿ ÿ ÿ ÿ ÿÿˆ ÿ ÿ ˆ ˆ
2r _
ÿ ÿÿ
uuii ÿ ÿ
r
2
tu + yo uu ii = ÿ
uuyo
n nnyo=1
nii yo =1 =1 =1
ÿ
Machine Translated by Google
Las tres ecuaciones reportadas en (3.37) se pueden escribir de manera más compacta
en notación matricial como:
AA2 1j - = 0
(3.38)
habiendo definido:
ÿ ˆ2
tu ÿ ˆˆ
uu ii ÿ
ÿ1ÿ
norte
yo ÿ 2 ÿ
1 ÿ
norte
ˆ ˆˆ
= () 12ÿ1 ÿ
2 T
uu ii
UN1
tu yo
ÿ ÿ
tr WW nn (3.39)
n
ÿ ˆˆ
ÿÿ
uu ii ( ˆ2 ˆ ˆii )
uu
1 ÿ 1 tu
yo
+ 0
norte ÿ norte
ÿ
T ÿ
ˆ
111 ˆ 2 2 u uu yo ii yo nn ˆˆ ÿ
UN2 = ÿ ÿÿ
; tu
ÿÿÿ (3.40)
ÿ ÿ
ÿ ÿ
ÿ ÿ=2 j
rr T ÿ ,, e
2 ÿÿ
(3.41)
1 22
= ( sí _,, )
ÿ
=
ˆ ˆˆ
12
j Automóvil club británico
(3.42)
Paso 4: Utilizar el estimador rˆ, así obtenido, para estimar los elementos de la
matriz de correlación ÿ reportada en la Ecuación (3.15) como:
ˆ 1 1
ˆ
ÿ
ÿ
ÿÿ ÿ=
) (
) ( ˆ T IW IW rr (3.43)
T 1 T 1
= (Z ZZ y ÿ ÿ)
ÿ ÿ
FGLS
b (3.44)
Como ejemplo del modelo de error espacial, consideremos el conjunto de datos relacionado
con el precio de los automóviles usados por estado en 1960 y los impuestos y gastos de
envío de automóviles nuevos por estado en el período 1955–59. Este conjunto de datos
es muy popular en la econometría espacial y se puede descargar fácilmente en el entorno
R utilizando el procedimiento ilustrado en la sección 2.3.5.
El mapa de los 48 estados considerados se muestra en la siguiente figura (se
descartaron Alaska y Hawái por estar aislados del resto. También se descartó el Distrito
de Columbia por sus excepcionales características).
1
38 45 2
46 3
37 sesenta y cinco
47 7 8 10
9 4 1112
17 14 16 15
30 13
28 18 36
32 29 39
40 35 34
41
43 42
49 22
48 23 20
21 24 19
25 26
27
44
Machine Translated by Google
norte. estados precio de impuestos nm. estados precio de impuestos nm. estados precio de impuestos
Prueba I de Moran
La prueba muestra que existe evidencia de una correlación espacial residual positiva
altamente significativa. Con todo, el modelo no es satisfactorio y, dada la evidencia de una
correlación espacial residual positiva y significativa, tenemos indicaciones claras de un
modelo de error espacial como marco alternativo. En primer lugar, estimemos el modelo
usando la técnica de máxima verosimilitud (ver sección 3.4.2). Los resultados se muestran
a continuación:
Las pruebas ahora muestran que el coeficiente de regresión relacionado con la variable
impuesto no es significativo, mientras que el parámetro r es altamente significativo evaluado
a través de la prueba de razón de verosimilitud (ver Ecuación (1.31)) y a través de la prueba
de Wald (ver Ecuación (1.33)). Entonces, la dependencia espacial entre los residuales
explica la mayor parte de la variabilidad del modelo y el modelo se reduce a una
autorregresión pura (caso de b = 0 y r o l también igual a 0. Consulte la Sección 3.2) donde
el precio en un país se explica simplemente por el precio en los países vecinos.
Para finalizar, estimemos el mismo modelo de Error Espacial usando ahora los
estimadores de Mínimos Cuadrados Generalizados Factibles discutidos en la sección 3.4.3.
Los resultados se muestran en la siguiente tabla:
3.5.1 Generalidades
= Z u 1+lb
y Wy +l < (3.45)
ÿ ..
con u X iidN . (0, 2 sun nyo ) . Este modelo se conoce en la literatura como
el modelo de retraso espacial (SLM) (Anselin, 1988; Arbia, 2006).
En este caso, surge un problema de endogeneidad en el sentido de que el valor
retrasado espacialmente de y está correlacionado con la perturbación estocástica.
De hecho, usando el mismo argumento presentado en la Ecuación (3.18), tenemos que
1 1
=(
ÿ ÿ
- yo Z upara +
(I Wy ) = +que
y b el y I WZ
) ( l bl
I Wu ÿ ÿ
T
ÿ
1 ÿ
1 T
E ÿ(Wy
ÿ ÿÿ
ÿ = ÿ uu (
u )EWIWZIW
ÿ
ÿ
ÿ
) ( l bl+ ÿ )
1 1
= WIWZE ( )T T
ÿ ÿ
( (ulb
WIWE
)l uu
ÿ
+ ÿ
) ÿ
ÿ
ÿ
ÿ
1
= 2 WI
ÿ
se
_ (WI ÿ
yo
) ÿ 0
Z ÿulibras
En primer lugar, observe que al reescribir la Ecuación (3.45) como ( )= + I Wy
tenemos:
1 ÿ
1
=( ÿ
) +(I lWu
y I WZ bl ÿ ÿ
)
Machine Translated by Google
1 11
ÿ ÿ ÿÿ ÿ ( ) ( ) (
Ey EIWZIW u = += l bl l ÿ ÿ ÿÿ ÿ ) (IWZ b ) (3.46)
T 2 1 T
( ) = IWIW( sl l ÿÿ ÿ ) (
ÿ
)
ÿ
E yy mi
= segundos
2
mi (3.47)
1
2
ÿ
1 1 T
2 2 ÿ ÿ ( l ) y IWZ
ÿ
L ( , lb ) =constante
ÿ y;, ÿ mi ÿ ÿÿ ÿ experiencia ÿ
ÿ ÿÿ
2 b
ÿ ÿÿ
2ÿ mi
ÿÿ
(3.48)
" ÿ ÿÿ ÿ yI
ÿ (WZ
l)
ÿ
1
ÿÿ
ÿ
1
b }
2 21 1
T ÿ ÿ ( ÿÿ ÿ ÿ l ) y IWZ
ÿ
l (ÿ ÿ,milb ;, ) =constante
y ÿ
1 en
2 b
2 2ÿ ÿÿ
(3.49)
mi
1 ÿ
1
" ÿ ÿÿ ÿ yI
ÿ (WZ
l) b
ÿÿ
1
)( s e T
)( 1 T
ÿÿ ÿÿ
ÿÿ - = ( IW IW IW IW ) = ( )
2 2 2 norte
mi
s sl lmi ÿ
yo
ÿ
yo
1 T T
)
ÿ ÿ
(
y, puesto que ( IW IW l )
ÿ
)
ÿ
( ÿ
yo 1 = (IW
) IW l
ÿ ÿ
yo
, puede ser
2
ÿ
2
2
=
ssmilÿn IW mi
( ÿ
) (3.50)
Machine Translated by Google
1 en ( ÿ 2 IW
ÿ
yo ( ÿ
2
, libras
, y; )constante
=
ÿ
mi
norte
ÿ
yo )2
2
1 ÿ ÿ ( ) lbl l T ÿ
1
( IWIW) 1 1( T
yI WZ ÿ ÿ
ÿ ÿÿ
ÿ ÿÿ ÿ ÿ
2ÿ 2 mi
ÿÿ ÿ ÿ
1 b
"ÿ
yI WZ
ÿ ÿ ( yo ) ÿ
ÿÿ
= constante
norte
1 yI
ÿ ÿWZ
ÿÿ ÿ ÿ ( ) l libra T
ÿ
ln +
ÿ miln
2
IW
ÿ
1
ÿ2 2ÿ 2 mi
ÿ
(3.51)
T
IWI Wy IWZ
ÿ
ÿ ÿÿ ÿÿ("l)()()
l libra
ÿ
1
ÿÿ
y, dado que l ÿ) ÿÿ
(Yo WyÿIWZ
ÿ ( )(ÿ) l libra ÿ ÿ1= I Wy Z b, eventualmente
ÿ ÿ
obtenemos:
2
2 norte
ln +
; ), =, s lb y
l (constante ÿ
s ln l IW ÿ
2
mi
1 T
(3.52)
[() I Wy ZI Wy Z ] [ ]( ) l bl b
ÿ ÿÿ ÿÿ
2
2s mi
ÿ ÿ uÿÿIWZ
Ey EIWZIW ÿ ( )b(1ÿ)11ÿ( (ÿÿ
) =ÿ += l bl) l
(3.53)
Machine Translated by Google
1
(IW IW
ÿ
)
l ll lWW
=++ 22 33 + ...
Por lo tanto
22 33
() = ÿ ll lb + ...ÿÿ
Oye IWWWZ
+ÿ+ 22
= Z bWZ (3.54)
+ WZ libras + libras +...
por lo que E(y) puede expresarse como una función lineal de Z,WZ,W2Z,….
Esto sugiere el uso de los primeros tres elementos de la expansión (3.54), es
decir Z,WZ,W2Z, como instrumentos relevantes para eliminar la endogeneidad
de Wy. Nos referiremos a este conjunto de instrumentos como la matriz n-by-3k
ÿ2
HZ WZ knnnk
WZ ÿ 3 =, , nknkn nn ÿ ÿ.
Escribamos ahora la ecuación (3.45) de la siguiente manera:
yM= tu
+q (3.55)
+1 [n n n n n 1 , ] yk _ +1 1 = k
M Y Z=
con el conjunto de regresores nk lb el , [ ] 1 q
vector de parámetros desconocidos.
En la primera etapa del procedimiento de dos etapas, las variables
independientes M se retroceden sobre los instrumentos H a través de la
regresión instrumental:
M H= + gh (3.56)
T 1-
ˆ
gramo ) HH HM T =( (3.57)
por el cual derivamos el valor estimado de M, digamos Mˆ, que está dado por:
ˆ T 1-
ˆ
MH=HH
=( )HHM Tg (3.58)
Machine Translated by Google
1
ÿ2 = (mmT mi ) T (3.60)
SLS
Consideremos un ejemplo del modelo Spatial Lag. Los datos que estamos
utilizando fueron recopilados por Harrison y Rubinfield (1978) e integrados por
Gilley y Pace (1996) y son muy populares en econometría espacial. Están
R procedimiento
contenidos en el conjunto de datos Boston y se pueden descargar utilizando el
ilustrado en la sección 2.3.5. Los datos se refieren al precio medio de la vivienda
observado en 506 distritos censales del área de Boston junto con una serie de
variables que pueden considerarse determinantes potenciales del valor de la vivienda.
El mapa de las 506 secciones censales, representadas a través de sus centroides, se
muestra en el gráfico a continuación, mientras que la lista de variables, contenidas en la
base de datos, se muestra en la siguiente tabla.
4690
4680
4670
4660
Prueba I de Moran
La prueba muestra que existe evidencia de una correlación espacial positiva y altamente
significativa en los residuos de la regresión que motiva un análisis posterior. En nuestro caso,
dado que nos estamos refiriendo a unidades de área muy pequeñas (las secciones censales),
ciertamente es razonable especular que el valor de la casa cambia suavemente a través del
espacio, en el sentido de que los barrios caros tenderán a concentrarse en ciertas zonas de la
ciudad, por lo tanto mostrando una correlación espacial positiva. Por estas razones, podemos
probar si un modelo de retraso espacial logra un mejor ajuste a nuestros datos mientras elimina
la correlación residual.
En primer lugar, estimemos el modelo usando la Máxima Verosimilitud
técnica (Sección 3.5.2). Los resultados se muestran a continuación:
Las pruebas t muestran que, nuevamente como en el caso de MCO, todas las variables
excepto INDUS y EDAD son significativas, con un signo que está de acuerdo con la estimación
de MCO. El coeficiente de regresión relacionado con la variable TAX no es significativo,
mientras que tanto la prueba de razón de verosimilitud como la prueba de Wald muestran que
el parámetro l es altamente significativo.
Sin embargo, la especificación del retraso espacial, aunque enfatiza la característica
importante de una dependencia espacial de los precios de la vivienda, no ha eliminado por
completo el problema de la autocorrelación espacial residual. De hecho, la prueba LM para
residuos muestra que todavía existe una correlación residual positiva y significativa.
= yoti
y por + yo < 1 (3.61)
u Wu = 1 + r er < (3.62)
así tenemos:
= ÿ
1
()Yo Wy ul
ÿ
() yo y= yo tu
ÿ
(3.63)
1
( I) Wu
= tuIW
= (r ) e re (3.64)
ÿ
ÿ ÿ
1 1
() IW yo ÿ)y= (
IWestoy (3.65)
ÿ
ÿ
Machine Translated by Google
y, como consecuencia
T 1 1 T Tÿ
=
ÿ ÿ
( EIWIWIWIW
) ) ( )
ÿ ÿ
E yy yo rr ()
ÿÿ ÿ ÿ
ÿÿ ( () l camiseta _
2
ÿ ÿ
T T
( sl r1 IW IW IW )IW ) ( ) (3.66)
ÿ ÿ
= ÿÿÿ ÿ
mi (1
yo ( r )
= ÿs 2 mi
1 T T
= ( lIWIWI
)( ÿÿ( ÿr WI
rl)( )W )
ÿ
ÿ ÿ
= IW WW + señor T T+T ÿ
ÿ()
ÿÿ señor ÿ (3.67)
T T+T T
ÿ " IW
lr WW
( yo
) ÿ
+ ÿÿ ÿ
y Z=Wy
+ tu licenciado en Derecho
+ yo < 1 (3.68)
1 u Wu = + re r < (3.69)
con mi . . .yo
2 Xÿ iidN (0,) ÿe nn .
Los modelos (3.68) y (3.69) presentan dos problemas importantes de estimación.
Primero, similar al caso del SLM examinado en la sección anterior, tenemos
un problema de endogeneidad asociado a la presencia del término rezagado
Wy. En segundo lugar, debido a la presencia de la autorregresión en la
perturbación estocástica en la Ecuación (3.69), no podemos emplear un GLS
Machine Translated by Google
Z= tu+y
Wy bl + yo < 1 (3.70)
u Wu = 1 + r er < (3.71)
1
() (IWZb
Ey= ) ÿl (3.72)
y también
T 1 1 T T
())l ()
ÿ ÿ
()
ÿ ÿ
r () r
ÿ ÿ
E (yy
= EIWIWIWIW
yo
ÿ
ÿÿ ÿ
camiseta _
ÿ
ÿ ÿÿ
(3.73)
T
= ÿ mi1 21
()IW2()IW
( lrl IW
r IW
T
ÿ ÿ
) ( )= ÿ
ÿ ÿ
ÿÿÿ ÿ
ÿ
mi
2
ÿ
1
ÿe
ÿ
ÿ ( ÿ lby) NI WX
ÿÿ ÿ;ÿÿ (3.74)
ÿ
Machine Translated by Google
2
Ahora, recordando la simplificación del determinante ÿe ÿ reportado en la
Ecuación (3.50), la probabilidad se deriva fácilmente como:
2
ÿ
norte 2
L (ÿ 2 IWIW
( rl b ;y cuesta
, ,, )= ÿ
mi
) yo
ÿ ÿ
1 T
ÿÿÿÿ
" Exp ÿ
ÿÿ ÿ r WZ 1
ÿ ( ) yI
ÿ
b
2
ÿ ÿÿ
2ÿ mi
ÿ ÿ
ÿ()
ÿ WZ
r
ÿ
1
b}
y la log-verosimilitud como:
norte
yo (
ÿ
2
, lrb
, y ,costo
;)=
ÿ ÿÿ
ln +
ÿ 2ln 2
mi
en l +
IWIW r
1 T
ÿ
( IW ) ( 1l bl ÿÿ
)T
ÿ
yI WZ
ÿ ÿÿ ÿ
2ÿ 2
mi
ÿ
(3.75)
)( r rlWI W) T(
" ( IWI )
ÿ ÿÿ
" ÿ yI
ÿ ( yo )
ÿ ÿ WZ ÿÿ
ÿ
1
b
ÿ ÿÿ ÿ ( )( ) 1
I Wy Z b, eventualmente ÿ
ÿ
I Wy IWZ lobtenemos:
lb = ( y, ya que l ) ÿ
ÿ ÿ
norte
2
l (ÿ , , costo
; ) =, lrb y ÿ ÿÿ
ln +
ÿ 2ln 2
mi
en l +
IWIW r
1 T
ÿ
ÿ( ÿÿ
) r ÿbl
IW
ÿ()
y Z Wy
(3.76)
2ÿ 2
mi
ÿÿ
ÿ
( " ÿÿr() IW
)bl y Z Wy
ÿÿ ÿ ÿ
y *I Wy =() - r
ZI*WZ =( ) - r
Machine Translated by Google
yo (
ÿ
2
,lrb, ,; ) =costo
y n ln +ÿ 2ln l
ÿ
mi
IW
ÿ
2
1 T
ÿ + entrada
IW yr Z Wy
ÿÿ ÿÿ
licenciado en Derecho
ÿ
(3.77)
2ÿ ÿÿ2
mi
ÿÿ
ÿ ÿ
"ÿ
y Z Wy ÿ
ÿÿ
ÿ segundo
ÿÿ
ˆ ˆ
( I)Wy
=( )I +WZ r ser r
ÿ ÿ
y en consecuencia definimos:
ˆ ˆ
tu =wu (3.79)
ˆ
2 u wu = (3.80)
Paso 3: Use los términos en las Ecuaciones (3.78) a (3.80) para obtener un
estimador consistente de r a través del procedimiento Método de los
Momentos generalizado presentado en la sección 3.5.3 y en particular
usando las condiciones de momentos contenidas en la Ecuación (3.38).
Llamemos a rˆ un estimador consistente de r.
ˆ ˆ
( IW y IWZ
( ) =( ) Wy ÿ ÿ ÿÿ ÿ ) ble + (3.81)
" ˆ * **T ˆ
T
ÿGS2SLS = Q QQ
ÿÿ
yÿÿÿ
ÿ (3.82)
* ˆ * 1* T T-
donde ÿ ÿ [ ] segundo l, , QZ Wy
, [ ],= y ) ÿ QI
ÿ" WQ =( Q HH =( HQ
) .
Kelejian y Prucha (1998) demostraron que, bajo los supuestos del modelo,
los estimadores GS2SLS son consistentes con una varianza asintótica igual a:
ˆˆ
ÿ
1
2** ÿ mi T
qq
ÿ ÿ
ÿ
ÿ ÿÿ
(3.83)
Machine Translated by Google
" "
* "
1
QIW=(ZW IWZ
ÿ bÿ ÿ) , ÿyo ( )
ÿ
(3.84)
ÿ
ÿ ÿ
ÿ
ÿ
ˆ
= QQT Qy ÿ 1ÿ ÿ ÿT
ÿ
ÿÿ
* * **
ÿBFGS2SLS (3.85)
Los resultados son comparables a los de los modelos estimados en el Ejemplo 3.3 en cuanto
a la significación y el signo de las variables. El parámetro r
relacionado con la autocorrelación espacial residual es positivo y significativamente diferente
de cero, mientras que el parámetro l también es positivo, pero no significativamente diferente
de cero. Consideremos más a fondo los resultados relacionados con el mismo modelo, pero
estimados usando la técnica de Mínimos Cuadrados Espaciales Generalizados en Dos
Etapas presentada en la sección 3.6.3. Estos resultados se muestran en la siguiente tabla:
r = 0,35868
LM s=( ) syo
ÿÿT(ÿ00
- (0)) 1
(3.86)
Machine Translated by Google
ÿ ÿL ( )
donde ÿ es un vector de parámetros, 0 s ( )= ÿ es la función de puntuación y
ÿÿ
ÿ ÿ L( )ÿ
ÿÿ2
ÿ ÿ ÿÿÿÿ ÿ ÿ
IE( )= es la matriz de información de Fisher asociada con el
0 T
ÿÿ
ˆ ˆ
norte
2
ÿ
mi T Nosotros 2
ÿ
LM = ÿ
SEM
tr WW TWW +
ˆˆ
eeT (3.87)
( ) ÿ
ÿ ÿÿÿ
2 T 2
= ÿ n Wy ÿ ÿ ÿ
mi
ÿ
LM ÿÿ
ˆˆ
(3.88)
RETRASO
q eeT
ÿ
T ˆ
con b ˆ ) WX2 b =( )T
= ( MI ) (
T
, , T = tr(WTW+WW)
Q WX ÿ
X
ÿˆ
+ T M XXXXX
ˆ mi
2
y con by de los ÿˆe denota los estimadores de máxima verosimilitud
parámetros correspondientes de la Ecuación (3.45). A veces, se considera una hipótesis
alternativa adicional con una estructura de error que sigue una estructura de media móvil y
autorregresiva espacial.
Sin embargo, no se presenta aquí una revisión detallada de esta alternativa.
Tanto LMSEM como LMLAG se distribuyen asintóticamente, bajo el nulo, como c2 con 1
grado de libertad. Sin embargo, las dos estadísticas de prueba no son independientes entre
sí, por lo que solo se puede probar la hipótesis alternativa de que los errores siguen un
modelo SEM suponiendo que no hay un componente de retraso espacial y viceversa. Por
esta razón
Machine Translated by Google
Anselin et al. (1996) propusieron una versión robusta de ambas pruebas que se puede
expresar como:
T
ˆˆ ˆ
T 2
1 ÿ nSemana
RLM = ˆˆ 1 ÿ nˆˆWy ÿ ÿ
TQ
ÿ
SEM (3.89)
TT
ÿ (1Q
)ÿ ÿ camiseta _ eeT
ˆˆˆ 2
1 ÿ ÿcamiseta
n W n _Wy ÿ ÿT
RLM = ˆˆ ˆˆ ÿ
(3.90)
RETRASO
QTÿ ÿ ÿ camiseta _ eeT
ˆ ˆ
mi TW mi
yo = (3.92)
ÿ" 2
con 2 ÿ"un factor de normalización que depende del modelo particular elegido como hipótesis
alternativa. En particular, si la alternativa
Machine Translated by Google
hipótesis está constituida por un modelo de Error Espacial, el factor de normalización asume
la expresión:
ÿ 1
ˆˆ
T+ 2
"
2 =
camiseta _
{ÿ en( WWW
ÿ
ÿ
ÿ
) ÿÿ
}
ÿ (3.93)
norte
con el término tr(A) indicando la traza de la matriz A, que es la suma de sus principales
elementos diagonales. Como consecuencia, las estadísticas de prueba se pueden definir
como:
ˆ ˆ
eeToeste
norte
yo =
ÿ 1
ˆˆ
2 (3.94)
camiseta _ {ÿ en( WWW
ÿ
ÿ
ÿ
T + ÿÿ
) }
Las dos expresiones reportadas en las Ecuaciones (3.91) y (3.94) coinciden si la matriz de
pesos tiene entradas dicotómicas (0 y 1) en cuyo caso
ÿ 1
2
= y, por lo tanto,ÿ ÿi
2 ww ij ij
=
w tr WWW +(j
yo
{ ÿ
ÿ
ÿ
T
) ÿ
ÿ
ÿ
} .
= X WX+u lb b ÿ +
y Wy yo < 1
(1) + = Q + tu (2) (3.95)
tu Wu
re= + 1r< (3.96)
detrás del procedimiento GMM descrito en la sección 3.4.3. Considere además los
Estimadores de Mínimos Cuadrados Espaciales Generalizados en Dos Etapas derivados
de la Ecuación (3.82)
" ˆ * ** ˆ
= Q QQ T
ÿÿ
y ÿ ÿTÿ (3.97)
ÿGS2SLS ÿ
ˆ
con Q *HH
=(HQ
) T T 1- * y H la matriz de instrumentos
ˆ "
Residuos de GS2SLS . Para probar la hipótesis nula de que no hay correlación espacial
entre los residuales (es decir, ÿ = 0) contra la hipótesis alternativa de que ÿ ÿ 0, Kelejian y
Prucha (2001) derivaron el siguiente factor de normalización:
2
"
=
2 ÿ norte
ÿ
2
{ () (ÿ tr WWW norte) ÿ ÿ + (
ˆˆ
camiseta _
ÿ
ÿ
ÿ
T+ ÿ
1 TT ee
ˆˆˆˆ
) CC
}1
2
(3.98)
ˆT ˆ
(mi W mi )
yo =
ˆˆ 2 1 ˆˆTT
(3.99)
norte
ÿ
{ () (
2 camiseta _ T tr WWW n + )+ ÿ ÿÿ
ÿ
ÿ
ÿ
(
ÿ
ee
ˆˆ
) CC
}1
2
1 ˆ ˆˆ
* **
ÿ
1 ˆ*
ˆ ÿÿ TTT ÿ ÿ T
ˆ = HH HQ QQ ˆ
= Q WW
(+T)ˆ
ÿ
ÿ
mi
y . En
ÿ
c CV
= ÿ ˆaˆ, PAG
ÿ
ÿ
ÿ
ÿ
un
ÿ ÿ ÿ ÿÿn nn ÿ
norte
ÿ ÿ ÿÿ ÿ
ÿ ÿ
dependencia. Los resultados obtenidos se muestran a continuación junto con sus versiones
robustas.
La tabla revela claramente que, si se compara con el modelo de error espacial (como se
esperaba por la equivalencia demostrada por Burridge, 1980), la prueba LM con firma el
hallazgo de la prueba I de Moran en la detección de correlación espacial residual no
significativa. Sin embargo, si se compara con un modelo de retraso espacial, no se puede
aceptar la hipótesis de la independencia espacial del error. Las versiones robustas de las
dos pruebas confirman sustancialmente estos hallazgos.
ÿ
bi = yi (3.100)
ÿX
i
norte
=+ + bb l PIB w i desempleo ÿ
ÿ ÿÿ desempleo (3.101)
yo 0 1
yo j
j =1
Machine Translated by Google
En este caso, un aumento del PIB en la región i produce como efecto inmediato una
disminución del nivel de desempleo en esa región.
Sin embargo, dado el mecanismo autorregresivo espacial considerado en este marco, la
variación del nivel de desempleo en la región i, también produce un efecto sobre el nivel de
desempleo en otras regiones vecinas por lo que todos los impactos deben evaluarse
simultáneamente.
Este tema ha sido tratado en la literatura por Kelejian et al. (2006) y LeSage y Pace (2009)
entre otros. La solución formal al problema consiste en evaluar la derivada parcial (3.100) en
cada modelo específico. Considere, por ejemplo, el caso del modelo Spatial Lag:
= X u 1 +lb l < +
y Wy (3.102)
1 ÿ
1
=( WX I)Wu
+( l bl y I ) (3.103)
ÿ ÿ
1
Ey( )=(
IWX) ÿb ÿ l (3.104)
matriz:
()
ÿ ÿ Oye 1 () ÿi
ÿ ÿOye
ÿÿ ...
X1 ÿX norte
ÿ E y( ) =
S= ... ... ... (3.105)
ÿX
ÿ Oye
() ÿ ÿ Oye
() ÿ
norte
... norte
ÿ
X1 X norte ÿ
(ÿ )
s = Ey i (3.106)
yo
ÿX
j
Machine Translated by Google
Sobre esta base, LeSage y Pace (2009) sugirieron las siguientes medidas
de impacto que se pueden calcular para cada variable independiente Xi
incluido en el modelo:
norte
ÿ E(y) i
= S n 1 ( )=
IDA n tr ÿ ÿ
1
ÿ (3.107)
yo = 1
ÿX i
E(y) iÿ
norte norte
ATIT n j = ÿ
1
ÿ ÿsn = ÿ
1
(3.108)
yo
ÿX
yo = 1 yo = 1 j
3. Una medida relacionada con el impacto producido por una sola observación
en todas las demás observaciones, denominada Impacto total promedio de
Una observación. Para cada observación esto se calcula como la suma
de la j-ésima columna de la matriz S:
norte norte
ÿE
(yi)
=
ATIF norte 1
ÿ ÿsn =
ÿ ÿ
1
i yo
ÿX (3.109)
j =1 j =1 j
4. Una medida global del impacto medio obtenido de las dos medidas anteriores:
norte norte
= ATI ADI
TODO ÿ
(3.111)
> resumen(modelo)
Si queremos estimar un Modelo de Error Espacial a través del criterio de Máxima Verosimilitud
(ML) (sección 3.4.2) utilice el comando
Por el contrario, para estimar el modelo de error espacial por el procedimiento de mínimos
cuadrados generalizados factibles (GLS) (sección 3.4.3) usamos, en cambio, el comando:
si añadimos la opción
Finalmente, para estimar los parámetros de un modelo SARAR por ML (sección 3.6.2)
utilice el comando:
• Autocorrelación espacial
• Autorregresión espacial pura
• Modelo de error espacial
• Modelo de retraso espacial
• Autoregresivo espacial con modelo de error autoregresivo (SARAR)
• Modelo de variables independientes rezagadas
• Solución de máxima verosimilitud para la estimación del modelo de error espacial
• Descomposición de Ord
• Solución factible de mínimos cuadrados generalizados para el modelo de error espacial
Estimacion
• Estimación del Método Generalizado de Momentos
• Medidas de impacto
Preguntas
1. ¿Cuál es una de las principales limitaciones del uso de las estadísticas I de Moran para probar la
hipótesis de que no hay autocorrelación espacial entre los residuos de la regresión? ¿Cómo se
puede abordar esta limitación? que alternativa
hay pruebas disponibles?
2. ¿Cuáles son las ventajas y desventajas relativas de emplear una estrategia de Máxima Verosimilitud
y una estrategia de Mínimos Cuadrados Generalizados al estimar un modelo SARAR?
Ejercicios
Ejercicio 3.1 El siguiente mapa muestra los límites de los 27 países que eran miembros de la
Unión Europea en julio de 2012.
= r 2
tu
i ejem ; +<; i1 yo
_ id N ÿe(0, )
norte. .
se puede expresar como un
ÿ =1 w
norte
yo j
ÿ
norte
wyyo j
j =1 ui X iidN .. .(0,ÿ
y i = l bl ++; 1;
2
X tu < ÿ tu nnyo ) puede ser
i i
ÿ
norte
w
j=1 i
ÿ j =1 wyij j ÿ j 1 wuj j =
norte norte
yi = yo l +; 1;
tu
i
< tu
i
= r + ;ejem
i
< 1
ÿ =1 w ÿ =1 w
norte norte
yo j yo j
mi . . .yo
2 Xÿ iidN (0,) ÿe nn y considere el caso de lr = ÿ . Demuestra que en este
Ejercicio 3.6 Considere nuevamente el conjunto de datos discutido en los Ejemplos 3.3 y 3.4
relacionado con el determinante del precio medio de la vivienda observado en 506 distritos
censales del área de Boston. Para descargar el tipo de conjunto de datos:
>datos(boston)
Estime el modelo utilizado en los Ejemplos 3.3 y 3.4, pero especificando el componente
espacial en el formulario Error espacial. Utilice tanto el procedimiento de Máxima Verosimilitud
como el de GLS Factible. Compare los resultados obtenidos con los presentados en los
ejemplos 3.3 y 3.4.
Referencias al Capítulo
Anselin, L. (1988) Econometría espacial: métodos y modelos, Dordrecht: Kluwer
Editores Académicos.
Anselin, L., Bera, A., Florax, R. y Yoon, M. (1996) 'Pruebas de diagnóstico simples para la
dependencia espacial', Regional Science and Urban Economics, 26, 77–104.
Arbia, G. (2006) Econometría Espacial: Fundamentos Estadísticos y Aplicaciones a la
Crecimiento económico regional, Heidelberg: Springer-Verlag.
Burridge, P. (1980) 'Sobre la prueba de Cliff-Ord para la autocorrelación espacial', Journal of
la Sociedad Real de Estadística, Serie B, 42, 107–8.
Cliff, AD y Ord, JK (1972) Autocorrelación espacial, Londres: Pion.
Gerschgorin, S. (1931) 'Über die Abgrenzung der Eigenwerte einer Matrixi', Izv.
Akád. Nauk. URSS Otd. Fiz.-Mat., 7, 749-54.
Gilley, OW y Pace, RK (1996) 'Sobre los datos de Harrison y Rubinfeld', Journal
de Economía y Gestión Ambiental, 31, 403–5.
Harrison, D. y Rubinfeld, DL (1978) 'Precios de vivienda hedónicos y la demanda de aire
limpio', Journal of Environmental Economics and Management, 5, 81–102.
Kelejian, HH, Tavlas, GS y Hondronyiannis, G. (2006) 'A Spatial Modeling Approach to Contagion
Among Emerging Economies', Open Economies Review, 17, 4–5, 423–42.
Lee, LF (2003) 'Mejores estimadores espaciales de mínimos cuadrados en dos etapas para un
modelo autorregresivo espacial con perturbaciones autorregresivas', Econometric Reviews, 22,
307–35.
Lee, LF (2004) 'Distribución asintótica de estimadores de máxima verosimilitud para modelos
autorregresivos espaciales', Econometrica, 72, 1899–925.
LeSage, J. y Pace, RK (2009) Introducción a la econometría espacial, Boca Raton,
Florida: Chapman & Hall/CRC Press.
Moran, PAP (1950) 'Notas sobre fenómenos estocásticos continuos', Biometrika,
37, 1, 17–23.
Ord, JK (1975) 'Métodos de estimación para modelos de interacción espacial', Journal of
la Asociación Estadounidense de Estadística, 70, 120–6.
Whittle, P. (1954) 'Sobre procesos estacionarios en el plano', Biometrika, 41, 434–49.
Machine Translated by Google
4
Otros temas en espacial
Econometría
4.1.1 Generalidades
Hasta este punto del texto, todos los modelos presentados han considerado X
iidN . .esta
. (0, I ) las 2
innovaciones serán así asumiendo
sección 1.2, por muchas mirazones,
datos hipótesis
suposición
espaciales. ÿ(homocedasticidad).
ÿe
como
tipologías
De nn
puede
deesis
ya
realista
hecho, se
considerarse
de
a discutió
datos varianza
cuando Sin
en
diferencia
(por de la
constante
embargo,
poco
la otras
ejemplo,
se trata
de
datos de series temporales), los datos espaciales se observan dentro de
unidades que, en general, son diferentes en términos de
99
Machine Translated by Google
su tamaño y forma. Esta característica, que es propia de todos los datos espaciales
observados en redes irregulares, puede resultar en heteroscedasticidad de las innovaciones
con mayores variaciones en áreas más grandes. Además, incluso si podemos asumir la
cedasticidad del hogar en un nivel dado de agregación espacial (por ejemplo, el nivel de
condado), tal característica generalmente se pierde si agregamos los datos a un nivel más
alto de agregación (por ejemplo, el nivel estatal) debido a a la diferente dimensión de las
distintas áreas geográficas (para una prueba véase, por ejemplo, Arbia, 1989).
tu Wu = +r <
1 re (4.2)
pero ahora, en lugar del supuesto habitual E( )= mi 2 Xÿ iidN. .. (0, ) yo ÿe , nos deja
2
argumento i ÿ considerado en2 la
ei , supongamos
surge
nn sección
.unen
problema
Debecambio
3.5,
ser el que, al usar el mismo
evidente
de endogeneidad en el que el término Wy está correlacionado con las innovaciones.
Esto motiva el uso de una estrategia en dos etapas. Además, surge un problema
de ineficiencia como resultado de las innovaciones heteroscedásticas, por lo que
es necesario considerar un procedimiento ponderado.
El procedimiento que ilustraremos fue introducido por Kelejian y Prucha (2010) y utiliza un
enfoque que es similar a los Mínimos Cuadrados Espaciales en Dos Etapas presentados en
la sección 3.6 para el modelo general SARAR(1,1) con innovaciones homecedásticas, con
algunas importantes diferencias. En lo que sigue, intentaremos proporcionar las intuiciones
detrás del procedimiento, sin discutirlo en todos sus detalles matemáticos, mientras remitimos
al lector interesado al artículo de referencia para obtener una comprensión más profunda.
Machine Translated by Google
en la varianza, yo
ÿ
ÿ , mi
ÿ ÿ ver Ecuación (3.35) . Sin embargo
ÿ norte
yo = 1 )2 ÿ
Paso 1: en primer
~ lugar,
~ obtener una estimación consistente de los parámetros b
y yo, digo b y yo
Paso 2: utilice las estimaciones obtenidas en el primer paso para obtener una estimación
inicial de u en la Ecuación (4.1), digamos û
Paso 3: use û para obtener una estimación inicial del parámetro autorregresivo r en la
Ecuación (4.2), digamos r ~, imponiendo condiciones de momentos. Esta estimación es
consistente, pero ineficiente debido a la falta de constancia de las varianzas,
uy=ZÿWY
ÿ" " bl
Paso 3: Utilice los términos de la ecuación (4.2) para obtener un estimador inicial
de r a través de un procedimiento GMM no ponderado análogo al considerado en
la sección 3.6.3, pero basado en condiciones de solo dos momentos ya que ahora
no se puede derivar ninguna condición de la parámetro s2. En otras palabras, dado
que la heteroscedasticidad no se expresa en una forma preespecificada, los
procedimientos GMM solo pueden enfocarse en la estimación del parámetro desconocido r.
Llamemos a rÿ el estimador inicial de r así obtenido. Kelejian y Prucha (2010)
sugieren que este estimador puede interpretarse como un estimador de mínimos
cuadrados no lineal no ponderado (Greene, 2011). Este estimador, en nuestras
hipótesis, es consistente, pero ineficiente debido a la heterogeneidad de las
varianzas de las perturbaciones.
= 1
T nH H ÿ ÿnn nn
22 2 ÿ 2 (4.3)
Machine Translated by Google
2 =
n el tamaño deTla muestra,ZÿWZy = una
ÿ[ ]E, uu
nH la matriz
matriz de instrumentos
de varianza-covarianza
de n por 2 conde
además las perturbaciones
instrumentos de la
al elemento genérico de ÿ elementos genéricos
matriz ÿ como
ÿ
Observeÿij ÿque
ÿ . la
Refiramos
matriz de
ÿ
años
, rs , = 1,2.
H ahora tiene dimensión n-by-2 porque solo imponemos dos condiciones
de momentos.
En su trabajo Kelejian y Prucha (2010) proponen el siguiente párrafo
estimador métrico para el elemento genérico de yrs
y"
rs
ÿ = (2AAAA
ÿ
) n tr + ÿ ÿ
1
( rr ss )( ) ÿ ÿ1 ÿ
TTT ÿ ÿÿ + + naars
" ""
ÿ
"
r
"
s
, = 1,2 (4.4)
norte
TTT
1 =
A WW iwwij =1ÿÿ j # #jjj ##
OA 2
=
"" "
ÿ
1 "
r r
r un )
=( un IW HP
ÿ
1
"" "
r =
T
ÿ ÿ ÿ ( )( + ) ( ÿÿ n QIWAAI
r Wu
r ÿ ÿ ar r ÿ ÿ
T " "
[]y
con ÿ ÿ
) , QZWy, =
" 1 11T TTT T 1 1 11
(
ÿ ÿÿ ÿ ÿ ÿÿ
P n=( ÿ )n(HH n HQ ) ÿ ÿ
HH n HQ n QH ÿ)ÿÿ
) )( .
( El resultado del procedimiento GMM ponderado descrito anteriormente
es un nuevo estimador del parámetro r. Kelejian y Prucha (2010) han
demostrado que dicho estimador es consistente y eficiente. Llamemos a
este nuevo estimador rˆ.
Paso 5: utilice la estimación de rˆ obtenida en el Paso 4 para transformar el
modelo original de la forma habitual, premultiplicando cada lado de la Ecuación
(4.1) por el término ( IW :ÿ rˆ)
ˆ ˆ
IW y IWZ Wy r bl e ÿ ÿÿ r ( ) ( ) =( ) + (4.5)
Machine Translated by Google
ˆ ˆ * ** ˆ
= ÿQ QQ
ÿÿ
T
y ÿ ÿTÿ
ÿGS2SLS (4.6)
ˆ
) *ÿWQ
, = ],QI
[ donde, como antes, QZ Wy rˆ =( y Q *HH
=( )HQ T T1
- *
1 T
matriz de varianza-covarianza se define como ÿ nH=H ÿ ÿ = 1,2 , de manera que la
rs,
expresión algebraica de su elemento genérico yrs , es dado por:
nn
= 1
y rs hh ÿ ir
norte
ÿ ÿÿ es ij (4.7)
yo =1j =1
con hir, his el i-ésimo elemento del vector de (respectivamente) el r-ésimo y el s-ésimo instrumento.
nn
ˆ *
ÿ1 ÿÿ
ˆˆ
= hh uuK dd ir es ij( /)
ij
y rs norte
(4.8)
yo=1 =1
En la expresión anterior, û es un estimador de las perturbaciones u, K( °) denota una función kernel, dij representa la
distancia (como sea que se mida) entre la i-ésima y la j-ésima observación espacial, la distancia que incluye un
dd = denota
+u
posible error de medida uij, independiente de las perturbaciones e y tal que 0 < < u ÿ. Finalmente, ij ijtérmino
el ij d
*
representa una distancia de estandarización correctamente seleccionada tal que para n ÿ ÿ, d ÿ ÿ.
yo
En cuanto a la función kernel K(°), que incorpora varias formas de suavizar la función, son posibles varias
1. Uniforme
ÿÿ 0.5 para 1 ÿ de lo
norte
()=
ÿ
k norte
ÿ
ÿ
0 contrario
ÿÿ
2. Bartlett (triangular)
ÿÿÿ 1 norte
para 1 ÿ de lo norte
()=
ÿ
k norte
ÿ
ÿ
0 contrario
ÿÿ
3. Epanechnikov (cuadrático)
3
ÿÿ
norte(1ÿ ÿ ÿ ) 2 para
ÿ
norte
1ÿ
k ( ) =4
norte
ÿÿ
0 de lo contrario
4. Cuadrático (bi-peso)
15
ÿÿ
ÿ
ÿÿ (1 ÿ ÿ )2 2 por norte
1ÿ
k ( ) = 16
norte
ÿÿÿ
0 de lo contrario
Machine Translated by Google
5. Cuadrático (tri-peso)
35
ÿÿ
norte ÿ - 1
ÿ
( )3 2 por norte
ÿ 1
k
( ) = 32
norte
ÿ
ÿ
0 de lo contrario
ÿÿÿ
6. Gaussiano
1 ÿ1 ÿ
2
()=
ÿ
k norte ÿ mi
XP ÿ ÿ
norte
ÿ
1 ÿ
2 ÿ2 ÿ
(2 ) pag
7. Tukey-Hanning
ÿÿ 1
ÿ 1+ porque ÿ
(pn 1
ÿ
por norte
ÿ
()
ÿ )ÿ
k norte = 2ÿÿ
ÿ
0 de lo contrario
ÿÿ
8. coseno
ÿÿ
ÿÿpÿÿ ÿ ÿ ÿÿÿ
pag
ÿ ÿ
porque ÿ ÿ
por norte
ÿ 1
()
ÿÿ ÿ
k norte ÿ ÿÿ=4ÿÿ nº 2 ÿ
ÿ
ÿ0 de lo contrario
ÿÿÿ
9. Partzén
ÿÿ
2 q
ÿ 3ÿ 1ÿÿ6 + 6 nn n
ÿ
por ÿ2
k
()=norte
ÿ
ÿ
ÿ
3 q
ÿ 2(1
- norte ) ÿq _
por norte
ÿÿÿ
2
ÿ ÿ 25 sen(6pn
) cos(6 ) pn
()=
ÿ
k norte
ÿ
ÿÿÿ22
12 peniques ÿ 6p _ 5 ÿ
En el artículo citado, Kelejian y Prucha (2007) probaron la consistencia de los estimadores (4.8) y derivaron sus distribuciones asintóticas.
Un conjunto de datos muy popular en econometría espacial se refiere a un estudio urbano sobre los determinantes del crimen en Columbus
(Ohio). Este conjunto de datos fue recopilado y estudiado por primera vez por Anselin (1988) y luego utilizado varias veces
Machine Translated by Google
en la literatura para probar nuevos procedimientos. Tanto los datos como los mapas
necesarios para un análisis geográfico están disponibles enRformato . Para recuperarlos
teclee session Las
datos (colon) y datos (coldis) en un R siguientes figuras muestran
el mapa de los 49 barrios en planificación correspondientes a las secciones censales
de Columbus (Ohio) junto con sus centroides.
(a) Mapa de los 49 barrios de Columbus (Ohio) (b) Mapa de los
centroides de los 49 barrios de Columbus (Ohio)
2
3
4
6
85
7
13 1111 9 10
14 12
19 15
dieciséis 17
18 25 26 22
24 20 23
27
21
31 30 29 28 33
32
34 37 38 35
36
39 43 44 40 41
42
46 45 48
49 47
(un)
40
35
30
25
25 30 35 40 45 50
(b) colón$X
Machine Translated by Google
Además, la siguiente tabla muestra los datos relacionados con una medida de
delincuencia (la variable dependiente “crimen”, digamos y, definida como el total
de robos residenciales y robos de vehículos por cada mil hogares), y de las dos
variables independientes “ingreso ” (diga la variable X) y “valor de la casa” (diga la
variable Z) observados en los 49 vecindarios.
(continuado)
Machine Translated by Google
Continuado
Todos los coeficientes son significativamente diferentes de cero, incluido el efecto espacial
l, que muestra que el número de delitos en un tramo censal está significativamente
relacionado con el de los tramos censales vecinos.
Machine Translated by Google
Sin embargo, como se desprende del mapa, los diversos vecindarios son muy
diferentes en cuanto a su área, por lo que la hipótesis de la varianza del error
constante es poco plausible. De hecho, podemos esperar que la varianza sea
diferente de un área a otra con una mayor variabilidad en áreas más grandes. Por
y para estimar el mismo modelo SARAR que antes bb01bl
=+2 + esta
u razón + queremos
+ XZ Wy u ;
Wu = r + e, pero considerando ahora una varianza del error variable en 2.
E( )= ei yo ÿ
el espacio Consideremos primero la estimación paramétrica obtenida a través del
procedimiento de mínimos cuadrados espacial generalizado en dos etapas modificado
ilustrado en la sección 4.1.2. Los resultados del procedimiento de estimación se muestran
en la siguiente tabla.
Los resultados de la estimación revelan que aún existe una relación significativa de
la variable “delito” con la variable “ingresos”, pero, ahora que consideramos un
efecto de heterocedasticidad, la relación con la variable “valor de la vivienda” ya no
es significativa (parámetro b2 ). Se confirma que el efecto de contagio en el crimen
(l ÿ0) es significativo en este nuevo escenario mientras que no se encuentra una
correlación espacial significativa en los residuales (r = 0). La prueba de Wald
rechaza la hipótesis de que ambos parámetros son iguales a 0. Nótese que en el
modelo SARAR heteroscedástico ya no estimamos el parámetro de varianza única
s2 como se aclaró en la sección 4.1.2.
Finalmente, estimemos nuevamente el modelo usando la estimación no
paramétrica de la matriz de varianza-covarianza discutida en la versión espacial
heteroscedástica autocorrelación consistente (HAC) del modelo SARAR (ver
sección 4.1.3). En particular, para estimar de manera no paramétrica la matriz
de covarianza de varianza reportada en la Ecuación (4.8), consideramos una
función kernel triangular.
Machine Translated by Google
4.2.1 Introducción
En todas las secciones anteriores del libro (capítulo 3 y sección 4.1), hemos considerado
el caso de una regresión espacial relacionada con variables dependientes continuas;
sin embargo, en muchos casos, la variable dependiente de un modelo de regresión
puede asumir solo un número discreto de resultados posibles. Por ejemplo, podríamos
estar interesados en la presencia o ausencia de cierta tecnología en una región en
función de una serie de variables independientes. Surgen situaciones similares al
explicar la elección del consumidor entre diferentes centros comerciales, al modelar
datos de conteo, al estudiar la interacción espacial o al modelar el comportamiento
electoral o las elecciones de los pacientes en economía de la salud, al explicar el
comportamiento criminal y en muchas otras situaciones. Todos estos casos entran
dentro de la categoría de lo que se conoce en la literatura como modelos de elección
discreta (ver Greene, 2011). Cuando la variable dependiente es discreta en lugar de
continua, los modelos que hemos discutido hasta ahora no pueden emplearse y deben
ajustarse para seguir su naturaleza estadística. Como la naturaleza de este libro es
introductoria, nos limitaremos solo al caso de elecciones binarias y, dentro de este
contexto, solo consideraremos algunas de las posibles especificaciones del modelo. A
pesar del enorme interés de estos modelos bajo una perspectiva aplicada, han recibido
comparativamente menos atención en la literatura con respecto a los modelos de
variable dependiente continua discutidos en el Capítulo 3 y la sección 4.1.
y •Xser
= + (4.9)
Py( =1
X Py ( PX X • > 0 )= ( )
)= X
yo yo
ser>
metro
i
(4.10)
( mi < FX i b
( =PXX fd )= i
=
b )mm ÿ ()
ÿÿ
similar:
Py( =0
X Py)= X
yo yo
( 0PX () • <
)= X ser<
metro
i
(4.11)
= PXX
( FX b
i
>i )=1
mi
ÿ
( segundo )
=1
ÿÿ (milímetro
f.d. )
ÿÿ
Machine Translated by Google
ÿF ÿÿ
=
ÿÿ
tal que ÿ
f y mb = X el componente sistemático de la
ÿ ÿX ÿÿÿ
i ÿ segundo
Un método de estimación popular para los modelos (4.10) y (4.11) se basa en la estrategia
de Máxima Verosimilitud que ahora se describirá brevemente.
En primer lugar, considere que, dado que la variable dependiente es binaria,
podemos construir una función de verosimilitud considerando la probabilidad de
extraer una muestra aleatoria de tamaño n de una distribución de Bernoulli, lo que lleva a:
( b) = ( = ) = 1( = )...1(,...,
= L PY=
nn y Y y X PY y X PY
1 y X1) norte norte
(4.12)
L ( )= ÿ
bb bb ÿ ÿ ÿÿ()i ()
efectos especiales Efectos
1 ÿ
ÿ
i (4.13)
yi =1 yi =0
donde ÿyi =1 representa el producto de todos los valores de y tal que yi = 1 y de manera similar para ÿyi =0.
norte
LX FX ) = ÿ ÿ ( )( yi [1 )] bb b yi 1
ÿ
( (4.14)
ÿ
efectos especiales
ÿ
i i
yo = 1
yi =0
Machine Translated by Google
norte
ÿ ( y{ FX
[L) ÿ ÿÿ] l ( ) = ln ( ) = ln bb b +(1 )ln 1 ii i ÿ i FX( y segundo )
ÿ
ÿ
} (4.15)
i =1
ÿ
norte
Fi
ÿ
ÿ yfyoÿ
ÿ ÿ segundo ( ) = +(1 ) l yx
i ÿ yo= 0 (4.16)
ÿ
segundo 1
ÿÿ
yo = 1
yo
_ ÿ ÿFyo
ÿ
norte
( ()=
yX ÿ lsegundo
segundo ÿ ÿÿ
yo ii ) =0 (4.17)
i =1
ÿ2
norte
T
2 yob (ÿÿ
)=ÿÿ i (1 ) XX
yo ii (4.18)
ÿ
segundo i =1
ÿ ÿÿ
ÿ ÿ
ÿ
i i
XX
( b)==0
l i + i (4.19)
ÿ b ÿÿ yo 1 yo
yyo=0 yi =1 _
con = ( ) ÿ ÿ yo X b
i , la función de densidad normal estándar tal que
ÿ ÿ ( t)
ÿ = mientras que, en este caso, la segunda derivada es:
ÿt
ÿ2
norte
T
( )=
segundo
kk ÿÿ ( 2
lb i i i ii )+
XXX (4.20)
ÿ
segundo i =1
Machine Translated by Google
T
ÿ (2 i1)ii (2yX
yÿ 1) ÿ
ÿ ÿ
segundo ÿ
con k =
yo . Cabe señalar que, tanto en
ÿ ÿ 1)
ÿ ÿy (2
Yob
ÿ
X i ÿ
ÿ en el caso de los modelos Logit y Probit, la interpretación de los parámetros no es tan sencilla
como en el caso del modelo de regresión lineal (a-espacial). En este caso, de hecho, el efecto
marginal de un aumento unitario de las variables independientes sobre la variable dependiente
binaria no es simplemente el coeficiente de regresión ÿ, sino que asume el valor:
ÿ EyX
( ) = (4.21)
bb( ) f X
ÿX
EyX
()ÿ
= ÿ ( X b 1 ÿ ÿÿ ÿ ) ( X bbÿ )ÿ
(4.22)
ÿX
ÿ (EyX
)
= (ÿX )
cama y desayuno (4.23)
ÿX
Para juzgar la importancia de las estimaciones de los parámetros, la mayoría de las herramientas
discutidas en un marco de regresión lineal todavía están disponibles. En particular, al probar la
importancia de las estimaciones de un solo parámetro, podemos usar la prueba t (empleando
los errores estándar derivados de la matriz de información (4.18) o (4.20)) o la aproximación de
puntajes z, explotando la propiedad de normalidad asintótica de los estimadores ML .
Además, también están disponibles todas las pruebas basadas en la probabilidad (como la prueba de
razón de verosimilitud, la prueba de Wald y el multiplicador de Lagrange) discutidas en la sección 1.1.
Finalmente, para medir el grado de ajuste del modelo a los datos observados, mientras que el
criterio R2 obviamente no está disponible (al estar basado en la descomposición de la varianza
de la variable y que ahora es binaria), aún podemos usar el AIC y Criterios BIC (ver Ecuaciones
(1.27) y (1.28)).
Para ilustrar los modelos de elecciones discretas descritos en esta sección, examinemos un
conjunto de datos (preparados por Anselin y originalmente disponibles
Machine Translated by Google
por Dubin, 1992) sobre el precio de la vivienda y una serie de variables relacionadas
con su valor observadas en 211 localidades de Baltimore. Los datos se pueden
descargar desde R usando el comando data(baltimore) como se ilustra en la Sección
2.3.5. El conjunto de datos también contiene las coordenadas X, Y de las casas. El
mapa de su ubicación se muestra en la siguiente figura.
580
560
540
520
si la utilidad derivada de comprar una casa cara puede explicarse por estas
características. Consideraremos las especificaciones Logit y Probit del
modelo. Los resultados de las estimaciones de ML se muestran a continuación.
registro probit
yo yo
ÿ ÿÿ
=( libras
con mi
) ÿ1 MVN(0,
Yo Wu ÿ
=( yo
ÿ
* que ÿcomo
y mi ÿ ) y ) ÿ ZI WZ =( ÿ l . Dado
expresa se 1
proceso
un
autorregresivo espacial, tenemos que, a partir de los resultados presentados
en la sección 3.5.2.
ÿ
1
T TE
ee(IWIW
ÿ
)= = ll ÿÿ (ÿ
ÿ )(
ÿ
) (4.26)
ÿ ÿÿ
a través de la integralPy( =
i 1) = (
FZ ) =y
i mm ÿm fdb
=((I) – lW) y• – Zi b
ÿÿ
= Pz *ser
( + 0yo i
> , , i• )
Z i*wy (4.27)
PAGS
ÿ ÿ iji= ( eb ÿÿ i*Z, ,) ( i•
Z i*Zwy *b )
i
que hay que tener debidamente en cuenta. De hecho, generalizando el resultado obtenido
para el modelo Probit a-espacial (ver Ecuación (4.10)), en este caso tenemos:
ÿ
*b ÿ
i
Py( z=1
wy•
*
)= ÿÿi ij, i
yoz ÿ
ÿ
ÿ
ÿ
(4.28)
ÿ ÿ ÿÿ
ÿ ÿ yo
( =11, = 1,...,
2 = 1); Py yy norte
yo0;1
{ } y= (4.29)
mmm
1 2 norte
( =11, = 1,...,
2 = 1;) = Py y yn ÿÿ ÿ... ÿd(milímetro
) (4.30)
ÿÿ ÿÿ ÿÿ
ÿ
norte
1 ÿ
( ) = (2 ) ÿpag
metro ( Tÿ ÿ
2 ÿ ÿ ÿÿ ÿ exp mm ) (4.31)
2 ÿÿÿ
Sin embargo, no existe una solución analítica para una función de distribución de probabilidad
normal univariante y el problema se vuelve aún más grave en el caso multivariante. Dado
que la integral múltiple contenida en la Ecuación (4.30) no puede evaluarse analíticamente,
la única solución es obtener aproximaciones numéricas.
(, ) Z yo j•
ÿ EyXwy ÿ
* *
yoÿ yo
bb ÿ
= ÿ ÿ
(4.31)
ÿX
ÿ
ÿ ÿÿ
i ÿ ÿ ÿ ÿÿ ÿ mi,yo ÿ ii
con i
ÿ ÿ ii
Machine Translated by Google
Como se ha dicho, existen dos problemas principales al definir una estrategia de estimación
óptima: un problema de endogeneidad y un problema de no esfericidad (tanto en forma de
autocorrelación como de heteroscedasticidad) de la matriz de varianza-covarianza. En la
literatura, se propusieron varias alternativas basadas en probabilidades y momentos, a partir
de las primeras contribuciones de McMillen (1992), Pinkse y Slade (1998) y Klier y McMillen
(2008), entre otros (ver Fleming, 2004 para una revisión). ). En particular, aquí discutiremos
las siguientes estrategias de estimación:
ÿ • T ÿ
víaij jZ +
norte
ÿ yo
ÿ
ÿ
norte
i segundo ÿ
•
ÿ
ÿ
y i en ÿÿ
yo = 1 ÿ
l (Zazul
, Wy , )= ÿ
ÿ
ÿ ii
ÿ
ÿ
ÿ ÿ
yo = 1
ÿ ÿ
(4.32)
ÿ •
ÿ ÿ
l víayoZj +
norte
ÿÿ ÿ
norte
Yo
segundo ÿ
yo = 1 ÿ
+ (1
ÿ ÿ ÿÿ ÿ y i ) en 1 ÿ
ÿ
ÿ ii
ÿ
ÿ
ÿ ÿ
yo = 1
ÿ ÿ
Machine Translated by Google
El término y• no es observable y, por tanto, para derivar una función de verosimilitud operativa,
tenemos que explotar la forma reducida del modelo.
Usando (4.25), la función logarítmica de verosimilitud se puede reescribir como:
•
ÿ
yo b ÿ ÿ
segundo
ÿ
( bll
Wy, Z , i ln ÿ+ ÿÿ
(1 ÿ)lnyo1 ÿ ÿ
= ÿ) y ÿ yi (4.33)
yo = 1 ÿÿ ÿ yo yo = 1 yo ÿ
La expresión (4.33) tiene una estructura complicada que crea problemas de cálculo en la fase de
maximización numérica. Para maximizar tal expresión, McMillen (1992) sugirió el uso del algoritmo
EM . El algoritmo EM (introducido por primera vez por Dempster et al., 1977) es un procedimiento
iterativo que se desarrolla en dos pasos: un paso E (expectativa) y un paso M (maximización). El
paso E consiste en calcular la expectativa de la probabilidad utilizando un valor inicial para los
parámetros desconocidos. El paso M consiste en maximizar la probabilidad esperada encontrada
en el paso E con respecto a los parámetros desconocidos. Los dos pasos se repiten hasta que los
parámetros convergen en una solución estable, que puede demostrarse que coincide con los
estimadores ML de la verosimilitud original. McMillen (1992) sugirió generalizar el algoritmo EM al
caso espacial, reemplazando la variable binaria con la expectativa de la variable latente subyacente
y maximizar la expectativa del log-verosimilitud como si la variable artificial fuera la variable latente
real. En particular, en el caso del modelo Spatial Lag Probit (4.25), el valor esperado puede derivarse
como:
ÿ
Z *b ÿ
ÿ
ÿ ÿ ÿ iÿ ÿ ÿ ii
ÿ
ÿ
ÿ
• * ÿÿÿ
( i ZE yo >ÿ ii iZ b ) +
Oye i = 1) = + ( segundo
ÿ
yo
(4.34)
Z *b ÿ
ÿ
i
ÿ
ÿÿ ÿ
ÿÿ ÿ ÿ ii ÿ
ÿÿ
1 1 ( ) en
l = porque T
t ÿ ÿÿ mm 2 2 (4.35)
1 =(en
I b,
Wy Z=(esta
ÿ•) (ml
)ˆ T
elEn
, expresión, última
ÿÿ ÿ IW IW
ÿ ÿ
El uso del enfoque EM presenta dos problemas principales. En primer lugar, la matriz de varianza-
covarianza ÿ que está presente en la Ecuación (4.35) es
Machine Translated by Google
Esta operación no solo puede ser muy pesada desde el punto de vista computacional, sino
que el cálculo del determinante se basa en aproximaciones que pueden volverse inexactas
cuando n es grande y W denso, es decir, contiene una gran cantidad de entradas distintas
de cero.
Pinkse y Slade (1998) introdujeron un método de estimación alternativo para una versión
espacial de un modelo de elección binaria, quienes desarrollaron una técnica GMM para un
modelo Probit expresado en forma de error espacial con heterocedasticidad.
= • b yZu + (4.36)
tu Wu
r =+ mi (4.37)
Z iid NI. .ÿ 2
con mi
(0, ) ÿe . Similar al modelo (4.24), las ecuaciones (4.36) y (4.37) se
pueden escribir en forma reducida como:
• ÿ
1
yZ IW = +( ) b re (4.38)
ÿ
1 T
donde u MVN = (0, ) ÿ (ver sección 3.4) y (ver Ecuación IW=(
ÿ ) ÿÿ ÿr IW ( r ) 1
ÿ
3.15). Usando la Ecuación (4.15), el modelo Probit de error espacial conduce a la siguiente
función de verosimilitud logarítmica:
norte
y FX [L] ÿ ( l br br ( , ) = ln ( , ) = { b ) ÿ ÿÿ ln +(1
ii i ÿ)ln
i 1 FX( y segundo
) ÿ
(4.39)
ÿ }
i =1
norte ÿ T ÿ norte ÿ T ÿ
z yo z
•
ÿ ÿ
ÿ ÿ ÿ ÿ
segundo segundo
Z( brl
,
Wy , )= yo en ÿ y yo + (1 ÿ ÿÿy yo ) en 1 (4.40)
yo = 1 ÿ ÿ ÿyo yo = 1 ÿÿ yo ÿ
Machine Translated by Google
Dado que la noción tradicional de perturbaciones en este nuevo contexto no tiene sentido,
ÿÿ
ÿÿ
z iT segundo
ÿ
ÿ
ÿ
ÿ
ÿ
ÿ ÿ
T
ÿ
"
ÿ z
ÿ ÿ
ÿ
ÿ segundo
ÿ
yo
ÿ
yo ÿ
tu
yo ( ÿ) = ÿ ÿÿÿ ÿ y yo ÿ ÿÿ
ÿ ÿ (4.41)
ÿ ÿ ÿÿ zÿÿiT ÿ ÿ 1
ÿ
ÿ ÿ ÿ
ÿ
i
ÿ
b Tz _ b
ÿ ÿ ÿ ÿ
ÿ ÿ ÿ ÿÿÿ ÿ ÿÿ ÿ
ÿ ÿ
i ÿ
ÿÿ ÿÿÿ
yo ÿ ÿÿ ÿ yo
matriz H de n por k . Los instrumentos son exógenos por definición, lo que sugiere la condición de
momentos:
ÿ zzÿT
ÿ
ÿ ÿÿ ÿ
ÿ ÿbÿ ii ÿ = 0
T
ÿÿ ÿ
b
ÿÿ ÿÿ ÿÿ ÿi y ÿ
ÿÿ ÿ
yo ÿ ÿÿÿÿ
ÿ
ÿ
ÿ
ÿÿÿ
i
mi hola ÿ ÿ (4.43)
ÿÿz yoTÿÿ ÿ T ÿ
ÿ
bz ÿ ÿ
i b ÿ
ÿ ÿÿ1 ÿ ÿ
ÿ ÿÿ ÿÿÿ ÿ ÿ
ÿÿÿ
ÿÿ ÿÿ yo ÿ ÿÿ yo
ÿÿ
donde hi indica la i-ésima fila de una matriz de instrumentos H. Finalmente, usando la muestra
análoga a la Ecuación (4.43), tenemos el siguiente conjunto de condiciones:
ÿ ÿ
ÿ ÿ zÿÿT ÿ T
ÿ
yo
bz i ÿ ÿ ÿÿ b ÿÿ ÿ ÿ
ÿy i ÿÿ ÿÿÿÿÿ
ÿ
1
norte ÿ
ÿ ÿ
yo i
metro
( hermano
, )= ÿ hi
ÿÿÿ
ÿ ÿÿ1 ÿ ÿ
ÿ ÿÿÿ
ÿ
ÿ
ÿÿ ÿÿ ÿ yoÿ i ÿÿ
1
metro
( , ) metro
br ( , ) T= -min
br (4.45)
Siendo M una matriz definida positiva que define los pesos asignados a cada momento muestral m(,)
br . Pinkse y Slade (1998) prueban la consistencia y la normalidad asintótica del procedimiento GMM
y derivan
Machine Translated by Google
• lby Wy Z
u•= ++ (4.46)
u X iid
ÿ .Logistic
2 con expresado . . en forma
(0, reducida:
) oYo ÿun n
u•IWZIW
=( uZ b )1 (11+* )=(
yo
ÿ ÿÿ
lb +() y IWZ
ÿ
yo )=+
ÿ
ser (4.47)
ÿ 1 0 00 0 ÿ
ÿÿ0 ÿ 2 0
ˆ
ÿ =
(4.48)
00ÿ ÿ norte
ÿ
Machine Translated by Google
**
Exp( Z i b )
= ( = 1)1= 1+
Pi Py
exp( Z i** segundo )
(4.49)
debido a la hipótesis de que los errores se distribuyen de acuerdo con la ley logística y con Z**
representando la variable Z transformada como en la Ecuación (4.25) (es decir ) ÿ ÿ l ZI WZ =( ),
*
pero también normalizada a las varianzas heteroscedásticas como
1
ˆ
ZZ**
= ÿÿ . * 1
=ÿ
uyP "yo ii (4.50)
Klier y McMillen (2008) sugieren un procedimiento GMM que se desarrolla a lo largo de los
siguientes pasos:
Paso 2: Use estos valores iniciales en la Ecuación (4.49) y calcule a través de ellos los residuos
generalizados dados por la
"
Ecuación (4.50). Llame a estos residuos generalizados u yP
= i 0
i0
ÿ
yo
ÿ 0
Gÿ0 =
Pidÿ0
HIW=(WZ ) ÿ ÿ yo 1 **
llamemos GRAMO
0_ las estimaciones de los gradientes así obtenidos.
ˆˆ ˆ
"
T 1 T 0
ÿ ÿ (=1+ 0 00 0) GG
ÿ
Gu
Machine Translated by Google
En su contribución, Klier y McMillen (2008) derivan las expresiones explícitas para los gradientes
de b y l, dadas por:
GP PZ
= (1
ÿ
) ** (4.51)
bi yo ii
Z
i
**b ÿ
GP PH ii
= (1 ÿ ÿ ÿÿ ÿ ) ÿb ÿ
(4.52)
yo
i i 2 yo
ÿ
i ÿ
1
1 =(IW
l ) WI W ) (
ÿ ÿ
yo
con ÿii el i-ésimo elemento diagonal de la matriz ÿÿ ÿ
( IW ÿEl) ÿ l 1 .
procedimiento GMM descrito anteriormente todavía es computacionalmente pesado debido
al hecho de que cada paso de la iteración requiere la inversión de la matriz . Por esta razón, en
el mismo artículo, Klier ) ÿ l 1 alrededor
( IWyÿMcMillen (2008) dan
delunpunto
pasodemás y proponen
partida linealizar
l0 = 0. En el modelo
este punto de partida,
de hecho, no es necesario invertir ninguna matriz porque . Habiendo hecho tales supuestos ÿ l
( )= IW I , los términos del gradiente se simplifican sustancialmente. De hecho, expandiendo ( )
ÿ0 00 , bl y analizando el error generalizado alrededor de 1
delas
la estimaciones
expansión,
en el iniciales
tenemos:
primer deteniéndonos
término lineal
ÿ
" "
0 uuG ( ÿ +
0)
i ÿÿÿ (4.53)
i
y deja = M HHT
( - ) 1 . La función objetivo a minimizar se convierte en:
parámetros aunque una cierta pérdida de eficiencia es el precio a pagar por el aumento
del rendimiento computacional.
una distancia < 22. Para facilitar la comparación, también mostramos nuevamente los resultados de
la estimación del modelo Probit a-espacial ya considerado en el ejemplo 4.2. Observe que los
modelos espaciales ahora incluyen el parámetro adicional l que captura los efectos debido a la
dependencia espacial en la variable latente.
La primera observación es que, sin importar qué método de estimación se seleccione, el parámetro
espacial l siempre es altamente significativo. De la comparación entre los cuatro modelos, surge
también un papel dominante de la variable AGE como factor explicativo, mientras que el papel de
variables como NROOM y SQFT se vuelve menos relevante con respecto a la versión aespacial del
modelo. Este efecto se debe a que gran parte del fenómeno ya se explica por las variaciones
espaciales de la variable latente.
Los paneles espaciales son un caso especial de panel donde los datos se observan en dos
dimensiones: a través de unidades espaciales ya lo largo del tiempo. Los modelos de datos de panel tienen
Machine Translated by Google
y =+X+ab
eso
eT eso eso (4.56)
T T
xu x=+aby
eso +=+
i ++(eso i sobre
i mí eso i eso
) (4.57)
Machine Translated by Google
las “islas” Alaska y Hawái y el distrito de Columbia, para un total de 48 estados; véase el ejemplo
3.2 para el mapa) observado a lo largo de los años entre 1970 y 1986, a través de una función de
producción donde las variables explicativas consideradas son la dotación de capital público
(carreteras, instalaciones de agua y otros servicios, codificados como “pcap”), capital privado
(codificado como “pc”) y empleo (“emp”). La tasa de desempleo ("unemp") se agrega para
representar los efectos del ciclo económico. El modelo se puede expresar formalmente de la
siguiente manera:
Iniciar sesión(
PIB it+ ab
log(
) =pcapit
1 23b4 it ) + log( ) +pclog(
empb ser
it
eso
)+ unemp + eso
En este ejemplo, consideramos un subconjunto de los datos originales que incluye solo las
observaciones entre 1970 y 1974. El conjunto de datos utilizado no se muestra aquí para ser
breve. El modelo original propuesto por Munnell (1990) se estimó usando OLS, que equivale a
agrupar todas las observaciones bajo el supuesto de que no hay componentes individuales. Los
resultados se muestran en la siguiente tabla:
ya lo=has +
hecho
Wÿ i (4.58)
1
como en la sección 3.4 y, en consecuencia,
y
eso
=( ) IW ÿ r
ÿ
ÿ
ca11ca11ca ca 11 12 11 11 21 12 ÿ
ÿ ÿ
ca11ca21ca ca 11 22 21 21 21 22
=
. Además, para simplificar la
ca12ca11ca ca 12 12 22 11 22 12
ÿ
ca12ca21ca ca 12 22 22 21 22 22 ÿ
notación, de ahora en adelante también definamos la matriz B = (In ÿ rW), con In una matriz
identidad de n por n , W la matriz de peso espacial habitual y ÿ
el parámetro de dependencia del error espacial. Entonces, para todo el panel
podemos reescribir el error idiosincrático de forma compacta como:
mi ( B ÿÿ -
= TI )1 (4.59)
i eso )
Como consecuencia, el término de error compuesto = me se puede escribir de forma compacta interfaz de usuario
como:
=
ui yo ( )( )
Tn T m + BI ÿ ÿ
ÿ1
ÿ (4.60)
Machine Translated by Google
1
= 2
JI ÿ ÿÿ 2+ÿ yo bb T (4.61)
nT nT tu , ÿ metro
( )(T)ÿnorte ÿ T nn
V wu
( tu yo r ÿ += ) ÿ (4.62)
ÿ = (IB)(ÿ ÿÿ ÿ 1
IB ÿ
T
) (4.63)
nT nT tu , T mi T
donde ÿ =
+de2 unÿmodelo
JTIITn 2
es ladematriz
ÿ metro típica dedevarianzas-covarianzas
componente error unidireccional.
mi
ÿÿ
Como Baltagi et al. (2013) observan, el significado económico del SEM-
RE y el que implica el KKP
modelo son muy diferentes. En el primer modelo, solo los componentes que varían en el tiempo
se difunden espacialmente, mientras que en el segundo también los efectos secundarios
espaciales muestran un componente permanente.
4.3.5 Estimación
yyy "eso
=ÿ
eso i (4.64)
contigo = ÿ t=1
y eso
ÿ" =( )Yo
T Ay X ÿ ÿ" "b (4.65)
Machine Translated by Google
nT nT T
= ln( ) +ÿln|
mi
2
| l const -
ejército de reserva
ÿ
ˆ "" " ÿ
1 "
b = (T XX XI)Ay T ( ÿ ) (4.67)
""
T
2 = ÿÿ
ÿÿ
(4.68)
nT
De esta forma, obtenemos una nueva expresión para los errores a utilizar en
la Ecuación (4.65). Luego se itera el procedimiento hasta la convergencia.
El procedimiento de Elhorst se puede adaptar fácilmente al modelo de error espacial
especificación. Nuevamente, un procedimiento eficiente de dos pasos se
2
puede basar en concentrar la probabilidad con respecto aÿÿbcomo:
y
nT nT
= ÿ
l const + ln|ÿ|ÿ
2
TB ln( ) ÿ
ln( "T )
"ÿÿ (4.69)
2 2
donde los residuos del modelo degradado ahora se filtran a través de:
"
"
con BI W =( )Entonces,
ÿr. la expresión (4.69) se puede maximizar con respecto a r.
Nuevamente como antes, el valor de r obtenido de la maximización de la Ecuación
(4.69) se usa en un paso de Mínimos Cuadrados Generalizados, imponiendo las
siguientes condiciones de primer orden:
ˆ "" ""
ÿ
1
( T
b = XXXy ) (4.71)
Machine Translated by Google
T
""
2 = ÿÿ
ÿÿ
(4.72)
Nuevo Testamento
Ver Lee y Yu (2010b) para una discusión sobre el tema, y Millo y Piras (2012) para una evaluación de su
significado práctico a través de la simulación de Monte Carlo. Para resolver el problema, Lee y Yu
(2010a) sugieren una transformación ortonormal diferente de los datos.
Efectos aleatorios
1
Yo=constante
Nuevo Testamento
2
ÿ
2 2
T (4.73)
1
ÿÿ ÿ () () ÿ
1 Yo
T Ay
ÿÿ X
ÿ ÿÿ
segundo ÿÿ ÿ nT Yo T Ay X b
ÿ
ÿÿ2
2ÿ
ÿ
con ÿ la matriz de varianza-covarianza del error compuesto. Se puede emplear un procedimiento iterativo,
a la Oberhofer y Kmenta (1974), para
Machine Translated by Google
y
ÿ ÿÿ ÿ () () 1 T
2 T T
ÿÿ = Yonsegundo
Ay X ÿÿ ÿ ÿÿ ÿ Yo Ay X
segundo ÿ ÿÿ ÿ
T (4.75)
T )
Yo Ay X tu ÿ =
( + segundo (4.76)
T
ui =( ÿ µÿ)+ (4.77)
j = m2ÿ (4.78)
ÿ
yX=tu
+b (4.79)
ui =( T ÿ yo)+ (4.80)
ÿ ÿ= ( )+Ter yo yo (4.81)
1
= JTI BB ) ()T
ÿ
T ÿ 1 T (4.82)
SEM RE T
ÿ
( E
j BB
+(ÿ)+
ÿÿ
norte
J con =j T T .
y EIJ TTT =ÿ
T
En la segunda especificación (KKP) se aplica el mismo modelo espacial
tanto al componente de error individual como al idiosincrásico, y se puede
expresar a través del conjunto de ecuaciones:
yX=tu
+b (4.83)
ui =( T ÿ yo)+ (4.84)
tu yo wu
T =( )+ ÿ r
mi
(4.85)
1
= ( JI BB
+ ÿ)j (
ÿ
ÿ
KKP TT
T
) (4.86)
Efectos aleatorios
Kapoor et al. (2007) extendieron el estimador generalizado de momentos sugerido por
Kelejian y Prucha (1999) para el parámetro espacial de un modelo transversal (ver
sección 3.4.3) al caso del panel. Describen el procedimiento de estimación para el
parámetro autorregresivo espacial del proceso de error (r) y los dos componentes de
varianza de la perturbación y el proceso 2 (definido por los dos términos ÿÿ ). Se definen
2 22
alternativos sobre la base de las siguientes condiciones tres estimadores GMM
1 +m ÿ de momentos:
ÿ ÿÿ =
1 ÿ
eeT q 0 ÿ
1)
ÿ
ÿ (ÿ n T
1 ÿ
ÿ
2 ÿ
T ÿ
mi
q 0mi ÿ ÿ
( n T 1)
ÿ
2 T
1
ÿ
ÿ 1 ( en WW )
T norte
mi
q 0mi
(nT
ÿ
1) 0
mi = (4.87)
1 ÿ
2
eeT 1
( n T 1)
ÿ
2 T
ÿ
1 1 ( en WW )
1
eeT
norte
( n T 1)
ÿ
ÿ
0 ÿ
1
eeT
( n T 1)
ÿ
ÿ ÿ
yo
TT
ÿ
XX* 1*
T ÿ1 ÿ =( ) ÿ
(4.88)
yo
donde las variables X* son el resultado de una transformación espacial tipo Cochrane-
Orcutt del modelo original (ver Capítulo 3), y tanto X* como ÿÿ1
mi
dependen de los valores estimados de r, ÿm y 2 ÿ12.
Efectos fijos
Recientemente se ha sugerido una modificación del procedimiento anterior para el caso
en que no se pueda mantener razonablemente el supuesto de los efectos aleatorios de
falta de correlación entre los efectos individuales y los regresores. Mutl y Pfaffermayr
(2011) señalan que, bajo el supuesto de efectos fijos, la estimación por MCO de la
ecuación de regresión ya no es consistente. Sugieren reemplazar los residuos de OLS
con mínimos cuadrados espaciales de dos etapas dentro de los residuos. En el caso
de error espacial, un estimador intra simple producirá estimaciones consistentes de los
parámetros del modelo.
En el artículo citado, Mutl y Pfaffermayr (2011) reformulan las condiciones de los
primeros tres momentos de Kapoor et al. (2007) en términos de los residuos internos y
luego estimar el parámetro espacial r usando el GMM
procedimiento descrito en Kapoor et al. (2007) basándose únicamente en estas
condiciones de los tres primeros momentos. Luego, los parámetros del modelo se
obtienen mediante OLS después de una transformación espacial adicional tipo Cochrane-
Orcutt de las variables transformadas internas.
Machine Translated by Google
La varianza estimada del efecto individual es mucho mayor que la del error
idiosincrático, mostrando este último una correlación espacial sustancial: la evidencia
a favor de un proceso espacial en los errores es, por lo tanto, fuerte. Las
estimaciones de los parámetros b no son muy diferentes de las obtenidas con el
modelo de efectos aleatorios espaciales a informado en el ejemplo 4.4, pero, dada
la evidencia anterior, podemos confiar en que estas últimas estimaciones sean más
precisas al considerar un componente estadísticamente significativo. consideración
que se descuidó en la especificación a-espacial del modelo.
Si uno está interesado en el efecto del producto social bruto de un estado en los
estados vecinos, entonces una especificación de Retraso Espacial de Efecto Aleatorio
parece más apropiada. Los resultados de la estimación se muestran en la siguiente tabla:
Modelo SLM-RE
log( ÿ es
b, +itk yy
) registro
y ( ) = +i registro ( ) +
ÿ
eso eso
mi
donde, como ya se explicó en el Ejemplo 1.1, yit representa el PIB per cápita en
el año ty la región i. Por lo tanto, la tasa de crecimiento en un período de k años
para cada región i es una función del nivel inicial de ingreso de la región y de un
intercepto individual. Mirando el problema desde una perspectiva de datos de panel
Machine Translated by Google
La estimación del modelo arroja un coeficiente negativo y significativo para b, lo que confirma
la convergencia.
Para estimar las diversas especificaciones del modelo espacial, consideramos la matriz
binaria de vecindad de las regiones italianas descrita en la sección 2.3.2. Primero consideramos
el modelo de efectos fijos de retraso espacial, estimado a través de la máxima verosimilitud.
Obtenemos los siguientes resultados:
SLM-FE
El parámetro de retraso espacial l resulta ser muy alto y estadísticamente significativo. Por
lo tanto, el crecimiento en las regiones vecinas tiene un fuerte efecto positivo en el crecimiento
local. La estimación del coeficiente de convergencia b sigue siendo estadísticamente
significativa y tiene el signo negativo esperado, pero ahora tiene un valor absoluto mucho
más bajo (aunque tenga en cuenta que no se puede comparar directamente con modelos sin
retraso espacial). Esto destaca una menor “velocidad de convergencia” en el proceso de
ajuste (ver Ejemplo 1.1).
A continuación, consideramos un modelo con un componente de error espacial, asumiendo
que los choques al crecimiento de las regiones vecinas se propagan a las vecinas, afectando
Machine Translated by Google
su resultado Los resultados de la estimación del modelo de error espacial, efecto fijo
son los siguientes:
SEM-FE
4.4.1 Generalidades
Todos los modelos que hemos considerado hasta ahora describen las relaciones
entre variables como un mecanismo estacionario sobre las distintas unidades
geográficas. Este enfoque presenta la ventaja de la síntesis: un solo parámetro, el
coeficiente de regresión, resume todos los vínculos complejos entre la variable
dependiente y y la correspondiente variable independiente del modelo. Sin embargo,
esta simplificación es a veces demasiado fuerte. En muchas situaciones empíricas,
no es razonable creer que una relación entre dos variables es constante en toda el
área geográfica y es más sensato conjeturar que varía en el espacio según algún
patrón regular. Por ejemplo, si estamos tratando con un tamaño de muestra grande
observado en un espacio geográfico grande (por ejemplo, un país grande o un
continente), es más sensato construir un mecanismo de regresión flexible donde se
permita que cambie la relación entre las variables suavemente de un lugar a otro.
Considere el caso informado en el Ejemplo 3.2, donde estudiamos la relación entre
el precio de los autos usados y los impuestos sobre la base de los datos observados
en 48 estados de EE. UU. En principio se puede imaginar que tal relación debería
ser diferente en cada estado o, en otras palabras, que es espacialmente no
estacionaria. En muchos aspectos, la heterogeneidad de las relaciones en el espacio
puede considerarse más como la regla que como la excepción, en primer lugar
porque existen variaciones geográficas en las actitudes y preferencias de las
personas, y en segundo lugar porque un modelo es a menudo el resultado de una
especificación errónea debido a la dificultad en
Machine Translated by Google
Para cada ubicación i, (i=1,2,…,n) considere el siguiente modelo de regresión (ver Wheeler y
Paez, 2010):
y iX= bei
yo yo1
+;,....n
= (4.89)
ÿ
11 1 k1 ÿ
... ...
X = , bi es vector de (variando geográficamente)
nk
1
1 XX
ÿ norte1 nk ÿ
1ÿ
ˆ 1
= X GX
ÿ
ÿ T T (4.90)
b ii yo X Gy ÿ
ÿ
ÿ
gramo
i1 ÿ
0 00 gramo
i2
GRAMO
= ... es una matriz diagonal de n por n que especifica la
i
0 0 ... 0
ÿ gramo
en ÿ
peso inversamente relacionado con la distancia. Sin embargo, existe una diferencia importante
entre las dos matrices en que el número de observaciones
para ser incluido en cada regresión local (es decir, el número de entradas distintas de cero de
la matriz Gi ) tiene que ser lo suficientemente grande para preservar los grados de libertad de
la regresión y permitir una estimación fiable de los parámetros. Los coeficientes estimados
(4.90) pueden interpretarse, como es habitual, como los efectos marginales (locales) sobre la
variable dependiente de una variación unitaria en la variable independiente. GWR , por lo tanto,
modela semiparamétricamente la idea esencial (que está en la base de todos los modelos
econométricos espaciales) de que, para pronosticar el comportamiento de una variable en una
ubicación específica, los mejores predictores son las observaciones cercanas. Además, limitar
el procedimiento de estimación a solo observaciones vecinas probablemente reducirá, si no
eliminará por completo, la mayoría de los efectos negativos de la correlación espacial y la
heterocedasticidad en las estimaciones de parámetros.
ÿÿ
1 si dd < *
g ij =
ÿÿ ij
ÿ
(4.91)
0
ÿ
ÿÿÿ
Aunque en principio se podría utilizar cualquiera de los núcleos presentados en la sección 4.1.3, en la práctica los núcleos
1. Gaussiano. Este núcleo ya se ha considerado en la sección 4.1.3 y en este nuevo contexto se puede expresar como:
ÿ ÿ re
2 ÿ
1 ÿ ij
ÿÿÿÿÿÿÿ2
ÿ ÿ ÿ g = exp ij ÿ
(4.92)
ÿ
ÿ ÿ
ÿÿ ÿÿÿÿ
con s un parámetro, llamado ancho de banda, a través del cual podemos controlar el rango de observaciones incluidas en
ÿ d 2 ÿ2 ÿ
1 g ij ÿ ÿ =
yo
ÿ
ÿ
2
ÿ
ÿ
(4.93)
ÿ
ÿ ÿ
ÿ ÿ
3. Tri-cubo
3
d 3 ÿÿ
yo
1 g ÿ ijÿ ÿ ÿ =
ÿ
ÿÿ
ÿ
(4.94)
3ÿ ÿ
ÿÿ ÿ ÿ
Los parámetros de ancho de banda pueden elegirse a priori o estimarse a partir de los datos, un proceso que a menudo se
denomina calibración. En este sentido, la estrategia de calibración más popular es el método de validación cruzada, un proceso
de búsqueda iterativo que identifica, mediante ensayos repetidos, el ancho de banda que minimiza la raíz cuadrática media del
error de predicción. (Para un enfoque diferente, véase, por ejemplo, Paez et al., 2002. Véase Wheeler y Paez, 2010 para una
revisión). Una vez que se elige la función kernel y se calibra el modelo, la Ecuación (4.90) está completamente especificada y se
puede usar para estimar los parámetros del modelo. En cuanto a la prueba de hipótesis, consideremos, como de costumbre, los
estadísticos de prueba obtenidos al tomar la diferencia entre el valor de bi bajo la hipótesis nula y bajo la hipótesis alternativa
ˆ
b i
prueba = ˆ
(4.95)
Var ( segundo
i)
ˆ
Var ( segundo
)= iii ÿe
2 Automóvil club británico
T (4.96)
Machine Translated by Google
T
ÿ
1
Los=GX
habiendo definido. AX ( XG ii i) deT prueba (4.95) se pueden usar para
estadísticos
probar la validez de la hipótesis de regresión en cada observación individual.
En este sentido podemos observar que el efecto de una inde
La variable dependiente de la variable dependiente y es significativa solo en
algunas zonas específicas del área de estudio y, por el contrario, es irrelevante
en otras, lo que sugiere patrones geográficos interesantes.
Una vez estimado el modelo y contrastada la significación de las variables
independientes en cada uno de los n modelos estimados, podemos proceder,
como de costumbre, a contrastar la validez de las hipótesis que subyacen al
modelo. En particular, en el presente contexto, es de interés probar si los
residuos del modelo muestran alguna regularidad geográfica (por ejemplo, en
forma de autocorrelación espacial) que no fue capturada adecuadamente por el
procedimiento ponderado geográficamente. La teoría relacionada con la prueba
de autocorrelación espacial entre residuos GWR ha sido desarrollada por Leung et al. (2000).
El enfoque propuesto parte de la definición del pseudo-residuo del modelo
global, definido como los residuos calculados como la diferencia entre el valor
observado de yi en cada ubicación i y el valor estimado en base al
(espacialmente no estacionario) parámetros Estos residuos no se definen de
forma convencional porque en cada localidad se calculan a partir de un modelo
de regresión diferente. Una vez que se calculan los pseudoresiduos, se utilizan
para detectar posibles regularidades utilizando una versión revisada del familiar
coeficiente I de Moran. Una alternativa a Leung et al. (2000) el procedimiento
fue sugerido por Paez et al. (2002).
enfoque de GWR (introducido por LeSage, 2004) para resolver algunas de las
dificultades que surgen en el enfoque estándar en presencia de valores atípicos y
fenómenos heteroscedásticos fuertes. En esencia, el procedimiento mejora el método
al imponer una distribución a priori (dependiendo de un conjunto de hiperparámetros)
a los coeficientes de regresión.
Una extensión adicional se refiere a la aplicación del GWR general
marco ilustrado en esta sección para tratar con modelos de elección discreta (ver
sección 4.2). Por ejemplo, McMillen y McDonald (2004) derivan un enfoque de
Máxima Verosimilitud para la estimación de modelos Probit Ponderados
Geográficamente que muestran que a través de este enfoque gran parte de la
hetorcedasticidad y la autocorrelación, endémicas de los modelos espaciales de
elección discreta (ver sección 4.2.3), pueden ser eliminado reduciendo así los efectos
negativos sobre la consistencia y eficiencia de los estimadores.
20
15
10
(un) (b)
4.5 Códigos R
2
mínimos cuadrados
la Sección espaciales
y, X4.1.2.
y Z están generalizados
Supongamos
almacenadas
además en
en la
quedos etapas
sesión modificado
las observaciones
R activa y quede ilustrado
selas
generó en
variables
una matriz de peso W con uno de los procedimientos descritos en los capítulos
anteriores. Para estimar el modelo, escriba el comando:
modelo2<-stslshac(fórmula=y~X+Z,listaw=w,distancia=D,tipo=
"Epanechnikov")
>modelo0<-glm(y~X+Z, familia=binomial(enlace=”probit”))
W<-nb2mat(continuación)
que transforma una lista de vecinos (nb) en (2) una matriz (mat). Consideremos
ahora los diversos estimadores de un modelo Probit espacial. Para comenzar
Machine Translated by Google
> modelo1<-spprobitml(y~X+Z,wmat=W,stdprobit=F)
>rho=rho0
siendo rho0 cualquier valor tal que |rho0 |<1. La solidez de los resultados con respecto
a diferentes valores iniciales debe probarse en cualquier circunstancia práctica. Una
vez hecho esto, ahora escriba:
> modelo3<-spprobit(y~X+Z,wmat=W)
Modelos de Paneles Espaciales por Método Generalizado de Momentos). Los datos de Munnell
usados en los Ejemplos 4.4 y 4.6 están disponibles en el paquete como un conjunto de datos
incorporado, junto con la matriz de ponderaciones para los 48 estados de EE. UU. ya
considerados en el Ejemplo 3.2 (excluyendo Alaska y Hawai y el Distrito de Columbia. Consulte
el mapa en Ejemplo 3.2). Podemos cargar el conjunto de datos a través del comando:
> datos(Produc)
En primer lugar, para estimar el modelo OLS, agrupando todos los datos (espaciales y
temporales), podemos usar la función plm incluida en el plm
paquete añadiendo la opción model=”pooling”
mientras que la especificación KKP reportada en las Ecuaciones en (4.83) y (4.84) puede ser
estimada por ajuste espacial de máxima verosimilitud.
error="kkp" como opción:
modelo
Finalmente, para calcular la prueba I de Moran sobre los residuos, usando la prueba de
Leung et al. (2006) (y teniendo disponible una matriz de peso, digamos W) podemos
escribir el comando:
gwr.morantest(modelogwr, W)
• GS2SLS factible •
Estimación matricial
• Estimadores HAC
• Procedimientos de HAC
espacial • Parámetros molestos
• Estimación del kernel
• Funciones del núcleo
• Variable dicotómica
• Modelos de elección discreta
• Modelos binarios •
Variable latente •
Regresión latente
Machine Translated by Google
• Función de índice •
Distribución logística estandarizada •
Modelo A-espacial Probit y Logit • Efectos
marginales en un modelo Logit y Probit • Forma reducida de
un modelo
• Forma estructural de un modelo
• Modelo Spatial Lag Probit •
Algoritmo EM • Estimador ML del
modelo Spatial Lag Probit • Estimador GMM del
modelo Spatial Error Probit • Perturbaciones generalizadas
de Probit y Logit • Estimador GMM linealizado • Términos
de gradiente • Ordenar y paneles largos • Agrupados
series de tiempo • Término de error individual e
idiosincrásico • Heterogeneidad no observada • Producto
de Kronecker • Efectos fijos
• Efectos aleatorios
• Modelo de error espacial con efectos aleatorios •
Modelo KKP • Modelo de retraso espacial con
efectos aleatorios • Modelo de error espacial con
efectos fijos • Modelo de retraso espacial con
efectos fijos • Tiempo degradante • Dentro de
residuos • Paneles espaciales de dinámica estable
• Paneles espaciales de dinámica inestable • No
-relaciones espaciales estacionarias • Estadísticas
de exploración
• Ventanas móviles •
Regresión ponderada localmente •
Regresión ponderada geográficamente •
Función kernel • Ancho de banda • Kernels
gaussiano, bicuadrado y tricubo • Calibración
• Validación cruzada • GWR bayesiano • GWR de
elección discreta
Machine Translated by Google
Preguntas
5. ¿Cuáles son las razones por las que no se puede utilizar un enfoque de ML estándar
para estimar un modelo Probit en datos espaciales?
6. ¿Por qué se introduce una versión linealizada de la estimación del método generalizado
de momentos en la estimación espacial Probit/Logit?
7. ¿Cuál es la diferencia entre los efectos fijos y los aleatorios?
efectos en el modelado de datos de panel? ¿Cómo podemos elegir entre los dos
modelos?
8. Describa la especificidad de los dos componentes de error en un marco de datos de
panel. ¿Cómo podemos interpretar el componente de error “individual” e “idiosincrático”?
Ejercicios
y 0 1
Demuestre que incluso si el modelo de regresión es homecedástico a un nivel más bajo de
agregación, esta propiedad generalmente se pierde a un nivel más alto de agregación.
Machine Translated by Google
Ejercicio 4.5 Considere nuevamente los datos relacionados con los 27 Estados miembros
de la UE utilizados en los Ejercicios 3.1 y 4.3. Considere también algunos datos adicionales
relacionados con la intensidad de la exportación Hi-tec (descargable desde el sitio web http://
epp.eurostat.ec.europa.eu/portal/page/portal/region_cities/regional_
estadísticas/datos/tablas_principales). En particular, clasificamos a cada Estado
miembro como de "alta intensidad" si el porcentaje de exportaciones de alta
tecnología es superior al 18 por ciento. Los datos se muestran en la siguiente tabla.
ESO
Italia 6,8 Chipre 20,1 0 EL Grecia 6,6 Luxemburgo 0
CY Lituania 5,8 Hungría 22,2 1 LU 0 41,9 Letonia 5,3 Malta 1
LT Países Bajos 18,4 BT 35,2 0
HU 1 MT 1 1
Países Bajos
Machine Translated by Google
Sobre la base de los resultados del Ejercicio 3.1 y de estos nuevos datos, estime un modelo
Probit que explique la intensidad Hi-tec como un factor de Educación tanto en la versión a-espacial
como espacial utilizando los tres estimadores (ML, GMM y LGMM ) discutido en la sección 4.2.
ÿÿÿÿW
2
parámetros TI A ÿ y de la matriz
ÿm =( ÿm
1 y JI
ÿ=0.3,
ÿ . obtenga la forma explícita de la y la matriz de
2
T norte )
Ejercicio 4.7 Desde el paquete splm, cargue el conjunto de datos Seguros y la matriz de
contigüidad binaria para las provincias italianas (itaww). Ver Millo (2014) para más detalles.
Transforme la matriz de contigüidad en un objeto listw como se describe en 2.3.2. Estimar un
modelo de datos de panel de error espacial que explique la variable prima de seguro real per
cápita (codificada como ppcd) en función de la variable PIB real per cápita (rgdp) usando la
estrategia de Máxima Verosimilitud, con efectos aleatorios, ambos en el SEM -RE y en las
especificaciones KKP . Discuta los resultados con especial atención a las estimaciones de los
parámetros espaciales.
Referencias al Capítulo
Amemiya, T. (1985) Econometría avanzada, Oxford: Basil Blackwell.
Anselin, L. (1988) Econometría espacial: métodos y modelos, Kluwer Academic Publishers,
Dordrecht.
Anselin, L. (1990) 'Algunos enfoques robustos para probar y estimar en espacial
Econometrics', Regional Science and Urban Economics, 20, 141–63.
Machine Translated by Google
Anselin, L. (2002) 'Under the Hood: Issues in the Specification and Interpretation of Spatial
Regression Models', Agricultural Economics, 27, 3, 247–67.
Anselin L., Le Gallo J., Jayet H. (2008) 'Spatial Panel Econometrics', en L. Matyas, P. Silvestre
(eds), The Econometrics of Panel Data, Fundamentals and Recent Developments in Theory
and Practice, 3.ª edición , Heidelberg: Springer-Verlag, págs. 625–60.
Baltagi, B. (2008) Análisis econométrico de datos de panel, 4.ª edición, Nueva York: Wiley.
Baltagi B. y Pesaran, H. (2007) 'Heterogeneidad y dependencia transversal en modelos de
datos de panel espacial: introducción a la teoría y las aplicaciones', Journal of Applied
Econometrics, 22, 2, 229–32.
Baltagi, BH y Pinnoi, N. (1995) 'Crecimiento de la productividad del estado y del capital social
público: evidencia adicional de un modelo de componentes de error', Empirical Economics,
20, 2, 351–9.
Baltagi, B., Egger, P. y Pfaffermayr, M. (2013) 'A Generalized Spatial Panel Data
Modelo con efectos aleatorios', Econometric Reviews, 32, 5, 650–85.
Barro, RJ y Sala-i-Martin, X. (1992) 'Convergence', Journal of Political Economy, 100, 2, 223–
51.
Beron, KJ y Vijverberg, WP (2004) 'Probit in a Spatial Context: A Monte Carlo Approach', en
L. Anselin, R. Florax y S. Rey (eds) Advances in Spatial Econometrics, Heidelberg: Springer-
Verlag, págs. 169–95.
Brundson, C., Fotheringham, AS y Charlton, M. (1996) 'Regresión ponderada geográficamente:
un método para explorar la no estacionariedad espacial', Análisis geográfico, 28, 4, 281–98.
Case, A. (1992) Patrón espacial en la demanda de los hogares, Econometrica, 59, 4, 953–65.
Cleveland, W. y Devlin, S. (1988) 'Regresión ponderada localmente: un enfoque del análisis
de regresión por ajuste local', Journal of the American Statistical Association, 82, 596–610.
Pinkse, J., Slade, M. y Shen, L. (2006) 'Probit espacial dinámico con efectos fijos utilizando GMM
de un paso: una aplicación a las decisiones operativas de la mina', Análisis económico
espacial, 1, 53–99.
Pinkse, J., Slade, ME y Brett, C. (2002) 'Competencia de precios espaciales: un enfoque
semiparamétrico', Econometrics, 70, 1111–53
Piras, G. (2011) 'Estimación de modelos de datos de panel espacial de efectos aleatorios: alguna
evidencia adicional', documento de trabajo.
Smirnov, O. (2010) 'Modelado de elección espacial discreta', Regional Science & Urban
Economics, 40, 5, 292–8.
Wang, H., Iglesias, EM y Wooldridge, JM (2013) 'Estimación de máxima verosimilitud parcial de
modelos probit espaciales', Journal of Econometrics, 172, 77–89.
Wang, X. y Kockelman, KM (2009) 'Inferencia bayesiana para datos de respuesta ordenados con
un modelo probit ordenado espacial dinámico', Journal of Regional Science, 49, 5, 877–913.
5
Especificaciones de modelos alternativos para
grandes conjuntos de datos
5.1 Introducción
167
Machine Translated by Google
= 1 lb l <+ y+ Wy Z u (5.1)
iidN
ÿ .. .(0,a )menudo
2 con unoXestocásticos yW
y, filas
(aunque
expresión en(5.1)
lasnoaplicaciones
denecesariamente
empíricas.
la siguiente ) estandarizados
forma Reescribamos
alternativa: por la
(Yo Wy
) +ÿlb = Z tu (5.2)
Como se dijo, los problemas computacionales que surgen cuando se analizan bases
de datos muy grandes se derivan principalmente de la inversión de la matriz de
ÿ
1
IWÿl la Ecuación
covarianza de varianza del modelo ( (consulte ) la Ecuación
3.47). Ahora
(5.2)generalicemos
y
especifiquemos un nuevo modelo de Rezago espacial generalizado como:
=
sy zu + segundo (5.3)
S mi =aW (5.4)
Machine Translated by Google
ÿ
W
yo
S =e W =
un ÿa (5.5)
i =0
i!
Propiedad 3. El inverso de S es
ÿ
1S = mi
ÿ
aW
ÿaW
correlación. De hecho, a partir de la ecuación, SIWe)=
=(ÿltomando la norma de
suma máxima de filas de las dos matrices e igualándolas obtenemos:
o inversamente:
ll = ln(1 ) ÿ (5.7)
1 T
E (yy ÿ )ÿ =IWIW SS
= 2ÿ ( =
ÿ ÿ
T 2 21 T
) l ÿÿ)(- l (5.8)
ÿÿ
mi mi mi
1
2
ÿ,, rb ; ) constante
=y
1 2 1 ln ÿSS
e ÿÿ
T ÿ ÿÿ ÿ ÿ 1ÿÿ ÿb T
ÿ
T ÿ
1
b
y SX SS y SZ
ÿ ÿÿ ÿ
yo (
2 2ÿ 2
mi
1
(5.9)
= constante 1 2en
1 T T
ÿ ÿÿ ÿ
ÿ SS
ÿÿ
[Sí
][ ]Z Sí Zyo yo
2 mi
2ÿ 2
mi
T = 1 T
1 Observe que a partir de la Ecuación (3.50), tenemos
SS
a partir
SS ÿÿ de
ÿ ÿlay,Propiedad
4 de la matriz exponencial informada anteriormente, esto simplifica 1 = 1 T
como SS ÿ ÿ . Como consecuencia tenemos:
2 2
1 T
yo (
ÿ , libras
, =; yc
) ÿÿ ÿ
1 en ÿ
mi Sí Z Sí Z [ segundo
]
ÿ
(5.10)
2ÿ mi2
[ ] segundo
ÿ ii ii q
W = un WW un
=
Se (5.11)
un ÿ ÿÿ
yo =0
yo !
i =0 i!
LeSage y Pace (2007) han demostrado que el papel de parada q depende de la cantidad
de correlación espacial (positiva o negativa), mientras que no depende del tamaño de la
muestra. También muestran, a través de datos simulados, que cuando el valor absoluto de
la correlación espacial no es muy alto (inferior a 0,95, como suele ocurrir en circunstancias
prácticas), un truncamiento en q = 16 produce una muy buena aproximación. Para niveles
más altos de l se necesitan más términos en la expansión.
2 q ÿ 1ÿ
Y y=Wy,W y W
, y ÿ ,...., (5.12)
ÿ
ÿ1
ÿ 0!
0... 0 ÿ
0 1 ... 0
= 1!
GRAMO
(5.13)
... ... ... 0
0 00 1
ÿ (1)!
qÿÿ
T 2 q aa a ÿ ÿ1
tu ÿ ( ) = 1, , ÿ ,..., (5.14)
ÿ
Sy YG ÿ ( ) a (5.15)
TTT
tú _ () (ul = GYP PY Gua ) () (5.16)
T
tú _ Q ÿ ua ua () () (5.17)
TT
habiendo definido =( QGYP PYG ) , para que al final:
T T
min( ) min(
( )) ( ) uu ÿ ua ua Q (5.18)
LeSage y Pace (2007) demostraron que la Ecuación (5.18) es un polinomio en a que admite
una solución de forma cerrada y probaron que tal solución es única y representa un mínimo.
Además, las condiciones de segundo orden proporcionan una forma alternativa de evaluar
el Hessian y, como consecuencia, los errores estándar en los que podemos basar la
inferencia y la prueba de hipótesis sobre los parámetros.
Machine Translated by Google
yZ=tu + b (5.19)
pero ahora, en lugar de modelar los residuos como en la Ecuación (3.14) como
u Wu = 1 + r ,er < , Consideremos el siguiente modelo más general:
mi ÿ ÿ N(0, ) (5.20)
o:
i =0
i!
ÿ ÿ
un W
yo
ÿ ÿ
1 = mi
ÿ
W = (5.21)
un ÿ i!
i =0
Machine Translated by Google
= (IW
ÿ
1 ÿ
T
Si, por el contrario, ÿÿIWÿ rr )( ) , o
= (Yo WI W rr T
ÿÿ ÿ1
ÿ
)( ) (5.22)
T
ÿÿ ÿ1rr=rr(Yo WI WI)(
ÿ
WI W ) =( ÿ
)( ÿ T
)
(5.23)
= IWWrrrWW
ÿÿ T+ 2 T
1 +
ÿ ÿ =2 22 (5.24)
Yo WW rr
ÿ
mi yo _
= ÿ
Wÿÿ (5.25)
metro
i
yo = 1
i =1
ÿ
5
6
10
27
26
4 9
28
8
21
12 19
29
18
14 24 31
11 13 0 2525
2022 22 30
3 23
dieciséis
1
17 15
Machine Translated by Google
Fuente: Datos de población: http:// www.inegi.org.mx/ est/ contenidos/ proyectos/ ccpv/ cpv2010/ Default.aspx
Datos de salud: http:// www.sinais.salud.gob.mx/ estadisticasportema.html.
Máximo LÍO
Probabilidad Especificación
Comparando los resultados obtenidos con los dos métodos de estimación, notamos
que la especificación MESS confirma sustancialmente las conclusiones de la
estimación ML en términos tanto del signo como de la significación de los parámetros.
El personal de salud por cada 1.000 habitantes y el porcentaje de población mayor de
65 años parecen ser los factores más significativos para explicar la distribución
geográfica de los médicos en las 32 entidades federativas de México. Las estimaciones
puntuales de los parámetros son todas muy similares con una pequeña subestimación
del procedimiento MESS solo para el parámetro de dependencia espacial l y para el intercepto.
En ambos casos el parámetro l es negativo y no significativamente diferente de cero. Los
errores estándar también son todos notablemente similares. Con un tamaño de muestra
muy pequeño como el empleado en este ejemplo, la diferencia en los tiempos de cómputo
es obviamente insignificante. Sin embargo, el ejemplo muestra que en grandes conjuntos
de datos, la especificación MESS puede reducir sustancialmente la carga computacional
sin pérdida de precisión de las estimaciones.
norte
i *
Ly( )=
wy ijjÿ=1
j (5.26)
*
siendo wij la matriz de peso estandarizada (ver Ecuación (2.3)). En otros
términos, el retraso espacial se define como el promedio del valor yj observado
en todas las ubicaciones que son vecinas de la ubicación i. Esta expresión
implica que la dirección no importa ya que todos los vecinos (cualquiera que
sea su posición con respecto a la ubicación i) contribuyen de la misma manera
a la variable rezagada. Esta hipótesis, implícitamente asumida por todos los
modelos presentados hasta ahora, se conoce en la literatura como isotropía
(para una definición formal, véase, por ejemplo, Cressie, 1993).
El concepto de isotropía deriva de la física e implica que la estructura de
dependencia no presenta sesgos direccionales o direcciones preferidas.
La hipótesis de la isotropía se discute comúnmente en muchas ramas de
la estadística espacial. Por ejemplo, cuando se trata de datos espaciales
en meteorología, geología u otros fenómenos físicos (donde la dirección
es de suma importancia; véase, por ejemplo, Schabenberger y Gotway,
2002) o en aplicaciones de imágenes médicas donde, por ejemplo, la
anisotropía es demostró ser un buen predictor del riesgo de cáncer de
mama (Heine y Mahorta, 2002).
Los economistas siempre han sido conscientes de este problema. Por
ejemplo, el premio Nobel Clive Granger (1974) señaló que la suposición
de ausencia de sesgos direccionales es particularmente fuerte y poco
realista en la econometría espacial. Afirma que “si la dirección no importara,
el grado de relación de estas variables dependería únicamente de la
distancia entre los puntos. La relación entre los valores medidos en Oxford
y Londres será la misma que entre los valores medidos en dos pueblos de
Lincolnshire separados por 55 millas aproximadamente. La correlación
entre las cifras de desempleo en Nueva York y Filadelfia será la misma
que entre dos pequeños pueblos del medio oeste a unas cien millas de
distancia. Este supuesto de estacionariedad en el plano es completamente
irreal para las variables económicas” (Granger, 1974, p. 15).
Una manifestación particularmente común de la anisotropía es la asimetría
de las relaciones espaciales. De hecho, en el libro fundacional de la disciplina,
Paelinck y Klaassen (1979) identifican la asimetría como una de las cinco
características fundamentales de la econometría espacial. Un buen ejemplo de
Machine Translated by Google
ps ps
yyy= ++
r Vl yo r mi
yo Hm
yyl Vi=l re
%
+ (5.27)
yyhola=mr
%
+ mi
ps ps
# VVy HH rr #
referencia a esta situación simple, la asimetría implicarrque
yo
metro i
rrrVVV== ==
rrr # Además, que . Así, la asimetría implica anisotropía, pero
no al revés.
HHH
la isotropía implica simetría, pero la simetría no necesariamente implica isotropía.
2
= +ZbliidN
yuu ly ZI11)Wy +
22 W + | ÿ . . . (0, ÿ (5.28)
= bly
Z Wy uu+Z iid NI+ ) | ÿ . . . (0, ÿ
2 (5.29)
yo
metro i j
yo
(un) (b)
Figura 5.2 Dos matrices W diferentes que incorporan dos direcciones diferentes de dependencia espacial. (a) W1 = dependencia
de noroeste a sureste; (b) W2 = dependencia del sureste al noroeste. La celda i depende solo de las celdas l y m que siguen la
matriz de ponderación W1 , y solo de las celdas j y k que siguen la W2
matriz de ponderaciones.
Machine Translated by Google
Dejar tu
( ani ) = y Z Wy Wy ÿÿ ÿ bl l ÿ ÿbly yZ( Wy tuperturbaciones
ISO ) =
en los dos ser el
11 22
modelos en competencia. Las funciones logarítmicas de verosimilitud para
los modelos anisotrópico e isotrópico vienen dadas respectivamente por:
2
, llb IWWtodos
1 2,, ) constante
=
ÿ 1 en
Y YO (
ÿ ÿÿ
yo
11 22
2
1
(5.30)
ÿ
uu
( ANÍ
T
)( ) ANÍ
2ÿ 2
1 1 en (
2, , ÿ ÿÿ l onst IW uuc 2 ( TISO
) ISO )
yo (
ISO ÿ libras ) = (5.31)
2ÿ 2
Dadas estas definiciones, Arbia et al. (2013) desarrollaron una prueba de isotropía
considerando los estadísticos de la prueba de Razón de Verosimilitud (ver Ecuación (1.30)):
ˆˆˆ ˆˆ
Una prueba , llb ÿ, 2) ÿ 1ÿ,2
= 2 (ˆlANI
ÿ ÿ
ÿ ÿ
(ˆ ,2 , ÿ) lb
ÿ ISO ÿÿ (5.32)
ˆˆ ˆ
d 2 (5.33)
Una prueba ÿ &&&$c 1
= Z iidN 2
yuu + IZ)11
bl ly Wy22W+ + | ÿ . . . (0, ÿ
X
con y = ln ; ZXi =
eso
X
yo 0 , Xit el ingreso per cápita en la región i en el momento t y
yo 0
u el componente de error.
Los datos empíricos considerados se refieren a la renta per cápita en las 20 regiones
italianas ya consideradas en el ejemplo 1.1 en un período de tiempo que va desde el
año 2000 hasta el año 2008. Para identificar un sesgo direccional significativo, los
autores definieron 20 matrices W1 diferentes considerando a su vez cada región como
la que origina el sesgo direccional y las otras regiones siguen de manera similar al
tiempo satisfaciendo la restricción de contigüidad. Entonces, por ejemplo, la matriz W1
que se refiere a la región de Lombardía como origen del sesgo direccional se construye
de acuerdo con el esquema que se muestra en la siguiente figura. Así, en el gráfico,
Lombardía se codifica como “región 1” y no depende de ninguna otra región, las 4
regiones codificadas como “región 2” dependen únicamente de Lombardía, las 6
regiones codificadas como “región 3” dependen únicamente de las regiones codificado
como "región 2" y así sucesivamente.
Machine Translated by Google
2
3
3
1
2
2
2
3
3 3
4
4
5
5
6
6
10 7
Fuente: creación del autor utilizando el software "R" y archivos de forma disponibles en ISTAT que se
pueden descargar en la página web http:// www.istat.it/ it/ archivio/ 44523
Nota: Relación espacial anisotrópica procedente de la región de Lombardía. Cada región depende
únicamente de aquellas regiones con un número de código más bajo. La región 1 (Lombardía) es aquella
donde se origina el sesgo direccional y no depende de ninguna otra región.
Una prueba
(continuado)
Machine Translated by Google
Continuado
Una prueba
y Z=+
Wy+ bl
11l 22
Wy u + (5.34)
norte
L fyÿ2lbÿ ( , , )= m,
yyyoyy
( | ,
yyfilmando
estoy ) (5.35)
i =1
donde lm PN
, i () modo
ÿ de que cada densidad en el lado derecho solo está condicionada a los predecesores-
vecinos.
Usando los resultados estándar en distribuciones condicionales multinormales (ver, por ejemplo,
Anderson, 2003) y suponiendo que no hay covarianza cruzada entre las variables Z e y en diferentes
ubicaciones (es decir, ( )= ( )=0 Cov Z y Cov Z y im ), la expresión genérica para la función de densidad
condicional
Illinois 2 del lado derecho de (5.35) será ÿ con media condicional y varianzas dadas por:
(,) Nmc c
ÿ norte
lb ( + µ wym mm ij j l (1+ ) ÿ
C
=
ÿ
ÿ
ÿ ÿÿ)
ÿ
ÿ
2
zi ÿ
z )
yo
ÿ
j =1 + (1 ÿ ()
(5.36)
2 22 ÿ
2 litros
b z
ÿÿ
22
C
= ÿ
ÿ
ÿ
ÿ
2 2
(1 yo ) (1 yo )
ÿ ÿ
Machine Translated by Google
donde l¢ denota la correlación entre yl e ym, que es la correlación entre los predecesores de yi
que son vecinos de segundo orden entre sí (ver sección 5.2.1).
norte
L fy
2
( ÿ yy, ll, b ÿ , )= (
ÿ m,
yyyoyy yo|estoy, )
i =1
ÿ ÿ
(5.37)
1
norte ÿ norte ÿ
ÿ
ÿ
ÿ2ÿ
= constante ÿ ( 2 )2 ÿ exp
C
ÿ
2ÿ 2
ÿ
ÿ (y ic ÿ
metro ) ÿ
ÿ
ÿÿ
ci ÿ =1 ÿ ÿ
y la log-verosimilitud como:
2
norte 1 ÿ
norte
ÿ
, ÿ , ) = c onst
l (ÿ, ll segundo en (ÿc _2 ) (y ic
ÿÿ ÿ ÿ ÿ
ÿ metro )2
2 2 ÿ ci2 =1
ÿ ÿ
2 22 ÿ
ÿ n ÿ ln 2 2 litros
b z ÿ
, ll, b , ÿ) =
2 2
ÿ constante ÿÿ ÿ
ÿ ÿ
yo ( ÿ2 ÿ2
(1 yo ) (1 yo )
ÿ ÿ
ÿ ÿ
1 ÿ
ÿ '2
ÿ
2 ÿ2
ÿ ÿÿ" 2ÿ(1 ÿ
ÿ ÿ ÿÿ
yo ) 2 (1 )l libra
2 ÿ 22
ÿ ÿ
z ÿ
ÿ
norte
ÿ
yo
ÿ
norte ÿ
(5.38)
ÿ ÿ ÿ ÿ yo
yÿ m +
ÿ
ÿ
ÿ ( por
yo j
ÿ
metro ÿ ÿ )
yo = 1 (1+) yo
ÿj
=1
ÿÿÿ
ÿÿ
2
ÿÿ
b
+
ÿ
ÿÿÿ
ÿ2 ( zi µ z ) ÿ
ÿ
(1 yo )
ÿ
ÿÿ ÿ
Esta expresión no contiene ninguna inversión de matriz, por lo que su cálculo se puede ejecutar
de forma sencilla, incluso con un tamaño de muestra muy grande.
En este ejemplo, deseamos ilustrar los desempeños de la aproximación unilateral con respecto a
un enfoque de verosimilitud total. También compararemos los resultados con los obtenidos con la
especificación MESS discutida en la sección 5.1. Por esta razón, examinaremos nuevamente el
conjunto de datos sobre salud en los 32 estados mexicanos. Dado que en un modelo isotrópico
la dirección de proximidad no
signif.
códigos:
0 b0
b1
b2
b3
–0b4
l .049681
–
0.14109 Valor
estimado
0.064011 0.058434 0.186960
0.012195 0.139859
0.446938
'***' Máxima
verosimilitud
0.001
error Estándar
0.19208 0.025163 0.034338 0.031370
'**'
0.01
'*'
0.05
'.'
0.1
0.46263 0.01096* 0.14794 0.06250 0.000*** 0.75434
valor
p
''
1.
–
0.136520 –
0.049863 Valor
estimado
0.064794 0.058685 0.187352 0.124292
Especificación
MESS
error Estándar
0.16331 0.024870 0.037131 0.033965 0.012738 0.200922
0.43326 0.01475* 0.19049 0.09545 0.000*** 0.54136 valor
p
–
0.069582 –
0.047028 valor Estimado
0.066109 0.050829 0.184956 0.036752
Aproximación
Unilateral
error Estándar
0.046159
0.1317 0,023256
0,004473*** 0.034094
0.167774 0.031676
0.108572 0.011789
0.000*** 0.229270
0.872646
valor
p
188
Machine Translated by Google
Machine Translated by Google
yi ii= Z+ b mi
(5.39)
Machine Translated by Google
i=1…n, como en el modelo (3.13), pero ahora, en lugar de especificar el error en forma
autorregresiva como en (3.14), supongamos la siguiente distribución gaussiana bivariada conjunta
para cada par de perturbaciones, digamos i y l :
ÿmi
ÿ
i
( ) 2 ÿÿ0 ÿ il l Ni,
ÿ
ÿ
MVN ÿ ÿ 1 , () ÿÿÿ =yo l ni (5.40) ( )
ÿ
mi
ÿ ÿ ÿÿyo ÿ ÿ
Esta definición es muy general y similar a la adoptada en la Ecuación (5.20) en la sección 5.2.2;
sin embargo, aquí no pretendemos modelar simultáneamente el comportamiento aleatorio conjunto
de todas las n perturbaciones como en los modelos econométricos espaciales convencionales y
en la aproximación MESS , sino solo sus relaciones de 2 por 2 . Nótese que N(i), como siempre,
representa el conjunto de vecinos de la ubicación i y que la elección del criterio de vecindad no es
esencial para el método. En la Ecuación (5.40),
ÿ1ÿ
ÿy
ÿ ÿ =ÿ
ÿ
ÿ 1ÿ
ÿ
ÿy
controlando por la correlación espacial del error tal que y ÿ ÿ( 1; 1) + . El símbolo y se usa
intencionalmente en lugar del símbolo r más comúnmente usado en un contexto de error espacial
para resaltar las diferencias en su significado. La hipótesis (aparentemente restrictiva) de que la
correlación entre todas las unidades en un vecindario es la misma sin importar la dirección, se
deriva de la suposición de isotropía (implícitamente) hecha en toda la literatura de econometría
espacial (ver sección 5.3).
xx xx xx
xx xx xx
Figura 5.3 Patrón de codificación bivariado en una cuadrícula de celosía cuadrada regular
Machine Translated by Google
patrón de codificación.
Se pueden introducir fácilmente esquemas de codificación similares en esquemas espaciales
irregulares con una definición adecuada de vecindad. El objetivo de este procedimiento es
bastante claro: seleccionando pares de observaciones siguiendo el criterio de incluir dos unidades
espaciales vecinas, podemos retener la información espacial contenida en la muestra. Sin
embargo, al seleccionar pares de unidades espaciales que son, por definición, independientes
entre sí evitamos incurrir en problemas de estimación, típicos de los modelos econométricos
espaciales presentados en el Capítulo 3. La hipótesis de pares independientes, que puede
parecer demasiado restrictiva en a primera vista, tiene que ser considerado con referencia a la
definición de un barrio. De hecho, siempre podemos definir una vecindad de tal manera que
aquellos pares que no pertenecen a la vecindad estén lo suficientemente lejos para ser
independientes. Finalmente, considerar pares de perturbaciones aleatorias no es esencial para
el método y uno podría considerar igualmente tripletes y grupos de orden superior, siendo la
única justificación teórica para esta elección el teorema de Hammersley-Clifford y la consiguiente
restricción a la interacción por pares asumida por los modelos discutidos. por Besag (1974).
ÿ ÿ
1 ÿ
1 ÿ
ÿy yoÿ2 2 2 +
Feeil ( eeil ÿ yo l si
ÿ
ÿ
)=2 experiencia ÿ ÿÿ ÿÿ
2 pags ÿ
1 ÿ
y 2 2 1 2ÿ ( ÿ
y 2)
ÿÿ
(5.41)
si l Ni ÿ ( ), i=1,…,q
q
2 =
L(,ÿ, )por ÿfe e Illinois
( ee ) Illinois
i =1
q ÿ ÿ
1 ÿ
1 2
ÿ
= ÿ ÿ exp 2
ÿ
ÿee
ÿ 2 ey
2
yo +
enfermo ÿ
ÿÿÿ
yo = 1 2pags 2 1 ÿ
ÿy 2 ÿ2 1( ÿ
años
2
) ÿ
ÿ ÿ
ÿ
q
= (2 )
ÿ
q 2
ÿ
q 22
(ÿ ) (1 y )
ÿ
pag
ÿ
ÿ
1
q ÿ
ÿ (5.42)
" experiencia ÿ ÿ
ÿ
2 ÿ ÿy yoÿ2 2 2 si
ÿ yo l + ÿ
ÿÿÿ
2 ÿ2 1 ( ÿ
y ) i =1
ÿ ÿ
2 22
Const
q
,
l ( , ) ÿ= por q ln( )ÿ en(1 y )
ÿ ÿÿ
2
q (5.43)
1
ÿ
ÿy yoÿ2 2 2 si
+ enfermo ÿ
2 2 ÿÿ )
2 ÿ1 ( ÿ
y i =1
ÿ
qqq 2 qqq 2
22 2 il 22 2 il
1 =+= j 2 =+=
a ÿÿÿ yy y j
a ÿÿÿ ZZ Z =1j =1 =1
=1 =1 il j =1 yo
qqq 2 q q
3 =+= Zy yo
= Illinois +
a ÿÿÿ Zy Zy yo yo
jj a ÿ4 ÿ Zy Zy (5.44) yo i
=1il j
=1 =1 yo = 1 yo =1
q q
= =
un5 ÿZZ Illinois
un6 ÿyy i yo
i =1 i =1
ZZ
ÿ ZZ la por brevedad que es la suma
expresión que indicamos yo = 1
Illinois yo = 1 mal
ÿ Ni ( )
al mismo par (y de manera similar para las otras expresiones en las Ecuaciones
(5.44)). Emplearemos consistentemente esta simplificación notacional. Arbia (2014)
ha demostrado que, bajo los supuestos del modelo, la Ecuación (5.43) admite un
máximo, que este máximo es único y que se logra en los puntos obtenidos como
solución del siguiente sistema de ecuaciones no lineales:
ˆ
ˆ LMB 4
ÿÿ
ÿ
BML = Ay 3
ÿ
(5.45)
ÿ
segundo ˆ
ÿ
1 2 BML 5
ya
ÿ
q
ÿ
ÿ
ÿ ˆ 2
ÿ yo = 1
( 2
ojo ee 2 2
yo ÿ
ˆ
BML enfermo + )
BML =
ÿ ˆ 2
BML
ÿ
2 ( 1q y )
ÿ
ˆ2 ˆ ˆ2 ˆ
ÿÿ
ÿ ˆˆ ˆ
ÿ 21+3 BML 2 BML 2 BML 6 2 BML BML 5 +2 BML BML 4
aba ba ya yba yba
ÿÿ ÿ
=
ÿ
( ˆ 2
BML )
ÿ
ÿ
21q ÿ
y
ÿ
q
(5.46)
ÿ
ˆ
ÿ yo
i yo
6 45
ˆ
BML +
ˆ2
LMB
eea baba (5.47)
ÿ
BML = =
ÿ
y ˆ =1
2ÿ ˆ2
ÿ
BML BML
ÿÿÿ
q qÿ
2
ˆ ÿ
ya aaa 43 3
ÿ j =1q xyjj ˆ
b BML = == = 2q b ML (5.48)
2 ya un un
ÿ j
ÿ
51 1 2x _
j=1
q 2q
ˆ2 1 1 2
ÿ = ÿee
2 +ÿ yo 2
= ÿ mi
2
=ˆ (5.49)
BML
2q
ÿÿ litros ÿ
2q ÿj ML
yo = 1 j =1
En el artículo citado, Arbia (2014) demuestra que los estimadores BML se distribuyen normalmente,
son insesgados en muestras pequeñas y débilmente consistentes.
La matriz exacta de información de Fisher y los errores estándar exactos de
los estimadores también se derivan para ser utilizados en la estimación de intervalos de confianza y
pruebas de hipótesis. Además de las ventajas analíticas y computacionales, los estimadores BML
también brindan algunas ventajas interpretativas interesantes. De hecho, considere nuevamente la
expresión formal del estimador BML del parámetro de regresión b derivado en la Ecuación
ˆ
= un ya 3 4
ÿ
2 ya
1 5
covarianza entre Z e y (el término a3) aumentada con el término adicional –ya4 que representa el
desbordamiento espacial de la variable Z en una ubicación sobre la variable y en una ubicación vecina
que pertenece al mismo par (el término a4), ponderada con el parámetro de correlación espacial y. De
manera similar, el denominador representa la varianza de la variable independiente (el término a1)
aumentada con el término –2ya5 que representa la autocovarianza espacial de la variable Z (el término
a5), ponderada con la correlación espacial del término de error. La interpretación es bastante sencilla.
En el caso de correlación espacial de error positivo (y >0), si el desbordamiento espacial entre Z e y y
la autovarianza espacial de Z son de diferente signo, podemos monitorear el efecto multiplicativo de
un cambio en la variable Z sobre la variable y. En particular, si el desbordamiento espacial (a4) es
negativo y la autocovarianza espacial de Z (a5) es positiva, se enfatizará el efecto multiplicativo. La
expresión formal del estimador BML bˆ también muestra que, en presencia de una fuerte correlación
espacial positiva de la variable independiente, el efecto sobre y de una variación en la variable
independiente es más pronunciado en presencia de un desbordamiento positivo entre la variable
independiente dos variables Este resultado tiene una explicación intuitiva. De hecho, una ubicación se
beneficia no solo de un aumento de Z en la misma ubicación, sino también del aumento de Z en las
ubicaciones vecinas. Del mismo modo, la expresión formal de la BML
El estimador de ÿ (ecuación (5.45)) también muestra que podemos tener un mayor impacto de la
variable independiente en la variable dependiente incluso si no hay un desbordamiento espacial entre
las dos. De hecho, cuando a4 = 0, el efecto sobre y de una variación en la variable independiente será
más pronunciado si a5 > 0, es decir, en presencia de una correlación espacial positiva en la variable
independiente.
Como ya se mencionó, dado que la matriz de información de Fisher exacta se puede derivar
formalmente, la prueba de hipótesis estándar basada en la probabilidad
Machine Translated by Google
xx xx xx
xx xx xx
xx xx xx
xx xx xx
xx xx xx
xx xx xx
xx xx xx
xx xx xx
Figura 5.4 Cuatro esquemas de codificación bivariados diferentes para los datos de la Figura 5.3
se pueden aplicar procedimientos a esta nueva especificación. Sin embargo, este marco
de trabajo también permite un mayor enfoque para la evaluación del error estándar y para
la prueba de hipótesis basadas en la idea de remuestreo. Los métodos de remuestreo para
conjuntos de variables aleatorias dependientes tienen una larga tradición en estadística
que se remonta a las contribuciones anteriores de Solow (1985), Künsch (1989), Arbia
(1990) y Sherman (1996). La técnica de codificación bivariada presentada en esta sección
se basa en la identificación de una submuestra de pares de unidades.
Sin embargo, en cualquier situación empírica dada, el esquema de codificación bivariante
no es único. Incluso en el ejemplo muy simple que se muestra en la Figura 5.3 podemos,
de hecho, producir cuatro codificaciones diferentes (y, en consecuencia, cuatro estimaciones
diferentes de los parámetros del modelo) como se muestra en la Figura 5.4.
El número de configuraciones posibles podría ser incluso mayor cuando se trata de
datos espaciales irregulares, como los que se encuentran en aplicaciones prácticas. Al
tratar con un tamaño de muestra muy grande, podemos derivar muchos esquemas de
codificación bivariados posibles y, en consecuencia, muchas estimaciones diferentes de
los parámetros, lo que permite la derivación de una distribución de remuestreo. A este
respecto, el enfoque de codificación bivariada sugiere una forma formal de arrancar datos
espaciales en un contexto de regresión que preserva la condición de independencia entre
las submuestras sin destruir las características de dependencia espacial de los datos.
Arbia (2014) evalúa el rendimiento del método BML examinando tanto datos generados
artificialmente como conjuntos de datos reales. En particular, en Arbia (2014), el autor
muestra, por medio de algunos experimentos de Monte Carlo, que las estimaciones de
BML son muy precisas mientras que el tiempo de cómputo es insignificante: con un procesador Intel
Machine Translated by Google
procesador core i7 trabajando a 2,7 GHz, el tiempo requerido para los cálculos oscila entre
0,9 milisegundos cuando el tamaño de la muestra es n = 100 a 831 milisegundos cuando n =
2500.
5.5 Códigos R
>exp(A)
siendo A una matriz definida positiva real. Incluso si la exponencial de una matriz se define
como la serie infinita de Taylor, se aproxima utilizando la aproximación diagonal de Padé de
Ward (Moler y Van Loan, 2003).
El paquete R spdep también contiene una rutina para estimar un modelo de retraso espacial
utilizando la especificación MESS . El comando es muy simple y refleja de cerca el comando
para el modelo de retraso espacial correspondiente presentado en la sección 3.8. La sintaxis
del comando es la siguiente:
> mle <- maxLik(logLik = logLikFun, inicio = c(beta = 0, sigma = 1, lambda=0.2, rho=0.1))
Machine Translated by Google
con beta = 0, sigma = 1, lambda = 0.2, rho = 0.1 valores iniciales arbitrarios para la búsqueda
numérica del máximo y mle un nombre convencional para el modelo. Los resultados del
procedimiento de maximización se pueden visualizar escribiendo:
> resumen(mle)
coords<-coordenadas(poli)
luego identificamos para cada unidad el primer vecino más cercano a través del comando:
knn<-knearneigh(coords, k=1)
nn<-knn2nb(knn)
W<-nb2listw(nn)
• Big data •
Matrices de peso escasas y densas • Tiempo
de computación y limitaciones de almacenamiento •
Transformación exponencial de matriz • Vecinos de
primer orden • Vecinos de orden superior • Expansión
de potencia de matriz • Especificación espacial
exponencial de matriz • Isotropía y anisotropía • Sesgo
direccional de las relaciones espaciales • Asimétrico
relaciones espaciales • Modelos centro-periferia •
Prueba de isotropía • Modelo de rezago espacial
anisotrópico • Aproximación unilateral • Modelo de
rezago espacial unilateral • Predecesores-vecinos •
Verosimilitud compuesta • Verosimilitud por pares
• Pseudoprobabilidad
• Técnica de codificación bivariada •
Estimador de máxima verosimilitud marginal bivariada • Remuestreo
espacial y bootstrap espacial
Preguntas
Ejercicios
q = 3.
Ejercicio 5.2 Considere el caso de un modelo isotrópico y considere un
vecindario en el que cada unidad espacial tiene solo un vecino que no es
vecino de ninguna otra unidad. Derive la matriz W en esta hipótesis para
una muestra de dimensión n. Derive también la matriz (I – lW) y su
inversa. Recuerde la expresión formal de la matriz de varianza-covarianza
ÿ de un modelo de Rezago Espacial unilateral y derive su determinante |ÿ|.
Ejercicio 5.3 Dado el conjunto de datos utilizado en los ejemplos 3.3 y 3.4 y en los
ejercicios 3.6 y 4.8, y utilizando una matriz W estandarizada por filas , vuelva a estimar
un modelo de retraso espacial utilizando la especificación MESS. En los mismos
conjuntos de datos, defina una matriz W unilateral estandarizada por filas basada en
el primer vecino más cercano y estime nuevamente un modelo de retraso espacial unilateral.
Compare los resultados obtenidos con los tres métodos.
= ++ 1 y
y 1aw
1 12y2bw 1 13 3
mi
=++
y 2aw y2bw
21 1y 2 24 4 2
mi
=++ 31
y 3aw
3 34y34bw
3 1y
mi
=++
y 4aw y4bw43 3y 4 42 2 4
mi
yi ii = x+ ser
un
Fee ( eeil ) = ÿ ÿ ÿ ÿ mi 1+ (2
yo _ ÿ
yo
ÿ
el
Illinois
yo
un mi _ ÿ
1)(2 1) , = 1, , e iq
_ ÿ
ÿ
ÿ
!
; =r 4
Referencias al Capítulo
Anderson, T. (2003) Introducción al análisis estadístico multivariante, 3.ª edición,
Hoboken, Nueva Jersey: Wiley.
Arbia G., (1990) 'Sobre la no estacionariedad de segundo orden en redes bidimensionales
Processes', Computational Statistics and Data Analysis, 9, 147–60.
Arbia, G. (2006) Econometría espacial: fundamentos estadísticos y aplicaciones a la convergencia
regional, Heidelberg: Springer-Verlag.
Arbia, G. (2012) 'Simplificación de las fases de estimación y prueba de hipótesis en el modelado
econométrico espacial de grandes bases de datos', discurso de apertura de la 6.ª Conferencia
Mundial Anual de la Asociación de Econometría Espacial, Salvador Bahía, Brasil, 11 al 13 de julio.
Arbia, G. (2014) 'Inferencia de probabilidad por pares para regresiones espaciales estimadas en
conjuntos de datos muy grandes', Estadísticas espaciales, 7, 21–39.
Arbia, G., Bee, M. y Espa, G. (2013) 'Pruebas de isotropía en econometría espacial
Models', Spatial Economic Analysis, 8, 3, 228–40.
Bell, KP y Bockstael, NE (2000) 'Aplicación del enfoque de estimación de momentos generalizados a
problemas espaciales relacionados con datos de micronivel', Review of Economics and Statistics,
82, 72–82.
Besag, J. (1974) 'Interacción espacial y análisis estadístico de sistemas de celosía (con discusión)',
Journal of the Royal Statistical Society B, 36, 192–236.
Chiu, YM, Leonard, T. y Tsui, K. (1996) 'The Matrix-Logarithmic Covariance Model', Journal of The
American Statistical Association, 91, 198–210.
Cressie, N. (1993) Estadísticas para datos espaciales, Nueva York: Wiley.
Davis, RA y Yau, CY (2011) 'Comentarios sobre la probabilidad por pares en series temporales',
Statistica Sinica, 21, 255–77.
Granger, CWJ (1974) 'Análisis de series temporales y datos espaciales', en A. Scott (ed.),
Estudios en Ciencias Regionales, Londres: Pion.
Griffith, DA (2000) 'Propiedades de función propia y aproximaciones de matrices de incidencia
seleccionadas empleadas en análisis espacial', Álgebra lineal y sus aplicaciones, 321, 95–112.
Griffith, DA (2004) 'Funciones propias extremas de matrices de adyacencia para gráficos planos
empleados en análisis espacial', Álgebra lineal y sus aplicaciones, 388, 201–19.
Machine Translated by Google
Gumbel, EJ (1960) 'Distribución exponencial bivariada', Journal of the American Statistical Association,
55, 698–707.
Heine J. y Mahorta, T. (2002) 'Tejido de mamografía, riesgo de cáncer de mama, análisis de imágenes
en serie y mamografía digital: tejido y factores de riesgo relacionados', Acad. Radiol., 9, 298–316.
6
Conclusiones: ¿Qué sigue?
202
Machine Translated by Google
Referencias al Capítulo
Anselin, L. (1988) Econometría espacial: métodos y modelos, Dordrecht: Kluwer
Editores Académicos.
Arbia, G. (2006) Econometría espacial: fundamentos estadísticos y aplicaciones a la
convergencia regional, Heidelberg: Springer-Verlag.
Arbia, G. (2012) 'A Lustrum of SEA: Recent Research Trends After the Creation of the Spatial
Econometrics Association (2007–2011)', Spatial Economic Analysis, 6, 4, 377–96.
Arbia, G., Espa, G., Giuliani, D. y Mazzitelli, A. (2010) 'Detecting the Existence of Space-
Time Clusters of Firms', Regional Science and Urban Economics, 40, 5, 311–23.
Arbia, G., Espa, G., Giuliani, D. y Mazzitelli, A. (2012) 'Clusters of Firms on an Inhomogeneous
Space: The Case of High-Tech Industries in Milan in 2001', Economic Modelling, 29, 1 , 3–
11.
Baltagi, B., Kelejian, H. y Prucha, I. (2007) 'Análisis de espacialmente dependiente
Data', Journal of Econometrics, 140, 1, 1–4.
Besag, J. (1974) 'Interacción espacial y análisis estadístico de sistemas de celosía', Journal
of the Royal Statistical Society, Serie B, 36, 192–236.
Bivand, R., Pedesma, J. y Gomèz-Rubio, V. (2008) Análisis de datos espaciales aplicados
con R, Heidelberg: Springer-Verlag.
Cressie, N. (1993) Estadísticas para datos espaciales, edición revisada del original de 1991,
Nueva York: Wiley.
Cressie, N. y Wikle, C. (2011) Estadísticas para datos espacio-temporales, Hoboken, NJ:
Wiley.
Drukker, DM, Prucha, I. y Raciborski, R. (2013a) 'Estimadores de máxima verosimilitud y
mínimos cuadrados espaciales generalizados en dos etapas para un modelo autorregresivo
espacial con perturbación autorregresiva espacial', Stata Journal, 13, 2, 221– 41.
Drukker, DM, Prucha, I. y Raciborski, R. (2013b) 'Un comando para estimar modelos
autorregresivos espaciales con perturbaciones autorregresivas espaciales y variables
endógenas adicionales', Stata Journal, 13, 2, 287–301.
Drukker, DM, Peng, H., Prucha, I. y Raciborski, R. (2013c) 'Creación y gestión de matrices
de ponderación espacial con el comando spmat', Stata Journal, 13, 2, 242–86.
Ippoliti, L., Romagnoli, L. y Arbia, G. (2013) 'A Gaussian Markov Random Field Approach to
Convergence Analysis', Estadística espacial, 6, 78–90.
LeSage, J. y Pace, K. (2009) Econometría espacial introductoria, Boca Raton, FL:
Chapman & Hall/CRC Press.
Marcon E. y Puech, F. (2003) 'Evaluación de la concentración geográfica de industrias
utilizando métodos basados en la distancia', Journal of Economic Geography, 3, 4, 409–
28.
Marcon E. y Puech, F. (2010) 'Medidas de la concentración geográfica de industrias: mejora
de los métodos basados en la distancia', Journal of Economic Geography,
10, 5, 745–62.
McMillen, D. (2013) Regresión cuantil para datos espaciales, SpringerBriefs en
Ciencia Regional, Heidelberg: Springer-Verlag.
Partridge, MD, Boarnet, M., Brakman, S. y Ottaviano G. (2012) 'Introducción: ¿Adónde va la
econometría espacial?', Journal of Regional Science, 52, 2, 167–71.
Patuelli, R. y Arbia, G. (2014) The Spatial Econometrics of Spatial Interaction Models,
Heidelberg: Springer-Verlag (próximamente).
Ripley, B. (1981) Estadística espacial, Nueva York: Wiley.
Sain, SR y Cressie, N. (2007) 'A Spatial Model for Multivariate Lattice Data', Journal of
Econometrics, 140, 1, 226–59.
Machine Translated by Google
Ejercicio 1.1
1. Modelo 1
2. Modelo 2
modelo 3
3. El mejor modelo es el modelo 2 que alcanza el nivel de significación más alto de las estadísticas F con
un valor alto del R-cuadrado ajustado.
4. Modelo 4
207
Machine Translated by Google
Gales – 0.6329899
Escocia – 0.8822571
Irlanda del Norte – 1.1388039
norte de Inglaterra – 3.1397582
Noroeste de Inglaterra 2.5364883
Yorkshire y Humberside 1.2721572
Midlands Orientales – 0.5921008
West Midlands 0.4511717
anglia oriental – 0.2855529
Gran Londres – 1.0219450
Sudeste de Inglaterra 2.3965191
Sudoeste de Inglaterra 1.0370716
Ejercicio 2.1
Matriz W no estandarizada:
01100001
10111011
11010000
01101000
01010110
00001000
01001001
11000010
Matriz W estandarizada:
Ejercicio 2.3
L(X) = (26, 15,67, 23,67, 17, 24,5, 25,33, 27,25, 14, 26, 29, 25, 16, 24, 21,25, 20,33, 14,67, 17,5, 14,5,
20,5, 16, 14,5, 15, 20.67, 14, 21.5)
Unido_reg 1 4
3 5 8 12
22
34
32
12
43
256
551
467863
457
75
5 6 8 9 11 8
5 1 5 7 11 12
9 2 7 11 10 1
11 11 5 7 8 9
10 12 12 3 1 8
11
Ejercicio 2,5 L(VAB) = (6,7, 2,75, 5,95, 8,233, 5,44, 6,3, 9,42, 8,34, 10,45, 14,7, 10,3, 8,53)
Machine Translated by Google
14
12
10
5 10 15 20
VAB
Existe una relación positiva entre el VAB y su valor espacialmente rezagado (LGVA) mostrando correlación
espacial para esta variable.
Ejercicio 2.7
La falta de correlación espacial de los residuos debe aceptarse con un nivel de confianza del 49 %.
Machine Translated by Google
Ejercicio 2.9
0 27 UE UE_países 1 4
5 9 14 25 2 2 18 24
34
5 15 16 20 4
2
5 22
581
3 4 9 14 15 16 25 6 2
21 26
7 1 23
829
17
Machine Translated by Google
96
1 5 8 10 23 25
10 4
9 15 19 27
11 1
24
12 2
16 26
13 4
15 18 19 20
14 2
15
15 6
3 5 10 13 19 20
16 4
3 5 12 20
17 1
8
18 2
2 13
19 3
10 13 15
20 4
3 13 15 16
21 2
6 22
22 2
4 21
23 2
79
24 2
2 11
25 3
159
26 2
6 12
27 1
10
modelo SARAR
SEM
Estimar estándar valor z Pr(>|z|)
(Intercepción) 1.0294194 Error 35,9273 < 2e–16***
Valor de la 0.0014198 0.0286529 0.00079871,7776 0.07546 .
prueba educ 0.32931 1,7495 0.080209 .
Rho LR: 2.6041 0.10659
Estadística de Wald: 3,0607 0.080209 .
AIC: –92,005
SLM
Estimación estándar valor z Pr(>|z|)
(intersección) 0,66359077
0,00132915
educ Error 3,4780 0.0005052***
Lambda 0,34291, valor LR:
de3,1194
prueba 1,8712
0.19079632 0.00071032 0.0613180 .
Estadística de Wald: 3,5943
92,521AIC: – 1,8959 0.057977 .
0.077367 .
0.057977 .
= +; i ii y Xu bu Lu yo=ii( re
)+ ;
u yo
Luii ( )= ÿ r mi
(1)ÿ=L ui r mi
i
(1 )) =ÿÿyo
(1ÿLy
ii) +
r (1 rb r LX Lu
por=+
Ly+XeLX
iii iir rb
ÿ
y Ly=+Xr+LX
ii e
bg
ÿ
yo ii
Este es un modelo de retraso espacial con una variable independiente L(X) retrasada espacialmente.
No se puede emplear una estrategia OLS simple porque el coeficiente g está sujeto a la
restricción gr = b.
Machine Translated by Google
yx= tu
+ segundo
u wu = r ;
(1 -) r= tu
mi W
(1 ) = Wy
(1 ) WX
+ (1 Wu
ÿ ÿÿ r br r )
y X =+ segundo mi
T
Tee = (por Xy X ÿ
)( ÿ
b ) = min
T
(y( XIWI
ÿ
) ) ( ) Wy
ÿ) (ÿÿXbr rb T = min
con y=(
) ÿConsidere
ry IXI
WyWX
=( ahora
) ÿ r la un modelo .
deprobabilidad
SEM (Ecuación 3.23)
norte
yorb
2 21
( , ÿ,ÿ )ee= constante ÿ ÿÿ ÿ
en( ) 1 en ( IW IW
)r2 )(
ÿ
r
ÿ
T
2
1 IWIW
ÿ ( ) ( yX 1
b
ÿ
br Tr
yX ) (1 ) T ÿ
(
ÿ ÿ
ÿÿ ÿ ÿ ÿ
ÿ2 ÿ
)
T 1 T
ÿ
1
yX IWIW
ÿÿ ÿ
yXr ÿ
) ÿ br
ÿ ( ) ( ( segundo
ÿ
) ÿ
ÿ
( ÿ
) = min
( ) ( ) ( WyT br ry XIWI
ÿ ÿÿ T )( ) = min
ÿ
Xb
1 * *T TT TT ÿ ÿ
1 ÿ
( XXX
* y XP*)PX XP Py =( )
ˆ
T ÿ ÿ ÿÿ
11ÿ1 T
= (X XX y ) = b GLS
1 T
puesto ) ÿ r y 1como
P IWconsecuencia.
=( habiendo
1 T PAG ÿÿ ÿÿ = ( )( yo WI W ) rr . = ÿ ÿ
ˆ ÿ
1
T T
b GLS
rrr = XIWI
ÿÿ
( WX
ÿ
)(
ÿ
)
ÿÿ
T T
" r ÿWy
) ( XIWI
( r
ÿ ÿ
ÿ)
ÿ ÿ
con varianzas de error que se pueden obtener de la diagonal principal de la matriz (ver
Ecuación 1.48)
ˆ T T
ÿ
1
2 11 T = ÿ mi2 XIWI
Var b( )=GLS ÿÿ
( WX rr )( )
ÿ ÿ
( ÿ XX ÿÿ ÿ mi ) ÿÿ
1 wyij ii =
yi = yo + ÿ i ; con ÿi ii= + b X u . Además, dado ese
ÿ
norte
yo j=1 w
2
ui X iidN
ÿ . .(0, ÿ tu nnyo ) entonces:
mi( ÿi
)= ( EX u EX
yo+Eu
)=X( )+
yo (bb
)= b i i
= +tiÿr
y por
tu Wu
r =+ mi
(+ )=r yo por ti
( )= Yo Wu ÿ r mi
Machine Translated by Google
1
y Yo Wu =()ÿ +r
ÿ
1 uI W =( ) ÿ r mi
y por lo tanto:
=(IW
yIW + ) r re ) (
ÿ
1 ÿ
ÿ
1 = I WI W )( + ) ÿ r re
ÿ
1
[](
1 **
ÿ
1
= (IW ÿ r 2 2 = (IW ÿ r
ÿ
) mi ) mi
Este es un SLM
= ** *
y Wy Z ur br < + + 1
* * *
con matriz de peso 2 W W= y parámetro De 2r= . Dado que r <1, Después también r <1.
T
)=ÿ
T 2 IWIW 1
( )( )
ÿ ÿ
(
E yy mi
r
ÿ ÿ
r
1 T
=
ÿ ÿ
2 22IW
ÿ 22
_
( ÿ
IW
re )( ÿ
r )
1
2 2
ÿ
L (ÿ , libras
, ; y)=constante ÿ ÿ 2
mi
ÿ ÿ
ÿ
1 T
ÿ ÿ ( ÿ ÿÿ yI WZ
2 21yI WZ ÿÿ ÿ
ÿ 1 ÿ 2 21
" rb rb ( ) )
ÿ ÿÿ
ÿ ÿ
2ÿ
experiencia ÿ ÿ
2 ÿÿ ÿ ÿ ÿ
mi ÿÿ
Ejercicio 3.6
estimación ML
estimación FGLS
T TT
= ee e 2
= GG T.
Var ( )=
mi mi GG ÿe
ÿ1ÿ ... 1 ÿ
'
n1veces
ÿ
ÿ
norte
1
ÿ
ÿ ÿ
1 ... 1
2
'
norte
2
norte veces
GRAMO
= y GG T =
norte
ÿ metro ÿ
1 ... 1
ÿ
norte
metro
'veces ÿ
Ejercicio 4.2
Uniforme:
ÿ 1
ÿ Kdnorte
ÿre ( nn
) = 0.5 = 0.5 [ norte ]
1
ÿ
1
=1
ÿÿ ÿ
1
Machine Translated by Google
Epanechnikov (cuadrático)
1 1 1
ÿ 3
3 3 ÿ 4ÿ3ÿÿ3ÿÿ ÿ ÿÿ
ÿÿKd(ÿnn) ( =( 2 norte
1 ÿ
norte
2
) dn = 1 ÿ
norte ) d norte
= norte =1
ÿÿ ÿ
1
4 4 ÿ
1
ÿ
Cuadrático (bi-peso)
ÿ 1 1
15 2 15 2 2
ÿÿK ddd
(ÿ)
nn =
16
( (1 ÿ
norte
2
) norte
=
dieciséis
1 ÿ
norte ) norte
ÿÿ ÿ
1 ÿ
1
1
15
=
dieciséis
ÿ (1 2 + rennn ÿ
2 4
)
ÿ
1
ÿ 15 ÿ 2 norte
5
= += 1 norte
ÿ
norte
ÿÿ3
16 ÿ 3 5
ÿ ÿ
Ejercicio 4.3
yXu =
• segundo +
u wu = + re
Tenemos
1 uI W =( ) ÿ ÿ l mi
y consecuentemente:
mi ( )=0
T
ÿ
1
= ÿ- ÿl IWIWl
TE uu ( ( )= ÿÿ
ÿ
)( ÿ)ÿ
ÿ
Machine Translated by Google
Pi( =Py
1) X ( iii yo• 0 >
= wy , •)
Ji
= (PX
0 ,u)=
Xb wy
yo +) (Pu
(yo ÿÿ>XX
yo segundo
wy X, • ÿ b , , i• )
yo i i i yo i
norte
milímetro
12 metro
L = ÿÿ ÿ... ()
jm m d
ÿÿ ÿÿ ÿÿ
norte
1
con (p.a.
) = (2 ) 2 ÿ ÿ ÿÿ ÿ exp ÿÿdonde
ÿT = X yb
ÿ
ÿ ) , yo
2 ( ÿ mmmm yo ÿ ÿ ÿ i
T
ÿ
1
ÿÿ =
- l (IWIW
ÿ
ÿ
l )( )
ÿ
.
ÿ ÿÿ
Ejercicio 4.5
Probit estándar
AIC: 31.126
Probit ML
Probit GMM
Probit LGMM
Ejercicio 4.6
ÿ ÿ ÿ ÿÿ 100 011 1 ÿÿ
ÿ todos
ÿ ÿÿ ÿ1 00 1ÿ ÿÿ ÿ; ÿ ÿ ÿ ÿÿ =(
TI = AI W )= 0 1 0 1 0 0 = l l
norte
ÿ ÿÿ
ÿ10
ÿÿÿ
001 100 0 1 ÿ ÿÿ
ÿ
yo
ÿ
1 000 ÿÿ
todos ÿ
ÿ ÿ
yo 10000
ÿ
yo 01000
TÍ Aÿ
=
0001 ÿÿ
todos
000 10 ÿ
yo
ÿÿ
000 01 ÿ
yo
ÿ ÿ 100100
ÿÿ
010010
ÿ11ÿÿÿ 001001
T.J.
= ÿÿ11ÿÿ
ÿ yo
j T norte =
100100
010010
ÿÿ
001001
Ejercicio 4.7
SEM-RE
Coeficientes:
(Interceptar) –5.855669 0.640199 –9.1466 < 2.2e–16***
log(rgdp) 1.126815 0.065639 17.1669 <2.2e–16***
KKP
Coeficientes
(Interceptar) –1,57211 0.78284 –2,0082 0,04462* <
log(rgdp) 0,68644 0.08021 8,5580 2e–16***
Solo el término similar a KKP es significativo: por lo tanto, en el enfoque de efectos aleatorios,
concluimos en contra de la correlación espacial en la parte idiosincrásica del error, pero a favor de
la correlación espacial de los efectos individuales.
Machine Translated by Google
Ejercicio 4.8
AIC: 3277.6
Prueba LM para residuos
autocorrelación 0.013478 0.90758
GWR
I de Moran
estadístico = 12,578, valor p = 0,000597
Ejercicio 5.1
ÿ ÿ 00011010 ÿ ÿ 00000100
ÿÿ ÿÿ
00000100 00000000
00001011 00000100
10000111 00000000
W 2 = ; W =
3
10100001 00000000
01010010 10100001
10110100 00000000
ÿÿ
00111000 ÿÿ
00000100
3 wa
yo
9 27 2 3
Para l = 0.9502, entonces a = 3 ÿ, entonces S ÿ ÿÿi =0ÿ =1 3 + WWW
yo ! 26
Machine Translated by Google
ÿ 0 1 0 ... 0 ÿ
ÿ ÿ
yo ÿ 0 ... 0
ÿÿ
1
0 0 1 ... 0 ÿ01 ÿ
yo ÿ ... 0
W = ; IW
( yo
ÿ
)=
ÿ 2 ll l ... norte
ÿ
1 ÿ
1 ÿ
ÿ01 ÿ ... yo
norte
ÿ
1
( IW
)= 00l 1 yo ; 3 IW ÿ l = 1 .
ÿ
ÿ
ÿ
norte
0 0 ... ÿ ... 1 ÿ
1 ÿ
T :
IW=(
ÿ )) ÿÿ ÿyoIW ( yo , y, como AB AB =
1 T 1 T
( IW
) ( )IW
yo(IW
) IW ÿÿ ÿ ) =1
yo
ÿÿ ÿ ÿ
= ( yo
ÿ
Ejercicio 5.3
Probabilidad total
LÍO
Aproximación unilateral
Ejercicio 5.4
Condiciones de simetría:
aw ; 1=12 2
21aw bw ; 1=13 3
31aw = aw 3 34 4 43 2 24=4 42 ;
bw bw bw
Machine Translated by Google
Condiciones de isotropía:
ÿy1
ÿÿ
ÿ
0 wow
12 13 0 ÿ ÿ mi 1 ÿ ÿÿ
un1
ÿ ÿ ÿ ÿÿ
y2 21 _ 00 24 _ un
ÿ ÿÿ
= ÿÿ
= = 2
eÿ
= ÿÿ
2
ÿ ÿ ÿ ÿ ab ii ÿ ; ÿ ÿ ÿ = yo = 1,...,4 ÿ
y _
Wÿ ; ; mi ÿ ÿ ÿ un ; ÿ
y3 w 31 00 w 34 un3
ÿ
ÿ ÿ mi
3
ÿ
4
ÿÿÿÿÿÿÿy
0 wow
42 43 0 mi 4 un4
ÿÿÿÿ
ÿ ÿ ÿÿÿ ÿÿÿÿÿ
Expresión compacta:
T
= +
ya Wy e
Ejercicio 5.5
Probabilidad
q
ÿÿ ÿ ÿyoÿ_1 +
ÿ ÿ
el
le e=
yo
yo _ _
(2 un
ÿ
1)(2 mi
ÿ
ÿ 1)
ÿ
i =1
Log-verosimilitud
q
ÿ { ee il
}
ÿÿ ÿ ÿ
yo mi
ÿ = ln 1 + (2 1)(2 lee ee un
_
ÿ
yo
ÿ
ÿ 1)ÿ
ÿ
i =1
q qq
ÿ ÿÿ
ÿ
mi
ÿ
mi
= ÿÿ
ee un i yo
ÿ + ln 1 + (2 ÿ mi
i ÿ
1)(2 mi
yo
ÿ
ÿ 1)ÿ
=1ii
yo =1 =1
Condiciones
ÿÿ
q q
ÿ ÿÿ
ÿÿ ÿÿ ÿ segundo
yXyoyX
ll b ÿ ÿ( )( ) b
ÿÿ yo = 1 i =1
ÿÿÿ
q ÿÿ
ÿÿ
()yXi ()yX i b ÿÿ
yo yo
b ÿÿ
un mi 1)(2 mi
ÿ ÿ
1 +ÿ (2
ÿ +ÿ ln
ÿ ÿ 1) ÿ= ÿÿ
0ÿ
i =1
ÿÿÿ
2 ÿÿ
q q
ÿ ÿÿ
2 ÿÿ ÿÿ ÿ segundo
yXyoyX
ll b ÿ ÿ( )( ) b
ÿÿ yo = 1 i =1
ÿÿÿ
q ÿÿ
"
ÿÿ
()yXi () ib yX
ÿÿ
yo yo
b
1) 0ÿÿ<ÿÿ
ÿ ÿÿ
un mi 1)(2 mi
ÿ ÿ
ÿ ÿ ln+ 1(2 ÿ ÿ
i =1
ÿÿÿ
Machine Translated by Google
Índice
225
Machine Translated by Google
226 Índice
Índice 227
228 Índice
Índice 229
eficiencia, 80 software,
normalidad, 4, 18, 34, 58, 115, GeoDA, 204
123 Matlab, 204
imparcialidad, 4 PySAL, 204
pequeña muestra, R, 20
eficiencia, 76, 80, 101–2, 120, 130, 134– SPSS, 27
6 ESTADO, 204
imparcialidad, 4, 12, 22, 194 matrices de peso disperso, 167–8, 172, 198
pseudo-probabilidad, 5, 148, 189, 198
autorregresión espacial pura, 52 autocorrelación espacial, 11–12, 15, 22–3, 26–
7, 33, 36–9, 46–7, 49, 51, 73, 81–2,
núcleo cuadrático, 84, 92–3, 104, 110, 120, 150 –1
bipeso, 105, 154
espectral, 106, 154 arranque, 195, 198
tripeso, 106 modelos econométricos ver modelos
barrio caso de la reina, 27, 40, 47, 128, 180-1 métodos de expansión, 203
Procedimientos HAC, 104–5, 153, 158, 160
230 índice