Analisis Factorial y Kluster CCAA

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 86

Jean Monnet European Studies Centre

Universidad Antonio de Nebrija

DOCUMENTO DE TRABAJO NEBRIJA 2005/013

Análisis estadístico multivariante por Comunidades


Autónomas: diferencias y similitudes

Carlos Poza Lara∗


Carlos Poza Lara es profesor de teoría económica de la Facultad de Ciencias
Jurídicas, Económicas y Empresariales de la Universidad Antonio de Nebrija.
E-mail: [email protected]
Los Documentos de Trabajo sirven para una definición inicial de trabajos y líneas
de investigación promovidos por la Universidad Antonio de Nebrija. En el se
publican investigaciones originales en cinco idiomas de trabajo: español, inglés,
francés, italiano y portugués, en forma de artículos en vías de publicación,
comunicaciones a Congresos, además de otros trabajos de investigación, entre
los que caben citar extractos de Tesis Doctorales ya defendidas y merecedoras
de la máxima calificación y tesinas de Doctorado conducentes al DEA aprobadas
en la Universidad. Las opiniones y los juicios de los autores no son
necesariamente compartidos por la Universidad Antonio de Nebrija.

Derechos Reservados © 2005, por Carlos Poza Lara


Derechos Reservados © 2005, por el Jean Monnet European Studies Centre

Universidad Antonio de Nebrija


Facultad de Ciencias Jurídicas, Económicas y Empresariales
Campus de la Berzosa
28240 Hoyo de Manzanares (Madrid)

ISBN 84-88957-44-0
Serie Documento de Trabajo Nebrija, Módulo Europeo Jean Monnet

No está permitida la reproducción total o parcial de este artículo ni su almacenamiento o


transmisión para la venta, ya sea por procedimientos electrónicos, químicos, mecánicos,
por fotocopia u otros métodos, sin permiso previo por escrito de los titulares de los
derechos.
Análisis estadístico multivariante por Comunidades
Autónomas: diferencias y similitudes

Carlos Poza Lara


Resumen

Este documento de trabajo tiene como objetivo comparar la situación de las


Comunidades Autónomas en España, con el fin de conocer en términos generales
en qué se asemejan ciertas zonas y en qué se diferencian. Además, a partir de las
conclusiones obtenidas se detectan los problemas y las fortalezas de cada
comunidad, con la consecuente posibilidad de corregir y potenciar respectivamente
las situaciones de las mismas, mediante recomendaciones de política económica.
Los resultados desarrollados en este documento se basan en la aplicación de las
técnicas de análisis de datos multivariante: análisis factorial, análisis cluster y
análisis de la varianza; por consiguiente, los resultados son estadísticamente
significativos.

Palabras clave: Desarrollo económico y social, análisis factorial, análisis cluster,


política económica.

1. INTRODUCCIÓN

Este trabajo de investigación tiene como objetivo fundamental conocer la


situación económica y social, a grandes rasgos, de las diversas Comunidades
Autónomas que existen en España. Las razones del planteamiento de este
objetivo son las siguientes: primero, conocer las diferencias y similitudes entre
las diferentes regiones de nuestro país, esto es, saber las características que
agrupan zonas en nuestro país; y segundo, detectar las debilidades y fortalezas
de cada Comunidad Autónoma, de forma que podamos mejorar o paliar las
debilidades y potenciar las fortalezas existentes. Estas medidas de política
económica y social que se pretenden aplicar en última instancia tienen como
condición necesaria evaluar y comparar la situación de cada zona.

-3-
Poza, Carlos

Las hipótesis de la investigación de las que partimos hacen referencia tanto a


variables como a observaciones. En primer lugar, se intuye que, entre las
variables extraídas para el análisis existen parecidos, generándose así
problemas de intercorrelación. De esta forma la primera hipótesis que
formularemos es que existe multicolinealidad entre las variables a estudiar.

Otra hipótesis que podemos resaltar en este trabajo de investigación son las
similitudes y diferencias que existen entre las Comunidades Autónomas
(observaciones) de nuestro país. Así, aunque no sabemos a priori los grupos
que se van a formar sí que existe cierta intuición sobre los resultados que
vamos a obtener. Con lo que creamos la hipótesis de si existen diferencias o no
significativas entre Madrid-Extremadura-Ceuta-País Vasco-Galicia-Andalucía-
etc., que posteriormente analizaremos.

Por último, como tercera hipótesis destacamos la importancia de que exista


heterogeneidad inter-grupos significativa y homogeneidad intra-grupos. Hecho
que constatará la validez de los resultados finales del mismo.

Dados unos objetivos y planteadas las hipótesis, es conveniente desarrollar el


trabajo de una forma uniforme y ordenada, es decir, vamos a aplicar una
metodología capaz de analizar, explicar y aclarar todos los resultados. De los
tres existentes (método descriptivo, interpretativo y sintético) vamos a emplear
el descriptivo ya que la intención es describir someramente los resultados,
intercalando tablas, gráficos y texto que ilustren la realidad. No obstante,
también tendrá cierto carácter sintético, sobretodo por su extensión y forma de
expresar las conclusiones, e interpretativo, ya que de manera general se
valorarán los resultados obtenidos.

A través de este modelo extraeremos la máxima información posible de las


variables y observaciones exploradas mediante la fuente elegida, en este caso
el Instituto Nacional de Estadística (INE) (fuente secundaria oficial). Esta

-4-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

investigación además, se basa en datos de corte transversal, esto es, para el


año 20041 se han extraído las siguientes variables:

1. Índice de precios al consumo.


2. Tasa de paro.
3. Proporción de la población de 16 o más años analfabeta/sin estudios.
4. Proporción de la población de 16 o más años con estudios superiores.
5. Producto Interior Bruto per cápita.
6. Detenidos por 1000 habitantes.
7. Muertes violentas por homicidio.
8. Autopistas, autovías y carreteras de doble calzada (Km).
9. Entrada de turistas en valor absoluto.
10. Viviendas terminadas protegidas y libres.
11. Tasa de actividad.
12. Viviendas con Internet.
13. Personal en I+D.

Realizado el proceso de exploración de datos, con su correspondiente


extracción, elección y depuración de variables, al final vamos a trabajar con 13,
a partir de las cuales se relacionarán los diferentes casos (19 Comunidades
Autónomas2). Para cada Comunidad Autónoma se han extraído los valores de
las distintas variables, pudiendo realizar comparaciones entre ellas.

En primer lugar, a modo descriptivo se exponen diversos estadísticos


descriptivos de forma gráfica para conocer el valor de las variables para cada
observación, realizando comparaciones a priori para intuir los resultados
finales.

1
Nótese que algunas variables no son de 2004, aunque se ha trabajado con el
último dato disponible de la misma. Se indicará cuales para tomar con precaución
algunas conclusiones.
2
Ceuta y Melilla son Ciudades Autónomas, aunque para facilitar la ejecución de los
análisis las tomaremos como Comunidades Autónomas.

-5-
Poza, Carlos

En segundo lugar, se va a realizar un Análisis Factorial3 ya que se aprecia


cierta intercorrelación entre las variables a estudiar. De esta forma, los factores
son conocidos a priori y el diseño experimental se crea para obtener una
puntuación para cada individuo de los distintos factores. Esto es, se va a
aplicar un Análisis Factorial “confirmatorio”.

Posteriormente, en tercer lugar, realizaremos un Análisis Cluster o de


Conglomerados4 utilizando como variables los factores obtenidos en el factorial
anterior, donde se saturaban las variables iniciales. De esta forma obtendremos
grupos de Comunidades Autónomas, diferentes entre ellos y parecidos dentro
de ellos, con la ventaja de que serán más fáciles de interpretar y más visuales,
ya que el número de variables finales (Factores) son reducidas, en nuestro
caso serán tres.

Por último, antes de exponer las conclusiones es conveniente contrastar la


hipótesis de heterogeneidad inter-grupos, es decir, que el análisis cluster ha
agrupado de manera eficiente. Contraste que realizaremos mediante la
comparación de medias entre grupos (ANOVA).

Así, para concretar, el trabajo se desarrollará de la siguiente forma:


• Objetivos e hipótesis. (Descritos anteriormente)

3
“Es una técnica de reducción de datos. En ocasiones las bases de datos están
integradas por variables en las que aparece una amplia redundancia en la
información. Técnicamente se dice que son variables con un elevado nivel de
intercorrelación. Ello plantea el problema de la multicolinealidad. El análisis factorial
va a permitirnos sustituir el conjunto original de variables por un conjunto
sensiblemente menor en número de variables no observables llamadas factores.
Definidas como variables incorreladas que explican los elevados niveles de
intercorrelación presentes en las muestra. Estos factores, por tanto, amén de
eliminar la multicolinealidad describen las relaciones entre las variables”. (Manuel
García, C. (2005). Escuela de Estadística. UCM.)
4
Es una técnica que clasifica individuos en grupos de clasificación que no son
conocidos a priori. No sólo agrupa casos homogéneos sino que también nos da la
naturaleza o razón por las que se forman los grupos.

-6-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

• Aplicación de la metodología y resultados.


- Definir variables y casos.
- Análisis descriptivo.
- Análisis Factorial.
- Análisis Cluster.
- ANOVA.
• Conclusiones. Teniendo en cuenta objetivos e hipótesis.

2. APLICACIÓN DE LA METODOLOGÍA Y RESULTADOS.

2.1. Definición de las variables y casos.

La variable objeto de estudio va a ser la Comunidad Autónoma, concretamente


las 19 en las que se divide nuestro país. Así, éstas serán a su vez las
observaciones o casos a seguir y a analizar. La elección de esta variable como
la variable a explicar mediante las demás (que se expondrán a continuación)
radica en la importancia de saber en qué estado se encuentran para aplicar
políticas en un futuro corto plazo, y además detectar los problemas de cada
una por separado y de forma conjunta, obteniendo así economías de escala en
el esfuerzo de implementar las medidas correspondientes.

Para analizar estas observaciones hemos elegido 13 variables de entre otras


muchas, que por razones de operatividad y comprensión no se han incluido.
Además, en la fase exploratoria de datos se han depurado algunas de estas
variables, así como se han eliminado aquellas que sesgaban en exceso
nuestros resultados. Sin embargo, desde mi punto de vista éstas pueden
representar de forma general el estado en el que se encuentra una Comunidad
Autónoma. Esto es debido a la diversidad de las mismas, variables
estrictamente económicas, sociales, tecnológicas, de educación, de seguridad,
etc. Las cuales específicamente han sido seleccionadas debido a:

1. Índice de precios al consumo (IPC) Nos indica la tasa de inflación de


una zona. Elemento importante para conocer nuestra competitividad y
poder adquisitivo. Último dato 2004.

-7-
Poza, Carlos

2. Tasa de paro (tparo) Nos muestra el porcentaje de desocupados


respecto de la población activa. Es un buen indicador de los recursos
humanos ociosos en una economía. Último dato 2004.
3. Proporción de la población de 16 o más años analfabeta/sin estudios
(analfabe) Nos indica el número de analfabetos y personas sin
estudios por cada 100 habitantes. Indicador de la población con más
riesgo de sufrir exclusión económica y social. Último dato 2002.
4. Proporción de la población de 16 o más años con estudios superiores
(est_sup) Nos indica el número de personas con estudios superiores
por cada 100 habitantes. Indicador de la población con mayor
prosperidad y capacidad de crecer, ya que la educación es un fuerte
componente del crecimiento económico. Último dato 2002.
5. Producto Interior Bruto per cápita (PIBpc) PIB por habitante. Refleja
cuál es el nivel de vida medio de una economía, grosso modo. Último
dato 2002.
6. Detenidos por 1000 habitantes (detenido) Este indicador nos ofrece el
nivel de inseguridad de una zona. Y por consiguiente afectará a la
calidad de vida de la población. Último dato 2002.
7. Muertes violentas por homicidio (Homicidio) Este es otro indicador de
la inseguridad de una región, afectando nuevamente al estado de vida
de las personas. Último dato 2002.
8. Autopistas, autovías y carreteras de doble calzada (Km) (Carretera)
La longitud de las carreteras con alta capacidad de absorción de tráfico
es un indicador muy importante para conocer el estado de las
infraestructuras del transporte, ya que afecta indirectamente a muchos
sectores (turismo, empresas, mercado de trabajo...). El único
inconveniente es que la variable se encuentra en términos absolutos por
lo que al no tenerse en cuenta el tamaño de la Comunidad Autónoma
puede llevarnos a confusión. Por ello, debemos tomar precaución en las
conclusiones. Último dato 2003.
9. Entrada de turistas en valor absoluto (turistas) Indica cuál es la
afluencia de personas que pasan sus vacaciones en dichas
Comunidades Autónomas. Es importante porque refleja o representa
algunas características que a priori no se perciben. Por ejemplo:

-8-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

infraestructuras, clima, calidad de vida, comunicación, etc. Último dato


2003.
10. Viviendas terminadas protegidas y libres (viviendas) Refleja el
número de viviendas terminadas al que las personas pueden acceder.
Obviamente un número elevado de ellas incrementa la oferta
favoreciendo en último lugar la satisfacción de las necesidades de la
población. Último dato 2003.
11. Tasa de actividad (tactiv) Indicador que mide qué parte de la
población total es activa. Esto es, población activa entre población total.
Mide el grado de participación o fuerza laboral en el mercado de trabajo
de una economía. Último dato 2004.
12. Viviendas con internet (viv_Inter.) Mide qué parte de la población
accede a internet desde su hogar. Esta proporción refleja hasta qué
punto las nuevas tecnologías invaden las economías domésticas. Último
dato 2003.
13. Personal en I+D. (pers_imd) Este indicador hace referencia a las
personas que trabajan en I+D sobre el total. De este modo representa el
nivel de desarrollo de una zona, desarrollo en términos de investigación
e innovación. Último dato 2004.

Agregando la información de todas las variables podemos conocer la situación


de cada Comunidad Autónoma, sobretodo si realizamos comparaciones entre
ellas.

Para ello, en el siguiente epígrafe vamos a expresar mediante estadística


descriptiva y gráficos el estado de las variables para cada zona.

2.2. Análisis descriptivo.

La ordenación y presentación de los datos, que a continuación vamos a


desarrollar, ha superado la etapa de depuración5 de anomalías que nos hemos

5
La recogida de datos inicial estuvo compuesta por 42 variables de todo tipo
(escala, nominal y ordinal), las cuales generaban sesgos sobre la información de la

-9-
Poza, Carlos

encontrado cuando recopilamos los mismos. Así, para poder llegar a una
descripción inicial de las características más relevantes procederemos a
exponer la información extraída.

En la tabla 1 se pueden apreciar diferentes estadísticos descriptivos para cada


una de las variables seleccionadas en la investigación. En la primera columna
se encuentran las variables, en la segunda el número de Comunidades
Autónomas objeto de estudio, en la tercera y cuarta el valor mínimo y máximo
que toma la variable respectivamente, y en la última aparece una medida de
dispersión con respecto a la media, estadístico calculado en la columna
anterior.
Tabla 1. Estadísticos descriptivos

N Mínimo Máximo Media Desv. típ.


Índice de precios al
19 2,267 3,714 3,01553 ,379091
consumo
Tasa de paro 19 4,40 17,65 9,8247 3,28689
Proporción de
población de 16 o más
19 1,2 27,4 16,006 7,8973
años analfabeta/sin
estudios
Proporción de
población de 16 o más
19 13,6 26,8 17,858 3,9927
años con estudios
superiores
11291,9284 22064,4915 16640,0215 3145,41769
PIB per cápita 19
30 888 15382 955722
Detenidos por 1000
19 3,67 85,68 15,6405 24,91966
hab.
Muertes violentas por
19 ,37 2,18 1,0430 ,46558
homicidio
Autopistas, autovías y
carreteras de doble 19 0 2219 632,05 595,004
calzada (Km)
Entrada de turistas en 4176360,04
17 71641 11816977 3086914,94
valor absoluto 0
Viviendas VP+Libres 19 345 129689 26649,95 31996,837
Tasa de actividad 19 45,91 61,83 55,2111 4,25076
Viviendas con internet 19 19,14 40,40 29,3816 6,51857
Personal en I+D 17 ,08 30,42 5,8829 9,55020
N válido (según lista) 17
Fuente: elaboración propia a partir de datos del INE.

que queríamos disponer. De este modo optamos por seleccionar las más
relevantes, que tuvieran las mismas características en cuanto a medida y que nos
resultara más fáciles de interpretar sus resultados. Es decir, 13 variables con un
contenido multidisciplinar.

-10-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

A primera vista podemos destacar la gran variabilidad existente entre algunas


variables, hecho que indica la gran desigualdad que hay entre las distintas
Comunidades Autónomas de nuestro país. Por ejemplo podemos resaltar los
diferenciales en el IPC, en la tasa de paro, en el PIB per cápita, en el turismo,
en la tasa de actividad, en el personal en I+D, en general en todas, aunque no
en todas se da la misma desigualdad.

A continuación, vamos a desagregar esta información por Comunidades


Autónomas con el objetivo de comparar el comportamiento de cada una de las
variables sobre cada una de las zonas6.

En el gráfico 1 aparecen los diferenciales de inflación, y a primera vista las


Comunidades que superan la media española son Ceuta, Melilla, Murcia,
Navarra y Cataluña. Esto nos indica la pérdida de poder adquisitivo y
competitividad de dichas regiones, sobretodo comparado con el resto.

Gráfico 1. Índice de precios al consumo

4
3,5
3
2,5
2
1,5
1
0,5
0
m na

M e)
an )

om G ra
s e)

illa
a

id ia

M a
M ria

ra

C )
C an as

N cia

ia
C lles

a
ch

t
un a l i c

d
le o d

eu

ed
tre i a

(L
ar
C ri
b

el
ur
ad
an

ad
a
. L ta

Ex lenc
(I

av

M
ja
Ba pad

io
ar

Va

R
a
ci
rin

ad
(P

(C
id
un
s

rid
ria

om

ad
tu

C
As

Fuente: elaboración propia a partir de INE

En el gráfico número 2 se analiza la tasa de paro, indicador que nos muestra


las fuertes desigualdades existentes en el mercado de trabajo en España. En
peor situación se encuentran Extremadura, Andalucía y Galicia con elevadas

6
Para mayor detalle véase anexo.

-11-
Poza, Carlos

tasas. En el casi pleno empleo se sitúan La Rioja, Navarra y Aragón. La media


española es bastante alta (10%).

Gráfico 2.Tasa de paro


20
18
16
14
12
10
8
6
4
2
0
Comunidad

Melilla
Extremadura
Cataluña

Media
Rioja (La)
Cantabria

Galicia

Madrid

Ceuta
C. La
Canarias

Murcia
Andalucía

C. y León

País Vasco
Balears

Navarr
Aragón

Asturias

Fuente: elaboración propia a partir de INE

Si observamos ahora los gráficos 3 y 4 simultáneamente se ve cómo en


términos generales aquellas Comunidades Autónomas con un mayor número
de analfabetos/sin estudios tienen a su vez una menor proporción de la
población con estudios superiores, y viceversa, véase La Rioja, Madrid, Ceuta
y Melilla, Andalucía... Además, no podríamos continuar sin destacar
negativamente a Castilla-La Mancha, Andalucía y Extremadura como los peor
situados y a La Rioja, País Vasco y Madrid como las mejores en cuanto a nivel
de educación.

Gráfico 3. Proporción de población de 16 o más años


analfabeta/sin estudios
30,0

25,0

20,0

15,0

10,0

5,0

0,0
Comunidad

Melilla
Extremadura
Cataluña

Media
Rioja (La)
Cantabria

Galicia

Madrid

Ceuta
C. La
Canarias
Andalucía

Murcia
C. y León

País Vasco
Balears

Navarr
Aragón

Asturias

-12-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Fuente: elaboración propia a partir de INE

Gráfico 4. Proporción de población de 16 o más años con


estudios superiores

30,0
25,0
20,0
15,0
10,0
5,0
0,0

m na

M e)
an )

om G ra
s e)

illa
a

id ia

M a
C )
M ria
C an ias

r
N ia

ia
C lles

a
ar
ch

t
un al i c

d
le o d

eu
c

ed
tre i a

(L
b

el
av
C ar

ur
ad
an

ad
. L ta

Ex lenc
(I

M
ja
Ba pad

io
ar

Va

R
a
ci
rin

ad
(P

(C
id
un
s

rid
ria

om

ad
tu

C
As

Fuente: elaboración propia a partir de INE


Continuando con el análisis descriptivo por Comunidades se puede apreciar las
grandes diferencias en términos de PIB per cápita (gráfico 5), zonas como
Madrid, País Vasco y Cataluña aglutinan un índice bastante elevado
comparado con regiones como Extremadura, Andalucía, Galicia y Castilla-La
Mancha con valores muy inferiores al resto. Esto muestra la gran desigualdad
económica que existe dentro del territorio nacional.

Gráfico 5. PIB per cápita


25.000,00

20.000,00

15.000,00

10.000,00

5.000,00

0,00

Fuente: elaboración propia a partir de INE. Datos en euros.

En los gráficos 6 y 7, relacionados con la seguridad ciudadana, destacan


negativamente Ceuta y Melilla, con valores desmesurados con respecto a los

-13-
Poza, Carlos

demás, debido a la fuerte entrada diaria de personas procedentes de


Marruecos, con un nivel de vida y educación muy inferior al de España y no
controlados como parte de la población de la zona, lo que genera cierto
descontrol en lo que se refiere a la seguridad civil. No obstante, Canarias,
Baleares, Murcia y la Comunidad Valenciana no se quedan atrás en
inseguridad, tanto en número de detenidos como de homicidios. Por el
contrario, regiones como Extremadura, La Rioja, Castilla-La Mancha y Castilla-
León gozan de índices mucho más bajos que el resto.

Gráfico 6. Detenidos por 1000 hab.


90,00
80,00
70,00
60,00
50,00
40,00
30,00
20,00
10,00
-
M e)
m na

illa
a

id ia

ta
M a

C )
an )

om G a

N ia
C an as
s e)

a
C lles

ch

ar
a bri

ur

d
un lic

eu
(L
tre cia
le o d

el
C ri

ur
av
ad
ad
an
. L ta
a

M
(I

ja
Ex len
Ba ad

io
ar
p

Va

R
ci
in

ad
r

(C
(P

id
un
s

rid
ria

om

ad
tu

M
As

Fuente: elaboración propia a partir de INE

Gráfico 7. Muertes violentas por homicidio por 1000 hab.

2,50

2,00

1,50

1,00
0,50

-
a

M )
an )

om Ga a
s e)

illa
a

id ia

ta
M ria

C )
C ant s

r
N a
de
C les

tre i a n

a
ar
ur
C ria

ch

ci
un l i c
le o d

eu
(L
ab

el
av
ur
ad
(Il

an

ad
a

Ex enc

M
ja
Ba ad

io
ar

l
p

Va

R
a
ci

.L
rin

ad
(P

(C
id
un
s

rid
ria

om

ad
tu

C
As

Fuente: elaboración propia a partir de INE

Respecto al gráfico 8 resaltamos a Andalucía y Castilla y León por su elevado


número de kilómetros de carreteras, obviamente debido a la extensión de su

-14-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

territorio, y a zonas como el País Vasco, Madrid y Cataluña como aquellas con
un gran número de kilómetros sin ser de las más extensas. Hecho que indica el
buen desarrollo de sus infraestructuras de transporte. En cambio, nota negativa
se llevan Extremadura y Castilla-La Mancha ya que a pesar de ser
Comunidades de elevada extensión no disfrutan de Kms de carretera
proporcionales a su tamaño.

Gráfico 8. Autopistas, autovías y carreteras de doble


calzada (Km)
2.500

2.000

1.500

1.000

500

0
M e)
m na

illa
a

id ia

ta
M a

C )
an )

om G a

N ia
C an as
s e)

a
C lles

ch

ar
a bri

ur

d
un lic

eu
(L
tre cia
le o d

el
C ri

ur
av
ad
ad
an
. L ta
a

M
(I

ja
Ex len
Ba ad

io
ar
p

Va

R
ci
in

ad
r

(C
(P

id
un
s

rid
ria

om

ad
tu

M
As

Fuente: elaboración propia a partir de INE

Gráfico 9. Entrada de turistas en valor absoluto

12000000
10000000
8000000
6000000
4000000
2000000
0
M )

ís arr
rin Ar a
Ba pad ón

s e)

M ria

.y a

ad Ca ón

om G ra

N ia

a)
C an as

Ex enc a
m na

id ia

ja o
an )

de
C les

C ch

ñ

R asc
c
un alic

(L
u
le o d

C ari
b
g

Le

a
Va talu

Pa av
ur
lu

ad
an
(Il

. L ta

i
a

ad
da

V
io
An

ar

re
l
a
ci

t
(P

(C
id
s

un

rid
ria

om

ad
tu
As

Fuente: elaboración propia a partir de INE

En el gráfico 9, entrada de turistas, se corrobora en datos lo que comúnmente


se sabe, Cataluña, Canarias, Baleares, Andalucía, la Comunidad Valenciana y

-15-
Poza, Carlos

Madrid son las Comunidades Autónomas que más turismo reciben en términos
absolutos con respecto a las demás zonas.

Si vemos el gráfico 10, donde se contabilizan las viviendas terminadas tanto


protegidas como libres, Andalucía, Cataluña, la Comunidad Valenciana y
Madrid son las regiones con un incremento mayor de la oferta, hecho que
indica la fuerte inversión tanto pública como privada en lo referente a sector de
la construcción.

Gráfico 10. Viviendas VP+Libres

140000

120000

100000

80000

60000

40000

20000

0
Comunidad

Melilla
Extremadura
Cataluña

Rioja (La)
Cantabria

Galicia

Madrid

Ceuta
C. La
Canarias

Murcia
Andalucía

C. y León

País Vasco
Balears

Navarr
Aragón

Asturias

Fuente: elaboración propia a partir de INE

En el siguiente gráfico (gráfico 11) se puede apreciar el impacto de las nuevas


tecnologías de la información sobre los hogares de España, es decir, como han
absorbido las economías domésticas por Comunidades Autónomas el
desarrollo de internet (variable representativa de las TIC, aunque obviamente
existen otras). Nuevamente, en términos de desarrollo económico aparecen
destacadas sobre las demás Madrid, Cataluña y País Vasco y, por el contrario,
Castilla y León, Extremadura, Andalucía y Galicia se sitúan en niveles inferiores
a la media.

-16-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Gráfico 11. % Viviendas que disponen de acceso a internet


45
40
35
30
25
20
15
10
5
0

Comunidad

Melilla
Extremadura
Cataluña

Media
Rioja (La)
Cantabria

Galicia

Madrid

Ceuta
C. La
Canarias
Andalucía

Murcia
C. y León

País Vasco
Balears

Navarr
Aragón

Asturias

Fuente: elaboración propia a partir de INE

Respecto a la tasa de actividad existente en nuestro país se observa que las


diferencias no son tan pronunciadas como en otros conceptos, sin embargo,
zonas con más actividad económica suelen tener tasas de actividad en el
empleo mayores, verbigracia, Madrid y Cataluña (gráfico 12).

Gráfico 12. Tasa de actividad


70

60

50

40

30

20

10

0
Comunidad

Melilla
Extremadura
Cataluña

Media
Rioja (La)
Cantabria

Galicia

Madrid

Ceuta
C. La
Canarias
Andalucía

Murcia
C. y León

País Vasco
Balears

Navarr
Aragón

Asturias

Fuente: elaboración propia a partir de INE

Para concluir esta primera impresión sobre las diferencias y similitudes entre
Comunidades Autónomas vamos a resaltar el personal empleado en
investigación y desarrollo sobre el total. Siguiendo el gráfico 13 podemos

-17-
Poza, Carlos

apreciar que, sin duda alguna, Madrid, Cataluña y País Vasco engloban la
mayor parte de la población española que se dedica a la I+D, siendo los
centros de investigación del país. En torno a la media se encuentran Andalucía
y la Comunidad Valenciana. Y prácticamente sin aportación se encuentran
Baleares y Extremadura.

Gráfico 13. Personal en I+D sobre total


35
30
25
20
15
10
5
0
a

M )
C les)

ra
ar de)

id ia
M ia

M )
C rias

r
N a

ia
de
tre i a n

a
ar
ch

ci
c
r

ed
(L
. L tab

av
ur
ad

l
(Il

an

ad
Ba ado

Ex nc

om Ga

ja
an

m
n
s

le

io
a
p

un
Va

R
a
ci

le
rin

ad
C
(P

(C
id
un
s

rid
ria

om

ad
tu

C
As

Fuente: elaboración propia a partir de INE

Una vez realizado el correspondiente análisis descriptivo de las variables a


estudiar y observadas grosso modo las diferencias y similitudes entre las
distintas Comunidades Autónomas es conveniente expresar esta información
de una forma más rigurosa. Para ello, vamos a emplear técnicas de análisis
estadístico multivariante: análisis factorial y análisis cluster. Con ellas
trataremos de contrastar las hipótesis planteadas al principio, así como
estructurar y hacer más visual la investigación.

2.3. Análisis factorial.

La intención con este tipo de análisis es agrupar aquellas variables en las que
exista una fuerte intercorrelación. Esto es debido a que a priori se intuye cierta
repetición en la información mostrada. Con esto se intentará que las 13
variables seleccionadas se saturen en pocos factores, capaces de explicar el
contenido de las mismas de una manera clara y sintética. Es más, el propósito

-18-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

es realizar, como dijimos al comienzo de la investigación, un análisis factorial


“confirmatorio”, donde las 13 variables se agrupen en 3 factores (siempre y
cuando expliquen un gran porcentaje de la varianza total).

Sin más preámbulos, pues, comencemos a estudiar la viabilidad del análisis:

1º) La evaluación de llevar a cabo el análisis factorial es positiva, ya que por un


lado existe una fuerte correlación entre algunas de las variables (véase anexo,
matriz de correlaciones), por otro lado, muchos de los p-valores son inferiores a
0,05 lo cual nos hace rechazar la hipótesis nula (correlación es nula), lo que
significa que la correlación no puede admitirse nula, aunque no debemos
deducir que sea necesariamente grande. Además, la medida de adecuación
muestral de Kaiser-Meyer-Olkin (KMO) se sitúa en torno al 0,6-0,7 lo que
también valida ejecutar el análisis factorial. Y por último, mediante el test de
esfericidad de Barlett se aprecia que su significance es inferior a 0,05,
aceptando la hipótesis alternativa de que la de matriz de correlaciones no es la
identidad (ver anexo). Con todo esto aceptamos que existe el problema de la
multicolinealidad y procede aplicar el análisis.

2º) Dado el conjunto de variables intercorreladas vamos a extraer 3 factores


(todos ellos con autovalores, según criterio de Kaiser, superiores a 1), los
cuales explican casi el 77% de la varianza total, donde el primer factor (F1) es
el más importante de los tres (ya que explica más variabilidad que ningún otro)
(ver anexo, varianza total explicada). Además, a través del gráfico de
sedimentación podemos observar un pico en el tercer factor hecho que
corrobora la buena elección de escoger tres factores. Y por último, si
apreciamos las matrices de componentes, especialmente la rotada (método
Varimax) para tres factores el F1 es el que más explica seguido de F2 y F3.

Como era de esperar las variables saturadas en cada uno de los factores
poseen una alta intercorrelación, que extrapolado al objetivo de nuestra
investigación hace que podamos nombrar cada uno de los factores en función
de las variables que agrupa. Así:

-19-
Poza, Carlos

Factor 1 (F1): construido por PIBpc, Viviendas con internet, Proporción de la


población de 16 o más años analfabeta/sin estudios, Proporción de la población
de 16 o más años con estudios superiores, Tasa de actividad y Personal en I+D
sobre total.

Por lo que se va a denominar Factor DESARROLLO ECONÓMICO Y SOCIAL.

Expresado como un índice:

F1 (DESARROLLO ECONÓMICO Y SOCIAL) = 0,977 PIBpc + 0,851


Viv_internet + 0,806 est_super – 0,797 Tparo – 0,728 analfab + 0,661 Tactiv +
0,582 Pers_imd

De esta ecuación podemos resaltar, en primer lugar, la elasticidad de cada


variable explicativa sobre la explicada, siendo el PIBpc la que mayor impacto
tiene sobre el factor o variable explicada. Y en segundo lugar, que tanto la tasa
de paro como la población analfabeta/sin estudios tienen una relación inversa
con el factor, esto es, cuanto mayor es el paro o analfabetos tanto más
perjudicará al factor, y por ende, al desarrollo económico y social de una
Comunidad Autónoma.

Factor 2 (F2): formado por Detenidos por 1000 habitantes, Muertes violentas
por homicidio e IPC.

Por lo que se va a denominar Factor PRECARIEDAD.

Expresado como un índice:

F2 (PRECARIEDAD) = 0,926 Homicidio + 0,912 Detenido + 0,789 IPC

De esta ecuación podemos decir que los homicidios es la variable que más
peso tiene sobre el factor. Además, como existe un relación directa entre las
variables y el factor deducimos que cuanto mayores sean los valores de las
variables más impacto tendrá sobre el factor. En términos prácticos, cuantas

-20-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

más muertes por homicidios, más detenidos y más alta sea la tasa de inflación
menor será la calidad de vida, que es lo mismo que decir que mayor será la
precariedad de la población civil.

Y por último:

Factor 3 (F3): formado por Viviendas terminadas protegidas y libres;


Autopistas, autovías y carreteras de doble calzada (Km) y Entrada de turistas
en valor absoluto.

Por lo que se va a llamar Factor INFRAESTRUCTURAS EN VALOR


ABSOLUTO.

Expresado como un índice:

F3 (INFRAESTRUCTAS) = 0,917 Viviendas + 0,757 Carretera + 0,741 Turistas

Por último, a través del gráfico de componentes en espacio rotado se puede


observar cómo las variables entre las que existe intercorrelación se agrupan en
un mismo factor. Este gráfico es tridimensional ya que aglutina tres factores.
Variables como el PIBpc, la tasa de actividad, la tasa de paro, las viviendas con
internet, la población analfabeta/sin estudios y con estudios superiores y el
personal en I+D se agregan en el F1 (se encuentran en torno al componente
1), otras variables se saturan en el F2 y el resto en el F3, tal y como se analizó
anteriormente (véase anexo).

No obstante, hemos descompuesto el gráfico anterior en tres partes:


comparación F1-F2; comparación F1-F3 y comparación F2-F3. En todas las
comparaciones las variables se agrupan alrededor o cerca del factor donde se
satura junto con el resto de variables que pertenecen a ese mismo factor.

-21-
Poza, Carlos

Gráfico 14

Gráfico de componentes en espacio rotado


1,0 detenidos por 1000 h
entrada de turistas

tasa de actividad

,5 viviendas con intern


muertes violentas po
viviendas vp+libres
proporción de poblac pib per cápita (2002
personal en i+d

tasa de paro
0,0 autopistas, autovías

índice de precios al proporción de poblac

-,5
Factor 2

-1,0
-1,0 -,5 0,0 ,5 1,0

Factor 1

Fuente: elaboración propia a partir de INE

Gráfico 15

Gráfico de componentes en espacio rotado


1,0
autopistas,
viviendasautovías
vp+libres

personalalen i+d
índice de precios

,5 muertes violentas po
entrada de turistas
tasa de paro
viviendas con intern
proporción de poblac tasa de actividad
proporción de poblac
pib per cápita (2002
0,0
detenidos por 1000 h

-,5
Factor 3

-1,0
-1,0 -,5 0,0 ,5 1,0

Factor 1

Fuente: elaboración propia a partir de INE

-22-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Gráfico 16

Gráfico de componentes en espacio rotado


1,0
viviendas vp+libres
autopistas, autovías

índice de precios al personal en i+d

,5 muertes violentas po
entrada de turistas
tasa de paro
viviendas con intern
proporción de poblac tasa de actividad
proporción de poblac
pib per cápita (2002
0,0
detenidos por 1000 h

-,5
Factor 3

-1,0
-1,0 -,5 0,0 ,5 1,0

Factor 2
Fuente: elaboración propia a partir de INE

2.4. Análisis Cluster.

Saturadas las variables en factores, ahora vamos a agrupar a los individuos


objeto de estudio de nuestra investigación, en conglomerados, con el fin de
distinguir en qué se parecen y en qué se diferencian las Comunidades
Autónomas de España.

Las variables a través de las cuales se va a realizar el análisis cluster son los
propios factores extraídos en el apartado anterior. Esto es, atendiendo al
desarrollo económico y social, a la precariedad y a las infraestructuras vamos a
aglutinar Comunidades Autónomas. Dichos grupos deberán ser heterogéneos
entre sí y homogéneos dentro de sí.

Una vez que averigüemos los cluster formados procederemos a interpretar en


qué se asemejan y en qué se diferencian. Esto es importante detectarlo ya que
las políticas económicas y sociales que se vayan a aplicar serán más eficaces.

-23-
Poza, Carlos

Aclarada la justificación de la aplicación del análisis cluster, vamos a comenzar


a formar los grupos. En primer lugar, decir que como la muestra es poco
numerosa (19 Comunidades Autónomas) utilizaremos un análisis cluster
jerárquico aglomerativo. Y en segundo lugar, observando tanto la matriz de
distancias, como el historial de conglomeración, el conglomerado de
pertenencia, el diagrama de témpanos vertical, así como el dendograma,
hemos llegado a la conclusión de que seleccionaremos cinco cluster, ya que
desde mi punto de vista es el que mejor interpreta y resume la realidad de los
datos. Obviamente, si hubiéramos elegido otras variables las agrupaciones
generadas, probablemente, hubieran sido otras.

Partiendo de la matriz de distancia podemos decir que cuanto mayor sea el


coeficiente, más distancia y diferencia existirá con respecto al resto, y a la
inversa cuanto más pequeño sea. Así, podemos apreciar a priori cuáles son las
Comunidades Autónomas en las que existe una gran similitud y en cuáles una
mayor diferencia. Por ejemplo, Andalucía tiene bastante parecido con Canarias
y Extremadura (coeficiente bajo), sin embargo, grandes diferencias con
respecto al País Vasco, Navarra o Madrid.

En el historial de aglomeración se identifican los clusters combinados en cada


paso del análisis cluster. Así, el primer paso se da claramente entre Ceuta y
Melilla. Posteriormente, se unen Galicia y Castilla-La Mancha y así
sucesivamente hasta formar los 5 cluster seleccionados como el número
idóneo.

Respecto al conglomerado de pertenencia recoge las soluciones según el


número de clusters fijado; en nuestro caso hemos seleccionado un rango de 3
a 7, para comparar cuál de ellos tiene más sentido para el trabajo de
investigación. Concretamente para 5 clusters el análisis describe perfectamente
las diferencias y similitudes entre las Comunidades Autónomas, siempre, claro
está, atendiendo a las variables elegidas. Es decir, nos dice a qué grupo
pertenece cada individuo (Comunidad).

-24-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Si la elección hubiera sido inferior las medidas o políticas a aplicar serían


demasiado generales, ya que demasiadas zonas estarían agrupadas en un
solo conglomerado. No obstante, desagregaciones superiores hubieran
provocado información demasiado personalizada y las medidas tendrían que
ser muy específicas, y no es ese el objetivo ya que entonces no habríamos
ejecutado un cluster.

Toda esta información expresada en tablas (ver anexo) también se puede


apreciar mediante el diagrama de témpanos vertical y el dendograma. Ambos
nos muestran cómo se van combinando los casos paulatinamente.

Analizada la información anterior llegamos a la conclusión de que las


Comunidades Autónomas se agrupan en 5 clusters. Estos cluster están
compuestos por:
Tabla 2
CLUSTER COMUNIDADES AUTÓNOMAS
Cluster 1 (C1) Andalucía
Cluster 2 (C2) Aragón, Asturias, Baleares, Canarias,
Cantabria, Castilla-La Mancha, Castilla
y León, Comunidad Valenciana,
Extremadura, Galicia y Murcia.
Cluster 3 (C3) Cataluña y Madrid
Cluster 4 (C4) Navarra, País Vasco y La Rioja
Cluster 5 (C5) Ceuta y Melilla
Fuente: elaboración propia

Conocidos los conglomerados, vamos a dar un paso más, vamos a detectar por
qué se han formado esos grupos y no otros, esto es, que hay de común dentro
de los grupos y que no hay de común entre ellos (ver gráficos 17, 18 y 19).

-25-
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
3
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
Andalucía
Poza, Carlos

Aragón

Asturias (Principado de)

Fuente: elaboración propia

Fuente: elaboración propia


Balears (Illes)

Canarias

Cantabria

Castilla - La Mancha

Castilla y León

-26-
Cataluña

Comunidad Valenciana

Extremadura

Galicia

Gráfico 18. PRECARIEDAD


Madrid (Comunidad de)

Murcia (Región de)


Gráfico 17. DESARROLLO ECONÓMICO Y SOCIAL

Navarra (Comunidad Foral de)

País Vasco

Rioja (La)

Ciudad autónoma de Ceuta

Ciudad autónoma de Melilla


WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Gráfico 19. INFRAESTRUCTURAS

2,5

1,5

0,5

Navarra (Comunidad Foral de)

Ciudad autónoma de Melilla


Ciudad autónoma de Ceuta
Asturias (Principado de)

Madrid (Comunidad de)


-0,5

Comunidad Valenciana
Castilla - La Mancha

Murcia (Región de)


Balears (Illes)

Castilla y León

Extremadura
-1

Rioja (La)
País Vasco
Andalucía

Cantabria

Cataluña
Canarias

Galicia
Aragón

-1,5

Fuente: elaboración propia

El C1 goza de un muy bajo factor desarrollo económico, pero por el contrario


existe buena calidad de vida (o factor precariedad negativa), y un factor
infraestructura en valor absoluto bastante elevado, gracias en gran medida a
las viviendas terminadas y al turismo. También por el número elevado de
kilómetros de autopista, autovías y carreteras de doble calzada; sin embargo
debemos tener en cuenta el tamaño de Andalucía. En esta situación no se
encuentra ninguna otra Comunidad Autónoma.

El C2 tiene como características similares un escaso factor desarrollo


económico y social salvo Baleares y la Comunidad Valenciana. Por el contrario,
la mayoría de ellos gozan de una calidad de vida bastante aceptable (poca
precariedad), con escasos homicidios y detenidos y con una tasa de inflación
en torno a la media. Y por último, en cuanto a las infraestructuras en valor
absoluto, en general se sitúan con valores escasos, salvando Baleares,
Canarias y la Comunidad Valenciana compensado fuertemente por la variable
entrada de turistas.

-27-
Poza, Carlos

El C3 tiene la capacidad de desarrollo económico y social que casi ninguna otra


región disfruta. Con bajas tasas de paro, elevadas tasas de actividad, PIBpc de
los más altos, etc. El factor precariedad afecta a ambas zonas de una forma
ligeramente distinta, pero en ningún caso radicalmente diferente, ya que
aunque Madrid tenga un mejor factor calidad de vida (inversa precariedad) que
Cataluña el diferencial es mínimo. Por último, las infraestructuras siguen una
línea parecida aunque ligeramente más alto el valor del F3 para Cataluña,
generado por una mayor afluencia de turismo.

Respecto al C4 podemos decir que resalta el gran desarrollo de dichas


Comunidades Autónomas, cercanas al pleno empleo, fuerte tasa de actividad,
niveles educativos avanzados, PIBpc elevados, etc. La precariedad en este
cluster es negativa, favoreciendo el bienestar de la población aunque en el
caso del factor infraestructuras en valor absoluto se encuentra por debajo de
los más destacados, con entrada escasa de turistas y con tamaño pequeño, de
ahí la menor cantidad de viviendas y carreteras7.

El último conglomerado, nº 5, está formado por Ceuta y Melilla con niveles


negativos en todos los aspectos. Es decir, sufren una fuerte desigualdad con
respecto al resto de Comunidades Autónomas.

Esquemáticamente expresaremos los resultados para cada cluster de forma


que el policy maker tenga la información suficiente cómo para conocer el
estado de los mismos.
Tabla 3
CLUSTER F1 F2 F3
Cluster 1 (C1) - + +
Cluster 2 (C2) - + -
Cluster 3 (C3) + - +
Cluster 4 (C4) + + -
Cluster 5 (C5) - - -

7
Téngase en cuenta que el factor infraestructuras está medido en términos
absolutos, por lo que la extensión de la Comunidad Autónoma influye directamente
en el indicador.

-28-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Fuente: elaboración propia

Demostrada de forma descriptiva la homogeneidad8 intra-grupal, donde todos


los casos que componen cada conglomerado cumplen los mismos “requisitos”,
pasaremos ahora a observar el comportamiento inter-grupos. Para ello será
necesario seguir la tabla 3 donde aparece el estado de cada cluster en general
sobre los factores9 (extraídos en el análisis factorial).

El cluster peor situado es el nº 5, con comportamiento negativo desde todas las


perspectivas. El cluster nº 2 sólo destaca por el factor precariedad, siendo muy
escasa. El C3 compuesto por Madrid y Cataluña posiblemente sea el mejor
posicionado junto con el nº 4. Y por último, Andalucía (C1) tiene una situación
harto especial, ya que si bien su F2 y F3 son elevados, en cambio su factor
desarrollo económico y social deja mucho que desear.

2.5. Análisis de la varianza.

Obtenidos los resultados para los distintos grupos que conforman el trabajo de
investigación, cinco clusters, y apreciada la heterogeneidad intergrupos, vamos
ahora a contrastar estadísticamente que realmente no existe homogeneidad
entre ellos.

Para ello, aplicaremos un análisis de la varianza (ANOVA) para contrastar la


hipótesis siguiente:

Ho: Igualdad de medias inter-grupos

No obstante, antes de llevar a cabo el ANOVA es necesario comprobar la


hipótesis de igualdad de varianzas. En este caso nos plantearemos la
hipótesis:

8
Nótese que la demostración no es válida en un análisis estadístico, necesitamos
pues una contrastación de hipótesis que lo corrobore. Se realizará en el siguiente
apartado.
9
Véase también los gráficos 20, 21 y 22 donde se expresan los factores en media
para cada conglomerado. Siguiente apartado.

-29-
Poza, Carlos

Ho’: Igualdad de varianzas inter-grupos

Esta hipótesis la contrastamos mediante el estadístico de Levene. Observado


su p-valor (anexo), al ser superior a 0,05 no rechazamos (aceptamos) la
hipótesis nula de homogeneidad de varianzas.

Con esto aplicamos el ANOVA y podemos ver que no existe igualdad de


medias (véase en anexo p-valor inferior a 0,05), por lo que al rechazar la Ho
decimos que no hay homogeneidad entre grupos. Esto es, el análisis cluster ha
formado conglomerados heterogéneos entre ellos. Ha sido válido y eficiente.

A través del cuadro nº 4, podemos ver los estadísticos descriptivos más


relevantes, estando las diferencias de medias entre grupos ya contrastadas.

Tabla 4
Informe

Average Linkage DESARROLLO ECONÓMICO


(Between Groups) Y SOCIAL PRECARIEDAD INFRAESTRUCTURA
1 Media -1,4188215 -,2427166 2,4516806
N 1 1 1
Desv. típ. . . .
2 Media -,3812524 -,3712761 -,1603973
N 11 11 11
Desv. típ. ,66873684 ,41396593 ,55109150
3 Media 1,5081058 ,2979381 1,4750288
N 2 2 2
Desv. típ. ,38771718 ,57047341 1,01691020
4 Media 1,2116824 -,4622693 -,7911908
N 3 3 3
Desv. típ. ,36923295 ,48559376 ,55091772
5 Media -,5193302 2,5588426 -,6318974
N 2 2 2
Desv. típ. ,01676241 ,00996027 ,01263188
Total Media ,0000000 ,0000000 ,0000000
N 19 19 19
Desv. típ. 1,00000000 1,00000000 1,00000000

Fuente: elaboración propia

Además, gráficamente se pueden observar las diferentes medias de cada


factor respecto a cada cluster. En el gráfico 20, aparecen los distintos
conglomerados (eje de abcisas) en relación con el factor desarrollo económico

-30-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

y social. Y en el 21 y 22, lo mismo para el resto de factores. Obviamente, la


información de los gráficos coincide con toda la expuesta en el apartado
anterior (tabla 3).

Gráfico 20

2,0

1,5

1,0
Media Factor Desarrollo Económico y Social

,5

0,0

-,5

-1,0

-1,5

-2,0
1 2 3 4 5

Average Linkage (Between Groups)


Fuente: elaboración propia

-31-
Poza, Carlos

Gráfico 21

3,0

2,5

2,0

1,5

1,0
Media Factor Precariedad

,5

0,0

-,5

-1,0
1 2 3 4 5

Average Linkage (Between Groups)


Fuente: elaboración propia

-32-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Gráfico 22

1
Media Factor Infraestructura

-1
1 2 3 4 5

Average Linkage (Between Groups)


Fuente: elaboración propia

3. CONCLUSIONES: Principales resultados y recomendaciones.

En este último apartado se van a exponer de manera simplificada los


resultados finales de todos los análisis.

- A través del análisis descriptivo de las variables iniciales se puede observar


cómo Ceuta y Melilla son las zonas que peores resultados ofrecen. Alta tasa de
paro, PIBpc bajo, poca seguridad, etc. También podemos destacar otras zonas
como Andalucía, Extremadura, Galicia, Castilla-La Mancha, Castilla y León,
etc. con valores nada destacables en sentido positivo, obviamente en términos
generales. Por último, quisiera resaltar la situación de Comunidades
Autónomas como Navarra, País Vasco, Madrid o Cataluña con niveles mucho

-33-
Poza, Carlos

mejores que el resto del país, niveles referidos prácticamente en todos los
ámbitos.

- Para un estudio menos engorroso se realizó un análisis factorial de forma que


las distintas variables seleccionadas y depuradas que tuvieran intercorrelación
nos sirvieran para agruparlas en factores y que tuvieran carácter de indicadores
a la hora de interpretar resultados.

De este modo las variables se saturaron en tres factores:

1º) Factor Desarrollo Económico y Social: construido por PIBpc, Viviendas con
internet, Proporción de la población de 16 o más años analfabeta/sin estudios,
Proporción de la población de 16 o más años con estudios superiores, Tasa de
actividad y Personal en I+D sobre total.

2º) Factor Precariedad: formado por Detenidos por 1000 habitantes, las
muertes violentas por homicidio y el IPC.

3º) Factor Infraestructuras en valor absoluto: donde se saturaban las viviendas


terminadas protegidas y libres, los Kms de carreteras y la entrada de turistas.
- Al estudiar el comportamiento de estos tres factores (indicadores) mediante
un análisis cluster para agrupar Comunidades Autónomas en función de sus
similitudes, se observa que se generan 5 grupos o conglomerados:

C1: Andalucía.
C2: Aragón, Asturias, Baleares, Canarias, Cantabria, Castilla-La Mancha,
Castilla y León, Comunidad Valenciana, Extremadura, Galicia y Murcia.
C3: Cataluña y Madrid.
C4: Navarra, País Vasco y La Rioja.
C5: Ceuta y Melilla.

- Analizando estos conglomerados, en primer lugar, se van a enumerar los


problemas detectados dentro de cada uno de ellos, y en segundo lugar,

-34-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

aprovechando esa información se van a proponer algunas medidas de política


económica que podrían corregir los problemas detectados en la primera fase:

a) El problema fundamental del C1 se centra en el escaso desarrollo del


F1. Esto es, bajo desarrollo económico y social. Traducido en términos
más desagregados, existen datos de tasas de paro muy altos, una
población, en comparación con el resto, con menor formación a nivel
educativo, con un PIBpc bastante inferior a los demás, etc.

Estos problemas hacen que fijemos el objetivo de conseguir un mayor


crecimiento económico, y desarrollo de otros aspectos para paliar esta
situación negativa. Dichas medidas podrían ser: incrementar las
reformas estructurales, especialmente en el mercado de trabajo
(flexibilizar su mercado para reducir las elevadas tasas de paro,
incrementar la actividad, generar empleo, para así crecer
económicamente y aumentar el nivel de vida) y al unísono aplicar otras
medidas estructurales que favorezcan el desarrollo de otras variables del
F1, como por ejemplo relativas al sistema educativo y tecnológico.

b) El C2 tiene como inconvenientes principales un escaso factor desarrollo


económico, aunque no tan acentuado como en el C1. Además, en este
cluster también existen problemas de infraestructuras en valor absoluto,
con un menor número de viviendas, carreteras, así como una menor
entrada de turistas en sus territorios, salvo alguna excepción ya
comentada a lo largo de la investigación.

Así, las recomendaciones a seguir serían por un lado, mejorar el


mercado de trabajo (similar al caso de Andalucía), y por otro, generar
más inversión en infraestructuras (viviendas, carreteras y otras que
favorezcan al turismo). Esto es, gasto público y formación bruta de
capital que genere tanto puestos de trabajo en el corto plazo como
beneficios de diversa índole en el futuro.

-35-
Poza, Carlos

c) El conglomerado nº 3, formado por Madrid y Cataluña es quizás el mejor


cluster. En términos de desarrollo económico y social es el más
avanzado, destacando también su aportación en infraestructuras. Claro
está, son las zonas más desarrolladas.

No obstante, como cualquier región tiene sus puntos negativos,


específicamente, existe cierta precariedad en la calidad de vida de los
madrileños y catalanes, en cuanto a estas variables se refiere. Es decir,
existe una tasa de inflación bastante alta, lo que produce una pérdida de
poder adquisitivo de la población. Además, la inseguridad existente es
ligeramente elevada lo que afecta nuevamente en el transcurso diario
del modo de vida.

Para corregir esta situación, en primer lugar, se debería controlar el


crecimiento de los precios en general. En este caso se debería realizar
un análisis más pormenorizado sobre qué sectores son los que más
inciden en el nivel de precios (viviendas, carburantes, etc.). No obstante,
este no es nuestro objetivo.

Junto a esto se deberían incrementar las medidas de integración, control


y seguridad que hagan reducir los índices de criminalidad en estas
regiones.

d) Respecto al C4, cuya situación también es bastante destacable desde el


punto de vista del desarrollo económico y social y el de la calidad de
vida, con niveles situados por encima de la media nacional. Decir
también que poseen las mejores tasas de paro de toda España, con
diferenciales cercanos al pleno empleo. El problema a corregir sería el
del factor infraestructuras en valor absoluto, en lo referente a la escasa
afluencia de turistas, en relación con el resto de Comunidades
Autónomas. Además, hay que tener en cuenta que tanto el número de
Kms de carreteras como el número de viviendas, en parte están
condicionados por la extensión geográfica. Obviamente, esto sabemos
que provoca un ligero sesgo en nuestros resultados.

-36-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Las medidas a llevar a cabo estarían centradas en mejorar las


condiciones para favorecer la entrada de turistas, mediante promociones
rurales y culturales, mejoras en la oferta de servicios y otras actuaciones
más específicas dentro de las cuales no vamos a entrar.

e) Por último, del conglomerado nº 5 deberíamos destacar la necesidad de


aplicar medidas10 tanto coyunturales como estructurales para modificar
el estado de dichas zonas, en todas sus vertientes: desarrollo
económico y social, calidad de vida e infraestructuras.

De este modo, a través de estas políticas se podrían reducir las


diferencias entre Comunidades Autónomas y así conseguir reducir la
heterogeneidad entre cluster, y por qué no disminuir también su número.

Por medio del siguiente cuadro resumen se pueden observar los problemas y
políticas para corregirlos.

Tabla 5. Problemas y recomendaciones.


CLUSTER PROBLEMAS RECOMENDACIONES
C1 o Escaso desarrollo Reformas estructurales
económico y social. mercado de trabajo y sistema
educativo.
C2 o Relativo bajo Reformas estructurales en
desarrollo económico general e inversión en
y social. infraestructuras.
o Escasa
infraestructura.
C3 o Ligera Precariedad. Control de los precios y de la
seguridad ciudadana.
C4 o Escaso factor Mejora infraestructuras y
infraestructura, condiciones para acceso a
especialmente turistas.
turismo.
C5 o Escaso desarrollo Reformas coyunturales o a c/p
económico y social. y estructurales o a l/p en
o Precariedad. general, especialmente sobre
o Escasez de factor sector terciario.
infraestructuras.
Fuente: elaboración propia

10
Tanto Ceuta como Melilla son Objetivo nº 1 de la Unión Europea en lo que
respecta a la redistribución de los Fondos Estructurales y de Cohesión.

-37-
Poza, Carlos

- Para demostrar la validez de estos resultados realizamos una contrastación


sobre la hipótesis de igualdad de medias entre grupos (o cluster). El análisis se
saldó favorablemente ya que se rechazó la hipótesis de homogeneidad inter-
grupal, con lo que la desagregación y comparación entre grupos es
estadísticamente significativa.

- Para concluir quisiera destacar que el objetivo de la investigación ha sido


cumplido. Se han aplicado diferentes técnicas de análisis de datos multivariante
para conocer cuáles son las diferencias y semejanzas, en términos generales,
entre las Comunidades Autónomas de España, de forma que hemos detectado
cómo mejorar esa situación. Sin embargo debemos tener en cuenta la
limitación de algunas variables para explicar las diferencias totales entre
Comunidades.

-38-
ANEXO

-39-
Poza, Carlos

Análisis Descriptivo

Tabla 1. Estadísticos descriptivos

N Mínimo Máximo Media Desv. típ.


Índice de precios al
19 2,267 3,714 3,01553 ,379091
consumo
Tasa de paro 19 4,40 17,65 9,8247 3,28689
Proporción de población
de 16 o más años 19 1,2 27,4 16,006 7,8973
analfabeta/sin estudios
Proporción de población
de 16 o más años con 19 13,6 26,8 17,858 3,9927
estudios superiores
PIB per cápita 19 11291,928431 22064,491589 16640,02151538 3145,4176995572
Detenidos por 1000 hab. 19 3,67 85,68 15,6405 24,91966
Muertes violentas por
19 ,37 2,18 1,0430 ,46558
homicidio
Autopistas, autovías y
carreteras de doble 19 0 2219 632,05 595,004
calzada (Km)
Entrada de turistas en
17 71641 11816977 3086914,94 4176360,040
valor absoluto
Viviendas VP+Libres 19 345 129689 26649,95 31996,837
Tasa de actividad 19 45,91 61,83 55,2111 4,25076
Viviendas con internet 19 19,14 40,40 29,3816 6,51857
Personal en I+D 17 ,08 30,42 5,8829 9,55020
N válido (según lista) 17
Fuente: elaboración propia a partir de datos del INE.

-40-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
Índice de precios al
19 100,0% 0 ,0% 19 100,0%
consumo * CC.AA.(2004)
a. Limitado a los primeros 100 casos.

Tabla 2. Índice de precios al consumoa

Índice de
precios al
consumo
CC.AA.(2004) Andalucía 1 2,982
Aragón 1 2,748
Asturias (Principado de) 1 2,920
Balears (Illes) 1 2,748
Canarias 1 2,267
Cantabria 1 2,747
Castilla - La Mancha 1 3,099
Castilla y León 1 2,803
Cataluña 1 3,473
Ciudad autónoma de 1 3,714
C t autónoma de
Ciudad 1 3,714
M lill
Comunidad Valenciana 1 2,999
Extremadura 1 2,497
Galicia 1 3,008
Madrid (Comunidad de) 1 2,995
Murcia (Región de) 1 3,370
Navarra (Comunidad 1 3,370
F lVasco
País d ) 1 3,032
Rioja (La) 1 2,809
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-41-
Poza, Carlos

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
Tasa de paro
19 100,0% 0 ,0% 19 100,0%
* CC.AA.(2004)
a. Limitado a los primeros 100 casos.

Tabla 3. Tasa de Paroa

Tasa de paro
CC.AA.(2004) Andalucía 1 16,07
Aragón 1 5,52
Asturias (Principado de) 1 10,36
Balears (Illes) 1 8,02
Canarias 1 10,76
Cantabria 1 11,26
Castilla - La Mancha 1 10,26
Castilla y León 1 10,54
Cataluña 1 9,37
Ciudad autónoma de 1 9,37
C t autónoma de
Ciudad 1 9,37
M lill
Comunidad Valenciana 1 10,07
Extremadura 1 17,65
Galicia 1 12,57
Madrid (Comunidad de) 1 6,91
Murcia (Región de) 1 9,86
Navarra (Comunidad 1 5,14
F lVasco
País d ) 1 9,17
Rioja (La) 1 4,40
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-42-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
Proporción de población
de 16 o más años
19 100,0% 0 ,0% 19 100,0%
analfabeta/sin estudios
* CC.AA.(2004)
a. Limitado a los primeros 100 casos.

Tabla 4. Proporción de población de 16


a
o más años
analfabetos/sin estudios

Proporción de
población de
16 o más años
analfabeta/sin
estudios
CC.AA.(2004) Andalucía 1 24,9
Aragón 1 10,1
Asturias (Principado de) 1 14,0
Balears (Illes) 1 17,3
Canarias 1 20,8
Cantabria 1 9,5
Castilla - La Mancha 1 27,4
Castilla y León 1 9,3
Cataluña 1 13,4
Ciudad autónoma de 1 23,5
C t autónoma de
Ciudad 1 23,5
M lill
Comunidad Valenciana 1 11,3
Extremadura 1 25,7
Galicia 1 23,3
Madrid (Comunidad de) 1 9,9
Murcia (Región de) 1 24,3
Navarra (Comunidad 1 6,9
F
País lVasco
d ) 1 7,9
Rioja (La) 1 1,2
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-43-
Poza, Carlos

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
Proporción de población
de 16 o más años con
19 100,0% 0 ,0% 19 100,0%
estudios superiores *
CC.AA.(2004)
a. Limitado a los primeros 100 casos.

Tabla 5. Proporción de población de 16


a
o más años con estudios
superiores

Proporción de
población de
16 o más años
con estudios
superiores
CC.AA.(2004) Andalucía 1 14,8
Aragón 1 18,6
Asturias (Principado de) 1 16,0
Balears (Illes) 1 14,3
Canarias 1 17,6
Cantabria 1 18,3
Castilla - La Mancha 1 13,7
Castilla y León 1 19,1
Cataluña 1 18,9
Ciudad autónoma de 1 13,6
C t autónoma de
Ciudad 1 13,6
M lill
Comunidad Valenciana 1 16,3
Extremadura 1 14,1
Galicia 1 16,2
Madrid (Comunidad de) 1 25,0
Murcia (Región de) 1 17,2
Navarra (Comunidad 1 26,8
F
País lVasco
d ) 1 24,7
Rioja (La) 1 20,5
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-44-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
PIB per cápita (2002)
19 100,0% 0 ,0% 19 100,0%
* CC.AA.(2004)
a. Limitado a los primeros 100 casos.

Tabla 6. PIB per cápitaa

PIB per cápita


CC.AA.(2004) Andalucía 1 12738,04245610
Aragón 1 17773,81382374
Asturias (Principado de) 1 14347,94979001
Balears (Illes) 1 20443,16331199
Canarias 1 16795,57053078
Cantabria 1 16394,71341518
Castilla - La Mancha 1 13497,70137670
Castilla y León 1 15931,34507019
Cataluña 1 19844,22642447
Ciudad autónoma de 1 15170,09196901
C t autónoma de
Ciudad 1 15170,09000000
M lill
Comunidad Valenciana 1 16111,67905817
Extremadura 1 11291,92843085
Galicia 1 13751,27985984
Madrid (Comunidad de) 1 22064,49158882
Murcia (Región de) 1 14046,85205433
Navarra (Comunidad 1 21021,69913835
F lVasco
País d ) 1 21148,06161961
Rioja (La) 1 18617,70887413
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-45-
Poza, Carlos

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
Detenidos por 1000
19 100,0% 0 ,0% 19 100,0%
hab. * CC.AA.(2004)
a. Limitado a los primeros 100 casos.

Tabla 7. Detenidos por 1000 hab.a

Detenidos
por 1000 hab.
CC.AA.(2004) Andalucía 1 9,65
Aragón 1 5,97
Asturias (Principado de) 1 5,65
Balears (Illes) 1 13,44
Canarias 1 17,05
Cantabria 1 6,71
Castilla - La Mancha 1 5,49
Castilla y León 1 3,86
Cataluña 1 6,80
Ciudad autónoma de 1 85,68
C t autónoma de
Ciudad 1 85,68
M lill
Comunidad Valenciana 1 10,25
Extremadura 1 4,12
Galicia 1 4,93
Madrid (Comunidad de) 1 7,51
Murcia (Región de) 1 10,00
Navarra (Comunidad 1 3,67
F lVasco
País d ) 1 4,29
Rioja (La) 1 6,42
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-46-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
Muertes violentas por
19 100,0% 0 ,0% 19 100,0%
homicidio * CC.AA.(2004)
a. Limitado a los primeros 100 casos.

Tabla 8. Muertes violentas por homicidioa

Muertes
violentas por
homicidio
CC.AA.(2004) Andalucía 1 1,21
Aragón 1 1,17
Asturias (Principado de) 1 1,04
Balears (Illes) 1 ,84
Canarias 1 ,95
Cantabria 1 1,12
Castilla - La Mancha 1 ,63
Castilla y León 1 ,61
Cataluña 1 1,09
Ciudad autónoma de 1 2,18
C t autónoma de
Ciudad 1 2,18
M lill
Comunidad Valenciana 1 1,04
Extremadura 1 ,57
Galicia 1 ,78
Madrid (Comunidad de) 1 ,86
Murcia (Región de) 1 1,27
Navarra (Comunidad 1 ,90
F lVasco
País d ) 1 1,01
Rioja (La) 1 ,37
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-47-
Poza, Carlos

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
Autopistas, autovías
y carreteras de doble
19 100,0% 0 ,0% 19 100,0%
calzada (Km) *
CC.AA.(2004)
a. Limitado a los primeros 100 casos.

Tabla 9. Autopistas, autovías y carreteras


a
de doble calzada
(Km)

Autopistas,
autovías y
carreteras
de doble
calzada (Km)
CC.AA.(2004) Andalucía 1 2219
Aragón 1 562
Asturias (Principado de) 1 282
Balears (Illes) 1 82
Canarias 1 278
Cantabria 1 177
Castilla - La Mancha 1 991
Castilla y León 1 1631
Cataluña 1 1224
Ciudad autónoma de Ceuta 1 1
Ciudad autónoma de Melilla 1 0
Comunidad Valenciana 1 1164
Extremadura 1 389
Galicia 1 819
Madrid (Comunidad de) 1 802
Murcia (Región de) 1 449
Navarra (Comunidad 1 272
F lVasco
País d ) 1 520
Rioja (La) 1 147
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-48-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
Entrada de turistas
en valor absoluto * 17 89,5% 2 10,5% 19 100,0%
CC.AA.(2004)
a. Limitado a los primeros 100 casos.

a
Tabla 10. Entrada de turistas en valor absoluto

Entrada de
turistas en
valor absoluto
CC.AA.(2004) Andalucía 1 7578782
Aragón 1 244045
Asturias (Principado de) 1 150280
Balears (Illes) 1 9608376
Canarias 1 10668547
Cantabria 1 192958
Castilla - La Mancha 1 155072
Castilla y León 1 1261872
Cataluña 1 11816977
Comunidad Valenciana 1 4963446
Extremadura 1 173187
Galicia 1 769214
Madrid (Comunidad de) 1 3093056
Murcia (Región de) 1 525711
Navarra (Comunidad 1 227489
F lVasco
País d ) 1 976901
Rioja (La) 1 71641
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-49-
Poza, Carlos

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
Viviendas VP+Libres
19 100,0% 0 ,0% 19 100,0%
* CC.AA.(2004)
a. Limitado a los primeros 100 casos.

a
Tabla 11. Viviendas terminadas protegidas y libres

Viviendas
VP+Libres
CC.AA.(2004) Andalucía 1 129689
Aragón 1 15518
Asturias (Principado de) 1 9944
Balears (Illes) 1 11841
Canarias 1 26077
Cantabria 1 8431
Castilla - La Mancha 1 17433
Castilla y León 1 27484
Cataluña 1 73073
Ciudad autónoma de Ceuta 1 345
Ciudad autónoma de Melilla 1 1121
Comunidad Valenciana 1 65121
Extremadura 1 12065
Galicia 1 27937
Madrid (Comunidad de) 1 43231
Murcia (Región de) 1 15660
Navarra (Comunidad 1 5026
F lVasco
País d ) 1 12181
Rioja (La) 1 4172
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-50-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
Tasa de actividad
19 100,0% 0 ,0% 19 100,0%
* CC.AA.(2004)
a. Limitado a los primeros 100 casos.

Tabla 12. Tasa de actividada

Tasa de
actividad
CC.AA.(2004) Andalucía 1 54,19
Aragón 1 54,51
Asturias (Principado de) 1 45,91
Balears (Illes) 1 61,83
Canarias 1 58,73
Cantabria 1 53,21
Castilla - La Mancha 1 53,11
Castilla y León 1 51,28
Cataluña 1 60,60
Ciudad autónoma de 1 50,59
C t autónoma de
Ciudad 1 50,59
M lill
Comunidad Valenciana 1 59,17
Extremadura 1 51,41
Galicia 1 53,57
Madrid (Comunidad de) 1 60,74
Murcia (Región de) 1 58,50
Navarra (Comunidad 1 57,94
F lVasco
País d ) 1 56,75
Rioja (La) 1 56,38
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-51-
Poza, Carlos

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
Viviendas con internet
19 100,0% 0 ,0% 19 100,0%
* CC.AA.(2004)
a. Limitado a los primeros 100 casos.

Tabla 13. % Viviendas con interneta

Viviendas
con internet
CC.AA.(2004) Andalucía 1 24,22
Aragón 1 31,95
Asturias (Principado de) 1 26,61
Balears (Illes) 1 36,34
Canarias 1 30,93
Cantabria 1 24,96
Castilla - La Mancha 1 30,19
Castilla y León 1 20,62
Cataluña 1 40,40
Ciudad autónoma de Ceuta 1 27,73
Ciudad autónoma de Melilla 1 28,55
Comunidad Valenciana 1 28,59
Extremadura 1 19,92
Galicia 1 19,14
Madrid (Comunidad de) 1 39,37
Murcia (Región de) 1 27,04
Navarra (Comunidad 1 35,90
F lVasco
País d ) 1 39,37
Rioja (La) 1 26,42
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-52-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Resumen del procesamiento de los casosa

Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
Personal en I+D
17 89,5% 2 10,5% 19 100,0%
* CC.AA.(2004)
a. Limitado a los primeros 100 casos.

Tabla 14. Personal en I+Da

Personal
en I+D
CC.AA.(2004) Andalucía 1 4,78
Aragón 1 3,28
Asturias (Principado de) 1 ,69
Balears (Illes) 1 ,12
Canarias 1 ,55
Cantabria 1 ,46
Castilla - La Mancha 1 1,12
Castilla y León 1 3,61
Cataluña 1 30,42
Comunidad Valenciana 1 4,50
Extremadura 1 ,08
Galicia 1 3,05
Madrid (Comunidad de) 1 28,61
Murcia (Región de) 1 ,99
Navarra (Comunidad 1 2,56
F lVasco
País d ) 1 14,75
Rioja (La) 1 ,44
Fuente: elaboración propia a partir de INE
a. Limitado a los primeros 100 casos.

-53-
Poza, Carlos

Análisis Factorial

Estadísticos descriptivos
a a
Media Desviación típica N del análisis N perdida
Tasa de paro 9,8247 3,28689 19 0
Proporción de población
de 16 o más años 16,006 7,8973 19 0
analfabeta/sin estudios
Proporción de población
de 16 o más años con 17,858 3,9927 19 0
estudios superiores
PIB per cápita 16640,02151538 3145,4176995572 19 0
Detenidos por 1000 hab. 15,6405 24,91966 19 0
Muertes violentas por
1,0430 ,46558 19 0
homicidio
Autopistas, autovías y
carreteras de doble 632,05 595,004 19 0
calzada (Km)
Entrada de turistas en
3086914,94 3937510,006 19 2
valor absoluto
Viviendas VP+Libres 26649,95 31996,837 19 0
Tasa de actividad 55,2111 4,25076 19 0
Viviendas con internet 29,3816 6,51857 19 0
Personal en I+D 5,8829 9,00402 19 2
Índice de precios al
3,01553 ,379091 19 0
consumo
a. Para cada variable, los valores perdidos se sustituyen por la media de la variable.

-54-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes
a
Matriz de correlaciones

Proporción deProporción de
población de población de Autopistas,
16 o más 16 o más autovías y
años años con Muertes carreteras de Entrada de Índice de
analfabeta/sin estudios PIB per Detenidos porviolentas pordoble calzada turistas en Viviendas Tasa de Viviendas Personal precios al
Tasa de paro estudios superiores cápita (2002) 1000 hab. homicidio (Km) valor absolutoVP+Libres actividad con internet en I+D consumo
Correlación Tasa de paro 1,000 ,661 -,550 -,750 -,044 -,006 ,393 ,110 ,404 -,363 -,582 -,181 -,233
Proporción de pobla
de 16 o más años ,661 1,000 -,749 -,720 ,367 ,342 ,088 ,170 ,139 -,260 -,356 -,232 ,160
analfabeta/sin estud
Proporción de pobla
de 16 o más años co -,550 -,749 1,000 ,764 -,413 -,316 -,019 -,184 -,075 ,424 ,531 ,439 -,023
estudios superiores
PIB per cápita (2002 -,750 -,720 ,764 1,000 -,156 -,123 -,200 ,229 -,114 ,651 ,836 ,545 ,059
Detenidos por 1000 -,044 ,367 -,413 -,156 1,000 ,873 -,382 ,099 -,251 -,313 -,043 -,017 ,605
Muertes violentas po
-,006 ,342 -,316 -,123 ,873 1,000 -,248 ,139 -,057 -,250 ,080 ,093 ,677
homicidio
Autopistas, autovías
carreteras de doble ,393 ,088 -,019 -,200 -,382 -,248 1,000 ,241 ,858 ,075 -,144 ,270 -,060
calzada (Km)
Entrada de turistas e
,110 ,170 -,184 ,229 ,099 ,139 ,241 1,000 ,541 ,531 ,395 ,358 -,054
valor absoluto
Viviendas VP+Libre ,404 ,139 -,075 -,114 -,251 -,057 ,858 ,541 1,000 ,267 ,024 ,365 -,028
Tasa de actividad -,363 -,260 ,424 ,651 -,313 -,250 ,075 ,531 ,267 1,000 ,642 ,414 -,082
Viviendas con intern -,582 -,356 ,531 ,836 -,043 ,080 -,144 ,395 ,024 ,642 1,000 ,645 ,229
Personal en I+D -,181 -,232 ,439 ,545 -,017 ,093 ,270 ,358 ,365 ,414 ,645 1,000 ,333
Índice de precios al
-,233 ,160 -,023 ,059 ,605 ,677 -,060 -,054 -,028 -,082 ,229 ,333 1,000
consumo
Sig. (Unilater Tasa de paro ,001 ,007 ,000 ,429 ,490 ,048 ,327 ,043 ,063 ,004 ,229 ,168
Proporción de pobla
de 16 o más años ,001 ,000 ,000 ,061 ,076 ,360 ,243 ,285 ,141 ,067 ,169 ,256
analfabeta/sin estud
Proporción de pobla
de 16 o más años co ,007 ,000 ,000 ,040 ,094 ,469 ,225 ,380 ,035 ,010 ,030 ,463
estudios superiores
PIB per cápita (2002 ,000 ,000 ,000 ,261 ,307 ,205 ,173 ,321 ,001 ,000 ,008 ,405
Detenidos por 1000 ,429 ,061 ,040 ,261 ,000 ,053 ,343 ,150 ,096 ,431 ,473 ,003
Muertes violentas po
,490 ,076 ,094 ,307 ,000 ,153 ,285 ,408 ,151 ,373 ,352 ,001
homicidio
Autopistas, autovías
carreteras de doble ,048 ,360 ,469 ,205 ,053 ,153 ,160 ,000 ,381 ,278 ,132 ,404
calzada (Km)
Entrada de turistas e
,327 ,243 ,225 ,173 ,343 ,285 ,160 ,013 ,014 ,058 ,079 ,418
valor absoluto
Viviendas VP+Libre ,043 ,285 ,380 ,321 ,150 ,408 ,000 ,013 ,135 ,461 ,062 ,455
Tasa de actividad ,063 ,141 ,035 ,001 ,096 ,151 ,381 ,014 ,135 ,002 ,039 ,370
Viviendas con intern ,004 ,067 ,010 ,000 ,431 ,373 ,278 ,058 ,461 ,002 ,001 ,172
Personal en I+D ,229 ,169 ,030 ,008 ,473 ,352 ,132 ,079 ,062 ,039 ,001 ,096
Índice de precios al
,168 ,256 ,463 ,405 ,003 ,001 ,404 ,418 ,455 ,370 ,172 ,096
consumo
a.Determinante = 6,027E-07
-55-
Poza, Carlos

Inversa de la matriz de correlaciones

Proporción de Proporción de
población de población de Autopistas,
16 o más 16 o más autovías y
años años con Muertes carreteras de Entrada de Índice de
analfabeta/sin estudios PIB per Detenidos por violentas por doble calzada turistas en Viviendas Tasa de Viviendas Personal precios al
Tasa de paro estudios superiores cápita (2002) 1000 hab. homicidio (Km) valor absoluto VP+Libres actividad con internet en I+D consumo
Tasa de paro 5,671 -3,087 -1,129 1,307 1,637 -,843 1,012 -1,069 -1,494 1,399 2,327 -1,695 1,400
Proporción de población
de 16 o más años -3,087 8,163 ,264 9,449 -2,744 ,716 -1,900 -,854 3,444 -3,136 -5,223 ,416 -,666
analfabeta/sin estudios
Proporción de población
de 16 o más años con -1,129 ,264 6,213 -6,365 1,644 -,889 ,003 3,132 -,906 -,400 1,003 -,525 -,121
estudios superiores
PIB per cápita (2002) 1,307 9,449 -6,365 26,341 -4,970 1,786 -2,399 -4,434 5,956 -4,624 -10,058 -1,240 1,008
Detenidos por 1000 hab 1,637 -2,744 1,644 -4,970 9,220 -5,794 ,850 -1,708 1,307 1,656 4,843 -1,209 -1,081
Muertes violentas por
-,843 ,716 -,889 1,786 -5,794 7,385 2,008 ,332 -3,138 ,813 -2,708 1,057 -1,545
homicidio
Autopistas, autovías y
carreteras de doble 1,012 -1,900 ,003 -2,399 ,850 2,008 7,412 ,857 -7,328 2,014 1,986 -,536 -1,019
calzada (Km)
Entrada de turistas en
-1,069 -,854 3,132 -4,434 -1,708 ,332 ,857 5,576 -3,567 -1,110 -,626 ,093 1,306
valor absoluto
Viviendas VP+Libres -1,494 3,444 -,906 5,956 1,307 -3,138 -7,328 -3,567 11,128 -2,740 -1,562 -,703 ,108
Tasa de actividad 1,399 -3,136 -,400 -4,624 1,656 ,813 2,014 -1,110 -2,740 4,590 1,564 ,300 -,560
Viviendas con internet 2,327 -5,223 1,003 -10,058 4,843 -2,708 1,986 -,626 -1,562 1,564 9,704 -1,901 -,522
Personal en I+D -1,695 ,416 -,525 -1,240 -1,209 1,057 -,536 ,093 -,703 ,300 -1,901 3,417 -1,109
Índice de precios al
1,400 -,666 -,121 1,008 -1,081 -1,545 -1,019 1,306 ,108 -,560 -,522 -1,109 3,527
consumo

-56-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

KMO y prueba de Bartlett


Medida de adecuación muestral de
Kaiser-Meyer-Olkin. ,635

Prueba de esfericidad Chi-cuadrado


155,154
de Bartlett aproximado
gl 78
Sig. ,000

-57-
Poza, Carlos
Matrices anti-imagen

Proporción deProporción de
población depoblación de Autopistas,
16 o más 16 o más autovías y
años años con Muertes carreteras deEntrada de Índice de
analfabeta/sin estudios PIB per Detenidos poviolentas por
doble calzadaturistas en Viviendas Tasa de Viviendas Personal precios al
Tasa de paro estudios superiorescápita (2002 1000 hab. homicidio (Km) VP+Libresactividadcon internet en I+D consumo
alor absoluto
Covarianza anti-im Tasa de paro ,176 -,067 -,032 ,009 ,031 -,020 ,024 -,034 -,024 ,054 ,042 -,087 ,070
Proporción de pob
de 16 o más años -,067 ,123 ,005 ,044 -,036 ,012 -,031 -,019 ,038 -,084 -,066 ,015 -,023
analfabeta/sin estu
Proporción de pob
de 16 o más años -,032 ,005 ,161 -,039 ,029 -,019 7,067E-05 ,090 -,013 -,014 ,017 -,025 -,006
estudios superiore
PIB per cápita (200 ,009 ,044 -,039 ,038 -,020 ,009 -,012 -,030 ,020 -,038 -,039 -,014 ,011
Detenidos por 100 ,031 -,036 ,029 -,020 ,108 -,085 ,012 -,033 ,013 ,039 ,054 -,038 -,033
Muertes violentas
-,020 ,012 -,019 ,009 -,085 ,135 ,037 ,008 -,038 ,024 -,038 ,042 -,059
homicidio
Autopistas, autovía
carreteras de doble ,024 -,031 7,067E-05 -,012 ,012 ,037 ,135 ,021 -,089 ,059 ,028 -,021 -,039
calzada (Km)
Entrada de turistas
-,034 -,019 ,090 -,030 -,033 ,008 ,021 ,179 -,057 -,043 -,012 ,005 ,066
valor absoluto
Viviendas VP+Lib -,024 ,038 -,013 ,020 ,013 -,038 -,089 -,057 ,090 -,054 -,014 -,018 ,003
Tasa de actividad ,054 -,084 -,014 -,038 ,039 ,024 ,059 -,043 -,054 ,218 ,035 ,019 -,035
Viviendas con inter ,042 -,066 ,017 -,039 ,054 -,038 ,028 -,012 -,014 ,035 ,103 -,057 -,015
Personal en I+D -,087 ,015 -,025 -,014 -,038 ,042 -,021 ,005 -,018 ,019 -,057 ,293 -,092
Índice de precios a
,070 -,023 -,006 ,011 -,033 -,059 -,039 ,066 ,003 -,035 -,015 -,092 ,283
consumo
Correlación anti-imTasa de paro ,724a -,454 -,190 ,107 ,226 -,130 ,156 -,190 -,188 ,274 ,314 -,385 ,313
Proporción de pob a
de 16 o más años -,454 ,573 ,037 ,644 -,316 ,092 -,244 -,127 ,361 -,512 -,587 ,079 -,124
analfabeta/sin estu
Proporción de pob a
de 16 o más años -,190 ,037 ,780 -,498 ,217 -,131 ,000 ,532 -,109 -,075 ,129 -,114 -,026
estudios superiore
PIB per cápita (200 ,107 ,644 -,498 ,658a -,319 ,128 -,172 -,366 ,348 -,421 -,629 -,131 ,105
Detenidos por 100 ,226 -,316 ,217 -,319 ,580a -,702 ,103 -,238 ,129 ,255 ,512 -,215 -,190
Muertes violentas a
-,130 ,092 -,131 ,128 -,702 ,616 ,271 ,052 -,346 ,140 -,320 ,210 -,303
homicidio
Autopistas, autovía a
carreteras de doble ,156 -,244 ,000 -,172 ,103 ,271 ,545 ,133 -,807 ,345 ,234 -,106 -,199
calzada (Km)
Entrada de turistas a
-,190 -,127 ,532 -,366 -,238 ,052 ,133 ,546 -,453 -,219 -,085 ,021 ,295
valor absoluto
Viviendas VP+Lib -,188 ,361 -,109 ,348 ,129 -,346 -,807 -,453 ,505a -,383 -,150 -,114 ,017
Tasa de actividad ,274 -,512 -,075 -,421 ,255 ,140 ,345 -,219 -,383 ,657a ,234 ,076 -,139
Viviendas con inter ,314 -,587 ,129 -,629 ,512 -,320 ,234 -,085 -,150 ,234 ,630a -,330 -,089
Personal en I+D -,385 ,079 -,114 -,131 -,215 ,210 -,106 ,021 -,114 ,076 -,330 ,758a -,320
Índice de precios a a
,313 -,124 -,026 ,105 -,190 -,303 -,199 ,295 ,017 -,139 -,089 -,320 ,681
consumo
a.Medida de adecuación muestral

-58-
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Comunalidades

Inicial Extracción
Tasa de paro 1,000 ,795
Proporción de población
de 16 o más años 1,000 ,726
analfabeta/sin estudios
Proporción de población
de 16 o más años con 1,000 ,754
estudios superiores
PIB per cápita (2002) 1,000 ,954
Detenidos por 1000 hab. 1,000 ,895
Muertes violentas por
1,000 ,873
homicidio
Autopistas, autovías y
carreteras de doble 1,000 ,719
calzada (Km)
Entrada de turistas en
1,000 ,621
valor absoluto
Viviendas VP+Libres 1,000 ,875
Tasa de actividad 1,000 ,646
Viviendas con internet 1,000 ,832
Personal en I+D 1,000 ,675
Índice de precios al
1,000 ,640
consumo
Método de extracción: Análisis de Componentes principales.
Poza, Carlos

Varianza total explicada

Sumas de las saturaciones al cuadrado Suma de las saturaciones al cuadrado


Autovalores iniciales de la extracción de la rotación
% de la % de la % de la
Componente Total varianza % acumulado Total varianza % acumulado Total varianza % acumulado
1 4,472 34,399 34,399 4,472 34,399 34,399 4,413 33,942 33,942
2 2,922 22,474 56,873 2,922 22,474 56,873 2,850 21,924 55,866
3 2,613 20,103 76,975 2,613 20,103 76,975 2,744 21,109 76,975
4 1,166 8,968 85,944
5 ,519 3,995 89,938
6 ,451 3,470 93,408
7 ,267 2,054 95,462
8 ,203 1,563 97,025
9 ,130 ,998 98,023
10 ,116 ,894 98,917
11 ,068 ,521 99,438
12 ,050 ,381 99,819
13 ,024 ,181 100,000
Método de extracción: Análisis de Componentes principales.

Gráfico de sedimentación
5

1
Autovalor

0
1 2 3 4 5 6 7 8 9 10 11 12 13

Número de componente

60
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Matriz de componentesa

Componente
1 2 3
PIB per cápita (2002) ,961
Proporción de población
de 16 o más años con ,831 -,251
estudios superiores
Viviendas con internet ,822 ,206 ,338
Proporción de población
de 16 o más años -,748 ,408
analfabeta/sin estudios
Tasa de paro -,721 -,478 ,216
Tasa de actividad ,716 -,232 ,281
Personal en I+D ,593 ,568
Detenidos por 1000 hab. -,346 ,778 ,413
Autopistas, autovías y
carreteras de doble -,744 ,403
calzada (Km)
Muertes violentas por
-,273 ,705 ,549
homicidio
Viviendas VP+Libres -,678 ,644
Índice de precios al
,625 ,500
consumo
Entrada de turistas en
-,243 ,723
valor absoluto
Método de extracción: Análisis de componentes principales.
a. 3 componentes extraídos
Poza, Carlos

Correlaciones reproducidas

Proporción deProporción de
población depoblación de Autopistas,
16 o más 16 o más autovías y
años años con Muertes carreteras deEntrada de Índice de
nalfabeta/sin estudios PIB per Detenidos poviolentas poroble calzadaturistas en Viviendas Tasa de Viviendas Personal precios al
Tasa de paro estudios superiorescápita (2002 1000 hab. homicidio (Km) alor absolutoVP+Libresactividadcon internet en I+D consumo
Correlación reprod Tasa de paro ,795b ,627 -,638 -,771 -,034 -,021 ,487 ,129 ,460 -,344 -,618 -,287 -,193
Proporción de pob b
de 16 o más años ,627 ,726 -,724 -,710 ,428 ,429 ,209 ,145 ,258 -,422 -,478 -,212 ,202
analfabeta/sin estu
Proporción de pob b
de 16 o más años -,638 -,724 ,754 ,788 -,414 -,386 -,129 -,008 -,136 ,532 ,593 ,351 -,141
estudios superiore
PIB per cápita (200 -,771 -,710 ,788 ,954 b -,188 -,128 -,179 ,166 -,099 ,654 ,833 ,576 ,123
Detenidos por 100 -,034 ,428 -,414 -,188 ,895b ,869 -,391 ,040 -,264 -,312 ,015 ,001 ,691
Muertes violentas p b
-,021 ,429 -,386 -,128 ,869 ,873 -,286 ,171 -,125 -,205 ,106 ,124 ,714
homicidio
Autopistas, autovía b
carreteras de doble ,487 ,209 -,129 -,179 -,391 -,286 ,719 ,460 ,763 ,243 -,067 ,220 -,264
calzada (Km)
Entrada de turistas b
,129 ,145 -,008 ,166 ,040 ,171 ,460 ,621 ,631 ,403 ,358 ,538 ,210
valor absoluto
Viviendas VP+Lib ,460 ,258 -,136 -,099 -,264 -,125 ,763 ,631 ,875b ,343 ,082 ,394 -,102
Tasa de actividad -,344 -,422 ,532 ,654 -,312 -,205 ,243 ,403 ,343 ,646b ,636 ,593 -,002
Viviendas con inte -,618 -,478 ,593 ,833 ,015 ,106 -,067 ,358 ,082 ,636 ,832b ,672 ,300
Personal en I+D -,287 -,212 ,351 ,576 ,001 ,124 ,220 ,538 ,394 ,593 ,672 ,675b ,263
Índice de precios a b
-,193 ,202 -,141 ,123 ,691 ,714 -,264 ,210 -,102 -,002 ,300 ,263 ,640
consumo
a
Residual Tasa de paro ,034 ,089 ,021 -,010 ,015 -,093 -,019 -,056 -,019 ,036 ,106 -,040
Proporción de pob
de 16 o más años ,034 -,025 -,010 -,061 -,087 -,120 ,025 -,118 ,161 ,121 -,020 -,042
analfabeta/sin estu
Proporción de pob
de 16 o más años ,089 -,025 -,023 ,002 ,070 ,110 -,177 ,061 -,108 -,061 ,087 ,118
estudios superiore
PIB per cápita (200 ,021 -,010 -,023 ,031 ,004 -,022 ,064 -,016 -,003 ,002 -,031 -,064
Detenidos por 100 -,010 -,061 ,002 ,031 ,003 ,009 ,059 ,013 -,001 -,058 -,018 -,086
Muertes violentas p
,015 -,087 ,070 ,004 ,003 ,038 -,032 ,068 -,045 -,026 -,031 -,037
homicidio
Autopistas, autovía
carreteras de doble -,093 -,120 ,110 -,022 ,009 ,038 -,219 ,094 -,168 -,077 ,050 ,204
calzada (Km)
Entrada de turistas
-,019 ,025 -,177 ,064 ,059 -,032 -,219 -,091 ,128 ,037 -,180 -,264
valor absoluto
Viviendas VP+Lib -,056 -,118 ,061 -,016 ,013 ,068 ,094 -,091 -,075 -,058 -,029 ,074
Tasa de actividad -,019 ,161 -,108 -,003 -,001 -,045 -,168 ,128 -,075 ,006 -,179 -,079
Viviendas con inte ,036 ,121 -,061 ,002 -,058 -,026 -,077 ,037 -,058 ,006 -,026 -,071
Personal en I+D ,106 -,020 ,087 -,031 -,018 -,031 ,050 -,180 -,029 -,179 -,026 ,070
Índice de precios a
-,040 -,042 ,118 -,064 -,086 -,037 ,204 -,264 ,074 -,079 -,071 ,070
consumo
Método de extracción: Análisis de Componentes principales.
a.Los residuos se calculan entre las correlaciones observadas y reproducidas. Hay 40 (51,0%) residuales no redundantes con valores absolutos mayores que 0,05.
b.Comunalidades reproducidas

62
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Matriz de componentes rotadosa

Componente
1 2 3
PIB per cápita (2002) ,977
Viviendas con internet ,851 ,230 ,234
Proporción de población
de 16 o más años con ,806 -,312
estudios superiores
Tasa de paro -,797 ,380
Proporción de población
de 16 o más años -,728 ,370 ,243
analfabeta/sin estudios
Tasa de actividad ,661 ,439
Personal en I+D ,582 ,218 ,537
Muertes violentas por
,926
homicidio
Detenidos por 1000 hab. ,912
Índice de precios al
,789
consumo
Viviendas VP+Libres ,917
Autopistas, autovías y
carreteras de doble -,325 ,757
calzada (Km)
Entrada de turistas en
,216 ,741
valor absoluto

Método de extracción: Análisis de componentes principales.


Método de rotación: Normalización Varimax con Kaiser.
a. La rotación ha convergido en 6 iteraciones.
Poza, Carlos

Matriz de transformación de las componentes

Componente 1 2 3
1 ,981 -,164 ,107
2 ,195 ,779 -,596
3 ,014 ,605 ,796
Método de extracción: Análisis de componentes principales.

Método de rotación: Normalización Varimax con Kaiser.

64
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Gráfico de componentes en espacio rotado

muertes violentas po
1,0 detenidos
índice por 1000
de precios al h

viviendas con intern


personal enentrada
i+d
,5 de turistas
proporción de poblac
pib per cápita (2002
tasa de actividad
viviendas vp+libres
e2 0,0 proporción de poblac tasa
autopistas, de paro
autovías

-,5

1,0 1,0
,5 ,5
0,0 0,0
-,5 -,5
Componente 1 Componente 3
Poza, Carlos

Gráfico de componentes en espacio rotado


1,0 detenidos por 1000 h
entrada de turistas

tasa de actividad

,5 viviendas con intern


muertes violentas po
viviendas vp+libres
proporción de poblac pib per cápita (2002
personal en i+d

tasa de paro
0,0 autopistas, autovías

índice de precios alproporción de poblac

-,5
Factor 2

-1,0
-1,0 -,5 0,0 ,5 1,0

Factor 1 66
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Gráfico de componentes en espacio rotado


1,0
autopistas,
viviendasautovías
vp+libres

índice depersonal en i+d


precios al

,5 muertes violentas po
entrada de turistas
tasa de paro
viviendas con intern
proporción de poblac tasa de actividad
proporción de poblac
pib per cápita (200
0,0
detenidos por 1000 h

-,5
Factor 3

-1,0
-1,0 -,5 0,0 ,5 1,0

Factor 1
Poza, Carlos

Gráfico de componentes en espacio rotado


1,0
viviendas vp+libres
autopistas, autovías

índice de preciospersonal
al en i+d

,5 muertes violentas po
entrada de turistas
tasa de paro
viviendas con intern
proporción de poblactasa de actividad
proporción de poblac
pib per cápita (2002
0,0
detenidos por 1000

-,5
Factor 3

-1,0
-1,0 -,5 0,0 ,5 1,0

Factor 2

68
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes
Conglomerados jerárquicos

Resumen del procesamiento de los casosa

Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
19 100,0 0 ,0 19 100,0
a. Vinculación promedio (Inter-grupos)
Poza, Carlos

Matriz de distancias

distancia euclídea al cuadrado


3:Madrid 8:Ciuda9:Ciuda
:Asturia:Balear CastillaCastilla :Comuni :Extre Comunida4:Murci5:Navarr 6:País utónomautónoma
Caso Andaluc:Aragó
Principad(Illes) Canaria
Cantabr
a ManchLeón Cataluñ Valencianadura2:Galic de egión domunidad Vasco:Rioja (L de C de M
1:Andalucía ,000 3,356 12,333 9,405 5,89912,577 6,720 7,904 7,995 4,505 8,427 6,515 13,141 8,659 19,764 4,595 19,444 18,161 18,172
2:Aragón 13,356 ,000 1,410 ,923 1,532 ,528 1,997 1,917 9,828 2,585 5,340 2,632 3,809 1,319 1,129 ,995 ,989 9,159 9,195
3:Asturias (Pr12,333 1,410 ,000 3,208 2,418 ,286 ,852 1,682 4,639 3,794 2,012 1,034 9,080 1,030 4,758 4,671 2,847 8,012 8,111
4:Balears (Ille9,405 ,923 3,208 ,000 ,707 2,149 2,242 2,631 4,755 ,967 6,898 3,111 1,654 1,259 2,009 ,702 3,386 8,257 8,243
5:Canarias 5,899 1,532 2,418 ,707 ,000 1,771 ,824 ,987 5,822 ,178 3,763 1,191 3,537 1,026 4,259 2,373 4,161 9,781 9,802
6:Cantabria 12,577 ,528 ,286 2,149 1,771 ,000 1,059 1,155 2,876 3,065 2,802 1,322 6,743 1,134 3,009 2,925 1,460 9,378 9,457
7:Castilla - La6,720 1,997 ,852 2,242 ,824 1,059 ,000 ,868 0,172 1,458 1,430 ,107 7,381 ,588 6,014 4,597 4,622 8,282 8,354
8:Castilla y Le7,904 1,917 1,682 2,631 ,987 1,155 ,868 ,000 1,131 1,725 1,703 ,693 6,642 2,198 5,431 4,092 3,106 13,831 13,910
9:Cataluña 7,995 9,828 14,639 4,755 5,82212,876 0,172 1,131 ,000 4,286 7,937 1,567 3,020 8,540 10,417 6,496 15,237 14,577 14,445
10:Comunida
4,505 2,585 3,794 ,967 ,178 3,065 1,458 1,725 4,286 ,000 4,815 1,874 3,285 1,655 5,400 2,948 5,815 10,371 10,374
Valenciana
11:Extremadu8,427 5,340 2,012 6,898 3,763 2,802 1,430 1,703 7,937 4,815 ,000 ,796 14,185 3,611 11,290 9,956 7,182 13,962 14,108
12:Galicia 6,515 2,632 1,034 3,111 1,191 1,322 ,107 ,693 1,567 1,874 ,796 ,000 8,637 1,189 7,151 5,647 5,048 9,920 10,009
13:Madrid (C
13,141 3,809 9,080 1,654 3,537 6,743 7,381 6,642 3,020 3,285 4,185 8,637 ,000 5,772 2,822 1,108 5,961 14,364 14,280

14:Murcia (Re8,659 1,319 1,030 1,259 1,026 1,134 ,588 2,198 8,540 1,655 3,611 1,189 5,772 ,000 4,204 3,165 4,330 5,044 5,085
15:Navarra (C19,764 1,129 4,758 2,009 4,259 3,009 6,014 5,431 0,417 5,400 1,290 7,151 2,822 4,204 ,000 ,524 1,352 11,675 11,666
16:País Vasc14,595 ,995 4,671 ,702 2,373 2,925 4,597 4,092 6,496 2,948 9,956 5,647 1,108 3,165 ,524 ,000 2,178 11,160 11,134
17:Rioja (La)19,444 ,989 2,847 3,386 4,161 1,460 4,622 3,106 5,237 5,815 7,182 5,048 5,961 4,330 1,352 2,178 ,000 14,950 15,012
18:Ciudad au
18,161 9,159 8,012 8,257 9,781 9,378 8,282 3,831 4,577 10,371 3,962 9,920 14,364 5,044 11,675 1,160 14,950 ,000 ,001
C
19:Ciudad au
18,172 9,195 8,111 8,243 9,802 9,457 8,354 3,910 4,445 10,374 4,108 0,009 14,280 5,085 11,666 1,134 15,012 ,001 ,000
M
Esta es una matriz de disimilaridades

70
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Vinculación promedio (Inter-grupos)

Historial de conglomeración

Etapa en la que el
conglomerado
Conglomerado que se aparece por primera
combina vez
Conglom Conglom Conglom Conglom Próxima
Etapa erado 1 erado 2 Coeficientes erado 1 erado 2 etapa
1 18 19 ,001 0 0 18
2 7 12 ,107 0 0 6
3 5 10 ,178 0 0 7
4 3 6 ,286 0 0 8
5 15 16 ,524 0 0 11
6 7 8 ,780 2 0 10
7 4 5 ,837 0 3 13
8 2 3 ,969 0 4 9
9 2 14 1,161 8 0 12
10 7 11 1,310 6 0 12
11 15 17 1,765 5 0 15
12 2 7 1,962 9 10 13
13 2 4 2,371 12 7 15
14 9 13 3,020 0 0 16
15 2 15 4,232 13 11 16
16 2 9 8,012 15 14 17
17 1 2 10,702 0 16 18
18 1 18 11,242 17 1 0
Poza, Carlos

Conglomerado de pertenencia

7 6 5 4 3
conglome conglome conglome conglome conglome
Caso rados rados rados rados rados
1:Andalucía 1 1 1 1 1
2:Aragón 2 2 2 2 2
3:Asturias (Principado 2 2 2 2 2
4:Balears (Illes) 3 2 2 2 2
5:Canarias 3 2 2 2 2
6:Cantabria 2 2 2 2 2
7:Castilla - La Mancha 2 2 2 2 2
8:Castilla y León 2 2 2 2 2
9:Cataluña 4 3 3 3 2
10:Comunidad
3 2 2 2 2
Valenciana
11:Extremadura 2 2 2 2 2
12:Galicia 2 2 2 2 2
13:Madrid (Comunidad de
5 4 3 3 2

14:Murcia (Región de) 2 2 2 2 2


15:Navarra (Comunidad F 6 5 4 2 2
16:País Vasco 6 5 4 2 2
17:Rioja (La) 6 5 4 2 2
18:Ciudad autónoma de
7 6 5 4 3
C
19:Ciudad autónoma de
7 6 5 4 3
M

72
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Diagrama de témpanos vertical

Caso

19:Ciudad autónoma de M

10:Comunidad Valenciana
18:Ciudad autónoma de C

13:Madrid (Comunidad de

15:Navarra (Comunidad F

7:Castilla - La Mancha

14:Murcia (Región de)

3:Asturias (Principado
8:Castilla y León
11:Extremadura
4:Balears (Illes)
16:País Vasco
17:Rioja (La)

1:Andalucía
6:Cantabria
5:Canarias
9:Cataluña

12:Galicia

2:Aragón
Número de
conglomerados
1 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
2 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
3 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
4 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
5 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
6 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
7 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
8 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
9 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
10 X X X X X X X X X X X X X X X X X X X X X X X X X X X X
11 X X X X X X X X X X X X X X X X X X X X X X X X X X X
12 X X X X X X X X X X X X X X X X X X X X X X X X X X
13 X X X X X X X X X X X X X X X X X X X X X X X X X
14 X X X X X X X X X X X X X X X X X X X X X X X X
15 X X X X X X X X X X X X X X X X X X X X X X X
16 X X X X X X X X X X X X X X X X X X X X X X
17 X X X X X X X X X X X X X X X X X X X X X
18 X X X X X X X X X X X X X X X X X X X X
Poza, Carlos

Dendrograma
_

* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * *

Dendrogram using Average Linkage (Between Groups)

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+

Ciudad autónoma de C 18
Ciudad autónoma de M 19
Cataluña 9
Madrid (Comunidad de 13
Navarra (Comunidad F 15
País Vasco 16
Rioja (La) 17
Canarias 5
Comunidad Valenciana 10
Balears (Illes) 4
Asturias (Principado 3
Cantabria 6
Aragón 2
Murcia (Región de) 14
Castilla - La Mancha 7
Galicia 12
Castilla y León 8
Extremadura 11
Andalucía 1

74
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

ANOVA de un factor

Estadísticos descriptivos de factores según los distintos clusters

Intervalo de confianza
para la media al 95%
Desviación Error Límite Límite
N Media típica típico inferior superior Mínimo Máximo
Factor Desarrollo 1 1 -1,41882 . . . . -1,41882 -1,41882
Económico y 2 11 -,3812524 ,66873684 ,2016317 -,8305160 ,0680111 -1,71309 ,63653
Social 3 2 1,5081058 ,38771718 ,2741574 -1,975395 4,9916064 1,23395 1,78226
4 3 1,2116824 ,36923295 ,2131767 ,2944569 2,1289079 ,79632 1,50265
5 2 -,5193302 ,01676241 ,0118528 -,6699345 -,3687259 -,53118 -,50748
Total 19 ,0000000 1,00000000 ,2294157 -,4819846 ,4819846 -1,71309 1,78226
Factor 1 1 -,2427166 . . . . -,24272 -,24272
Precariedad 2 11 -,3712761 ,41396593 ,1248154 -,6493822 -,0931700 -1,11724 ,35043
3 2 ,2979381 ,57047341 ,4033856 -4,827562 5,4234383 -,10545 ,70132
4 3 -,4622693 ,48559376 ,2803577 -1,668551 ,7440125 -1,02298 -,18167
5 2 2,5588426 ,00996027 ,0070430 2,4693531 2,6483321 2,55180 2,56589
Total 19 ,0000000 1,00000000 ,2294157 -,4819846 ,4819846 -1,11724 2,56589
Factor 1 1 2,4516806 . . . . 2,45168 2,45168
Infraestructuras 2 11 -,1603973 ,55109150 ,1661603 -,5306256 ,2098310 -,98059 ,85402
3 2 1,4750288 1,01691020 ,7190641 -7,661547 10,61160 ,75596 2,19409
4 3 -,7911908 ,55091772 ,3180725 -2,159746 ,5773646 -1,28044 -,19445
5 2 -,6318974 ,01263188 ,0089321 -,7453903 -,5184045 -,64083 -,62297
Total 19 ,0000000 1,00000000 ,2294157 -,4819846 ,4819846 -1,28044 2,45168
Poza, Carlos

Prueba de homogeneidad de varianzas

Estadístico
de Levene gl1 gl2 Sig.
REGR factor score a
1,280 3 14 ,320
1 for analysis 1
REGR factor score b
1,157 3 14 ,361
2 for analysis 1
REGR factor score c
1,911 3 14 ,174
3 for analysis 1
a. Groups with only one case are ignored in computing the test of
homogeneity of variance for REGR factor score 1 for analysis 1.
b. Groups with only one case are ignored in computing the test of
homogeneity of variance for REGR factor score 2 for analysis 1.
c. Groups with only one case are ignored in computing the test of
homogeneity of variance for REGR factor score 3 for analysis 1.

76
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

ANOVA

Suma de Media
cuadrados gl cuadrática F Sig.
REGR factor score Inter-grupos (Combinados) 13,105 4 3,276 9,369 ,001
1 for analysis 1 Término lineal No ponderado 1,791 1 1,791 5,122 ,040
Ponderado 3,060 1 3,060 8,752 ,010
Desviación 10,044 3 3,348 9,575 ,001
Intra-grupos 4,895 14 ,350
Total 18,000 18
REGR factor score Inter-grupos (Combinados) 15,489 4 3,872 21,591 ,000
2 for analysis 1 Término lineal No ponderado 4,730 1 4,730 26,371 ,000
Ponderado 7,469 1 7,469 41,646 ,000
Desviación 8,020 3 2,673 14,906 ,000
Intra-grupos 2,511 14 ,179
Total 18,000 18
REGR factor score Inter-grupos (Combinados) 13,322 4 3,330 9,966 ,000
3 for analysis 1 Término lineal No ponderado 7,193 1 7,193 21,527 ,000
Ponderado 2,682 1 2,682 8,025 ,013
Desviación 10,640 3 3,547 10,613 ,001
Intra-grupos 4,678 14 ,334
Total 18,000 18
Poza, Carlos

Gráfico
2,0

1,5

1,0
Media Factor Desarrollo Económico y Social

,5

0,0

-,5

-1,0

-1,5

-2,0
1 2 3 4 5

Average Linkage (Between Groups)

Gráfico
3,0

2,5

2,0

1,5

1,0
Media Factor Precariedad

,5

0,0

-,5

-1,0
1 2 3 4 5

Average Linkage (Between Groups)

78
WP Jean Monnet 2005-13
Análisis estadístico multivariante por CC.AA.: diferencias y similitudes

Gráfico
3

1
Media Factor Infraestructura

-1
1 2 3 4 5

Average Linkage (Between Groups)


-
BIBLIOGRAFÍA

- Carrau, J.M. (2005): “Anuario Económico de España”. Colección


Estudios Económicos. Servicio de Estudios La Caixa.
- Fernández Díaz, A.; Parejo Gámir, J.A. y Rodríguez Sáiz, L. (2002):
“Política económica”. Ed. McGrawHill.
- Fernández Franco, L. (2004): “Proyecto de Investigación”. Escuela de
Estadística. Universidad Complutense de Madrid.
- Fernández Franco, L. (2005): “Informe de una investigación”. Escuela de
Estadística. Universidad Complutense de Madrid.
- Herrero, C.; Soler, A. y Villar, A. (2002): “Capital humano y desarrollo
humano en España, sus Comunidades Autónomas y Provincias. 1980-
2000)”. Bancaja e Instituto Valenciano de Investigaciones Económicas.
- Instituto Nacional de Estadística (2004): www.ine.es
- Manuel, C.M. (2005): “Análisis Factorial”. Escuela de Estadística.
Universidad Complutense de Madrid.
- Manuel, C.M. (2005): “Análisis Cluster”. Escuela de Estadística.
Universidad Complutense de Madrid.
- Martín Pliego, F.J. (1995): “Introducción a la estadística económica y
empresarial”. Ed. AC.
- Martín Rodríguez, M. (1999): “Disparidades regionales: perspectiva
histórica y europea” en García Delgado, J.L. (1999): “España, Economía:
ante el siglo XXI”. Espasa Fórum.
- Santiago, J. (2004): “Cómo encontrar una idea de investigación”.
Escuela de Estadística. Universidad Complutense de Madrid.
- SPSS (2003): “SPSS Base 12.0 User’s Guide”. SPSS Manual.
- Visauta Vinacua, B. y Martori i Cañas, J.C. (2003): “Análisis Estadístico
con SPSS para Windows”. Volumen I Estadística Básica. Ed
McGrawHill.
- Visauta Vinacua, B. y Martori i Cañas, J.C. (2003): “Análisis Estadístico
con SPSS para Windows”. Volumen II Estadística Multivariante. Ed
McGrawHill.

-82-
DOCUMENTOS DE TRABAJO/WORKING PAPERS

Comité Editorial

José María Ortiz Ibarz


Emilio Fontela Montes
Alfonso Hidalgo de Calcerrada García
Fernando Fernández Méndez de Andés
Fernando Díez Estella

Comité Científico
(en orden alfabético)

Alvarado Ledesma, Manuel Universidad Argentina de la Empresa


Bonell, Fernando Universidad del Norte (Colombia)
Carvalho, Carlos Eduardo Pontificia Universidade Católica de São Paulo (Brasil)
Dembinski, Paul Université de Fribourg (Suiza)
Fernández Martínez, Pascual Universidad Rey Juan Carlos
Joyanes Aguilar, Luis Universidad Pontificia de Salamanca
Lombardo, Juan Manuel Universidad Pontificia de Salamanca
Marín Egoscozábal, Ainhoa Universidad Antonio de Nebrija
Ortega Mohedano, Félix Universidad Antonio de Nebrija
Pérez García, Julián Universidad Autónoma de Madrid
Pulido San Román, Antonio Universidad Autónoma de Madrid e Instituto Lawrence
Klein
Río Sánchez, Fco. Javier del Universidad Alfonso X El Sabio
Roca Garay, Richard Universidad Nacional Mayor de San Marcos (Perú)
Rueda-Junquera, Fernando Universidad de Burgos
Sánchez de Gómez, Lyda Universidad de Extremadura

Director

José Manuel Saiz Álvarez


Jean Monnet European Studies Centre, Universidad Antonio de Nebrija
DOCUMENTOS DE TRABAJO / WORKING PAPERS

Doc. Trabajo/WP Autor/Author Título/Title

2005/1 Sáiz, J.M. La región de Kaliningrado y la UE-25: situación


actual, retos y perspectivas de futuro

2005/2 Fontela, E.; Llanes, G. y El Sistema SAMEA y la detección de sectores


Rodríguez, C. clave de la contaminación atmosférica en España

2005/4 Delgadillo, L. Factores determinantes en la internacionalización


de la empresa española en México

2005/5 Bolaños, R.; Fontela, E.; Using Interpretive Structural Modelling in Strategic
Nanclares, A. y Pastor, P. Decision-making Groups
From the FSU Rouble Area to Pre-accession to
2005/6 Sáiz, J.M.
Euroland: the Estonian Case.
Retos de la televisión en Europa: viabilidad y
2005/7 Aguado, G.
tendencias de mercado
El Área de Libre Comercio de las Américas
2005/8 Endres, M.
(ALCA): Impacto, oportunidades y riesgos para las
empresas europeas
Perspectives on Entrepreneurial Education: A US-
2005/09 Guzmán, J. y Liñán, F.
Europe Comparison
e-Europe 2005: la convergencia de España en la
2005/10 Lombardo, J.M. y Sáiz, J.M.
Sociedad de la Información
La implantación técnica de la televisión digital
2005/11 García, A.
terrestre en España. Modelos europeos
El atractivo de “L’Île-de-France” en el horizonte
2005/12 Ortega-Mohedano, F.
2025. ¿Un modelo para las regiones?
Análisis estadístico multivariante por Comunidades
2005/13 Poza, C.
Autónomas: diferencias y similitudes
El Centro de Estudios Europeos “Jean Monnet” es una institución científica integrada dentro del
Módulo Europeo “Jean Monnet” de la Universidad Antonio de Nebrija. El objetivo fundamental
del Centro es la investigación en ciencias sociales, con especial incidencia a temas europeos. La
serie Documentos de Trabajo/Working Papers pretende poner al alcance de una amplia
audiencia académica el trabajo de los miembros que integran la comunidad de profesores e
investigadores de la Universidad Antonio de Nebrija. La serie incluye trabajos escritos por
profesores, investigadores, estudiantes de postgrado e invitados que colaboran regularmente
con la Universidad.

Las opiniones expresadas en este documento de trabajo son responsabilidad única del autor, y
su publicación no significa la adhesión del Centro de Estudios Europeos “Jean Monnet” a las
mismas.

The Jean Monnet European Studies Centre is a scientific institution inserted into the Jean
Monnet European Module of Nebrija University. The principal objective of the Centre is to carry
out research in Social Sciences, specially focused on European themes. The Documentos de
Trabajo/Working Papers Series is meant to share the current work of the Nebrija University’s
extended community with a broad scholarly audience. This series includes papers written by
professors, researchers, post-graduated students and invited participants that collaborate with
Nebrija University in a regular basis.

The responsibility for opinions expressed in this paper rests solely with its author, and its
publication does not constitute an endorsement by the Jean Monnet European Studies Centre of
the opinions expressed.

También podría gustarte