Separata de Analisis Factorial
Separata de Analisis Factorial
Separata de Analisis Factorial
Varianza Total
Com
Comn Espec
Especfica
Comunalidad Especificidad
1
Las hiptesis sobre los factores comunes son las siguientes:
La matriz de covariancias de los factores comunes es la matriz identidad, lo que implica que la variancia de cada uno
de los factores es 1 y que los factores estn no correlacionados entre s, ya que todos los elementos de fuera de la
diagonal principal son nulos. As pues, los factores comunes son variables estandarizadas de media 0 y variancia 1, y
que adems no estn correlacionadas entre s.
La matriz de covariancias de los factores nicos es una matriz diagonal, lo que implica que las variancias de los
factores nicos pueden ser distintas y tambin que los factores no estn correlacionados entre s.
La hiptesis sobre la relacin entre los factores comunes y nicos es la siguiente: E(fe)=0
Para poder realiza inferencias que permitan distinguir, para cada variable, entre los factores comunes y el factor nico,
es necesario postular que los primeros no estn correlacionados con este ltimo.
Como las variables X son variables estandarizadas, su matriz de covariancias es igual a la matriz de correlacin
poblacional Rp; es decir,
1 12 ... 1 p
1 ... 2 p
E ( XX ') R p
21
. . . .
p1 p2 ... 1
2
Como se trata de variables estandarizadas, la variancia de cada una de ellas es igual a 1. La matriz de correlacin
siguiente forma:
El primer elemento de la diagonal principal del primer miembro, que es la variancia de variable estandarizada X 1,
puede descomponerse de la siguiente forma:
Donde hj2 es la comunalidad, que se define como la parte de la variancia que es debida a los factores comunes,
mientras que wj2 es la especificidad, que se define como la parte de la variancia que es debida a los factores nicos.
Se puede obtener el coeficiente de correlacin entre par de variable originales como funcin de los factores comunes,
3
Estimacin usando el mtodo de compo-nentes principales
Usando ACP las p componentes se pueden expresar como:
En conjunto de ecuaciones es reversible, pudindose demostrar que es posible expresar las variables X en funcin de las
componentes Z.
En ACP las componentes Z no estn estandarizadas, mientras que los factores comunes si lo estn. Para superar este
problema se pueden utilizar las componentes estandarizadas
Yh
Fh , h 1, 2,..., p
h
Yh Fh h , h 1, 2,..., p
X j u1 j 1 F1 u2 j 2 F2 ... u pj p Fp
Teniendo en cuenta que uhj h es precisamente el coeficiente de correlacin entre la variable j-sima y la
X j r1 j F1 r2 j F2 ... rpj Fp
X j r1 j F1 r2 j F2 ... rmj Fm (rm 1, j Fm 1 ... rpj Fp )
4
Se tiene tambin que:
X j l j1 F1 l j 2 F2 ... l jm Fm e j
Los m factores Fh se estiman mediante las m primeras componentes principales estandarizadas Y h y la estimacin
de los coeficientes ljh viene dada por:
ljh r1 j
lj 2 r2 j
.
.
ljm rmj
Una vez estimados los coeficientes anteriores, se puede estimar la comunalidad de la variable X j de la siguiente forma:
e1 rm 1, j Fm 1 ... rpj Fp
2j 1 h 2j
Denominados scores factoriales. Una vez que se tienen los factores puede interesar conocer que puntuacin obtendran
los sujetos en estos factores. Para ello hay que calcular lo que se conoce como puntuaciones factoriales de cada
individuo.
El clculo de las puntuaciones factoriales se realiza a partir de la matriz factorial rotada y se basa en el modelo de la
regresin mltiple.
Las puntuaciones factoriales exactas slo pueden calcularse estrictamente cuando el mtodo de extraccin ha sido el
de Anlisis de Componentes Principales. Con los otros mtodos slo podrn hacerse estimaciones por medio de algn
mtodo correlacionado. Estas estimaciones se pueden realizar por distintos mtodos. Los procedimientos ms
conocidos son el de Regresin, Anderson-Rubin y Bartlett.
5
II. Rotacin de Factores
La interpretacin se efecta considerando las correlaciones del factor con las variables observadas iniciales, analizando
cules de estas variables contribuyen en mayor medida a la formacin del mismo y a facilitar la identificacin de un
nombre para el factor.
Se presentan casos en los que el coeficiente de correlacin de las variables iniciales con el factor no permite una clara
interpretacin por no destacarse algunas variables especialmente correlacionadas.
Se puede proceder a efectuar rotaciones para aumentar el valor de los coeficientes de correlacin de algunas de las
variables con los factores y facilitar la interpretacin.
Hay que tener en cuenta que el total de la variabilidad retenida permanece constante, pero vara la
variabilidad retenida por cada uno de los factores.
6
III. Contrastes en el Modelo Factorial
Los siguientes contrastes tratan de analizar la pertinencia de aplicacin del anlisis factorial a un conjunto de variables
observables: matriz de correlaciones, contraste de esfericidad de Bartlett y la medida de adecuacin muestral de
Kaiser, Meyer y Olkin.
Matriz de Correlaciones
Comprobar si a simple vista el nmero de correlaciones superiores a 0,5 es considerable.
H 0 : R p 1
H 1 : R p 1
1
0.5(
2
2
p)
n 1 (2 p 5) Ln R
p
6
Los rij son coeficientes de correlacin observados entre variables originales,, mientras que los aij son coeficientes de
correlacin parcial entre variables originales
7
KMO Intepretacin
0.8 0.9 Bueno
0.7 Intermedio
0.5 Aceptable
Menos de 0.5 Inaceptable
Basada en el KMO, se puede calcular tambin una medida de adecuacin muestral individual para cada una de las
variables. Esta medida, denominada MSA ( Measure of Sampling Adequacy) se define de la siguiente forma:
Un valor prximo a 1 para una variable indicar que dicha variables es adecuada para su tratamiento en el anlisis
factorial con el resto de variables.
Matriz de correlacionesa
Imagen de
Rapidez de nivel de flexibilidad Imagen del los Calidad del
servicio precios de precios fabricante vendedores producto Servicio
Correlacin Rapidez de servicio 1.000 -.349 .509 .050 .077 -.483 .612
nivel de precios -.349 1.000 -.487 .272 .185 .470 .513
flexibilidad de precios .509 -.487 1.000 -.116 -.035 -.448 .067
Imagen del fabricante .050 .272 -.116 1.000 .788 .200 .299
Imagen de los
.077 .185 -.035 .788 1.000 .177 .240
vendedores
Calidad del producto -.483 .470 -.448 .200 .177 1.000 -.055
Servicio .612 .513 .067 .299 .240 -.055 1.000
Sig. (Unilateral) Rapidez de servicio .000 .000 .309 .222 .000 .000
nivel de precios .000 .000 .003 .032 .000 .000
flexibilidad de precios .000 .000 .125 .366 .000 .255
Imagen del fabricante .309 .003 .125 .000 .023 .001
Imagen de los
.222 .032 .366 .000 .039 .008
vendedores
Calidad del producto .000 .000 .000 .023 .039 .293
Servicio .000 .000 .255 .001 .008 .293
a. Determinante = .003
8
# Analisis descriptivo y Analisis de Correlacion
library(psych)
describe(datos1)
vars n mean sd median trimmed mad min max range skew kurtosis se
x1 1 100 3.52 1.32 3.40 3.53 1.48 0.0 6.1 6.1 -0.08 -0.59 0.13
x2 2 100 2.36 1.20 2.15 2.30 1.19 0.2 5.4 5.2 0.46 -0.59 0.12
x3 3 100 7.89 1.39 8.05 7.95 1.70 5.0 10.0 5.0 -0.28 -1.12 0.14
x4 4 100 5.25 1.13 5.00 5.23 1.04 2.5 8.2 5.7 0.21 -0.04 0.11
x5 5 100 2.67 0.77 2.60 2.63 0.59 1.1 4.6 3.5 0.48 -0.02 0.08
x6 6 100 6.97 1.59 7.15 7.01 1.85 3.7 10.0 6.3 -0.22 -0.91 0.16
x7 7 100 2.92 0.75 3.00 2.94 0.74 0.7 4.6 3.9 -0.36 0.01 0.08
cor(datos1)
x1 x2 x3 x4 x5 x6 x7
x1 1.00000000 -0.3492251 0.50929519 0.0504142 0.07742782 -0.4826309 0.61190069
x2 -0.34922515 1.0000000 -0.48721259 0.2721868 0.18533024 0.4697458 0.51298082
x3 0.50929519 -0.4872126 1.00000000 -0.1161041 -0.03479587 -0.4481120 0.06661728
x4 0.05041420 0.2721868 -0.11610408 1.0000000 0.78813516 0.1999811 0.29867737
x5 0.07742782 0.1853302 -0.03479587 0.7881352 1.00000000 0.1766130 0.24042771
x6 -0.48263094 0.4697458 -0.44811201 0.1999811 0.17661305 1.0000000 -0.05516130
x7 0.61190069 0.5129808 0.06661728 0.2986774 0.24042771 -0.0551613 1.00000000
corr.test(datos1)
Probability values (Entries above the diagonal are adjusted for multiple tests.)
x1 x2 x3 x4 x5 x6 x7
x1 0.00 0.00 0.00 1.00 1.00 0.00 0.00
x2 0.00 0.00 0.00 0.07 0.52 0.00 0.00
x3 0.00 0.00 0.00 1.00 1.00 0.00 1.00
x4 0.62 0.01 0.25 0.00 0.00 0.41 0.03
x5 0.44 0.06 0.73 0.00 0.00 0.55 0.16
x6 0.00 0.00 0.00 0.05 0.08 0.00 1.00
x7 0.00 0.00 0.51 0.00 0.02 0.59 0.00
cor.plot(cor(datos1))
9
KMO y prueba de Bartlett
Medida de adecuacin muestral de
Kaiser-Meyer-Olkin. .446
$df
[1] 21
Matrices anti-imagen
Imagen de
Rapidez de nivel de flexibilidad Imagen del los Calidad del
servicio precios de precios fabricante vendedores producto Servicio
Covarianza anti-imagen Rapidez de servicio .028 .028 .002 .015 -.006 -.002 -.025
nivel de precios .028 .032 .021 .014 -.005 -.020 -.026
flexibilidad de precios .002 .021 .608 .043 -.039 .086 -.011
Imagen del fabricante .015 .014 .043 .347 -.275 -.018 -.015
Imagen de los
-.006 -.005 -.039 -.275 .371 -.044 .005
vendedores
Calidad del producto -.002 -.020 .086 -.018 -.044 .623 .010
Servicio -.025 -.026 -.011 -.015 .005 .010 .023
Correlacin anti-imagen Rapidez de servicio .345a .957 .018 .148 -.059 -.016 -.978
nivel de precios .957 .330a .155 .133 -.043 -.141 -.975
flexibilidad de precios .018 .155 .914a .094 -.083 .139 -.091
Imagen del fabricante .148 .133 .094 .558a -.766 -.040 -.172
Imagen de los a
-.059 -.043 -.083 -.766 .552 -.091 .051
vendedores
Calidad del producto a
-.016 -.141 .139 -.040 -.091 .927 .088
Servicio -.978 -.975 -.091 -.172 .051 .088 .288a
a. Medida de adecuacin muestral
10
B) ANLISIS DE FACTORES CON 6 VARIABLES Y SIN ROTACIN USANDO SPSS Y R
Matriz de correlacionesa
Imagen de
Rapidez de nivel de flexibilidad Imagen del los Calidad del
servicio precios de precios fabricante vendedores producto
Correlacin Rapidez de servicio 1.000 -.349 .509 .050 .077 -.483
nivel de precios -.349 1.000 -.487 .272 .185 .470
flexibilidad de precios .509 -.487 1.000 -.116 -.035 -.448
Imagen del fabricante .050 .272 -.116 1.000 .788 .200
Imagen de los
.077 .185 -.035 .788 1.000 .177
vendedores
Calidad del producto -.483 .470 -.448 .200 .177 1.000
Sig. (Unilateral) Rapidez de servicio .000 .000 .309 .222 .000
nivel de precios .000 .000 .003 .032 .000
flexibilidad de precios .000 .000 .125 .366 .000
Imagen del fabricante .309 .003 .125 .000 .023
Imagen de los
.222 .032 .366 .000 .039
vendedores
Calidad del producto .000 .000 .000 .023 .039
a. Determinante = .118
Matrices anti-imagen
Imagen de
Rapidez de nivel de flexibilidad Imagen del los Calidad del
servicio precios de precios fabricante vendedores producto
Covarianza anti-imagen Rapidez de servicio .629 .047 -.210 -.046 -.022 .208
nivel de precios .047 .650 .190 -.078 .013 -.162
flexibilidad de precios -.210 .190 .613 .037 -.038 .092
Imagen del fabricante -.046 -.078 .037 .358 -.281 -.012
Imagen de los
-.022 .013 -.038 -.281 .372 -.046
vendedores
Calidad del producto .208 -.162 .092 -.012 -.046 .628
Correlacin anti-imagen Rapidez de servicio .721a .074 -.338 -.098 -.046 .331
nivel de precios .074 .787a .301 -.161 .027 -.253
flexibilidad de precios -.338 .301 .749a .079 -.079 .149
Imagen del fabricante -.098 -.161 .079 .542a -.769 -.025
Imagen de los a
-.046 .027 -.079 -.769 .532 -.096
vendedores
Calidad del producto .331 -.253 .149 -.025 -.096 .779a
a. Medida de adecuacin muestral
11
################################
# #
# Anlisis Exploratorio con 6 variables #
# #
################################
datos=read.delim("hatco-factorial.txt")
str(datos)
vars n mean sd median trimmed mad min max range skew kurtosis se
x1 1 100 3.52 1.32 3.40 3.53 1.48 0.0 6.1 6.1 -0.08 -0.59 0.13
x2 2 100 2.36 1.20 2.15 2.30 1.19 0.2 5.4 5.2 0.46 -0.59 0.12
x3 3 100 7.89 1.39 8.05 7.95 1.70 5.0 10.0 5.0 -0.28 -1.12 0.14
x4 4 100 5.25 1.13 5.00 5.23 1.04 2.5 8.2 5.7 0.21 -0.04 0.11
x5 5 100 2.67 0.77 2.60 2.63 0.59 1.1 4.6 3.5 0.48 -0.02 0.08
x6 6 100 6.97 1.59 7.15 7.01 1.85 3.7 10.0 6.3 -0.22 -0.91 0.16
cor(datos2)
x1 x2 x3 x4 x5 x6
x1 1.00000000 -0.3492251 0.50929519 0.0504142 0.07742782 -0.4826309
x2 -0.34922515 1.0000000 -0.48721259 0.2721868 0.18533024 0.4697458
x3 0.50929519 -0.4872126 1.00000000 -0.1161041 -0.03479587 -0.4481120
x4 0.05041420 0.2721868 -0.11610408 1.0000000 0.78813516 0.1999811
x5 0.07742782 0.1853302 -0.03479587 0.7881352 1.00000000 0.1766130
x6 -0.48263094 0.4697458 -0.44811201 0.1999811 0.17661305 1.0000000
corr.test(datos2)
x1 x2 x3 x4 x5 x6
x1 0.00 0.00 0.00 1.00 1.00 0.00
x2 0.00 0.00 0.00 0.05 0.39 0.00
x3 0.00 0.00 0.00 1.00 1.00 0.00
x4 0.62 0.01 0.25 0.00 0.00 0.32
x5 0.44 0.06 0.73 0.00 0.00 0.39
x6 0.00 0.00 0.00 0.05 0.08 0.00
cor.plot(cor(datos2))
12
# Prueba de Esfericidad de Bartlett
library(rela)
cortest.bartlett(cor(datos2),n=dim(datos2))
$chisq
[1] 205.902077 4.639042
$p.value
[1] 1.339449e-35 9.947665e-01
$df
[1] 15
Grfico de sedimentacin
3,0
2,5
2,0
Autovalor
1,5
1,0
0,5
0,0
1 2 3 4 5 6
Nmero de componente
13
Matriz de componentesa
Componente
1 2
Rapidez de servicio -.627 .514
nivel de precios .759 -.068
flexibilidad de precios -.730 .336
Imagen del fabricante .494 .799
Imagen de los
.424 .832
vendedores
Calidad del producto .767 -.167
Mtodo de extraccin: Anlisis de componentes principales.
a. 2 componentes extrados
facto$communality # Comunalidades
x1 x2 x3 x4 x5 x6
0.6575783 0.5800456 0.6456241 0.8816649 0.8722222 0.6155984
Loadings:
PC1 PC2
x1 -0.627 0.514
x2 0.759
x3 -0.730 0.336
x4 0.494 0.799
x5 0.424 0.832
x6 0.767 -0.167
PC1 PC2
SS loadings 2.513 1.740
Proportion Var 0.419 0.290
Cumulative Var 0.419 0.709
14
C) ANLISIS DE FACTORES CON 6 VARIABLES Y CON ROTACIN VARIMAX USANDO SPSS Y R
Comunalidades
Inicial Extraccin
Rapidez de servicio 1.000 .658
nivel de precios 1.000 .580
flexibilidad de precios 1.000 .646
Imagen del fabricante 1.000 .882
Imagen de los
1.000 .872
vendedores
Calidad del producto 1.000 .616
Mtodo de extraccin: Anlisis de Componentes principales.
Componente
1 2
Rapidez de servicio -.787 .194
nivel de precios .714 .265
flexibilidad de precios -.803 -.011
Imagen del fabricante .102 .933
Imagen de los
.025 .934
vendedores
Calidad del producto .764 .179
Mtodo de extraccin: Anlisis de componentes principales.
0,50
Nivel de Precios
Rapidez de servicio
Factor_2
Flexibilidad de precios
0,00
-0,50
-1,00
-1,00 -0,50 0,00 0,50 1,00
Factor_1
15
# Anlisis Factorial con rotacion con funcin principal
library(psych)
facto=principal(r=datos2,nfactors=2,rotate="varimax")
str(facto)
facto$values
facto$communality
x1 x2 x3 x4 x5 x6
0.6575783 0.5800456 0.6456241 0.8816649 0.8722222 0.6155984
facto$loadings
Loadings:
PC1 PC2
x1 -0.788 0.193
x2 0.714 0.266
x3 -0.803
x4 0.101 0.933
x5 0.934
x6 0.764 0.179
PC1 PC2
SS loadings 2.369 1.883
Proportion Var 0.395 0.314
Cumulative Var 0.395 0.709
facto$scores
PC1 PC2
[1,] -0.657020717 -0.602644207
[2,] 1.176158938 1.297526812
[3,] 1.492440611 0.522742786
. .
. .
. .
[99,] 0.609275093 0.773018106
[100,] -0.353753147 -0.045820886
16
# Grafica de circulo de correlaciones
library(ade4)
s.corcircle(load,grid=FALSE)
fa.diagram(facto)
17
IV. Limitaciones y Supuestos del Anlisis Factorial2
El anlisis factorial es una tcnica de reduccin de datos que depende especialmente de las correlaciones (o de las
covariancias) y sus limitaciones y supuestos estn, por tanto, ligados a ellas.
Normalidad
Es un mtodo fundamental cuando el mtodo de extraccin es de mxima verosimilitud. En los dems casos su no
cumplimiento puede ser importante slo en lo relativo a la determinacin del nmero de factores, particularmente si
se emplean criterios estadsticos.
Linealidad
Los coeficientes de correlacin miden la relacin lineal entre variables y el supuesto de normalidad multivariada lo
exige. Si las correlaciones son no lineales, el anlisis no producir resultados adecuados.
2 Adaptado del libro Anlisis Multivariado. Un manual para investigadores de Andrs Catena & Otros. Editorial
Biblioteca Nueva. Madrid. 2003.
18