Separata de Analisis Factorial

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 18

ANALISIS FACTORIAL1

I. El Modelo de Anlisis Factorial


Formulacin del Modelo
Considerando que X1, X2,,Xp son variables estandarizadas; es decir, son variables con media 0 y variancia 1.
El modelo de anlisis factorial se define de la siguiente forma:

X 1 l11 F1 l12 F2 ... l1m Fm e1


X 2 l21 F1 l22 F2 ... l2 m Fm e2
...................................................
X p l p1 F1 l p 2 F2 ... l pm Fm e p
Donde F1, F2,, Fm son factores comunes; e1, e2,, ep son factores nicos o especficos; ljh es el peso del factor h en la
variable j. A los coeficientes de este tipo se les denomina cargas factoriales.
Cada una de las variables observables es una combinacin lineal de m factores comunes (m < p) y de una factor nico.
Matricialmente, se tiene:

X 1 l11 l12 ... l1m F1 e1


X l
2 21 l22 ... l2 m F2 e2
. . . . . . .

.
. . . . . .
X p l p1 l p 2 ... l pm Fm e p

En forma resumida, se tiene que: X = LF + e

Varianza Total

Com
Comn Espec
Especfica

Comunalidad Especificidad

Hiptesis del Modelo


Anlisis de Variables Matriz R

Anlisis de Individuos Matriz Q


1. Adaptado del libro de Anlisis Multivariante Aplicado. Aplicaciones al marketing, investigacin de mercados,
economa, direccin de empresas y turismo de Uriel, Ezequiel & Aldas, Joaqun. Editorial Thomson. 2005.
Espaa.

1
Las hiptesis sobre los factores comunes son las siguientes:

La esperanza de cada uno de los factores comunes es nula, es decir, E(f) = 0


La matriz de covariancias de los factores comunes es E(ff)=I

La matriz de covariancias de los factores comunes es la matriz identidad, lo que implica que la variancia de cada uno
de los factores es 1 y que los factores estn no correlacionados entre s, ya que todos los elementos de fuera de la
diagonal principal son nulos. As pues, los factores comunes son variables estandarizadas de media 0 y variancia 1, y
que adems no estn correlacionadas entre s.

Las hiptesis sobre los factores nicos son las siguientes:

La esperanza de cada uno de los factores nicos es nula, es decir, E(e) = 0


La matriz de covariancias de los factores comunes es E(ee)=
Donde es una matriz diagonal.

La matriz de covariancias de los factores nicos es una matriz diagonal, lo que implica que las variancias de los
factores nicos pueden ser distintas y tambin que los factores no estn correlacionados entre s.

La hiptesis sobre la relacin entre los factores comunes y nicos es la siguiente: E(fe)=0
Para poder realiza inferencias que permitan distinguir, para cada variable, entre los factores comunes y el factor nico,
es necesario postular que los primeros no estn correlacionados con este ltimo.

Propiedades del Modelo

Como las variables X son variables estandarizadas, su matriz de covariancias es igual a la matriz de correlacin
poblacional Rp; es decir,

1 12 ... 1 p
1 ... 2 p
E ( XX ') R p
21

. . . .

p1 p2 ... 1

2
Como se trata de variables estandarizadas, la variancia de cada una de ellas es igual a 1. La matriz de correlacin

poblacional se puede descomponer de la siguiente forma: R p LL ' , la cual puede descomponerse de la

siguiente forma:

1 12 ... 1 p l11 l12 ... l1m l11 l21 ... l p1 12 0 ... 0



21 1 ... 2 p l21 l22 ... l2 m l12 l22 ... l p 2 0 22 ... 0

. . . . . . . . . . . . . . . .

p1 p2 ... 1 l p1 l p 2 ... l pm l1m l2 m ... l pm 0 0 ... p2

El primer elemento de la diagonal principal del primer miembro, que es la variancia de variable estandarizada X 1,
puede descomponerse de la siguiente forma:

1 l112 l122 ... l12m 12

De forma genrica la variancia de la variable estandarizada Xj se puede descomponer de la siguiente forma:

1 l 2j1 l 2j 2 ... l 2jm 2j

La suma de los m primeros trminos va a ser designada por hj2, es decir,

h 2j l 2j1 l 2j 2 ... l 2jm

De tal forma, que: 1 h 2j 2j

Donde hj2 es la comunalidad, que se define como la parte de la variancia que es debida a los factores comunes,
mientras que wj2 es la especificidad, que se define como la parte de la variancia que es debida a los factores nicos.
Se puede obtener el coeficiente de correlacin entre par de variable originales como funcin de los factores comunes,

hj lh1l j1 lh 2l j 2 ... lhml jm


El problema que se plantea en el anlisis factorial es la estimacin de los coeficientes l jh. A los coeficientes estimados
se les denomina cargas factoriales. Para estimar dichas cargas se usan varios mtodos:
Mtodo de componentes principales
Mtodo de componentes principales iteradas o ejes principales
Mnimos cuadrados no ponderados
Mnimos cuadrados generalizados
Mxima verosimilitud

3
Estimacin usando el mtodo de compo-nentes principales
Usando ACP las p componentes se pueden expresar como:

Y1 u11 X 1 u12 X 2 ... u1 p X p


Y2 u21 X 1 u22 X 2 ... u2 p X p
..................................................
Yp u p1 X 1 u p 2 X 2 ... u pp X p

En conjunto de ecuaciones es reversible, pudindose demostrar que es posible expresar las variables X en funcin de las
componentes Z.

X 1 u11Y1 u21Y2 ... u p1Yp


X 2 u12Y1 u22Y2 ... u p 2Yp
..................................................
X p u1 pY1 u2 pY2 ... u ppYp

En ACP las componentes Z no estn estandarizadas, mientras que los factores comunes si lo estn. Para superar este
problema se pueden utilizar las componentes estandarizadas

Yh
Fh , h 1, 2,..., p
h

Yh Fh h , h 1, 2,..., p

Con lo que la ecuacin j-sima puede expresarse as:

X j u1 j 1 F1 u2 j 2 F2 ... u pj p Fp

Teniendo en cuenta que uhj h es precisamente el coeficiente de correlacin entre la variable j-sima y la

componente h-sima, se puede expresar de la siguiente forma:

X j r1 j F1 r2 j F2 ... rpj Fp
X j r1 j F1 r2 j F2 ... rmj Fm (rm 1, j Fm 1 ... rpj Fp )

4
Se tiene tambin que:

X j l j1 F1 l j 2 F2 ... l jm Fm e j

Los m factores Fh se estiman mediante las m primeras componentes principales estandarizadas Y h y la estimacin
de los coeficientes ljh viene dada por:

ljh r1 j
lj 2 r2 j
.
.
ljm rmj
Una vez estimados los coeficientes anteriores, se puede estimar la comunalidad de la variable X j de la siguiente forma:

h 2j lj21 lj22 ... ljm


2

La estimacin del factor nico e1 viene dada por:

e1 rm 1, j Fm 1 ... rpj Fp

La especificidad se puede estimar directamente mediante la siguiente expresin:

2j 1 h 2j

Puntuaciones de los factores

Denominados scores factoriales. Una vez que se tienen los factores puede interesar conocer que puntuacin obtendran
los sujetos en estos factores. Para ello hay que calcular lo que se conoce como puntuaciones factoriales de cada
individuo.
El clculo de las puntuaciones factoriales se realiza a partir de la matriz factorial rotada y se basa en el modelo de la
regresin mltiple.
Las puntuaciones factoriales exactas slo pueden calcularse estrictamente cuando el mtodo de extraccin ha sido el
de Anlisis de Componentes Principales. Con los otros mtodos slo podrn hacerse estimaciones por medio de algn
mtodo correlacionado. Estas estimaciones se pueden realizar por distintos mtodos. Los procedimientos ms
conocidos son el de Regresin, Anderson-Rubin y Bartlett.

5
II. Rotacin de Factores
La interpretacin se efecta considerando las correlaciones del factor con las variables observadas iniciales, analizando
cules de estas variables contribuyen en mayor medida a la formacin del mismo y a facilitar la identificacin de un
nombre para el factor.
Se presentan casos en los que el coeficiente de correlacin de las variables iniciales con el factor no permite una clara
interpretacin por no destacarse algunas variables especialmente correlacionadas.
Se puede proceder a efectuar rotaciones para aumentar el valor de los coeficientes de correlacin de algunas de las
variables con los factores y facilitar la interpretacin.

Entre los mtodos de rotacin ms comunes se tiene:


Varimax
Maximiza la suma de variancias de las cargas factoriales dentro de cada factor.
Quartimax
Trata de conseguir que una variable tenga una carga alta con un factor y baja con los dems.
Equimax
Solucin intermedia entre los anteriores.

Para interpretar la matriz de rotacin se debe tener en cuenta:


El objetivo de la matriz factorial rotada consiste en identificar cada una de las dimensiones extradas.
Se efecta escogiendo para cada factor, las variables originales (Xs) cuyas correlaciones con el factor sean las
ms elevadas (cercanas a +1 o a -1).

Hay que tener en cuenta que el total de la variabilidad retenida permanece constante, pero vara la
variabilidad retenida por cada uno de los factores.

6
III. Contrastes en el Modelo Factorial
Los siguientes contrastes tratan de analizar la pertinencia de aplicacin del anlisis factorial a un conjunto de variables
observables: matriz de correlaciones, contraste de esfericidad de Bartlett y la medida de adecuacin muestral de
Kaiser, Meyer y Olkin.

Matriz de Correlaciones
Comprobar si a simple vista el nmero de correlaciones superiores a 0,5 es considerable.

Contraste de esfericidad de Bartlett


Consiste en comprobar que la matriz de correlaciones es significativamente distinta de la matriz identidad. En caso que
fuera una matriz identidad no habra correlacin entre variables y no tendra sentido seguir con el anlisis factorial

H 0 : R p 1

H 1 : R p 1

1
0.5(
2
2
p)
n 1 (2 p 5) Ln R
p
6

Medida de Adecuacin Muestral


Los estadsticos Kaiser, Meyer y Olkin propusieron una medida de adecuacin de la muestra al anlisis factorial (KMO).
Un coeficiente de correlacin parcial mide la correlacin entre dos variables, una vez que se han descontado los
efectos lineales de otras variables. En un modelo factorial se pueden interpretar esos efectos de otras variables como
los correspondientes a los factores comunes. Por lo tanto, el coeficiente de correlacin parcial entre dos variables sera
equivalente al coeficiente de correlacin entre los factores nicos de dos variables. Segn el modelo de anlisis
factorial, los coeficientes de correlacin tericos calculados entre cada par de factores nicos son nulos por hiptesis.
Si los coeficientes de correlacin parcial constituyen una aproximacin a dichos coeficientes tericos, deben estar
prximos a 0.
La medida de KMO se define de la siguiente forma:

Los rij son coeficientes de correlacin observados entre variables originales,, mientras que los aij son coeficientes de
correlacin parcial entre variables originales

El valor de KMO variar entre 0 y 1

7
KMO Intepretacin
0.8 0.9 Bueno
0.7 Intermedio
0.5 Aceptable
Menos de 0.5 Inaceptable

Basada en el KMO, se puede calcular tambin una medida de adecuacin muestral individual para cada una de las
variables. Esta medida, denominada MSA ( Measure of Sampling Adequacy) se define de la siguiente forma:

Un valor prximo a 1 para una variable indicar que dicha variables es adecuada para su tratamiento en el anlisis
factorial con el resto de variables.

A) ANLISIS DE FACTORES CON 7 VARIABLES USANDO SPSS Y R

Matriz de correlacionesa

Imagen de
Rapidez de nivel de flexibilidad Imagen del los Calidad del
servicio precios de precios fabricante vendedores producto Servicio
Correlacin Rapidez de servicio 1.000 -.349 .509 .050 .077 -.483 .612
nivel de precios -.349 1.000 -.487 .272 .185 .470 .513
flexibilidad de precios .509 -.487 1.000 -.116 -.035 -.448 .067
Imagen del fabricante .050 .272 -.116 1.000 .788 .200 .299
Imagen de los
.077 .185 -.035 .788 1.000 .177 .240
vendedores
Calidad del producto -.483 .470 -.448 .200 .177 1.000 -.055
Servicio .612 .513 .067 .299 .240 -.055 1.000
Sig. (Unilateral) Rapidez de servicio .000 .000 .309 .222 .000 .000
nivel de precios .000 .000 .003 .032 .000 .000
flexibilidad de precios .000 .000 .125 .366 .000 .255
Imagen del fabricante .309 .003 .125 .000 .023 .001
Imagen de los
.222 .032 .366 .000 .039 .008
vendedores
Calidad del producto .000 .000 .000 .023 .039 .293
Servicio .000 .000 .255 .001 .008 .293
a. Determinante = .003

# Lectura de datos con 7 variables


datos=read.delim("hatco-factorial.txt")
str(datos)

# No considerar la primera columna Id


datos1=datos[,-1]
str(datos1)

8
# Analisis descriptivo y Analisis de Correlacion
library(psych)
describe(datos1)

vars n mean sd median trimmed mad min max range skew kurtosis se
x1 1 100 3.52 1.32 3.40 3.53 1.48 0.0 6.1 6.1 -0.08 -0.59 0.13
x2 2 100 2.36 1.20 2.15 2.30 1.19 0.2 5.4 5.2 0.46 -0.59 0.12
x3 3 100 7.89 1.39 8.05 7.95 1.70 5.0 10.0 5.0 -0.28 -1.12 0.14
x4 4 100 5.25 1.13 5.00 5.23 1.04 2.5 8.2 5.7 0.21 -0.04 0.11
x5 5 100 2.67 0.77 2.60 2.63 0.59 1.1 4.6 3.5 0.48 -0.02 0.08
x6 6 100 6.97 1.59 7.15 7.01 1.85 3.7 10.0 6.3 -0.22 -0.91 0.16
x7 7 100 2.92 0.75 3.00 2.94 0.74 0.7 4.6 3.9 -0.36 0.01 0.08

cor(datos1)
x1 x2 x3 x4 x5 x6 x7
x1 1.00000000 -0.3492251 0.50929519 0.0504142 0.07742782 -0.4826309 0.61190069
x2 -0.34922515 1.0000000 -0.48721259 0.2721868 0.18533024 0.4697458 0.51298082
x3 0.50929519 -0.4872126 1.00000000 -0.1161041 -0.03479587 -0.4481120 0.06661728
x4 0.05041420 0.2721868 -0.11610408 1.0000000 0.78813516 0.1999811 0.29867737
x5 0.07742782 0.1853302 -0.03479587 0.7881352 1.00000000 0.1766130 0.24042771
x6 -0.48263094 0.4697458 -0.44811201 0.1999811 0.17661305 1.0000000 -0.05516130
x7 0.61190069 0.5129808 0.06661728 0.2986774 0.24042771 -0.0551613 1.00000000

corr.test(datos1)

Probability values (Entries above the diagonal are adjusted for multiple tests.)
x1 x2 x3 x4 x5 x6 x7
x1 0.00 0.00 0.00 1.00 1.00 0.00 0.00
x2 0.00 0.00 0.00 0.07 0.52 0.00 0.00
x3 0.00 0.00 0.00 1.00 1.00 0.00 1.00
x4 0.62 0.01 0.25 0.00 0.00 0.41 0.03
x5 0.44 0.06 0.73 0.00 0.00 0.55 0.16
x6 0.00 0.00 0.00 0.05 0.08 0.00 1.00
x7 0.00 0.00 0.51 0.00 0.02 0.59 0.00

cor.plot(cor(datos1))

9
KMO y prueba de Bartlett
Medida de adecuacin muestral de
Kaiser-Meyer-Olkin. .446

Prueba de esfericidad Chi-cuadrado


567.467
de Bartlett aproximado
gl 21
Sig. .000

# Prueba de Esfericidad de Bartlett


library(rela)
cortest.bartlett(cor(datos1),n=dim(datos1))
$chisq
[1] 567.4674 22.6987
$p.value
[1] 1.094129e-106 3.602512e-01

$df
[1] 21

Matrices anti-imagen

Imagen de
Rapidez de nivel de flexibilidad Imagen del los Calidad del
servicio precios de precios fabricante vendedores producto Servicio
Covarianza anti-imagen Rapidez de servicio .028 .028 .002 .015 -.006 -.002 -.025
nivel de precios .028 .032 .021 .014 -.005 -.020 -.026
flexibilidad de precios .002 .021 .608 .043 -.039 .086 -.011
Imagen del fabricante .015 .014 .043 .347 -.275 -.018 -.015
Imagen de los
-.006 -.005 -.039 -.275 .371 -.044 .005
vendedores
Calidad del producto -.002 -.020 .086 -.018 -.044 .623 .010
Servicio -.025 -.026 -.011 -.015 .005 .010 .023
Correlacin anti-imagen Rapidez de servicio .345a .957 .018 .148 -.059 -.016 -.978
nivel de precios .957 .330a .155 .133 -.043 -.141 -.975
flexibilidad de precios .018 .155 .914a .094 -.083 .139 -.091
Imagen del fabricante .148 .133 .094 .558a -.766 -.040 -.172
Imagen de los a
-.059 -.043 -.083 -.766 .552 -.091 .051
vendedores
Calidad del producto a
-.016 -.141 .139 -.040 -.091 .927 .088
Servicio -.978 -.975 -.091 -.172 .051 .088 .288a
a. Medida de adecuacin muestral

# Indicador Kaiser-Meyer-Olkinn KMO y MSA


KMO(datos1)
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = datos1)
Overall MSA = 0.45
MSA for each item =
x1 x2 x3 x4 x5 x6 x7
0.34 0.33 0.91 0.56 0.55 0.93 0.29

10
B) ANLISIS DE FACTORES CON 6 VARIABLES Y SIN ROTACIN USANDO SPSS Y R

Matriz de correlacionesa

Imagen de
Rapidez de nivel de flexibilidad Imagen del los Calidad del
servicio precios de precios fabricante vendedores producto
Correlacin Rapidez de servicio 1.000 -.349 .509 .050 .077 -.483
nivel de precios -.349 1.000 -.487 .272 .185 .470
flexibilidad de precios .509 -.487 1.000 -.116 -.035 -.448
Imagen del fabricante .050 .272 -.116 1.000 .788 .200
Imagen de los
.077 .185 -.035 .788 1.000 .177
vendedores
Calidad del producto -.483 .470 -.448 .200 .177 1.000
Sig. (Unilateral) Rapidez de servicio .000 .000 .309 .222 .000
nivel de precios .000 .000 .003 .032 .000
flexibilidad de precios .000 .000 .125 .366 .000
Imagen del fabricante .309 .003 .125 .000 .023
Imagen de los
.222 .032 .366 .000 .039
vendedores
Calidad del producto .000 .000 .000 .023 .039
a. Determinante = .118

KMO y prueba de Bartlett


Medida de adecuacin muestral de
Kaiser-Meyer-Olkin. .665

Prueba de esfericidad Chi-cuadrado


205.902
de Bartlett aproximado
gl 15
Sig. .000

Matrices anti-imagen

Imagen de
Rapidez de nivel de flexibilidad Imagen del los Calidad del
servicio precios de precios fabricante vendedores producto
Covarianza anti-imagen Rapidez de servicio .629 .047 -.210 -.046 -.022 .208
nivel de precios .047 .650 .190 -.078 .013 -.162
flexibilidad de precios -.210 .190 .613 .037 -.038 .092
Imagen del fabricante -.046 -.078 .037 .358 -.281 -.012
Imagen de los
-.022 .013 -.038 -.281 .372 -.046
vendedores
Calidad del producto .208 -.162 .092 -.012 -.046 .628
Correlacin anti-imagen Rapidez de servicio .721a .074 -.338 -.098 -.046 .331
nivel de precios .074 .787a .301 -.161 .027 -.253
flexibilidad de precios -.338 .301 .749a .079 -.079 .149
Imagen del fabricante -.098 -.161 .079 .542a -.769 -.025
Imagen de los a
-.046 .027 -.079 -.769 .532 -.096
vendedores
Calidad del producto .331 -.253 .149 -.025 -.096 .779a
a. Medida de adecuacin muestral

11
################################
# #
# Anlisis Exploratorio con 6 variables #
# #
################################

# Lectura de datos con 6 variables

datos=read.delim("hatco-factorial.txt")
str(datos)

# No considerar la primera columna Id ni la ltima variable X7


datos2=datos[,c(-1,-8)]
str(datos2)

# Analisis descriptivo y Analisis de Correlacion


library(psych)
describe(datos2)

vars n mean sd median trimmed mad min max range skew kurtosis se
x1 1 100 3.52 1.32 3.40 3.53 1.48 0.0 6.1 6.1 -0.08 -0.59 0.13
x2 2 100 2.36 1.20 2.15 2.30 1.19 0.2 5.4 5.2 0.46 -0.59 0.12
x3 3 100 7.89 1.39 8.05 7.95 1.70 5.0 10.0 5.0 -0.28 -1.12 0.14
x4 4 100 5.25 1.13 5.00 5.23 1.04 2.5 8.2 5.7 0.21 -0.04 0.11
x5 5 100 2.67 0.77 2.60 2.63 0.59 1.1 4.6 3.5 0.48 -0.02 0.08
x6 6 100 6.97 1.59 7.15 7.01 1.85 3.7 10.0 6.3 -0.22 -0.91 0.16

cor(datos2)

x1 x2 x3 x4 x5 x6
x1 1.00000000 -0.3492251 0.50929519 0.0504142 0.07742782 -0.4826309
x2 -0.34922515 1.0000000 -0.48721259 0.2721868 0.18533024 0.4697458
x3 0.50929519 -0.4872126 1.00000000 -0.1161041 -0.03479587 -0.4481120
x4 0.05041420 0.2721868 -0.11610408 1.0000000 0.78813516 0.1999811
x5 0.07742782 0.1853302 -0.03479587 0.7881352 1.00000000 0.1766130
x6 -0.48263094 0.4697458 -0.44811201 0.1999811 0.17661305 1.0000000

corr.test(datos2)

x1 x2 x3 x4 x5 x6
x1 0.00 0.00 0.00 1.00 1.00 0.00
x2 0.00 0.00 0.00 0.05 0.39 0.00
x3 0.00 0.00 0.00 1.00 1.00 0.00
x4 0.62 0.01 0.25 0.00 0.00 0.32
x5 0.44 0.06 0.73 0.00 0.00 0.39
x6 0.00 0.00 0.00 0.05 0.08 0.00

cor.plot(cor(datos2))

12
# Prueba de Esfericidad de Bartlett
library(rela)
cortest.bartlett(cor(datos2),n=dim(datos2))

$chisq
[1] 205.902077 4.639042
$p.value
[1] 1.339449e-35 9.947665e-01

$df
[1] 15

# Indicador Kaiser-Meyer-Olkinn KMO y MSA


KMO(datos2)

Call: KMO(r = datos2)


Overall MSA = 0.66
MSA for each item =
x1 x2 x3 x4 x5 x6
0.72 0.79 0.75 0.54 0.53 0.78

Varianza total explicada

Sumas de las saturaciones al cuadrado


Autovalores iniciales de la extraccin
% de la % de la
Componente Total varianza % acumulado Total varianza % acumulado
1 2.513 41.885 41.885 2.513 41.885 41.885
2 1.740 28.994 70.879 1.740 28.994 70.879
3 .598 9.959 80.838
4 .530 8.830 89.667
5 .416 6.928 96.595
6 .204 3.405 100.000
Mtodo de extraccin: Anlisis de Componentes principales.

Grfico de sedimentacin

3,0

2,5

2,0
Autovalor

1,5

1,0

0,5

0,0

1 2 3 4 5 6

Nmero de componente

13
Matriz de componentesa

Componente
1 2
Rapidez de servicio -.627 .514
nivel de precios .759 -.068
flexibilidad de precios -.730 .336
Imagen del fabricante .494 .799
Imagen de los
.424 .832
vendedores
Calidad del producto .767 -.167
Mtodo de extraccin: Anlisis de componentes principales.
a. 2 componentes extrados

# Anlisis Factorial sin rotacin con funcin principal


library(psych)
facto=principal(r=datos2,nfactors=2,rotate="none")
str(facto)
facto$values

[1] 2.5131167 1.7396167 0.5975188 0.5297714 0.4156729 0.2043035

plot(facto$values,type="h") # Grafica de Valores propios

facto$communality # Comunalidades

x1 x2 x3 x4 x5 x6
0.6575783 0.5800456 0.6456241 0.8816649 0.8722222 0.6155984

facto$loadings # Cargas Factoriales, Correlaciones Factor,Componente

Loadings:
PC1 PC2
x1 -0.627 0.514
x2 0.759
x3 -0.730 0.336
x4 0.494 0.799
x5 0.424 0.832
x6 0.767 -0.167
PC1 PC2
SS loadings 2.513 1.740
Proportion Var 0.419 0.290
Cumulative Var 0.419 0.709

14
C) ANLISIS DE FACTORES CON 6 VARIABLES Y CON ROTACIN VARIMAX USANDO SPSS Y R
Comunalidades

Inicial Extraccin
Rapidez de servicio 1.000 .658
nivel de precios 1.000 .580
flexibilidad de precios 1.000 .646
Imagen del fabricante 1.000 .882
Imagen de los
1.000 .872
vendedores
Calidad del producto 1.000 .616
Mtodo de extraccin: Anlisis de Componentes principales.

Varianza total explicada

Sumas de las saturaciones al cuadrado Suma de las saturaciones al cuadrado


Autovalores iniciales de la extraccin de la rotacin
% de la % de la % de la
Componente Total varianza % acumulado Total varianza % acumulado Total varianza % acumulado
1 2.513 41.885 41.885 2.513 41.885 41.885 2.370 39.499 39.499
2 1.740 28.994 70.879 1.740 28.994 70.879 1.883 31.380 70.879
3 .598 9.959 80.838
4 .530 8.830 89.667
5 .416 6.928 96.595
6 .204 3.405 100.000
Mtodo de extraccin: Anlisis de Componentes principales.

Matriz de componentes rotadosa

Componente
1 2
Rapidez de servicio -.787 .194
nivel de precios .714 .265
flexibilidad de precios -.803 -.011
Imagen del fabricante .102 .933
Imagen de los
.025 .934
vendedores
Calidad del producto .764 .179
Mtodo de extraccin: Anlisis de componentes principales.

Mtodo de rotacin: Normalizacin Varimax con Kaiser.


1,00 a. La rotacin ha convergido ende3lositeraciones.
Imagen vendedores

Imagen del fabricante

0,50

Nivel de Precios
Rapidez de servicio
Factor_2

Calidad del producto

Flexibilidad de precios
0,00

-0,50

-1,00
-1,00 -0,50 0,00 0,50 1,00

Factor_1

15
# Anlisis Factorial con rotacion con funcin principal
library(psych)
facto=principal(r=datos2,nfactors=2,rotate="varimax")
str(facto)
facto$values

[1] 2.5131167 1.7396167 0.5975188 0.5297714 0.4156729 0.2043035

facto$communality

x1 x2 x3 x4 x5 x6
0.6575783 0.5800456 0.6456241 0.8816649 0.8722222 0.6155984

facto$loadings

Loadings:
PC1 PC2
x1 -0.788 0.193
x2 0.714 0.266
x3 -0.803
x4 0.101 0.933
x5 0.934
x6 0.764 0.179
PC1 PC2
SS loadings 2.369 1.883
Proportion Var 0.395 0.314
Cumulative Var 0.395 0.709

facto$scores

PC1 PC2
[1,] -0.657020717 -0.602644207
[2,] 1.176158938 1.297526812
[3,] 1.492440611 0.522742786
. .
. .
. .
[99,] 0.609275093 0.773018106
[100,] -0.353753147 -0.045820886

# Grafica de individuos sobre el primer plano de componentes


load <- facto$loadings[,1:2]
plot(load,type="n") # set up plot
text(load,labels=names(datos2),cex=0.8) # add variable names

16
# Grafica de circulo de correlaciones
library(ade4)
s.corcircle(load,grid=FALSE)

fa.diagram(facto)

# Almacena los datos y los resultados de los scores en un archivo CSV


datosf=cbind(datos2,facto$scores)
datosf
str(datosf)
write.csv(datosf,"hatco-datos-factorial-con-acp.csv")

17
IV. Limitaciones y Supuestos del Anlisis Factorial2

El anlisis factorial es una tcnica de reduccin de datos que depende especialmente de las correlaciones (o de las
covariancias) y sus limitaciones y supuestos estn, por tanto, ligados a ellas.

Tamao de la muestra y datos perdidos


Los coeficientes de correlacin son muy sensibles al tamao de las muestras. Son de hecho, poco fiables cuando las
muestras son pequeas, lo que hace recomendable que el nmero de sujetos sea lo suficientemente grande para que el
anlisis produzca resultados estables.
La prdida de sujetos tambin puede afectar a los coeficientes de correlacin, particularmente cuando esta se produce
de manera no aleatoria.

Normalidad
Es un mtodo fundamental cuando el mtodo de extraccin es de mxima verosimilitud. En los dems casos su no
cumplimiento puede ser importante slo en lo relativo a la determinacin del nmero de factores, particularmente si
se emplean criterios estadsticos.

Linealidad
Los coeficientes de correlacin miden la relacin lineal entre variables y el supuesto de normalidad multivariada lo
exige. Si las correlaciones son no lineales, el anlisis no producir resultados adecuados.

Ausencia de valores extremos


Los coeficientes de correlacin son medidas no robustas de relacin lineal, lo que implica que son afectados por la
existencia de puntuaciones extremas. Su existencia compromete la solucin factorial, por lo que es importante
comprobar si existen, y eliminarlos o realizar transformaciones que limiten su influencia.

Factorizabilidad de la matriz de correlaciones


El anlisis factorial produce resultados adecuados cuando la matriz de correlaciones contienen correlaciones altas entre
pares de variables. En general, si ninguna correlacin excede de 0.30 es bastante probable que no pueda llegarse a una
solucin aceptable.

2 Adaptado del libro Anlisis Multivariado. Un manual para investigadores de Andrs Catena & Otros. Editorial
Biblioteca Nueva. Madrid. 2003.
18

También podría gustarte