AFC Multiples
AFC Multiples
AFC Multiples
Presentacin
Anlisis Factorial
de Correspondencias
Mltiples
Primera Parte
La encuesta
y el tratamiento
de los datos de encuesta
Encuesta :
proceso estandarizado de observacin de p atributos
(cualitativos o cuantitativos) sobre n unidades de observacin.
Ejemplos de encuestas...
Indicadores observables :
Las unidades temticas de una encuesta estn
compuestas de indicadores - observables de manera
estndar -
utilizacin
Tipologa
debe
preveren
laselestrategias
dede
las
obsersocio-descriptiva
* Ejemplo,
estudio de de
lastratamiento
condiciones
trabajo
de esa
de los
delalos
en
produccin
vaciones
que sern minera...
recogidas.
variable?
mineros
trabajadores
Eventualmente N = n
La seleccin de las n unidades de observacin
puede ser aleatoria o razonada...
y slo entonces...
Indice
obsj
Indice
obsZ
xij
Tema K
xij
xij
Var. opinin
Op.
obs1
Op.
obsz
xij
xij
Tipologia
sociodesc.
Tipologa opinin
Tipologa de la opinin
J
de los n individuos
en J clases
njk
Tipologa
de
los
n individuos
en K clases
Por ello
el A.F.C.M. es el instrumento apropiado para
el tratamiento estadstico de los datos producidos por va de encuestas.
El mtodo de A.F.C.M. permite :
Primer error :
slo se exploran las relaciones bivariadas...
Var. sociodescriptivas
Var.
obs1
Var. Var.
obsj
obsz
Var. opinin
Op.
obs1
Op.
obsz
Variable
observj
Se crean
A.F.C.M.
evitar
tresautomticamente
errores ms
1 El
permite
los
comunes
que
tratando
se cometen
p xopinin
q Tablas de
Variable
j
los
datos
de
una
encuesta...
i
xij
xij
Contingencia!!!
1
njk
Segundo error :
se seleccionan las Tablas de Contingencia
interesantes entre las p x q tablas creadas...
Criterio de seleccin : test de independencia del Chi2
Pero
Tercer error :
se construyen arbitrariamente las tipologas
que resumen una unidad temtica...
Tema: opinin poltica
Esc.
obs1
Esc.
obsj
Esc.
obsp
Variable resumen :
vir p1x i1 pp x ip
eventualmente : pj = 1
Clase A : 0 F( v ) 25%
xij
Tipologa de la opinin :
Esquema de un cuestionario...
El investigador dispone:
- de un protocolo normalizado de encuesta ;
- de una lista estandardizada de caractersticas
observables, con atributos mutuamente exclusivos.
Durante el trabajo de campo
el observador atribuye, sin ninguna ambigedad,
al
i-simo individuo, la k-sima modalidad de la j-sima
caracterstica que figura en el cuestionario.
Suma imposible
Suma imposible
xi1 = 0
xi2 = 0
xi3 = 0
Tabla Lgica TL (n x K)
llamada tambin ;
Tabla de Burt TB (K x K)
correspondiente a la TCC (n x p)
Segunda Parte
Fundamentos racionales
del Anlisis Factorial
de Correspondencias Mltiples
Primer tema
Objetivos del mtodo
de Anlisis Factorial de
Correspondencias Mltiples
(A.F.C.M.)
Cuarto
Primer
Tercer objetivo
objetivo
Segundo
Construir
Estudiar
Resumir
tipologas
la relacin
el conjunto
de las
existente
unidades
de caractersticas
entre
de todas
observacin,
las
observadas
endeun
pequeo
nmero observadas.
de variables
modalidades
las
caractersticas
las
caractersticas
observadas.
mediante la comparacin de todas las unidades de
cuantitativas, relacionadas con el conjunto
observacin
a travscualitativas
de todas las
modalidades de
de variables
estudiado.
las caractersticas observadas.
Segundo tema
Anlisis Factorial de
Correspondencias
de una
Tabla Disyuntiva Completa
El espacio de representacin
de los individuos
verificacin de la pertinencia
de la distancia del Chi2
en el espacio de los puntos-lnea
una
Aplicando el A.F.C. a la Tabla TDC (n x K) podemos
Tabla de Contingencia de tipo particular.
representar :
- la j-sima coordenada del i-simo individuo
en :
x
K
x ij
nj
1
fij
; fi. ; f. j
;
np
n
np
ij
np
1 nj
n np
x ij
p
nj
np
x i' j
nj
1
fi' j
; fi'. ; f. j
;
np
n
np
i' j
np
1 nj
n np
x i' j
p
nj
np
x ij
Trmino general :
nj
, j 1, , K
np
x i' j
Trmino general :
nj
np
, j 1, , K
x i' j
d2 i,i'
n
n
j
j
j 1
p
p
np
np
x ij
np x ij x i' j
2
d i,i'
nj p
p
j 1
d2 i,i'
j 1
j 1
n x x
i' j
n j ij
n x x
i' j
n j ij
d2 i,i' 1
p
j 1
n x x
i' j
n j ij
De modo que .
La distancia del
i e i
2 Chi2 entre dos individuos
x ij x i' j 1 o bien x ij x i' j 2 0
slo si losen
individuos
i e i no presentan
aumenta
, en
que aumenta
2 la medida
x x 1
ij
i' j
el nmero de modalidades
diferentes
cuando los individuos
i e i presentan o
x
0 no presentan conjuntamente
ij
i' j
la j-sima
que presentan
esosmodalidad.
individuos.
d2 i,i' 1
p
j 1
n x x
i' j
n j ij
De modo que
Vemos tambin en esa expresin
que...
2
aumenta
las divergencias
presentadas
distancia tambin
entre dos si
individuos
con el factor
:
en las modalidades lo son a propsito de
n : inverso del peso de mod j 1, , K
j
nmodalidades
muy poco frecuentes
j
(de bajo peso).
El espacio de representacin
de las modalidades
verificacin de la pertinencia
de la distancia del Chi2
en el espacio de los puntos-columna
x ij
Trmino general :
np
nj
p
np np
i 1, , n
x ij'
Trmino general :
np
n j'
p
np np
i 1, , n
x ij
x ij'
np
np
d2 j, j'
nj
p
i 1
np np
n j'
p
np np
De modo que...
n
d2 j, j'
x ij
i 1
nj 1
x ij'
x ij x ij'
n j n j'
i 1
n j' 1
n
d2 j, j'
x ij x ij'
n j n j'
i 1
x ij2 x ij2'
x ij x ij'
d2 j, j'
n 2 2 2
n j n j'
n j n j'
i 1
Llamando :
nj
n j'
x ij2 x ij2'
x ij x ij'
d2 j, j'
n 2 2 2
n j n j'
n j n j'
i 1
para
los
individuos
los
que
n
Es igual
los
(n
n
individuos
individuos
que
que
jj ind.
jj
jjjj
n
n
n
n
2
2
2
j j'
n j' j nj' jn j'
n n
j
'
j
presentaron la modalidad
j nilalamodalidad
modalidadj.
j.
presentaron
j.
El cuadrado de la distancia entre dos modalidades
que presentaron
simultneamente
la modalidad
j
Individuos
para
los
cuales
x
=
1
y
x
=
0.
0
1.
ijij
ij
ij
es igual
a la proporcin
de individuos
que
presentaron
y la modalidad
j.
la modalidad
j, pero
modalidad
la proporcin
Individuos
para no
losla
cuales
xij = 1 j,
y xms
=
1.
ij
de individuos que presentaron la modalidad j, pero no
la modalidad j.
Matrices de inercia
asociadas a las nubes de puntos
perfiles en lnea y en columna
Dp
1
2
x i1
L p
x ij
p
x iK
p
nj
2
np
DI
1
1
I
n
A Dp L ' DI
L Dp
x ij x ij'
j 1
1 n j n j'
n n n
x ij
x iK
; ;
; ;
n1
nj
nK
p
p
p
np
np
np
x i1
x ij
nj
n1
x iK
nK
; ;
; ;
np
np
np
n1
nj
nK
p
p
p
np
np
np
x i1
Puesto que...
Coordenadas de GL :
nj
n1
nK
; ;
; ;
np
np
np
A w w
A L ' DI L
en general, la matriz A no es simtrica pero
Se verifica que :
tr A
1 1 y
tr A 1
p 0
B (n x n)...
B .u .u
Los
Los vectores propios w asociados a los valores
de A son iguales a los valores propios resultantes de
propios que resultan de la diagonalizacin de
la diagonalizacin de B.
= 1,r
la diagonalizacin de
B:
1 w
1
n
espacios.
Coordenadas factoriales
Coordenadas de los puntos-individuos sobre el eje :
n
j
F i
w j
np
n
j
j 1
p
np
x ij
G j
x ij
i 1
nj
u i
n
1
Se construyen as las
Tablas de Coordenadas
Factoriales de los individuos
y las
Tablas de Coordenadas
Factoriales
de los puntos-perfilesmodalidades
F1 F
Fr
F(i)
GI
G1
Gr
Gj
G(j)
GM
1, , r F
1, , r G
1 F i 0
n
i 1
K n
np G
j 1
j 0
s 2
s 2
i 1
K
1 F i F
n
nj
np
j 1
n1 F
2
G2 j
i 1
Tercer
objetivo
Segundo
objetivo
Primer
objetivo
Resumir
de caractersticas
Estudiar el
la conjunto
relacin existente
entre todas las
Contribucin a la inercia
de una modalidad
e
Inercia total de la
nube de puntos-modalidades
Contrib. j I
GM
pj
Siendo : d2 j ; GM
d2
j ;GM np d2 j ;GM
nx ij2
i 1
nj
2
n
j
x ij
1
2
n
nj
En esa expresin :
xij = 1 : para los nj ind. que presentaron la modalidad j.
xij = 0 : para los (n - nj) ind. que no presentaron la modalidad j.
d 2 j ; GM
n 1 2 1
nj 2 n nj
nj n nj n
n 1
nj
De modo que :
Contrib. j I
GM
nj
np
d 2 j ; GM
nj
1
1
p
n
nj n
np n j
Contrib. j I
GM
nj
1
1
p
n
Cuanto
ms rara es una modalidad mayor es su
Este trmino es muy pequeo si n es muy grande
j
Ejemplo de un grfico factorial de la nube de puntosmodalidades, con modalidades de muy baja frecuencia
otras
modalidades
mod2B
mod1C
mod3B
modalidades
raras
mod2A
eje I
mod4B
mod1A
mod2C
eje II
mod3C
mod1B
Cmo se construyen
artificialmente las
modalidades de
muy baja frecuencia?
Elaboracin de los
cuestionarios...
Supervisin del trabajo de campo...
Verificacin y correccin de la
base de datos...
de la nube
de puntos-modalidades
K
j 1
j 1
1 1 n j
p
n
IGM Kp 1
La inercia total de una Tabla Lgica depende
nicamente del nmero de variables observadas
y del nmero de modalidades definidas para esas
variables
Relaciones de Transicin
en el
anlisis de correspondencias
de una
Tabla Lgica
F i
x ij
pG
j 1
j i 1, , n
G j
x ij
n
i 1
F i j 1, , K
Eje I
Eje II
Eje I
Eje II
Eje I
Representacin
de los puntos-variables
en el
anlisis de correspondencias
de una
Tabla Lgica
Cuarto objetivo
Estudiar la relacin existente entre todas las
las caractersticas observadas.
Ejemplo
scattergrama de la distribucin de una variable
cuantitativa en una particin en tres grupos
yk 1
nk
nk
F i
i 1
G Jk
nk
x ij
n
i 1
de modo que :
nk
F i F i nk G Jk
i 1
yk G Jk
Siendo :
s2
inter - clases
k 1
nk 2
G Jk p
n
total
s2
k 1
nk 2
G Jk
np
k 1
nk 2
G Jk
np
k 1
nk 2
G Jk
np
y sabemos que : Jk
de modo que :
2 J;F
nk 2
G Jk
np
100
p
100
J
k 1
2 J;F
p
100
J
k 1
Tercer tema
Anlisis Factorial de
Correspondencias
de una Tabla de Burt
n j1
n jk
n jK
p 2n
p 2n
p 2n
pn j.
pn.1
2
2n
p
n
p
n j1
; ;
pn j.
; ;
pn.k
p 2n p 2n
n jk
pn j.
pn.K
p 2n p 2n
n jK
n
; ; n
; ; n
p n n
p n n
p n n
j. .1
j. .k
j. .K
k 1
k 1
n jk
n j'k
n
n
p n n
p n n
j. .k
j'. .k
n
n.k
n jk n j'k
n j. n j'.
Relaciones existentes
entre la Tabla Lgica
(o Tabla Disyuntiva Completa)
y la Tabla de Burt
Semejanzas y diferencias
entre el A.F.C. de una Tabla Lgica
y el A.F.C. de una Tabla de Burt
TB
J GTL
J
TB 2TL
Tercera Parte
Funcionamiento del Anlisis
Factorial de
Correspondencias Mltiples
1
p
J 1
2 G
;J
Si : 2 G ;J 1 J 1, , p 1
100 100
IG
Coeficientes de ayuda
a la interpretacin de resultados
en el Anlisis Factorial
de Correspondencias Mltiples
1 F2 i
n
C TR i
100 i I
nk 2
G k
C TR k n
100 k K
Elementos suplementarios
o ilustrativos
en el Anlisis Factorial
de Correspondencias Mltiples
Individuos suplementarios
F i' s
x 'sj
p
j 1
G j
1 1
p
j 1
x 'sj G j
Atributos suplementarios
G Cq
x iq
n
i 1
.q
F i
Modalidades suplementarias
G Cq
1
1
nqj
n
j 1
G j
Cuarta Parte
Prctica
del Anlisis Factorial de
Correspondencias Mltiples
Ejemplo de aplicacin
del A.F.C.M.
al tratamiento de la informacin
producida
en una observacin descriptiva
: Unidad
temtica
3 4
Variables
Variables :: Unidad
Unidad temtica
temtica 21 Variables
Variables
: Unidad
temtica
V31.
Colab.
a observ.
V23.
Miembro
Partido
Poltico
V9.
Part. Org. Escolar
V16.
Part.
denuncias/protes.
V1. Edad
V32.
Colab.Sindicato
a entrev.
V24.
Miembro
V10.
Part. Org. Poltica
V17.
Part.cartas
adm.pbl.
V2. Sexo
V33.
Colab.Org.
a organiz.
V25.
Miembro
Volont.
V11.
Part.
Sindical
V18.
Part.reclamos
func.
V3. Nivel
deOrg.
Instruccin
V34.
Colab.
a difusin
V26.
Miembro
Comit
Barrio
V12.
Part. Org.
Barrial
V19.
Part.
reuniones
amicales.
V4. Estatuto
ocupacin
V35.
Colab.
a iniciativa
V27.
Miembro
Asoc.Cult.
V13.
Part. profesional
a peticiones
V20.
Part.
progr.radio/TV
V5. Sector
V36.
Colab.Org.
a formacin
V28.
Miembro
Ecolo
V14.
Part.act.voluntarias
V21.
Part.prod.estudios
V6. Tipo
de ocupacin
V15.
Part.de
gestin
servicios V29.
V22.
Part.reuniones
defensa
V37.
Colab.Org.
a otras
for.
Miembro
Relig.
V7. Rama
ocupacin
V8. Regin de residencia
V30.
Primera etapa :
Segunda etapa :
Tercera etapa :
Primera etapa :
Objetivo : Construccin de una tipologa
Instrumento :
Anlisis Factorial de
Correspondencias Mltiples
de la tabla TCC(2163,7)
diff1 1 2 2 1
diff1 2 3 3 2
Interpretacin
de los ejes factoriales
y de los planos factoriales
ZOOM
Eje I
ZOOM
Eje I
Eje II
ZOOM
Eje I
Problema
Conclusiones :
- Permite verificar la clasificabilidad del conjunto de
individuos observados.
- Pero, siendo un espacio continuo de comparacin
de los individuos, se hace complejo la definicin
de las clases (problemas de frontera)