Cluster Analysis SPSS

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 29

Instructivo - Clúster

SPSS
Clúster para muestras
 Abrir la base de datos que se quiere clasificar
PASO 1: ESTANDARIZAR VARIABLES:
cuando las variables no tienen la misma
unidad de medida
 Estandarizar variables en caso que sea necesario:
 Menú-Analizar-Estadisticos descriptivos- Descriptivos-
selecciono las variables con las que se va a crear el
Clúster y seleccione guardar valores tipificados como
variables. (Aceptar)
PASO 1: ESTANDARIZAR VARIABLES:
cuando las variables no tienen la misma
unidad de medida
 Ahora las variables deben quedar estandarizadas y
observara que se crean nuevas variables en la ventana
datos que se anteponen con la letra Z:
ZIngresos_Vta_VehÍculos
PASO 2: GENERAR UNA MUESTRA
ALEATORIA DE LA BASE DE DATOS QUE
QUEREMOS CLASIFICAR

 Al tratarse de una muestra de más de 10.000 casos; el


proceso optimo para realizar el Clúster es:
 A la base que deseamos clasificar debemos sacarle una
muestra del 10%
Procedimiento obtener muestra aleatoria
 Ir al menú Datos-seleccionar casos
 Muestra aleatoria de casos y marcamos el 10% de los
casos luego en resultado activamos- copiar casos
seleccionados a un nuevo conjunto de datos y en Nombre de
conjunto de datos lo llamamos muestra y luego click en
aceptar o en pegar si desea guardar la sintaxis.
Se genera la Muestra en nuestro caso
equivalente al 10% de la base de datos.
Paso 3: CON LA MUESTRA DE LA BASE
CORRER EL JERARQUICO
Agregar variables – puntuaciones Z-
Seleccionar Dendograma
Para nuestro caso usaremos Metodo ward
Fijar el número de conglomerados que desea
obtener
En su base de Muestra se debe generar un
nuevo campo o variable denominada CLU5-1
PASO 4: Obtener los centroides
Se debe generar un nuevo archivo con los
centroides de cada clúster de acuerdo a las
variables.
Ir a la ventana variables- cambiar el nombre
CLU5_1 por CLUSTER_ (no debe escribirlo de
una forma diferente, si lo hace no podrá correr
los centroides en la base total) ahora debe
quitarle el “_mean” al nombre de las variables
para que coincidan con las variables de nuestra
base total
Ir a la base total que deseamos clasificar
Ahora debe aparecer en la base total un
nuevo campo con los Clúster ya clasificados
y cada caso debe tener una asignación de
un clúster.
EJEMPLO 2
 Las imágenes adjuntas son los procedimientos para cargar
un modelo de cluster proveniente de un conglomerado
jerárquico.
Se seleccionan los casos en este caso se
tomó un 20%.
 Se
genera el procedimiento jerárquico
con 3 CLUSTER (CLU3_1).
En la muestra

Ir a Datos-Agregar. LA variable de segmentación corresponde a la variable


CLU3_1 y en resúmenes de variables se ingresan
Las mismas variables con las que se hizo el clúster y crear un nuevo
conjunto de datos que tenga nombre de centroides.
Lo anterior, se genera una nueva ventana
emergente llamada centroides.
Se crean los centroides para cada Cluster
 Ahora, del archivo emergente Centroide cambiamos los
nombres a CLU3_1 por CLUSTER_ y el resto de
variables
 Les borramos _mean para que queden como la variable
original.
Ahora nos dirigimos al archivo que queremos
clasificar.
Vamos a conglomerado de k medias,
seleccionamos las mismas variables, en la opción
de guardar : conglomerados de pertenencias,
 En la opción de centros de los conglomerados : leer
iniciales y seleccionamos conjunto de datos abierto
la ventana que
 Se llama centroides (creada anteriormente). Se
ingresa el mismo número de conglomerados 3.Y por
último aceptar.

También podría gustarte