Tema 3
Tema 3
Tema 3
TIPOS DE ARCHIVOS
Permite también archivos con otras aplicaciones como Excel, Eprime, Dbase, etc. Además de
exportar archivos de datos y gráficas.
BARRA DE MENÚ
Archivo → Crear, abrir o grabar los diferentes archivos de SPSS, mostrar información de datos…,
imprimir, acceso directo a los últimos archivos abiertos, salir del SPSS, etc.
Ventana → Funciones habituales para controlar las ventanas. Se pueden distinguir los siguientes
tipos de ventanas: Edición de datos de SPSS (Ventana principal con los menús) y visor de SPSS.
Conjunto de iconos que permite ejecutar algunas de las funciones de SPSS de forma rápida.
DEFINIR VARIABLES
Asignar un tipo a cada variable indicando el máximo número de dígitos que deseamos para anotar
las observaciones y el tipo de la variable con la que vamos a trabajar, alfanumérica, fecha, moneda
o numérica, indicando en este caso el número de cifras decimales con las que queremos que
aparezca en el editor. SPSS permite trabajar con los siguientes tipos de variables:
Asignar una etiqueta a cada variable de no más de 120 caracteres (entre 30 y 40 es el valor
recomendado) que nos permita tener más información sobre esa variable.
Asignar valores, es decir, asignar etiquetas a los valores de cada variable. No es obligatorio, pero
es muy útil en algunos casos.
Definir perdidos, permitiendo definir los valores de los datos especificados como perdidos por el
usuario. A menudo es útil para saber por qué se pierde información. Por ejemplo, puedes querer
distinguir el dato perdido correspondiente a un entrevistado que se niega a responder del dato
perdido debido a que la pregunta no afecta a dicho entrevistado. Los valores de datos
especificados como perdidos por el usuario aparecen marcados para un tratamiento especial y se
excluyen de la mayoría de los cálculos.
Definir columnas para especificar la amplitud de la columna. Podemos hacerlo también desde el
propio archivo de datos.
Definir alineación, es decir seleccionar la justificación de las entradas de la columna: Izquierda,
derecha y centrado.
Definir el rol de un campo, este especifica cómo se utiliza en la generación de modelos. Por
ejemplo, si un campo es de entrada o si es un campo objetivo (lo que desea predecir).
TIPOS DE VARIABLES
VARIABLES NOMINALES
Ejemplos: Nombre de las ciudades: solo podemos diferenciarlas entre sí de acuerdo con esta
escala; Número de los jugadores de baloncesto: solo sirve para identificarlos y diferenciarlos del
resto de jugadores, no podemos establecer ningún tipo de orden o de gradación en función de este
número.
VARIABLES ORDINALES
VARIABLES DE INTERVALO
La distancia entre las unidades de medida sí es uniforme, de forma que podemos decir que B es
el doble que A, por ej. Por ello, permite realizar operaciones matemáticas.
VARIABLES DE RAZÓN
Aunque es similar, el cero en esta escala sí indica la ausencia de atributo, es cero absolutos.
Resumen:
ESCALA → Los valores de datos son numéricos en una escala de intervalo. Las variables de
escala deben ser numéricas.
ORDNAL → Los valores de datos representan categorías con un cierto orden intrínseco (bajo,
medio, alto; totalmente de acuerdo, de acuerdo, en desacuerdo). Las variables ordinales pueden
ser de cadena o valores numéricos.
Notar que, para las variables de cadena ordinales, se asume que el orden alfabético de los valores
de cadena indica el orden correcto de las categorías; en el caso de bajo, medio y alto el orden sería
alto, bajo y medio (orden que no es correcto), por lo que es más fiable utilizar códigos numéricos
para representar datos ordinales que usar etiquetas de esos códigos.
NOMINAL → Los valores de datos representan categorías sin un cierto orden intrínseco. Las
variables nominales pueden ser de cadena o valores numéricos que representan categorías
diferentes, por ejemplo 1 = Hombre y 2 = Mujer.
VARIABLES CUANTITATIVAS
Discretas → Los datos se definen por valores enteros. Ejemplo: Número de reclusos.
Continuas → Los datos se definen por valores interrumpidos. Ejemplo: Edad de los reclusos. En
la práctica se suelen clasificar por intervalos, por ejemplo, edad de 20-25, de 30-35, etc.
También llamadas explicativas o predictoras. Son aquellas cuyos atributos influyen en una
segunda variable (VD). La variable independiente explica el comportamiento de otra. Es la
variable que se manipula.
También llamadas explicadas. Son aquellas que están influidas por otra u otras variables
independientes (VI). Su valor se ve alterado por la VI. Se observa si cambia y cómo cambia.
VARIABLE DE CONTROL
Sirven para comprender mejor la relación entre una v. independiente y otra dependiente
Existe por tanto relación de dependencia entre el consumo de alcohol (x) u los accidentes de
tráfico (y).
Si introducimos la variable de control “edad”, se observa que, entre las personas de 18 y 30 años,
el número de accidentes de tráfico es todavía mayor.
VISOR DE RESULTADOS
Muestra toda la información que genera SPSS (tablas, gráficos y texto). Además, permite editar
y guardar los resultados.
IMPORTAR ARCHIVOS
SPSS permite recuperar datos desde un origen que no es SPSS. Por ejemplo, Excel, Stata, texto,
SAS, etc.
GUARDAR ARCHIVOS
SINTAXIS
FILTRADO DE CASOS
Menús desplegables que permiten controlar la mayoría de las acciones que SPSS permite llevar a
cabo.
El programa SPSS permite seleccionar determinados casos para un próximo proceso, bien
temporalmente o de forma permanente, sobre la base de un criterio lógico o de una decisión
aleatoria. Para ello seleccionaremos el menú Datos/Seleccionar casos.
En la selección permanente eliminamos del archivo activo los individuos deseados, mientras que,
en la temporal, la selección es recuperable (los casos son filtrados). En esta última situación, los
individuos (casos) del archivo que no satisfacen la condición aparecerán marcados como
excluidos mediante una línea que cruza en diagonal su número de fila. Aparece también una
variable llamada FILTER_$ que el sistema crea para controlar el filtrado de datos.
También son posibles otras opciones como segmentar archivo, dividir en archivos, etc.
FILTRADO DE CASOS
VARIABLES PRINCIPALES
(Ver ejercicio)
ANÁLISIS DE DATOS
Una vez elaborado el archivo de datos, y previamente al análisis estadístico de los datos, es
posible modificar los datos originales presentes en el archivo. Tales cambios pueden referirse
a las variables, a los casos, o al archivo en su conjunto. Puede interesarnos tanto la recodificación
de los valores de una variable como la generación de nuevas variables mediante transformaciones
de las ya existentes. SPSS permite generar nuevas variables mediante transformaciones numéricas
efectuadas sobre las antiguas.
(Ver ejercicios)
Es importante tener cuidado con el orden de utilización de los operadores y no olvidar que los
valores antiguos pierden su vigencia al recodificar una variable sobre el mismo nombre.
El botón SI... Permite realizar modificaciones similares, pero sujetas a que se verifique una
condición lógica. Se incluirán aquellos casos que verifiquen la condición. Los que no la cumplan
pasarán a ser valores ausentes definidos por el sistema.
A partir de una variable podemos crear otra cuyos valores sean una recodificación de los de la
primera. Esta recodificación podemos hacerla tanto en la misma variable como en variables
diferentes. Para ello, seleccionaremos Transformar/Recodificar/En distintas variables... Se abre
una ventana en la que deberemos asignar un nombre (y una etiqueta si queremos) a la nueva
variable. Si seleccionas en las mismas variables borrarás la variable original.
(Ver ejercicio)
5. ANÁLISIS DE CORRELACIÓN LINEAL
Una relación lineal positiva entre dos variables X e Y indica que los valores de las dos variables
varían de forma parecida.
Una relación lineal negativa significa que los valores de las dos variables varían justamente al
revés.
La forma más directa e intuitiva de formarnos una primera impresión sobre el tipo de relación
existente entre dos variables es a través de un diagrama de dispersión. La forma de la nube de
puntos nos informa sobre el tipo de relación existente entre las variables.
Si los participantes con mayor impulsividad son al mismo tiempo los participantes que peor
regulan sus emociones; entre impulsividad y regulación → Correlación lineal negativa.
Si los participantes que con mayor puntuación en extraversión son al mismo tiempo los
participantes que con mayor frecuencia se involucran en peleas; entre extraversión y frecuencia
peleas → Correlación lineal positiva.
Si de los mejores docentes mejor valorados por los alumnos unos investigan mucho y otros muy
poquito, y de los profesores que no son tan buenos docentes unos investigan y publican mucho y
otros no investigan nada; entre productividad científica y calidad docente → Ausencia de
correlación.
Un diagrama de dispersión también puede utilizarse como una forma de cuantificar el grado de
relación lineal existente entre dos variables: basta con observar el grado en el que la nube de
puntos se ajusta a una línea recta. Sin embargo, en la práctica:
Esto implica la necesidad de utilizar algún índice numérico capaz de cuantificar ese grado de
ajuste con mayor precisión de lo que nos permite hacerlo una simple inspección del diagrama de
dispersión.
Los coeficientes de correlación sirven para cuantificar el grado de relación lineal existente entre
dos variables, y valorar el grado de ajuste de la nube de puntos a una línea recta.
▪ Pearson: Es quizá, el mejor coeficiente y el más utilizado para estudiar el grado de relación
lineal existente entre dos variables cuantitativas. Toma valores entre -1 y 1: un valor de 1
indica relación lineal perfecta positiva; un valor de -1 indica relación lineal perfecta negativa;
un valor de 0, relación nula.
▪ Tau-b de Kendall: Apropiado para estudiar la relación entre variables ordinales. Se interpreta
igual que el coeficiente de Pearson.
▪ Spearman: Es el coeficiente de correlación de Pearson, pero aplicado después de transformar
las puntuaciones originales en rangos.
Cada celda contiene cinco valores referidos al cruce entre cada dos variables: