Tema 3

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

TEMA 3.

INTRODUCCIÓN AL ANÁLISIS DE DATOS CON EL


SOFTWARE SPSS

1. INTRODUCCCIÓN. ASPECTOS TÉCNICOS

TIPOS DE ARCHIVOS

Archivos de datos propios → .sav

Archivos de resultados y gráficas → .spv

Archivos de sintaxis → .sps

Permite también archivos con otras aplicaciones como Excel, Eprime, Dbase, etc. Además de
exportar archivos de datos y gráficas.

BARRA DE MENÚ

Archivo → Crear, abrir o grabar los diferentes archivos de SPSS, mostrar información de datos…,
imprimir, acceso directo a los últimos archivos abiertos, salir del SPSS, etc.

Edición → Deshacer, borrar, copiar, cortar, pegar, buscar, opciones, etc.

Ver → Barra de estado, Barras de herramientas…, Fuentes…, Cuadrícula, Etiquetas de valor.

Datos → Definir fechas y efectuar modificaciones en el archivo de datos: seleccionar, añadir,


ponderar, ordenar, ir al caso…, etc.

Transformar → Modificación y generación de nuevas variables. Las funciones de este menú y


del anterior son temporales y sólo están vigentes durante la sesión sin que afecten al archivo
original de datos. Si queremos que sean permanentes debemos grabar los cambios.

Analizar → Análisis estadísticos instalados.

Gráficos → Edición y creación de diversos tipos de gráficas de alta resolución.

Utilidades → Cambiar fuentes, información sobre archivos.

Ventana → Funciones habituales para controlar las ventanas. Se pueden distinguir los siguientes
tipos de ventanas: Edición de datos de SPSS (Ventana principal con los menús) y visor de SPSS.

? → Ayuda en el formato típico de Windows.


BARRA DE HERRAMIENTAS

Conjunto de iconos que permite ejecutar algunas de las funciones de SPSS de forma rápida.

2. PROCEDIMIENTOS BÁSICOS PARA INTRODUCIR DATOS

DEFINIR VARIABLES

Asignar un nombre cumpliendo las siguientes reglas:

- No más de 8 caracteres (siendo siempre el primero una letra o @).


- No utilizar símbolos como &, $, etc.
- No utilizar nunca espacios en blanco.
- No utilizar expresiones como ALL, AND, BY, EQ, GE, GT, LE, NE, NOT, OR, TO, o WITH.

Asignar un tipo a cada variable indicando el máximo número de dígitos que deseamos para anotar
las observaciones y el tipo de la variable con la que vamos a trabajar, alfanumérica, fecha, moneda
o numérica, indicando en este caso el número de cifras decimales con las que queremos que
aparezca en el editor. SPSS permite trabajar con los siguientes tipos de variables:

- Numéricas: formato numérico estándar.


- Coma: comas de separación cada tres posiciones. Un punto para la parte decimal.
- Punto: al contrario que el anterior.
- Notación Científica: uso de la E para exponente. Ejemplo 2,34E2.
- Cadena: variable alfanumérica (de más de 8 caracteres se considera larga).
- Formatos de fecha, dólar y moneda personalizada.

Asignar una etiqueta a cada variable de no más de 120 caracteres (entre 30 y 40 es el valor
recomendado) que nos permita tener más información sobre esa variable.

Asignar valores, es decir, asignar etiquetas a los valores de cada variable. No es obligatorio, pero
es muy útil en algunos casos.

Definir perdidos, permitiendo definir los valores de los datos especificados como perdidos por el
usuario. A menudo es útil para saber por qué se pierde información. Por ejemplo, puedes querer
distinguir el dato perdido correspondiente a un entrevistado que se niega a responder del dato
perdido debido a que la pregunta no afecta a dicho entrevistado. Los valores de datos
especificados como perdidos por el usuario aparecen marcados para un tratamiento especial y se
excluyen de la mayoría de los cálculos.

Definir columnas para especificar la amplitud de la columna. Podemos hacerlo también desde el
propio archivo de datos.
Definir alineación, es decir seleccionar la justificación de las entradas de la columna: Izquierda,
derecha y centrado.

Especificar la medida, se puede seleccionar uno o de los tres niveles de medida.

Definir el rol de un campo, este especifica cómo se utiliza en la generación de modelos. Por
ejemplo, si un campo es de entrada o si es un campo objetivo (lo que desea predecir).

TIPOS DE VARIABLES

SEGÚN LA ESCALA DE MEDIDA

VARIABLES NOMINALES

Su fin es identificar sujetos/objetos dentro de una distribución. Únicamente podremos establecer


las relaciones de igualdad/desigualdad.

Ejemplos: Nombre de las ciudades: solo podemos diferenciarlas entre sí de acuerdo con esta
escala; Número de los jugadores de baloncesto: solo sirve para identificarlos y diferenciarlos del
resto de jugadores, no podemos establecer ningún tipo de orden o de gradación en función de este
número.

VARIABLES ORDINALES

Su fin es ordenar a los sujetos/objetos de una distribución en función de alguna característica. La


distancia entre sus unidades no es uniforme. De esta forma, podemos decir que A está por encima
que B, pero no que sea el doble o que sea la mitad uno que otro. Además del atributo de
igualdad/desigualdad, en esta escala podemos añadir el ordenamiento de sus componentes.
Ejemplos: Orden de llegada en una carrera; Grado de satisfacción con el sistema judicial.

VARIABLES DE INTERVALO

La distancia entre las unidades de medida sí es uniforme, de forma que podemos decir que B es
el doble que A, por ej. Por ello, permite realizar operaciones matemáticas.

El cero es arbitrario, no indica la ausencia de atributo.

Ejemplos: El tiempo (fecha): el cero es arbitrario, puesto en el nacimiento de Cristo; El tiempo


(temperatura): el cero es también relativo.

VARIABLES DE RAZÓN

Aunque es similar, el cero en esta escala sí indica la ausencia de atributo, es cero absolutos.

Ejemplos: La altura (cm); El peso (gr).

Resumen:

ESCALA → Los valores de datos son numéricos en una escala de intervalo. Las variables de
escala deben ser numéricas.

ORDNAL → Los valores de datos representan categorías con un cierto orden intrínseco (bajo,
medio, alto; totalmente de acuerdo, de acuerdo, en desacuerdo). Las variables ordinales pueden
ser de cadena o valores numéricos.

Notar que, para las variables de cadena ordinales, se asume que el orden alfabético de los valores
de cadena indica el orden correcto de las categorías; en el caso de bajo, medio y alto el orden sería
alto, bajo y medio (orden que no es correcto), por lo que es más fiable utilizar códigos numéricos
para representar datos ordinales que usar etiquetas de esos códigos.

NOMINAL → Los valores de datos representan categorías sin un cierto orden intrínseco. Las
variables nominales pueden ser de cadena o valores numéricos que representan categorías
diferentes, por ejemplo 1 = Hombre y 2 = Mujer.

SEGÚN LA NATURALEZA DE LOS ASPECTOS A MEDIR

VARIABLES CUALITATIVAS (CATEGÓRICAS)

Aquellas cuyas categorías no pueden ser expresados en cifras, y no permiten la realización de


operaciones aritméticas con sus valores. Son cualitativas las variables nominales y ordinales.

Ejemplos: Sexo (hombre/mujer); Situación laboral (en activo/inactivo); Antecedentes penales


(si/no).

VARIABLES CUANTITATIVAS

Aquellas cuyos valores pueden ser expresados numéricamente, y permiten la realización de


operaciones aritméticas.

Ejemplos: Edad; Ingresos económicos; Número de delitos cometidos.

No todas las variables numéricas son cuantitativas.


Las variables cuantitativas pueden ser:

Discretas → Los datos se definen por valores enteros. Ejemplo: Número de reclusos.

Continuas → Los datos se definen por valores interrumpidos. Ejemplo: Edad de los reclusos. En
la práctica se suelen clasificar por intervalos, por ejemplo, edad de 20-25, de 30-35, etc.

SEGÚN LA FUNCIÓN QUE CUMPLEN EN EL ANÁLISIS

VARIABLE INDEPENDIENTE (VI)

También llamadas explicativas o predictoras. Son aquellas cuyos atributos influyen en una
segunda variable (VD). La variable independiente explica el comportamiento de otra. Es la
variable que se manipula.

VARIABLE DEPENDIENTE (VD)

También llamadas explicadas. Son aquellas que están influidas por otra u otras variables
independientes (VI). Su valor se ve alterado por la VI. Se observa si cambia y cómo cambia.

Ejemplo → El consumo de alcohol (VI) incide en el número de accidentes de tráfico (VD)

VARIABLE DE CONTROL

Sirven para comprender mejor la relación entre una v. independiente y otra dependiente

Ejemplo: El consumo de alcohol (x) incide en el número de accidentes de tráfico (y).

Existe por tanto relación de dependencia entre el consumo de alcohol (x) u los accidentes de
tráfico (y).

Si introducimos la variable de control “edad”, se observa que, entre las personas de 18 y 30 años,
el número de accidentes de tráfico es todavía mayor.

(Mirar ejemplos de INE y ejercicios)

VISOR DE RESULTADOS

Muestra toda la información que genera SPSS (tablas, gráficos y texto). Además, permite editar
y guardar los resultados.

IMPORTAR ARCHIVOS

SPSS permite recuperar datos desde un origen que no es SPSS. Por ejemplo, Excel, Stata, texto,
SAS, etc.

GUARDAR ARCHIVOS

Se pueden guardar directamente o al salir del programa.

SINTAXIS

La sintaxis se refiere al lenguaje de comandos (programación).


La ventaja que presenta trabajar con este lenguaje es que los archivos de sintaxis pueden guardarse
y volver a ser ejecutados en sesiones diferentes.

FILTRADO DE CASOS

Menús desplegables que permiten controlar la mayoría de las acciones que SPSS permite llevar a
cabo.

El programa SPSS permite seleccionar determinados casos para un próximo proceso, bien
temporalmente o de forma permanente, sobre la base de un criterio lógico o de una decisión
aleatoria. Para ello seleccionaremos el menú Datos/Seleccionar casos.

La selección de individuos puede ser temporal (filtrados) o permanente (eliminados):

En la selección permanente eliminamos del archivo activo los individuos deseados, mientras que,
en la temporal, la selección es recuperable (los casos son filtrados). En esta última situación, los
individuos (casos) del archivo que no satisfacen la condición aparecerán marcados como
excluidos mediante una línea que cruza en diagonal su número de fila. Aparece también una
variable llamada FILTER_$ que el sistema crea para controlar el filtrado de datos.

También son posibles otras opciones como segmentar archivo, dividir en archivos, etc.

BASE DE DATOS TALE

FILTRADO DE CASOS
VARIABLES PRINCIPALES

El TALE mide la tendencia general de rememorar o hablar sobre la vida pasada.

• SELF: Uso de los recuerdos para la construcción y el mantenimiento de un sentido coherente


del yo en el momento presente y una representación mental de uno mismos a través del
tiempo.
• SOCIAL: Capacidad de recuperar recuerdos para desarrollar, mantener y mejorar las
relaciones interpersonales (comunicación; intimidad; empatía).
• DIRECTIVA: Uso de los recuerdos autobiográficos para la solución de problemas en el
presente y la orientación de la conducta futura.

La Escala de Desesperanza de Beck evalúa actitudes negativas y pesimistas hacia el futuro y


hacia uno mismo.

El AF-5 mide el autoconcepto académico/laboral, social, emocional, familiar y físico.

(Ver ejercicio)

ANÁLISIS DE DATOS

Barra de tareas, Análisis, Descripción Estadística, Frecuencias/Descriptivos.

3. TRANSFORMACIÓN DE DATOS Y ANÁLISIS ESTADÍSTICO BÁSICO

TRANFORMACIÓN DE UNA VARIABLE

Una vez elaborado el archivo de datos, y previamente al análisis estadístico de los datos, es
posible modificar los datos originales presentes en el archivo. Tales cambios pueden referirse
a las variables, a los casos, o al archivo en su conjunto. Puede interesarnos tanto la recodificación
de los valores de una variable como la generación de nuevas variables mediante transformaciones
de las ya existentes. SPSS permite generar nuevas variables mediante transformaciones numéricas
efectuadas sobre las antiguas.

(Ver ejercicios)
Es importante tener cuidado con el orden de utilización de los operadores y no olvidar que los
valores antiguos pierden su vigencia al recodificar una variable sobre el mismo nombre.

El botón SI... Permite realizar modificaciones similares, pero sujetas a que se verifique una
condición lógica. Se incluirán aquellos casos que verifiquen la condición. Los que no la cumplan
pasarán a ser valores ausentes definidos por el sistema.

Por ejemplo, modificar la puntuación solo para la ciudad de Albacete.

4. RECODIFICACIÓN DE UNA VARIABLE

A partir de una variable podemos crear otra cuyos valores sean una recodificación de los de la
primera. Esta recodificación podemos hacerla tanto en la misma variable como en variables
diferentes. Para ello, seleccionaremos Transformar/Recodificar/En distintas variables... Se abre
una ventana en la que deberemos asignar un nombre (y una etiqueta si queremos) a la nueva
variable. Si seleccionas en las mismas variables borrarás la variable original.

(Ver ejercicio)
5. ANÁLISIS DE CORRELACIÓN LINEAL

Se suele decir que:

- Cuanta más motivación, mejores resultados académicos.


- Cuanta más empatía, menores manifestaciones de agresividad.
- Cuanto más grave el maltrato, mayores las secuelas psicológicas

¿Cómo se mide el grado de relación existente entre 2 variables?

El concepto de relación o correlación se refiere al grado de variación conjunta existente entre


dos o más variables. Los coeficientes de correlación expresan en qué grado los sujetos tienen el
mismo orden en dos variables.

Una relación lineal positiva entre dos variables X e Y indica que los valores de las dos variables
varían de forma parecida.

Una relación lineal negativa significa que los valores de las dos variables varían justamente al
revés.

La forma más directa e intuitiva de formarnos una primera impresión sobre el tipo de relación
existente entre dos variables es a través de un diagrama de dispersión. La forma de la nube de
puntos nos informa sobre el tipo de relación existente entre las variables.

EJEMPLOS DE CORRELACIÓN (Imp)

Si los participantes con mayor impulsividad son al mismo tiempo los participantes que peor
regulan sus emociones; entre impulsividad y regulación → Correlación lineal negativa.

Si los participantes que con mayor puntuación en extraversión son al mismo tiempo los
participantes que con mayor frecuencia se involucran en peleas; entre extraversión y frecuencia
peleas → Correlación lineal positiva.

Si de los mejores docentes mejor valorados por los alumnos unos investigan mucho y otros muy
poquito, y de los profesores que no son tan buenos docentes unos investigan y publican mucho y
otros no investigan nada; entre productividad científica y calidad docente → Ausencia de
correlación.
Un diagrama de dispersión también puede utilizarse como una forma de cuantificar el grado de
relación lineal existente entre dos variables: basta con observar el grado en el que la nube de
puntos se ajusta a una línea recta. Sin embargo, en la práctica:

Esto implica la necesidad de utilizar algún índice numérico capaz de cuantificar ese grado de
ajuste con mayor precisión de lo que nos permite hacerlo una simple inspección del diagrama de
dispersión.

Los coeficientes de correlación sirven para cuantificar el grado de relación lineal existente entre
dos variables, y valorar el grado de ajuste de la nube de puntos a una línea recta.

▪ Pearson: Es quizá, el mejor coeficiente y el más utilizado para estudiar el grado de relación
lineal existente entre dos variables cuantitativas. Toma valores entre -1 y 1: un valor de 1
indica relación lineal perfecta positiva; un valor de -1 indica relación lineal perfecta negativa;
un valor de 0, relación nula.
▪ Tau-b de Kendall: Apropiado para estudiar la relación entre variables ordinales. Se interpreta
igual que el coeficiente de Pearson.
▪ Spearman: Es el coeficiente de correlación de Pearson, pero aplicado después de transformar
las puntuaciones originales en rangos.

BILATERAL → Cuando no existen expectativas sobre la dirección de la relación. Indica la


probabilidad de obtener coeficientes tan alejados de cero o más que el valor obtenido.

UNILATERAL → Cuando existen expectativas sobre la dirección de la relación. Indica la


probabilidad de obtener coeficientes tan grandes o más grandes que el obtenido si el coeficiente
es positivo, o tan pequeños o más pequeños que el obtenido si el coeficiente es negativo.

Un coeficiente de correlación alto no implica causalidad.

Barra de tareas, Correlación.

COEFICIENTE DE CORRELACIÓN DE PEARSON (TABLAS SPSS)

Cada celda contiene cinco valores referidos al cruce entre cada dos variables:

1) El valor del coeficiente de correlación de Pearson.


2) El nivel crítico bilateral que corresponde a ese coeficiente (Sig. bilateral; el nivel crítico
unilateral puede obtenerse dividiendo por 2 el bilateral.
3) La suma de cuadrados (para el cruce de una variable consigo misma) y la suma de productos
cruzados (para el cruce de dos variables distintas).
4) La covarianza.
5) El número de casos válidos (N) sobre el que se han efectuado los cálculos.
El nivel crítico permite decidir sobre la hipótesis nula de independencia lineal (o lo que es lo
mismo, sobre la hipótesis de que el coeficiente de correlación vale cero en la población).
Rechazaremos la hipótesis nula de independencia (y concluiremos que existe relación lineal
significativa) cuando el nivel crítico sea menor que el nivel de significación establecido
(generalmente ≤.05). Por tanto, si el valor es menor o igual a 0.05 se considera una relación
significativa. (Ver ejercicio)

También podría gustarte