2.
1 Edición de la estructura de base de datos
En este apartado trabajaremos con las bases de datos. Las bases de datos que se utilizan en el
SPSS son desde un punto de vista conceptual matrices de datos bidimensionales. Constituyen
arreglos para el registro de datos organizados en dos dimensiones: columnas y filas. Las
columnas remiten a distintos atributos con diversos valores posibles (variables) de los casos
registrados en cada una de las filas (1).
De este modo, en una base de datos, en las distintas filas quedan registrados los valores
particulares de cada uno de los casos para cada uno de los atributos ubicados en cada una de las
columnas (en adelante, nos referiremos a estos atributos como variables/columnas).
El conjunto de columnas que contienen las variables de la matriz de datos constituye lo que se
conoce con el nombre de “Estructura de la base de datos”, la misma detalla principalmente los
nombres que identifican e individualizan las variables de la matriz, además del tipo de dato
(números o caracteres) que contiene la variable y su longitud máxima. De hecho, estos tres
elementos constituyen los 3 atributos esenciales para definición de una variable en términos
informáticos: nombre, tipo y longitud.
El SPSS, como puede verse en la Figura 1.b, permite la edición de la estructura de la base de
datos a través de la vista de datos de la ventana de Edición de Datos. Una vez abierta una base
de datos, se puede apreciar la estructura de la misma y eventualmente editarla modificando
atributos o borrando variables existentes como así también creando nuevas variables.
Con respecto a la definición de los nombres de las variables, deben ser tenidas en cuenta las
siguientes reglas:
Los nombres de las variables no pueden ser repetidos, deben ser únicos puesto que
constituyen referencias únicas.
Los nombres pueden tener una longitud de hasta 64 caracteres.
Los nombres de variable admiten caracteres en mayúsculas y en minúsculas.
El primer carácter debe ser una letra.
El resto del nombre puede contener cualquier combinación de letras, números,
caracteres que no sean signos de puntuación y un punto “.” (Aunque se deben evitar los
nombres de variable que terminan con un punto, ya que el punto puede interpretarse
como un terminador del comando).
Los nombres de variables no pueden contener espacios.
Existe un conjunto de palabras reservadas que no pueden ser utilizadas como nombres
de variables. Las palabras reservadas: son ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT,
OR, TO y WITH.
Figura 6
Cuadro de diálogo para la selección del tipo de variable
Con respecto al tipo de datos, el SPSS permite seleccionar entre varios tipos. En la Figura 6,
aparece el cuadro de diálogo que ofrece el SPSS al editar el tipo de variable en la Vista de
Variables del Editor de datos. Un análisis detallado de las opciones disponibles nos permite
concluir que en este cuadro de diálogo se encuentran mezclados tipos de datos (numérico,
cadena y fecha, que en el fondo es un tipo numérico) con formatos numéricos (coma, puntos,
notación científica, dólar, moneda personalizada y numérico restringido). Durante este curso
sólo utilizaremos los tipos numérico, cadena de caracteres y fecha.
Los variables de tipo numérico sólo aceptan datos numéricos del conjunto de números reales.
Pueden ser datos numéricos en sí, por ejemplo el valor de los ingresos mensuales de un hogar o
pueden ser códigos numéricos de diversos valores de variables nominales. El hecho de que una
variable sea de tipo numérico, hace que el SPSS asuma que es una variable con la cual puede
realizar operaciones numéricas por más que el contenido en sí no lo permita, como en caso de
los códigos. Por ejemplo, si se utiliza una codificación numérica para codificar al variable SEXO
asignando el código 1 para los varones, el 2 para las mujeres y el 3 para los casos sin dato, la
información puede haber sido registrada en una variable numérica lo cual permitiría calcular un
promedio de esta variable con el SPSS, sin embargo, la naturaleza de la variable hace descartar
necesariamente esta posibilidad.
Las variables de tipo caracter aceptan tanto letras como números; pero en el caso de estos
últimos los mismos son tratados como caracteres y no como valores numéricos, por lo cual por
mas que una variable de tipo carácter tenga sólo caracteres numéricos, no se podrán realizar
operaciones matemáticas con la mismas salvo que intermedie una conversión de los datos.
Como puede observarse en la Figura 1.b, además de los atributos esenciales para la definición
de una variable, el SPSS adiciona un conjunto de atributos para las variables. En esta
oportunidad nos detendremos en los 3 más relevantes:
a. Las etiquetas de variables (columna Etiquetas),
b. Las etiquetas de valores (columna Valores) y
c. Los valores perdidos (columna Perdidos).