Descriptiva Bidimensional Con SPSS
Descriptiva Bidimensional Con SPSS
Descriptiva Bidimensional Con SPSS
Introduccin
En una investigacin las posibles relaciones entre distintas variables poseen una gran
importancia. De la consideracin simultnea de dos o ms caractersticas de una misma
poblacin o muestra surgen las distribuciones bidimensionales. En este caso a cada
elemento observado le corresponden dos o ms valores (si se consideran variables
cuantitativas) o modalidades (en el caso en que se analizan variable es cualitativas).
Generalmente cuando estudiamos relaciones entre variables cualitativas hablaremos de
asociacin entre esas variables y cuando nos refiramos a relaciones entre variables
cuantitativas diremos correlacin.
Hay que distinguir entre correlacin y regresin. La correlacin se refiere a la variacin
conjunta de dos variables y no implica causalidad. Con la regresin queremos encontrar
un modelo matemtico que explique los valores de una de las variables (dependiente) en
funcin de la otra u otras (independientes).
En este tema vamos a trabajar con tres procedimientos de SPSS:
1.- Tablas cruzadas
2.- Correlaciones
3.- Regresin lineal
Analizar
Estadsticos descriptivos
Tablas cruzadas
Figura 1
En las ventanas de Filas (Columnas) se pasan las variables que deseamos aparezcan en
las filas (columnas) de la tabla. Las variables seleccionadas deben ser categricas
(variables con un nmero limitado de valores diferentes). Se genera una tabla de
contingencia para cada combinacin de variables de fila y columna.
La ventana Capa 1 de 1 nos permite cruzar variables categricas teniendo en cuenta los
niveles o categoras de una o ms variables adicionales. Estas variables de segmentacin
se van aadiendo en este recuadro. As SPSS genera una tabla de tres dimensiones
separada por cada variable de segmentacin seleccionada.
La opcin Mostrar los grficos de barras agrupadas: muestra un grfico de barras
agrupadas para cada combinacin de variables de fila y columna, dentro de las categoras
de cada variable de capa.
La opcin Suprimir tablas: muestra las medidas estadsticas relativas a la tabla de
contingencia sin llegar a mostrar la propia tabla. Si no se selecciona ningn estadstico en
el cuadro de dilogo Estadsticos de tablas de contingencia, entonces no se generar
ningn resultado.
Casillas
En las casillas o celdas de una tabla de contingencia puede aparecer informacin muy
variada, para controlar el contenido de stas pulsamos el botn Casillas mostrndose
el cuadro de dilogo de la Figura 2.
Figura 2
Estadsticos
El grado de relacin existente entre dos variables categricas no puede ser establecido
simplemente observando las frecuencias de una tabla de contingencia. Para determinar si
dos variables se encuentran relacionadas debe utilizarse alguna medida de asociacin,
para obtener dichas medidas se pulsa el botn Estadsticos que nos muestra el cuadro
de la Figura 4.
Figura 4
Ordinal. Este recuadro recoge una serie de medidas de asociacin que permiten
aprovechar la informacin ordinal que las medidas diseadas para datos nominales pasan
por alto. Todas las medidas de este apartado utilizan en el numerador la diferencia entre
el nmero de inversiones y no inversiones resultantes de comparar cada caso con cada
otro, pero se diferencian en el tratamiento de los empates.
- Gamma: Medida de asociacin simtrica entre dos variables ordinales cuyo valor
siempre est comprendido entre -1 y 1. Los valores prximos a 1, en valor
absoluto, indican una fuerte relacin entre las dos variables. Los valores prximos
a cero indican que hay poca o ninguna relacin entre las dos variables. Para las
tablas de doble clasificacin, se muestran las gammas de orden cero. Para las
tablas de tres o ms factores de clasificacin, se muestran las gammas
condicionales.
- d de Somers: Es una extensin asimtrica de gamma que difiere slo en la
inclusin del nmero de pares no empatados en la variable independiente.
Tambin se calcula una versin no simtrica de este estadstico. Se interpreta de
igual forma que gamma.
- Tau-b de Kendall: Medida no paramtrica de asociacin para variables ordinales
o de rangos que tiene en consideracin los empates. El signo del coeficiente indica
la direccin de la relacin y su valor absoluto indica la magnitud de la misma, de
tal modo que los mayores valores absolutos indican relaciones ms fuertes. Los
valores posibles van de -1 a 1, pero un valor de -1 o +1 slo se puede obtener a
partir de tablas cuadradas.
- Tau-c de Kendall: Medida no paramtrica de asociacin para variables ordinales
que ignora los empates.
Nominal por intervalo.
- Eta: Medida de asociacin cuyo valor siempre est comprendido entre 0 y 1. El
valor 0 indica que no hay asociacin entre las variables de fila y de columna. Los
valores cercanos a 1 indican que hay gran relacin entre las variables. Eta resulta
apropiada para una variable dependiente medida en una escala de intervalo (por
ejemplo, ingresos) y una variable independiente con un nmero limitado de
categoras (por ejemplo, gnero). Se calculan dos valores de Eta: uno trata la
variable de las filas como una variable de intervalo; el otro trata la variable de las
columnas como una variable de intervalo. No supone linealidad.
Kappa (de Cohen). Es un ndice que mide el acuerdo entre las evaluaciones de dos jueces
cuando ambos estn valorando el mismo objeto. Un valor igual a 1 indica un acuerdo
perfecto. Un valor igual a 0 indica que el acuerdo no es mejor que el que se obtendra por
azar. Kappa slo est disponible para las tablas cuadradas.
Riesgo: Es una medida del grado de asociacin entre la presencia de un factor y la
ocurrencia de un evento. Si el intervalo de confianza para el estadstico incluye un valor
de 1, no se podr asumir que el factor est asociado con el evento. Cuando la ocurrencia
del factor es rara, se puede utilizar la razn de las ventajas (odds ratio) como estimacin
del riesgo relativo.
McNemar: Prueba no paramtrica para dos variables dicotmicas relacionadas.
Contrasta los cambios en las respuestas utilizando la distribucin de chi-cuadrado. Es til
para detectar cambios en las respuestas debidas a la intervencin experimental en los
diseos del tipo "antes-despus". Para las tablas cuadradas de mayor orden se informa de
la prueba de simetra de McNemar-Bowker.
Estadsticos de Cochran y Mantel-Haenszel: Estos estadsticos pueden utilizarse para
contrastar la independencia entre una variable de factor dicotmica y una variable de
respuesta dicotmica, condicionada por los patrones en las covariables, los cuales vienen
definidos por la variable o variables de las capas (variables de control). Mientras que otros
estadsticos se calculan capa por capa, los estadsticos de Cochran y Mantel-Haenszel se
calculan una sola vez para todas las capas.
Tablas cruzadas: procedimientos relacionados
Para confeccionar un modelo de las relaciones entre dos o ms variables categricas,
utilice el procedimiento Loglineal general (disponible en la opcin Estadsticas
avanzadas) para ajustar un modelo a las frecuencias de las casillas. Para definir intervalos
a lo largo de una variable cuantitativa, utilice el procedimiento Recodificar, disponible en
el men Transformar.
Figura 6
Para poder cuantificar el grado de relacin lineal existente entre dos variables
cuantitativas, as cmo medir el grado de ajuste de la nube de puntos a una recta, vamos
a estudiar coeficientes de correlacin.
En el procedimiento de Tablas cruzadas ya se puede obtener el coeficiente de correlacin
de Pearson, en este apartado estudiaremos el procedimiento Correlaciones que incluye
tres opciones (1) Bivariadas, para el estudio de la relacin entre dos variables
cuantitativas, (2) Parciales, para el estudio de la relacin entre dos variables cuantitativas
cuando se controla o elimina el efecto de terceras variables y (3) Distancias, para el
estudio de la relacin entre dos variables cualesquiera que sea su nivel de medida.
Para acceder a este procedimiento, elegir:
Analizar
Correlaciones
Figura 7
(1) Correlaciones bivariadas ofrece tres tipos de coeficientes: rxy de Pearson, tau-b de
Kendall y rho de Spearman. Para acceder a este procedimiento, elegir:
Analizar
Correlaciones
Bivariadas
Apareciendo el cuadro de dilogo de la Figura 8.
Figura 8
La lista de variables slo muestra las variables que poseen formato numrico. Es
necesario trasladar al menos dos variables.
Coeficientes de Correlacin. Pueden seleccionarse uno o ms de los tres siguientes
coeficientes:
-
Pearson: Es una medida de la asociacin lineal entre dos variables. Los valores
del coeficiente de correlacin van de -1 a 1. El signo del coeficiente indica la
direccin de la relacin y su valor absoluto indica la intensidad. Los valores
mayores indican que la relacin es ms estrecha.
Marcar las correlaciones significativas. Esta opcin, que se encuentra activa por
defecto, Marca con un asterisco los coeficientes de correlacin significativos al nivel 0,05
y, con dos asteriscos, los significativos al nivel 0,01.
Opciones
El subcuadro Opciones permite solicitar estadsticos adicionales y determinar el
tratamiento de los valores perdidos. Al pulsarlo nos aparece el cuadro de dilogo de la
Figura 9.
Figura 9
Valores perdidos. Las opciones de este recuadro permiten seleccionar el tratamiento que
se desea dar a los valores perdidos.
-
Excluir casos segn pareja: Excluye del anlisis los casos que tengan valores
perdidos en cualquiera (o en ambas) de las variables de una pareja implicada en
el clculo de un estadstico especfico.
Excluir casos segn lista: Excluye los casos que tienen valores perdidos en
cualquiera de las variables utilizadas en cualquiera de los anlisis.
(2) Correlaciones parciales (Figura 10) permite estudiar la relacin existente entre dos
variables cuantitativas controlando el posible efecto de una o ms variables cuantitativas
extraas. Un coeficiente de correlacin parcial es una tcnica de control estadstico que
expresa el grado de relacin lineal entre dos variables tras eliminar de ambas el efecto
atribuible a terceras variables.
Para acceder al procedimiento:
Analizar
Correlaciones
Parciales
Figura 10
Figura 11
Figura 12
En Variables se trasladan las variables cuya distancia se desea calcular (o las variables
en las que debe basarse la distancia entre casos).
En Etiquetar los casos mediante: Por defecto, en los resultados los casos se identifican
mediante el nmero de caso. De manera opcional, puede utilizar los valores de una
variable de cadena para identificar los casos.
Calcular distancias. El procedimiento permite calcular distancias entre casos y entre
variables, en ambos opciones las distancias se calculan a partir de las puntuaciones de los
casos en el conjunto de variables seleccionadas.
Medida. Las medidas de distancias estn agrupadas en dos bloques: Disimilaridad y
Similaridad. El botn Medidas... de este recuadro conduce a un subcuadro de dilogo
que permite elegir la media de distancia que se desea utilizar, tiene dos versiones (que se
diferencian por el tipo de medida que ofrecen) dependiendo de la opcin marcada en el
recuadro:
-
REGRESIN LINEAL
El anlisis de regresin lineal es una tcnica estadstica utilizada para estudiar la relacin
entre variables cuantitativas. Tanto en el caso de dos variables (regresin simple) como
en el de ms de dos variables (regresin mltiple), el anlisis de regresin lineal puede
utilizarse para explorar y cuantificar la relacin entre una variable llamada dependiente o
criterio (Y) y una o ms variables llamadas independientes o predictoras (X1, X2, , Xp),
as como para desarrollar una ecuacin lineal con fines predictivos.
Supuestos. Para cada valor de la variable independiente, la distribucin de la variable
dependiente debe ser normal. La varianza de distribucin de la variable dependiente debe
ser constante para todos los valores de la variable independiente. La relacin entre la
variable dependiente y cada variable independiente debe ser lineal y todas las
observaciones deben ser independientes.
Para llevar a cabo un anlisis de regresin lineal seleccionamos:
Analizar
Regresin
Lineales
Apareciendo el cuadro de dilogo de la Figura 13:
Figura 13
Estadsticos
Con el botn Estadsticos accedemos al cuadro de dilogo que muestra la Figura 14, que
nos vale para solicitar resultados estadsticos opcionales, incluyendo los coeficientes de
regresin, descriptivos, estadsticos de ajuste del modelo, la prueba de Durbin-Watson y
diagnsticos de la colinealidad.
Figura 14
Generar todos los grficos parciales. Genera todos los diagramas de dispersin de la
variable dependiente con cada una de las variables independientes.
Guardar
El botn Guardar nos permite guardar los valores pronosticados, los residuos y
medidas relacionadas como nuevas variables que se aaden al archivo de datos de trabajo.
En los resultados, una tabla muestra el nombre de cada nueva variable y su contenido.
Opciones
El botn Opcionesnos permite controlar los criterios por los que se eligen las variables
para su inclusin o exclusin del modelo de regresin, suprimir el trmino constante y
controlar la manipulacin de los valores perdidos.