NOTAS DE ESTADÍSTICA APLICADA
UTILIZANDO SPSS
(MANEJO DE INSTRUCCIONES CON SPSS)
MAT. MAURICIO GARCÍA
Enero 2019
INDICE
1. TIPOS DE VARIABLES ....................................................................................... 2
NIVELES DE MEDICIÓN ................................................................................................ 2
A) DATOS DE NIVEL NOMINAL ...................................................................................... 2
B) DATOS DE NIVEL ORDINAL ....................................................................................... 3
C) DATOS DE NIVEL DE INTERVALO ............................................................................. 3
D) DATOS DE NIVEL DE RAZÓN ..................................................................................... 4
2. ENCUESTA SOBRE LA SATISFACCIÓN DE LOS EMPLEADOS DE
KALOSHA INDUSTRIES ............................................................................................. 5
3. COMANDOS .......................................................................................................... 8
A) MODO DE INGRESAR DATOS .................................................................................... 8
B) PLANTILLAS ............................................................................................................. 9
4. TIPOS DE REPRESENTACIONES .................................................................. 11
A) DIAGRAMAS DE TALLO Y HOJAS........................................................................... 11
B) CONSTRUCCIÓN DE DATOS AGRUPADOS..............ERROR! BOOKMARK NOT DEFINED.
C) HISTOGRAMAS Y POLÍGONOS DE FRECUENCIA ..ERROR! BOOKMARK NOT DEFINED.
D) TABLA DE FRECUENCIAS .....................................ERROR! BOOKMARK NOT DEFINED.
D) OBSERVACIONES GENERALES .............................ERROR! BOOKMARK NOT DEFINED.
5. MEDIDAS DE CENTRALIZACIÓN, DISPERSIÓN Y GRÁFICAS .. ERROR!
BOOKMARK NOT DEFINED.
A) DIAGRAMA DE CAJA Y BIGOTE ............................ERROR! BOOKMARK NOT DEFINED.
B) DIAGRAMA DE BARRAS ........................................ERROR! BOOKMARK NOT DEFINED.
C) DIAGRAMAS DE PIE .............................................ERROR! BOOKMARK NOT DEFINED.
D) DIAGRAMAS DE PARETO......................................ERROR! BOOKMARK NOT DEFINED.
6. TABULACION DE DATOS CATEGÓRICOS: TABLAS DE
CONTIGENCIA Y SUPERTABLAS. ......... ERROR! BOOKMARK NOT DEFINED.
A) TEORÍA DE PROBABILIDADES ..............................ERROR! BOOKMARK NOT DEFINED.
B) LA SUPERTABLA ..................................................ERROR! BOOKMARK NOT DEFINED.
7. TRANSFORMACIÓN DE DATOS ..... ERROR! BOOKMARK NOT DEFINED.
A) FUNCIONES ...........................................................ERROR! BOOKMARK NOT DEFINED.
B) CONDICIÓN IF ......................................................ERROR! BOOKMARK NOT DEFINED.
C) SELECCIÓN DE UNA MUESTRA ALEATORIA .........ERROR! BOOKMARK NOT DEFINED.
8. ALGUNAS DISTRIBUCIONES IMPORTANTES DE PROBABILIDAD
DISCRETA .................................................... ERROR! BOOKMARK NOT DEFINED.
A) DISTRIBUCIÓN BINOMIAL ...................................ERROR! BOOKMARK NOT DEFINED.
B) DISTRIBUCIÓN DE POISSON .................................ERROR! BOOKMARK NOT DEFINED.
C) DISTRIBUCIÓN HIPERGEOMÉTRICA ...................ERROR! BOOKMARK NOT DEFINED.
D) DISTRIBUCIÓN BINOMIAL NEGATIVA .................ERROR! BOOKMARK NOT DEFINED.
E) DISTRIBUCIÓN GEOMÉTRICA ..............................ERROR! BOOKMARK NOT DEFINED.
9. DISTRIBUCIÓN DE VARIABLES ALEATORIAS CONTINUAS ..... ERROR!
BOOKMARK NOT DEFINED.
A) USOS DE LAS TABLAS DE PROBABILIDAD NORMAL ............ ERROR! BOOKMARK NOT
DEFINED.
B) APLICACIONES DE LA CURVA NORMAL ...............ERROR! BOOKMARK NOT DEFINED.
C) ESTIMACIÓN DE LA SUPOSICIÓN DE NORMALIDAD: PROPIEDADES DE
EVALUACIÓN Y CONSTRUCCIÓN DE GRÁFICAS DE PROBABILIDADES ................ ERROR!
BOOKMARK NOT DEFINED.
10. TEORIA DE LA INFERENCIA ESTADÍSTICA: TEORIA DE LA
ESTIMACIÓN - PRUEBA DE HIPOTESISERROR! BOOKMARK NOT
DEFINED.
A) INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL CON CONOCIDA
(MUESTRAS GRANDES): ............................................ERROR! BOOKMARK NOT DEFINED.
B) PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL CON CONOCIDA
(MUESTRAS GRANDES) ..............................................ERROR! BOOKMARK NOT DEFINED.
C) INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL CON DESCONOCIDA
(MUESTRAS PEQUEÑAS) : ..........................................ERROR! BOOKMARK NOT DEFINED.
D) DISTRIBUCIÓN T DE STUDENT ..............................ERROR! BOOKMARK NOT DEFINED.
USO DE LA TABLA DE PROBABILIDAD T DE STUDENT ............. ERROR! BOOKMARK NOT
DEFINED.
E) PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL CON DESCONOCIDA
(MUESTRAS PEQUEÑAS) ............................................ERROR! BOOKMARK NOT DEFINED.
F) INTERVALO DE CONFIANZA PARA LAS PROPORCIONES ...... ERROR! BOOKMARK NOT
DEFINED.
G) PRUEBA DE HIPÓTESIS PARA LAS PROPORCIONES DE TAMAÑO GRANDE .... ERROR!
BOOKMARK NOT DEFINED.
H) DETERMINACIÓN DEL TAMAÑO DE MUESTRA PARA LA MEDIA ERROR! BOOKMARK
NOT DEFINED.
I) DETERMINACIÓN DEL TAMAÑO DE MUESTRA PARA LAS PROPORCIONES .... ERROR!
BOOKMARK NOT DEFINED.
J) CÁLCULO DEL TAMAÑO DE MUESTRA: INVESTIGACIÓN SOBRE LA SATISFACCIÓN
DE LOS EMPLEADOS DE KALOSHA INDUSTRIES ........ERROR! BOOKMARK NOT DEFINED.
K) INTERVALO DE CONFIANZA PARA LA VARIANZA POBLACIONAL .................. ERROR!
BOOKMARK NOT DEFINED.
L) PRUEBAS RELACIONADAS CON VARIANZAS ( O DESVIACIONES ESTÁNDARES
POBLACIONALES) .....................................................ERROR! BOOKMARK NOT DEFINED.
M) INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS POBLACIONALES
(MUESTRAS GRANDES) : ...........................................ERROR! BOOKMARK NOT DEFINED.
N) PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS POBLACIONALES PARA
MUESTRAS GRANDES (N>30). ...................................ERROR! BOOKMARK NOT DEFINED.
O) INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS POBLACIONALES
(MUESTRAS PEQUEÑAS CON Σ21= Σ22 PERO DESCONOCIDAS. ... ERROR! BOOKMARK NOT
DEFINED.
P)INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS POBLACIONALES
(MUESTRAS PEQUEÑAS CON Σ21 ≠ Σ22 Y DESCONOCIDAS. ......... ERROR! BOOKMARK NOT
DEFINED.
Q) INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES DE
MUESTRAS GRANDES. ...............................................ERROR! BOOKMARK NOT DEFINED.
R) PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE PROPORCIONES DE MUESTRAS
GRANDES ...................................................................ERROR! BOOKMARK NOT DEFINED.
11. REGRESIÓN LINEAL SIMPLE .... ERROR! BOOKMARK NOT DEFINED.
12. REGRESIÓN LINEAL MÚLTIPLEERROR! BOOKMARK NOT
DEFINED.
13. SERIES DE TIEMPO ....................... ERROR! BOOKMARK NOT DEFINED.
COMPONENTES DE UNA SERIE DE TIEMPO .............. ERROR! BOOKMARK NOT
DEFINED.
TENDENCIA SECULAR ......................................ERROR! BOOKMARK NOT DEFINED.
COMO SE PUEDE OBSERVAR EN LA COLUMNA FIT-3 SE ENCUENTRAN LOS
PRONÓSTICOS DE LOS DATOS HISTÓRICOS ASÍ COMO LA PROYECCIÓN DE LOS DOS
ÚLTIMOS MESES QUE SE PEDÍA. ................................ERROR! BOOKMARK NOT DEFINED.
PARA REALIZAR EL GRÁFICO TANTO DE LOS HISTÓRICOS COMO DE LOS
PRONOSTICADOS SE DEBE IR A: ................................ERROR! BOOKMARK NOT DEFINED.
Y EL GRÁFICO ES : ....................................................ERROR! BOOKMARK NOT DEFINED.
14. EMPLEO DE LA ECUACIÓN DE SEGUNDO GRADO EN UNA SERIE
DE TIEMPO .................................................. ERROR! BOOKMARK NOT DEFINED.
15. VARIACIÓN ESTACIONAL .......... ERROR! BOOKMARK NOT DEFINED.
16. DESESTACIONALIZACION DE DATOSERROR! BOOKMARK NOT
DEFINED.
UTILIZACIÓN DE DATOS DESESTACIONALIZADOS PARA EL PRONÓSTICO ........ ERROR!
BOOKMARK NOT DEFINED.
17. EJERCICIOS DE REPASO DE CADA UNO DE LOS MODULOS ERROR!
BOOKMARK NOT DEFINED.
18. SUAVIZACION EXPONENCIAL .. ERROR! BOOKMARK NOT DEFINED.
19. METODO DE PRONOSTICO DE HOLT WINSTERS .................... ERROR!
BOOKMARK NOT DEFINED.
NOTAS DEL SPSS 1
NOTAS DE ESTADÍSTICA APLICADA CON EL USO DEL SPSS
Para procesar la información se utilizará el paquete estadístico computacional SPSS
(Statistical Package for the Social Sciencies) que es un paquete estadístico aplicado a las
Ciencias Sociales, versión 23.0 para windows, el mismo que organizará los datos de la
información obtenida. Se obtendrá la información de cada una de las variables
cualitativas así como de la cuantitativa para interpretar los resultados y realizar las toma
de decisiones más pertinentes.
El lenguaje de máquina que utiliza el SPSS es el Fortran IV, el autor es Norman H. Nie,
existe actualmente las versión 24. La versión que se utilizará es la 23.0 en inglés.
Los requisitos para la instalación son:
Procesador 80386 o superior
4 Megabytes al menos de memoria de acceso aleatorio (RAM)
Disco duro con un espacio mínimo disponible comprendido entre 23 Mb necesarios
para el módulo Base y 28 Mb necesarios para el sistema completo.
Una unidad de disco de alta densidad
Un adaptador de gráficos con una resolución 640*480 (VGA o superior)
Mínimo se necesita Windows 3.1 o superior
Tiene varios módulos y son independientes.
Base, es indispensable para manejar cualquier otro módulo:
Programación en General, Procedimientos Estadísticos Básicos, Modelos
de Regresión Múltiple.
Estadísticas Profesionales: Técnicas de Análisis de Multivariantes de
datos ( Factorial, Discriminante, Conglomerado)
Estadísticas Avanzadas: Regresión Logísticas, Regresión de Cox,
Modelos Loglineales
Categorías: Procedimientos para el análisis conjunto y técnicas de la
varianza para el análisis multivariante.
Series Temporales: Herramientas y análisis para Series Temporales.
Tablas Estadística: Programa para la presentación de resultados mediante
tablas.
Lisrel : Análisis de modelos estructurados lineales.
El SPSS genera 4 tipos de archivos:
.SAV que es la base de datos a introducir
.LST que son los resultados obtenidos al procesar alguna
información
.CHT que son los gráficos generados al procesar variables
cualitativas especialmente
.SPS que son los datos que se utilizan para la sintaxis
NOTAS DEL SPSS 2
Los texto a ser utilizado en este curso son:
Anderson, D Sweeney,D y Williams, T (2001) “Estadística para la
Administración y Economía ”, México, Thomson, Séptima edición.
Berenson, M y Levine “Estadística Básica en la Administración ”,
México, Prentice Hall, Sexta edición, ( donde se encuentra la base de datos
Kalosha)
1. TIPOS DE VARIABLES
Existen básicamente dos tipos de variables, que producen dos tipos de datos: a)
datos cualitativos o atributos o categóricos que dan como resultado respuestas
categóricas, por ejemplo género, tipo de coche que se tiene, color de celular, etc., b)
datos numéricos, éstas a su vez se clasifican en discretas y continuas, las v.a.
discretas toma valores enteros finitos o numerables, tales como número de hijos,
número de empleados, número de televisores vendidos al año, etc y las variables
aleatorias continuas, que son aquellas que toman un valor cualesquiera dentro de un
rango específico, ejemplos, el peso de un envío, distancia entre dos ciudades, el peso
de una población dada, la estatura de una población determinada, etc.
Niveles de Medición
Los datos se pueden clasificar de acuerdo con niveles de medición. Los niveles de
medición indican, con frecuencia que cálculos se pueden realizar para resumir y
presentar los datos y que pruebas estadísticas pueden llevarse a cabo. Las escalas de
medición pueden tener las siguientes características matemáticas, magnitud, un
mismo intervalo entre las unidades y un cero absoluto.
Existen cuatro niveles de medición:
a) Datos de nivel nominal
Se usa principalmente para variables de tipo cualitativo y no cuantitativo. Es el nivel
de medición “ más bajo ” o más primitivo. Escala nominal porque es lo mismo que
clasificar y darles el nombre, consiste básicamente en clasificar en categorías tanto
a sujetos como a objetos que se desean tomar u medida y se asignan números a estas
categorías dadas. Las observaciones únicamente se pueden clasificar o contar no
hay un orden particular para las distintas clases. Por ejemplo, el género, podríamos
dar primero el número de hombres o primero el número de mujeres, marcas de
autos, creencias religiosas, tipo de raza, país del que proviene, géneros musicales,
también podría ser :
Número de
Empresa Porcentaje
llamadas
1.AT&T 108115800 76
2. MCI 20577310 14
3. SPRINT 8238740 6
4. OTRAS 7130620 5
TOTAL 144062470 100
NOTAS DEL SPSS 3
Es un nivel de medición nominal porque contamos el número de veces que es usada
cada empresa de larga distancia. El orden de las empresas podría haber sido otro. Es
decir no hay orden particular entre las categorías, por ejemplo no existe una relación
cuantitativa entre las empresas AT&T y MCI , AT&T no es más que MCI, etc,
simplemente son empresas distintas. Los números 1 y 2 son sólo nombres y no
existe relación de magnitud entre ellos.
Resumiendo tiene las siguientes propiedades:
1. Las categorías son mutuamente excluyentes (un individuo, objeto o
medición pertenece únicamente a una categoría) y exhaustiva (cada
individuo, objeto o medición debe pertenecer a una de las categorías). Un
objeto pertenece a una y sola una categoría.
2. Las categorías no tienen un orden lógico.
b) Datos de nivel ordinal
Se ordena los objetos medidos según posean más, menos o la misma cantidad de la
variable medida.
Cada categoría es más alta o mejor que la siguiente.
Resumiendo tiene las siguientes propiedades:
1. Las categorías de datos son mutuamente excluyentes y exhaustivas
2. Las categorías de datos están clasificadas u ordenadas de acuerdo con las
características especiales que poseen.
Así por ejemplo, el orden de los niveles de motivación en un trabajo de une empresa,
el empleado con rango 1 fue considerado mejor que el empleado con rango 2 , y así
sucesivamente, nótese que no se tiene la propiedad de intervalos iguales, entre las
unidades adyacentes, puesto que la diferencia entre el orden de motivación del
empleado con mayor motivación que el segundo puede ser grande y la que existe entre
el segundo y el tercero podría ser pequeño, Además no se dice nada con respecto
acerca del nivel absoluto de la variable, esto es los cuatro primeros rangos de
motivación podrían tener una gran diferencia o quizás el último no tiene la misma
motivación que los tres primeros , toda esta información no se puede encontrar en una
escala ordinal. Otro ejemplo, las calificaciones de los estudiantes, en una asignatura es:
Calificación Frecuencia
Superior 6
Bueno 28
Aceptable 25
Pobre 12
Inferior 3
Si sustituimos “superior” por 5, “bueno” por 4, etc., no podemos concluir que una
calificación “bueno” que corresponde a 4, sea necesariamente dos veces mejor que una
de pobre (que corresponde a dos). Solo podemos concluir que una calificación “bueno”
es mejor de una calificación de “pobre”. Pero no podemos concluir cuán mejor es.
c) Datos de nivel de intervalo
En este tipo de datos, a más de poder afirmar que un objeto posee más o menos una
cantidad variable que otro, se puede encontrar si existe o no diferencia entre dos objetos
NOTAS DEL SPSS 4
a ser medidos. Asó por ejemplo, si a un objeto se le asigna la cantidad de 18 en una
escala de intervalo, tiene, en cantidad de variable , 4 puntos de medida que un objeto
que se le asigna la calificación de 14, de la misma manera un objeto que se le fija la
puntuación de 9 tiene 4 unidades de medida más que aquel que se le asigna la
puntuación de 5. Nótese que entre 18 y 14 existe la misma diferencia, en cantidad de
variable que entre 9 y 5, pero no se puede afirmar ,en la escala de intervalo que el 18 es
el doble de 9. No existe un valor numérico que nos indique ausencia total de cantidad de
la variable, es decir aquí no existe el cero absoluto.
Otro ejemplo, si utilizamos la escala Celsius
Tiene todas las características del ordinal, pero, además la diferencia entre dos valores
es de un tamaño constante.
Las propiedades de la escala de intervalos es:
1. Las categorías de datos son mutuamente excluyentes y exhaustivas.
2. Las categorías de datos están ordenadas de acuerdo con la cantidad de la
característica que posee.
3. Diferencias iguales en la característica están representadas por diferencias iguales en
los números asignados a la característica.
Por ejemplo como variable numérica (temperatura en grados Celsius o Fahrenheit ),
además el tiempo de calendario (Gregoriana, Hebreo o Islámico).
d) Datos de nivel de razón
El que nos da más información acerca de la observación es el nivel de medición de
razón.
Tiene las características del nivel de intervalo, pero, además, el punto cero tiene
significado y la relación entre dos números tiene sentido tales como salarios, unidades
de producción, peso y altura así pues si usted tiene cero dólares, entonces, no tiene
dinero, si la aguja marca cero en una balanza en la escala hay una completa ausencia de
peso, si usted gana treinta mil dólares por año vendiendo seguros y su compañero
sesenta mil vendiendo carros, entonces su compañero gana el doble que usted.
Las propiedades del nivel de razón son:
1. Las categorías de datos son mutuamente excluyentes y exhaustiva.
2. Las características de datos están ordenadas de acuerdo con la cantidad de la
característica que posee.
3. Diferencias iguales en la característica están representados por diferencias iguales en
los números asignados a las categorías.
4. El punto cero refleja la ausencia de esa característica así por ejemplo se dan los
ingresos de cuatro combinaciones padre-hijo.
Ingreso
NOMBRE PADRE HIJO
Garzón $ 80.000 $ 40.000
Cevallos $ 90.000 $ 30.000
Marín $ 60.000 $ 120.000
NOTAS DEL SPSS 5
Álvarez $ 75.000 $ 130.000
Se observa claramente, que Garzón padre gana el doble que su hijo, Marín hijo gana el
doble que su padre.
2. ENCUESTA SOBRE LA SATISFACCIÓN DE LOS EMPLEADOS DE
KALOSHA INDUSTRIES
La empresa Kalosha Industries, es fabricante de partes y piezas automotrices. Tiene
9800 empleados, para lo cual se elabora una encuesta con la finalidad de medir la
satisfacción con el trabajo, que evalúe la longevidad y el progreso profesional y que
evalúe las aspiraciones, actitudes y opiniones de sus trabajadores.
Lo que básicamente se persigue es instrumentar una filosofía de administración para la
calidad total (TQM) en toda la compañía e incrementar su eficiencia y productividad.
La meta es obtener inferencias de toda la población de los empleados de tiempo
completo basándose en los resultados obtenidos de la muestra.
ENCUESTA SOBRE LA SATISFACCIÓN DE LOS EMPLEADOS
1. Cuántas horas trabajó la semana pasada en todos los trabajos? _______(horas)
2. Cuál es su ocupación?
1. Gerencial 2. Profesional 3. Técnico / Ventas
4. Apoyo Adminis 5. Servicios 6. Producción
7. Obrero (ocupacion)
3. Cuál es su edad (respecto al último cumpleaños)______(edad)
4. ¿Cuántos años de escuela concluidos?__________(educ)
5. ¿Cuál es su género? 1. masculino 2. femenino (sexo)
6. Entre los miembros de su familia que viven en su casa actualmente, ¿Cuántos,
incluyéndose usted, estuvieron empleados el año pasado?____(numaport)
7. ¿Cuáles fueron sus ingresos antes de los impuestos el año pasado (en miles de
dólares)?_____(ingresos)
8. ¿Cuáles fueron sus ingresos familiares totales antes de impuestos el año pasado (en
miles de dólares)? _________(ingfamil)
9. En general ¿qué tan satisfecho está con su trabajo? (satisfac)
1. Muy satisfecho 2. Moderadamente satisfecho
3.Un poco satisfecho 4. Muy insatisfecho
10. Si de la noche a la mañana se enriqueciera por una herencia, un regalo o la lotería,
¿dejaría de trabajar y se retiraría? (retiro)
1. si 2. no 3. no está seguro
11. ¿Cuál de las siguientes características del trabajo es la más importante para usted?
(carácter)
1. Altos ingresos 2. Ningún riesgo de ser despedido
3. Horario flexible 4. Oportunidades de progreso
5. Disfrute del trabajo
12. ¿Cuál de las siguientes formas es la más empleada por la mayoría de las personas para
sacar el trabajo? (avanzar)
1. Trabajo duro 2. Trabajo duro y suerte 3. Suerte
13. ¿Cuántos eventos traumáticos (muerte de un pariente o amigo cercano, divorcio,
separación, desempleo, incapacidad por enfermedad) experimentó el año
pasado?________(traumas)
14. ¿Es miembro de un sindicato de trabajadores actualmente? (sindicat)
1. si 2. no
NOTAS DEL SPSS 6
15. Desde los 16 años, ¿aproximadamente cuántos años ha trabajado tiempo completo a
cambio de un salario? (trabajad)
16. ¿Cuántos años en total ha trabajado para su actual empleador?____(trabkalo)
17. ¿Cuántas promociones, si las hubo, ha recibido mientras ha trabajado con su actual
empleador?_______(promoc)
18. En los siguientes cinco años, ¿qué tan probable es que sea promovido? (profutur)
1. Muy probable 2. Probable 3. No está seguro
4. Improbable 5. Muy improbable
19. ¿Las oportunidades promocionales son mejores o peores para personal de su género?
(oportuni)
1. Mejores 2. Peores 3. No tiene efecto
20. Desde su primer trabajo de tiempo completo con esta organización, ¿cómo describiría
su avance? (avance)
1. Avance rápido 2. Avance Intermedio
3. Casi en el mismo lugar 4.Pérdida de terreno
21. ¿Su trabajo le permite tomar parte en la toma de decisiones que le afectan en su trabajo?
(decisión)
1. Siempre 2. Gran parte del tiempo
3. Algunas veces 4. Nunca
22. Como parte de su trabajo, ¿participa en decisiones presupuestales? (decpresup)
1. si 2. no
23. ¿Qué tan orgulloso se siente de trabajar para esta organización? (orgullo)
1. Muy orgulloso 2. Algo Orgulloso
3. Indiferente 4. Nada orgulloso
24. ¿Rechazaría otro trabajo de más paga para poder quedarse en esta
organización?(maspaga)
1. Muy probable 2. Probable 3. No está seguro
4. Improbable 5. Muy improbable
25. En general, ¿cómo describiría las relaciones en su lugar de trabajo entre la gerencia y
los empleados? (geremple)
1. Muy buenas 2. Buenas 3. Regulares
4. Malas 5. Muy malas
26. En general, ¿cómo describiría las relaciones en su lugar de trabajo entre compañeros de
trabajo y colegas? (comcoleg)
1. Muy buenas 2. Buenas 3. Regulares
4. Malas 5. Muy malas
27. ¿Qué tan importante fue su formación académica formal para el trabajo que ahora hace?
(academic)
1. Muy importante 2. Importante
3. Algo importante 4. Nada importante
28. ¿Qué tan importante fue la capacitación formal para el trabajo que ahora hace?(capacit)
1. Muy importante 2. Importante
3. Algo importante 4. Nada importante
A continuación mostramos una parte de la base de datos de la Industries Kalosha .
NOTAS DEL SPSS 7
Encuestado horas ocupación edad educación Sexo numaport ingresos ing.famil. satisfac. retiro caracter avanzar trau
1 50 1 35 20 1 2 78,3 85,3 2 1 4 1 0
2 30 7 64 14 2 2 25,7 81,9 1 1 3 2 0
3 40 1 33 15 1 2 40,5 85,6 2 1 3 1 0
4 40 3 23 14 1 1 20,2 20,2 1 1 1 1 0
5 50 4 33 12 2 1 25,2 25,2 1 1 1 2 0
6 40 3 60 14 1 1 35,7 35,7 1 1 1 1 0
7 40 5 37 14 2 1 15 15 2 2 1 2 0
8 40 6 25 13 2 3 18 49,5 2 1 5 3 1
9 50 2 39 18 1 1 60,8 60,8 2 1 5 1 0
10 30 1 35 16 1 1 38,4 38,4 2 2 1 2 0
11 32 2 35 12 2 1 31 33,5 1 1 1 1 0
12 55 6 49 13 1 2 76,6 93,5 3 2 1 1 0
13 40 3 34 12 2 2 33,3 55,2 2 1 1 1 0
14 40 4 50 14 2 1 15,8 17,4 3 2 1 1 0
15 40 7 49 4 1 1 27,5 27,6 2 2 3 2 1
16 40 5 39 16 1 2 64,2 67,2 1 1 5 1 0
17 40 3 61 12 2 1 32 34,6 1 1 1 1 0
18 40 1 59 16 1 1 26,6 35,4 2 1 5 1 1
19 40 4 25 16 1 1 33,1 33,1 4 1 5 3 0
20 50 7 20 11 1 2 10,5 14,3 1 1 1 1 0
21 64 3 37 13 2 1 35,7 35,7 1 1 5 1 1
22 49 4 24 12 2 2 24,3 27,4 3 1 4 2 0
23 30 6 33 10 1 2 33,3 42,8 3 1 5 1 0
24 55 3 30 16 1 1 33,8 33,8 1 1 5 1 0
25 50 5 43 13 1 4 25,2 91,8 1 1 4 1 0
26 40 4 56 16 2 1 36,1 36,9 1 2 1 1 0
27 40 6 35 15 1 2 42,7 51,8 1 1 5 1 0
28 40 4 35 16 1 2 14,7 46,9 2 1 5 2 3
29 40 2 42 16 2 3 23,7 51,2 1 1 1 1 1
30 48 1 34 12 2 2 31,3 67,7 1 1 3 1 0
1. Ejercicios
Halle el número de encuestado(s) que
a) Más horas a la semana trabajaron (horas), de qué sexo es (ó son) (sexo), si pertenece
o no a un sindicato (sindicat) y que tan orgulloso se siente de trabajar para esta
organización (orgullo).
b) Tenga la edad más alta (edad), cuántos años de escuela concluidos (educ) y cuáles
fueron sus ingresos antes de los impuestos el año pasado (ingresos).
c) El (los) que menos años ha trabajado para su actual empleador (trabkalo), cuál es su
ocupación (ocupación), en general que tan satisfecho está con su trabajo (satisfac) y
en general cómo describiría las relaciones en su lugar de trabajo entre compañeros y
colegas (comcoleg).
d) Más experimentos traumáticos experimentó el año pasado (traumas), rechazaría otro
trabajo de más paga para poder quedarse en esta organización (maspaga), desde su
primer trabajo de tiempo completo con esta organización ¿cómo describiría su
avance? (avance).
e) Entre los miembros de su familia que viven en su casa actualmente ¿cuántos
incluyéndose usted estuvieron empleados el año pasado? (numaport), las
NOTAS DEL SPSS 8
oportunidades promocionales son mejores o peores para personal de un género
(oportuni), si es miembro de un sindicato (sindicat) y de que sexo es (sexo).
Para el cálculo del tamaño de muestra se han considerado dos preguntas como
principales dentro de esta encuesta, la No.7 pregunta cualitativa y la pregunta No.9
como cualitativa, se demostrará que el tamaño de muestra es de 400 empleados de los
9800.
Así pues de la encuesta Kalosha se observa que las preguntas:
2,5,9,10,11,12,14,18,19,20,21,22,23,24,25,26,27,28 son datos categóricos, en tanto las
restantes son variables numéricas dentro de estas se observa que discretas son las
preguntas 1,3, 4,6,13,15,17 y continuas son 7,8 y 16.
En la encuesta de Kalosha se puede observar que el nivel nominal son las preguntas 5,
10, 11, 14, 22.
En los datos de nivel ordinal se tiene las preguntas 2, 9, 12, 18, 19, 20, 21, 23, 24, 25,
26, 27 y 28.
3. COMANDOS
a) Modo de ingresar datos
Se puede observar las barras de herramientas que posee el SPSS, esto es las ventanas de
aplicación, las ventanas de salida y las ventanas de datos.
Se ingresaran datos d e una variable cuantitativa, para lo cual se hace doble clic en la
ventana de datos y se escribe la variable de la primera pregunta horas máximo se puede
ocupar hasta 8 caracteres.
Dentro de esta variable se escoge el tipo (type), en nuestro caso “numeric”, luego se
escoge por ser una variable entera “decimal places” cero, se puede escoger column
format y el texto centrado y además el espacio que ocupará dicha variable, que por
defecto viene dado por el type, antes mencionado.
En tanto para las variables cualitativas se debe realizar el mismo procedimiento con la
diferencia de que se deben definir las etiquetas (labels) en variable label se escribe las
características de la variable categórica, esto es, en value “1”, y en value label
“Gerencial”, y luego la tecla “add”, en value “2” , y en value label “profesional”, etc., y
luego OK. De igual manera se debe seguir llenando las demás variables cualitativas.
2. Ejercicio. Ingrese las cinco primeras variables (o preguntas) e ingrese los diez
primeros datos de cada variable.
NOTAS DEL SPSS 9
3. Ejercicio Ingrese la variable ¿qué tan orgulloso se siente trabajar para esta
organización? (orgullo) y los diez primeros datos.
Una vez ingresada toda la base de datos se puede grabar utilizando los comandos:
File Save se pone el nombre del archivo y lo pondrá automáticamente con extensión
.sav (ver parte superior de la pantalla como cambia al nombre sugerido).
Para recuperar el archivo creado, puede salir del programa volver, a ingresar
FileOpen (ó ctrl. O) buscar el archivo aceptar.
b) Plantillas
En el caso en el que se tiene varias preguntas y que se tiene las mismas opciones tales
como las preguntas de la encuesta 28 y 27 o la 25 y 26 o la 18 y 24 o la 14 y 22, se
puede utilizar una plantilla la misma que nos permitirá asignar a todo los grupos de
variables que deseemos definir, para lo cual se deben realizar los siguientes pasos:
DataTemplates...Define>> En Name (poner un nombre por ejemplo preg14-22)
luego ir a Applymarcar todas las opciones del Type, Value label, Missing values,
Column format (hacer clic)
NOTAS DEL SPSS 10
TypeNumericwidth 8decimal places 0continue
Value 1Value label SI Add
Value 2 Value label NOAddContinue
Column formatCenterContinue
Ir a Add se puede definir otra variable (poner PREG18-24)cambiar las etiquetas y
poner Add (añadir).
Una vez definido las plantillas deseadas, se posiciona en la columna, se va a
DataTemplates...Define>> se realiza el mismo proceso anterior se puede repetir en
las preguntas pertinentes.
Quedando finalmente:
NOTAS DEL SPSS 11
4. TIPOS DE REPRESENTACIONES
a) Diagramas de Tallo y Hojas
Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se
divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios
las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada
observación a lo largo del eje horizontal.
Los comandos para realizar el diagrama de tallo y hoja son:
AnalyzeDescriptive StatisticsExplore En Display escoger Plots
Ir a Plotsstem and leafcontinueOK
4. Ejercicio. Realice el diagrama de tallo y hoja de la variable edad de los
trabajadores de Kalosha Industries.
NOTAS DEL SPSS 12
EDAD Stem-and-Leaf Plot
Frequency Stem & Leaf
1,00 1 . &
19,00 2 . 01123344
57,00 2 . 555556666677777788888999999
66,00 3 . 0000001111222222233333333344444
77,00 3 . 5555555566666677777788888888899999999
74,00 4 . 000000001111111112222233333334444444
32,00 4 . 556777788888999
31,00 5 . 00011222233344
21,00 5 . 556777889
19,00 6 . 01122334
2,00 6 . 5
1,00 Extremes (>=69)
Stem width: 10
Each leaf: 2 case(s)
& denotes fractional leaves.
Interpretación:
Existe una sola persona que tiene 18 años de edad previamente podría mandar a ordenar
los casos de la variable edad para darse cuenta de que efectivamente es así, para lo cual
vaya: Data Sort CasesNombre de la variable (Edad)En forma ascendenteOK.
Además existen 19 personas que tienen una edad entre 20 a 24 años de edad. También
existe una sola persona que tiene 69 años de edad. La mayor concentración de edad se
encuentra entre los 35 a los 39 años y que representan 77 personas entre dichas edades.