Introduccion Statgraphics
Introduccion Statgraphics
Introduccion Statgraphics
Statgraphics es un software diseado para facilitar el anlisis estadstico de datos y que utilizaremos a lo largo del curso. El objetivo de esta prctica es que te familiarices con los distintos mens y opciones que Statgraphics proporciona para la descripcin estadstica de datos. Para ello, se propone la siguiente actividad guiada. Debes leer este documento detenidamente y realizar con el programa procedimientos que se describen.
Como es habitual, para salir del programa seleccionamos en la barra de men ARCHIVO...SALIR DE STATGRAPHICS o, simplemente, se cierra la ventana principal de la aplicacin pulsando el aspa que hay en el marco, arriba ala derecha. En la pantalla principal de Statgraphics, podemos distinguir los siguientes elementos: 1. Barra de men 2. Barra de herramientas 3. Barra de tareas
esta barra siempre est disponible, y permite acceder a todas las opciones que ofrece el programa. Para desplegar un men: o bien al hacer clic con el ratn sobre cada una de las palabras que componen la barra, o bien pulsar la tecla Alt. Observa queaparece subrayada una letra la palabra que etiqueta cada men. La combinacin Alt+Esa letra despliega el men correspondiente. Por ejemplo de ca +Letra Inicial de nombre del men. Por ejemplo, Alt+a abre el men Archivo A lo largo de este curso no usaremos todos los mens; de momento nos interesamos por: Archivo: permite realizar operaciones de carcter general: abrir, cerrar o grabar ficheros, imprimir y salir de Statgraphics. Edicin: est asociado a opciones de edicin: cortar, copiar, pegar, deshacer... Descripcin: contiene opciones para describir un conjunto de datos. Pulsa con le ratn cada uno de ellos y mira qu opciones despliegan.
Asocia iconos (botones) con algunas de las opciones ms frecuentemente utilizadas de la barra de men. Si se seala con el ratn cualquier botn de la barra, aparecer una breve descripcin de la funcin asociada.
El trabajo con Statgraphics implica hacer distintos tipos de anlisis estadsticos con datos. Adems, el programa ofrece informacin sobre esos anlisis y permite almacenar y editar los resultados obtenidos como resultado del estudio. Statgraphics genera automticamente una serie de ventanas en la que se recoger toda la informacin a la que nos referamos antes: Ventana de datos: hoja de clculo que contiene los datos que se van analizar. Inicialmente se llama <Sin nombre>, puesto que an no hay datos en el sistema.. Statadvisor: herramienta que interpreta de forma sencilla los resultados obtenidos. Statreporter: aqu podemos copiar los resultados del anlisis estadstico en un fichero con formato *.rtf (rich text format) compatible con OpenOffice, MSOffice,.... Podemos editar la informacin contenida en esta ventana igual que al trabajar con un procesador de textos. Sin Nombre Comentarios: Permite teclear una pequea descripcin del Statfolio (ver abajo). Statgallery: Los resultados del anlisis estadstico aparecen organizados en marcos. En esta ventana podemos guardar el contenido de esos marcos en otro marco. As, la informacin queda organizada en algo que se parece a una presentacin con diapositivas. Podemos modificar la disposicin de los paneles del Statgallery sin ms que desplazar con el ratn las barras horizontales y verticales. El conjunto de estos elementos se llama Statfolio. Un poco ms adelante volveremos sobre esto.
Pulsar con el botn derecho del ratn sobre la columna seleccionada. Aparecer un men del que seleccionamos la opcin Modificar Columna:
En esta pantalla escribiremos el nombre de la variable (mximo 32 caracteres, sin espacios en blanco, signos especiales y utilizando siempre una letra como primer carcter), y el tipo de variable (Numrica si vamos a analizar nmeros). Llama a esta variable EJEMPLO. Pulsar ACEPTAR y teclea los valores de la variable EJEMPLO (copialos o inventa 14 valores).
Statgraphics permite introducir columnas calculadas, esto es, crear una nueva variable (columna) como
transformacin de otras variables (columnas) previamente definidas. Para obtener una columna calculada realizamos las siguientes operaciones: Seleccionar la columna donde queremos que aparezcan los datos calculados. Hacer clic con el botn derecho del ratn y elegir la opcin Generar datos del men que aparece. Componer, en la ventana que aparece, la expresin para el clculo de los nuevos datos: (en este caso multiplicaremos por 2 la variable EJEMPLO).
Los ficheros de datos generados pueden almacenarse para anlisis posteriores. Para ello, en el men ARCHIVO seleccionaremos ARCHIVO...GUARDAR...GUARDAR DATOS / ARCHIVO...GUARDAR COMO....GUARDAR DATOS COMO y elegir el nombre y la ubicacin deseada para el archivo. (Podrn recuperarse posteriormente con la opcin ARCHIVO...ABRIR ... ABRIR DATOS).
Observa que los datos aparecen en una ventana que ahora se llama altura-2.sf3. Realizar un anlisis descriptivo de la variable ALTURA. Para ello, pulsa DESCRIPCIN...DATOS NUMRICOS...ANLISIS UNIDIMENSIONAL. Selecciona DATOS..ALTURA...ACEPTAR. Observa que ha aparecido una nueva ventana llamada Anlisis Unidimensional ALTURA con cuatro marcos que contienen los resultados del anlisis.
estudio, Grfico de dispersin y grfico de cajas y bigotes. Esto no agota todas las opciones que podemos seleccionar; al pulsar cada uno de los botones Opciones tabulares y Opciones grficas aparecen todas
IMPORTANTE: seleccionar un opcin aade un marco a la ventana de anlisis con la informacin correspondiente. Al colocar el puntero del ratn en cada marco y pulsar el botn derecho, el men Opciones de ventana da acceso a opciones que permiten obtener informacin ms detallada del anlisis que llevamos a cabo. En cada marco las opciones son diferentes.
Percentiles: proporcionan informacin sobre cmo estn distribuidos los datos. El percentil de orden k de un conjunto de datos es un valor que es mayor que el k % de los valores que toma la variable. El resultado para la variable ALTURA es el siguiente: ----------------------------------------------------------------------------------------------------Percentiles para ALTURA
1,0% = 90,0 5,0% = 100,0 10,0% = 109,0 25,0% = 123,0 50,0% = 143,0 75,0% = 166,0 90,0% = 175,0 95,0% = 180,0 99,0% = 185,0
Para calcular el valor de un cuantil cualquiera, por ejemplo, el 40, el botn derecho del ratn en el correspondiente marco e introduce el dato correspondiente. Tabla de frecuencias: permite resumir la distribucin de los datos contenidos en una variable. Al igual que los dems marcos en que se desglosa el anlisis de los datos, la tabla de frecuencias se visualiza a travs del men Opciones Tabulares. Como resultado, Statgraphics crea una serie de intervalos que constituyen una particin del rango de los datos estudiados. Selecciona esta opcin para obtener Tabla de Frecuencias para ALTURA ----------------------------------------------------------------------------------------------------------------Lmite Lmite Frecuencia Frecuencia Frecuencia Clase Inferior Superior Marca Frecuencia Relativa Acumulativa Acum.Rel. ----------------------------------------------------------------------------------------------------------------menor o igual 1 0,0 2 24,0 3 48,0 4 72,0 5 96,0 6 120,0 7 144,0 8 168,0 9 192,0 10 216,0 mayor 240,0 0,0 24,0 48,0 72,0 96,0 120,0 144,0 168,0 192,0 216,0 240,0 12,0 36,0 60,0 84,0 108,0 132,0 156,0 180,0 204,0 228,0 0 0 0 1 8 66 98 97 68 1 0 0 0,0000 0,0000 0,0000 0,0029 0,0236 0,1947 0,2891 0,2861 0,2006 0,0029 0,0000 0,0000 0 0 0 1 9 75 173 270 338 339 339 339 0,0000 0,0000 0,0000 0,0029 0,0265 0,2212 0,5103 0,7965 0,9971 1,0000 1,0000 1,0000
----------------------------------------------------------------------------------------------------------------la tabla nos dar informacin del nmero de datos que tienen su valor dentro de cada intervalo, es decir, la frecuencia frecuencia absoluta de cada intervalo. El porcentaje que esas observaciones representa frente al total se llama frecuencia relativa. El programa presenta tambin las frecuencias acumuladas para cada una de los intervalos. Podemos modificar el nmero de clases) en los que se divide el rango de los datos haciendo clic con el botn derecho del ratn sobre la tabla y seleccionando la opcin OPCIONES DE VENTANA:
Observa que puedes modificar los lmites superior e inferior. La tabla de frecuencias no slo puede aplicarse a datos numricos, sino tambin a variables cualitativas. Para ello se sigue la ruta DESCRIPCIN... DATOS CUALITATIVOS... TABULACIN. Incluir la variable COLOR OJOS...ACEPTAR. Si no apareciera la tabla, pulsa OPCIONES TABULARES y selecciona TABLA DE FRECUENCIAS. El resultado es: Tabla de Frecuencias para COLOR OJOS ----------------------------------------------------------------------------------------------------Frecuencia Frecuencia Frecuencia Clase Valor Frecuencia Relativa Acumulativa Acum.Rel. ----------------------------------------------------------------------------------------------------1 Azul 71 0,2094 71 0,2094 2 Marron 221 0,6519 292 0,8614 3 Negro 16 0,0472 308 0,9086 4 Verde 31 0,0914 339 1,0000 Diagrama de tallos y hojas: en el botn Opciones Tabulares, selecciona la opcin correspondiente.
4.2. Opciones Grficas: Grficos de dispersin y de caja y bigotes. Histograma y densidad suavizada. Diagramas de barras y sectores.
La informacin que aparece a continuacin es accesible desde el botn Opciones Grficas. Grfico de dispersin: permite visualizar la distribucin de los datos. Observa que la variable ALTURA es unidimensional y, sin embargo, los datos estn sobre el plano. Statgraphics desplaza verticalmente y de forma aleatoria cada valor de la variable para que sean visibles: si miras el equipo de tu compaero, o vuelves a hacer el anlisis, la nube ser diferente, pero sobre cada uno de los valores de la variable ALTURA habr siempre el mismo nmero de puntos. A veces es de inters obtener informacin grfica ms detallada de la que proporciona Statgraphics por defecto. Ve a cualquier anlisis en el que aparezca un grfico de dispersin. Haz doble click sobre el grfico, de modo que ocupe toda la pantalla. Observa que algunos botones se activan
Coloca el curso sobre uno de los puntos y djalo pulsado. Vers que aparecen arriba, a la derecha, informacin sobre ese dato (su valor exacto y la posicin que ocupa en la tabla). Tambin podemos colorear puntos (el botn de la brocha) o hacer visible una barra que podemos deslizar para separar la muestra en dos partes (botn derecho del ratn-->localizar,).
Diagrama de caja y bigotes: sirve para visualizar la distribucin de los valores obsservados (concentracin o dispersin, existencia de valores atpicos). Se construye con los percentiles 25%, 50% (mediana) y 75 %. Como medida de la dispersin se Grfico de Caja y Bigotes utiliza el rango intercuartlico (percentil 75 % - percentil 25%) de manera que cualquier dato que se aleje de los percentiles 25 75% una distancia superior a 1,5 veces el rango intercuartlico se considera atpico. Este diagrama se obtiene a travs del 150 160 170 180 190 botn Opciones grficas. ALTURA Se debe observar: la forma de los rectngulos que forman la caja (cuanto ms estrechos sean, indicarn una mayor concentracin de datos); la posicin de la media, marcada con una cruz roja respecto de la mediana, lnea central de la caja es la mediana, (la coincidencia de ambas indica simetra de la distribucin), y, si los hubiera, la existencia de valores ticos (quedan fuera de los segmentos de longitud 1,5 veces el rango intercuartlico colocados a derecha a izquierda). En ocasiones puede ser til observar simultneamente dos diagramas de la caja: por ejemplo para la variable altura en la que se separan los valores de las observaciones en funcin del diferente sexo de los individuos. Esta opcin est disponible en el men DESCRIPCIN... DATOS NUMRICOS... ANLISIS DE SUBGRUPO.... El resultado obtenido (tras seleccionar la opcin de GRFICO DE CAJA Y BIGOTES en el men de opciones grficas) es el siguiente: Observa que, en este caso, para SEXO=2 s hay un dato atpico, que est situado en torno a los 45
cm de altura. Con independencia de este hecho, con esta opcin es posible analizar simultneamente una variable discriminada segn el criterio de seleccin. (Esta misma representacin simultnea de grficos tambin est disponible cuando se quiera observar el histograma de una variable). Histograma (de frecuencias): son representaciones grficas de las tablas de frecuencias estudiadas con anterioridad, donde a cada intervalo o clase en que se divide el rango de los datos, se le asigna una barra cuya altura es proporcional a la frecuencia de aparicin de sus elementos. Para la variable ALTURA tenemos:
Histograma
8
frecuencia
ALTURA Diagrama de barras permite obtener informacin sobre las diferentes categoras en que puede dividirse una variable cualitativa. As por ejemplo en el fichero altura-2.sf3 podemos analizar el color de los ojos, de nuevo, a travs de sin ms que hacer DESCRIPCIN... DATOS CUALITATIVOS... TABULACIN, y seleccionar la opcin DIAGRAMA DE BARRAS de las Opciones Grficas.
Podemos, adems, cruzar dos variables. Por ejemplo, el color de los ojos por sexos: seleccionar el men DESCRIPCIN... DATOS CUALITATIVOS... TABULACIN CRUZADA. Seleccionar las variables COLOR DE OJOS y SEXO, y activar la opcin del DIAGRAMA DE BARRAS de las Opciones Grficas. Activa en Opciones Grficas la opcin Grfico de Mosaico, tambin muy descriptiva. Diagrama de sectores: da informacin sobre el peso relativo de las categoras en que se divide una variable. Para mostrarlo, sigue la ruta DESCRIPCIN...DATOS CUALITATIVOS ...TABULACIN y selecciona la variable COLOR OJOS. Activa la opcin de DIAGRAMA DE SECTORES en Opciones Grficas. El diagrama de sectores contiene informacin similar a la de la tabla de frecuencias o el diagrama de barras.