Curso de Introduccion Al Paquete Stata - 9 - 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 33

CENTRO DE

CIENCIAS HUMANAS
Y SOCIALES

Curso de introducción al paquete

Stata
(versión 9.1 SE)

José Manuel Rojo Abuín


Unidad de Análisis Estadístico
Centro de Ciencias Humanas y Sociales
Consejo Superior de Investigaciones Científicas (CCHS, CSIC)
Madrid

Madrid, 14 y 15 de Febrero de 2008


Contenido
I. INTRODUCCIÓN .................................................................................................. 2
II. EL AMBIENTE DE TRABAJO DE STATA......................................................... 3
Descripción del ambiente de trabajo.............................................................................. 4
Descripción de las ventanas ........................................................................................... 5
Descripción de la barra de herramientas........................................................................ 6
Ayuda del sistema.......................................................................................................... 6
Sintaxis de las órdenes de Stata ..................................................................................... 7
III. GESTION DE BASES DE DATOS ....................................................................... 9
Tipos de datos .............................................................................................................. 10
Cargar un fichero de datos en formato Stata................................................................ 11
a) Desde la barra de menús ..................................................................... 11
b) Instrucción en la ventana Command .................................................. 11
Introducir datos por teclado ......................................................................................... 12
Cargar los datos desde un fichero de datos en formato ASCII .................................... 12
Guardar ficheros de datos ............................................................................................ 13
Unir conjunto de datos................................................................................................. 14
La instrucción Merge .............................................................................. 14
La instrucción Append............................................................................ 15
IV. CREACIÓN Y MODIFICACIÓN DE VARIABLES .......................................... 18
a) Generar nuevas variables en función de expresiones matemáticas ya existentes .... 18
Funciones aritméticas .................................................................................. 19
Funciones matemáticas................................................................................ 19
b) El comando egen ..................................................................................................... 20
c) Recodificación de variables..................................................................................... 20
Generación de retardos y diferencias........................................................................... 21
V. ESTADÍSTICOS DESCRIPTIVOS UNIVARIANTES....................................... 22
VI. MODELOS DE REGRESIÓN POR MÍNIMOS CUADRADOS ........................ 26
Introducción ...................................................................................................................... 26
Diagnósticos sobre el modelo de regresión lineal simple ................................................. 27
Contraste de homocedasticidad ................................................................... 27
Contraste de multicolinealidad .................................................................... 27
Contraste RSET ........................................................................................... 27
Para guardar las estimaciones en una variable ............................................ 27
VII. REGRESIÓN LOGISTICA .................................................................................. 28
Introducción ...................................................................................................................... 28
Estudio de la capacidad de predicción del modelo ........................................................... 29
Estudio de los parámetros ................................................................................................. 29
Generación de gráficos auxiliares..................................................................................... 30
VIII. LISTA DE COMANDOS ..................................................................................... 31
Comandos generales .................................................................................... 31
Conjunto de datos y variables...................................................................... 31
Gráficos ....................................................................................................... 31
Estadísticos descriptivos.............................................................................. 31
Análisis estadísticos habituales.................................................................... 31
Modelos de regresión................................................................................... 31

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 1 / 33
I. INTRODUCCIÓN

El objetivo de este manual es familiarizar al lector con el paquete Stata. La versión


utilizada en la elaboración de este manual es Stata 9.1 SE para la familia Windows NT,
es decir Windows professional y Windows XP, en sus múltiples versiones.

Stata es una aplicación desarrollada para realizar análisis estadísticos sobre muestras
aleatorias de poblaciones. Hay quien señala una fuerte especialización en problemas
asociados con la econometría.

Si bien tiene una interface gráfica de usuario (GUI), en la práctica es mucho más
cómodo utilizar el potente a la vez que sencillo lenguaje de programación que incluye.
Este lenguaje de programación requiere un cierto esfuerzo inicial hasta que el usuario
empiece a acostumbrarse con los comandos; también suministra un sistema de ayuda
realmente detallado y completo.

Nota:

En general, bajo el programa Stata trabajaremos mediante lenguaje de


programación, y conviene recordar que es case-sensitive, es decir, diferencia
entre letras mayúsculas y minúsculas

Genero ¡= genero

En cuanto a la capacidad de manejar grandes volúmenes de información, a diferencia de


otras aplicaciones como SPSS y SAS, Stata necesita hacer una copia la base de datos
que vamos a analizar en la memoria RAM de nuestro computador, por tanto, la memoria
disponible en nuestro computador deberá de estar acorde con el tamaño de las bases de
datos que vamos a utilizar.

Existe una limitación en cuanto al número máximo de variables; en la versión 9.1 SE


el número máximo de variables contenidas en la base de datos está en torno a las
35.000.

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 2 / 33
II. EL AMBIENTE DE TRABAJO DE STATA

La interface de Stata consiste en un entorno de trabajo que facilita la interacción con la


aplicación:

El entorno de trabajo tiene el siguiente aspecto:

Este entorno puede ser configurado (hasta cierto punto) para adaptarlo a nuestras
necesidades.

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 3 / 33
Descripción del ambiente de trabajo

El entorno de trabajo, o ventana principal, de Stata se subdivide en cuatro ventanas


básicas, además de la barra de menús y la barra de herramientas.
Las ventanas básicas reciben los siguientes nombres:
Review
Variables
Command
Result

La ubicación de estas ventanas es la siguiente:

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 4 / 33
Descripción de las ventanas

Command En esta ventana se escriben las órdenes que se dan a la aplicación


Result Aparecen los resultados de las órdenes ejecutadas
Variable Listado de las variables contenidas en la base de datos cargada en la
aplicación; si no tenemos ninguna, esta ventana aparece vacía
Review Lista completa de los comandos ejecutados desde que se inició la
aplicación

Nota:

En la esquina inferior izquierda de la pantalla aparece el directorio de trabajo;


para cambiar de directorio basta con escribir el comando cd seguido del nuevo
directorio, exactamente igual a como se trabajaba en la consola de MS Windows.

Ejemplo:

cd d:\datos\enuesta

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 5 / 33
Descripción de la barra de herramientas

Abrir ficheros de datos en formato Stata

Guardar el actual fichero de datos

Imprimir resultados, gráficos y órdenes

Iniciar o cerrar un archivo para guardar resultados

Abrir el visor de ayuda

Restaurar la ventana de resultados a primer plano

Restaurar la ventana de gráficos de alta resolución a primer plano


Creaf un nuevo fichero de comandos (equivalente a los ficheros de sintaxis de
SPSS)
Invocar al editor de datos, se pueden modificar datos

Invocar al visualizador de datos, no podemos modificar datos


Continuar con la ejecución de comandos
Detener la ejecución de la tarea que está realizando

Ayuda del sistema

La aplicación Stata posee un sistema de ayuda realmente excelente (personalmente, es el


mejor que conozco).

Para solicitar ayuda sobre un tema, por ejemplo regresión, sólo tenemos que escribir la
orden help seguida de la palabra clave. Automáticamente se abre el visor de ayuda
mostrando un completísimo informe, incluso con ejemplos y temas relacionados.

Ejemplo

help probit

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 6 / 33
Resultado (mostrado sólo parcialmente):

Sintaxis de las órdenes de Stata

La aplicación Stata posee un lenguaje de programación avanzado que respeta unas normas
de sintaxis, al igual que otros lenguajes de programación como PASCAL o C++; quienes
estén familiarizados con estos lenguajes les resultará muy sencillo asimilar el lenguaje de
Stata.

Cualquier orden en Stata (con muy pocas excepciones) posee la siguiente sintaxis:

[prefix :] command [varlist] [=exp] [if] [in] [weight] [using filename] [, options]

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 7 / 33
Pero la mayoría de las veces vamos a utilizar la siguiente forma, mucho más simplificada:

command [varlist] [if] [in] [weight] [, options]

[…] todo lo que aparece entre corchetes es opcional


if seguida de una expresión lógica indica que sólo los datos que verifiquen
dicha condición serán incluidos en el análisis
in sirve para indicar el rango de observaciones que deseamos analizar
weight sirve para indicar una variable de ponderación
options son las opciones especificas del comando que estemos utilizando

Ejemplos:

table genero edad

Realiza una tabla de contingencia del género y la edad

table genero edad if altura > 1.70

Realiza una tabla de contingencia del género y la edad sólo para personas de más de 1,70
de altura

table genero edad if altura > 1.70 in 1/100

Realiza una tabla de contingencia del género y la edad solo para personas de más de 1,70
de altura utilizando únicamente los 100 primeros casos de la base de datos

table genero edad if altura > 1.70 in 1/100 [weight = pondera] , chi

En este comando, además, se indica que los datos van ponderados por la variable pondera
y se solicita que realice el test Chi cuadrado

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 8 / 33
III. GESTION DE BASES DE DATOS

Los ficheros de datos en Stata se denominan dataset.


Un dataset es una tabla, donde las columnas representan variables y las filas
observaciones o casos.

La variable del sistema _N indica el número total de observaciones contenidas en el


dataset.

display _N

Para conocer la naturaleza de los datos contenidos en el dataset se utiliza la instrucción


describe

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 9 / 33
Ejemplo:

Tipos de datos

La columna denominada storage type indica el formato de almacenamiento, es decir, el


número de bytes y, por tanto, la precisión de la variable.

Tipo menor valor mayor valor valor mas cercano de cero bytes
byte -127 100 +/-1 1 1
int -32,767 32,74 +/-1 2
long -2,147,483,647 2,147,483,620 +/-1 4
-
float 1.70141173319*10^38 1.70141173319*10^36 +/-10^-36 4
-
double 8.9884656743*10^307 8.9884656743*10^307 +/-10^-323 8

Precision float 3.795x10^-8


double 1.414x10^-16

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 10 / 33
Cargar un fichero de datos en formato Stata

Para cargar un fichero de datos en formato Stata ( extensión *.dta ) tenemos dos
opciones: bien realizar esta operación desde la barra de menús, o bien mediante una
instrucción escrita en la ventana command.

a) Desde la barra de menús

Si ya tenemos un fichero en memoria, el sistema nos advertirá de ello, permitiéndonos


continuar o abortar la operación.

b) Instrucción en la ventana Command

use “nombre de fichero”

Si ya tenemos un fichero de datos en memoria, la aplicación no permitirá cargarlo en


memoria pues borraría el anterior. Si este es nuestro caso, deberemos de utilizar la
opción clear para desalojar de la memoria el anterior fichero de datos:

use “nombre de fichero”, clear

La sintaxis de este comando es bastante flexible, permitiendo controlar qué parte del
fichero se desea cargar.

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 11 / 33
use [varlist] [if] [in] using filename [, clear nolabel ]

Introducir datos por teclado

Si ejecutamos la orden edit invocamos el editor de datos desde el cual podemos ir


introduciendo los datos tal como haríamos en una hoja de cálculo Excel. También
podemos realizar un copy-past aunque es poco recomendable.

Cargar los datos desde un fichero de datos en formato ASCII

El comando para realizar la lectura de ficheros ASCII es infile

La sintaxis (muy simplificada) de este comando es:

infile varlist using “nombre de fichero” [if ] [in ], options

Un ejemplo sencillo: supongamos que deseamos leer el siguiente fichero en formato


ASCII con la siguiente estructura (sin los nombres de variables):

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 12 / 33
Escribiríamos:

infile obs sexo carrera edad nota horast riesgo trabajo using "C:\creditos.dat" , clear

Nota

Está disponible el programa Stat/Transfer para realizar la traducción de bases


de datos entre distintos formatos, como por ejemplo SPSS, SAS, Stata, MS-
Excel, …, etc.

Guardar ficheros de datos

En principio, Stata no guarda las modificaciones realizadas en la base de datos; por ello,
si deseamos guardar el fichero de datos con las posibles modificaciones que hayamos
realizado, entonces utilizaremos el comando save

La sintaxis de este comando es:

save [nombre de fichero] [, opciones]

Ejemplo:

save creditos, replace

Con la opción replace grabamos encima del fichero que ya existía.

Para ordenar el dataset en función a una serie de variables se utiliza el comando sort

sort by iden
sort by hogar iden

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 13 / 33
Unir conjunto de datos

Es muy común en el trabajo diario combinar varias bases de datos. En este manual
vamos a mostrar dos operaciones básicas: añadir variables y añadir casos. Las
instrucciones asociadas a estas operaciones son merge y append.

La instrucción Merge
Merge se utiliza para añadir variables, pero no observaciones. Los ficheros de datos
deben de tener una variable de identificación y, además, deben de estar ordenados por
dicha variable.

Ejemplo:

Data1 Data2

La variable de identificación es obs y los dos dataset están ordenados de forma


ascendente.

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 14 / 33
Ejecutamos la orden

use data1
merge obs using data2

y obtenemos:

La instrucción Append
Se utiliza para añadir observaciones. La sintaxis de este comando es mucho más
sencilla.

Dataset 1 Dataset 2

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 15 / 33
Así, para combinar estas dos bases de datos, utilizamos los siguientes comandos:

use data1
append using data2

Si deseamos construir una nueva base de datos que condense la información original,
podemos utilizar el comando collapse

Ejemplo

Supongamos que tenemos una base de datos de hogares y en cada hogar se ha realizado
un muestreo de personas. Deseamos construir una base de datos donde la unidad
muestral sea el hogar, con una variable edad que represente la edad media de las
personas que viven en dicho hogar.

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 16 / 33
collapse (mean) alfabet tasa_nat tasa_mor , by (relig)

Resumen

En los capítulos previos hemos visto el funcionamiento básico de la aplicación,


introduciendo de forma progresiva los principios más elementales de la importación y
gestión de las bases de datos.

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 17 / 33
IV. CREACIÓN Y MODIFICACIÓN DE VARIABLES

Una vez cargada la base de datos que deseamos analizar es muy común modificarla,
creando nuevas variables o bien transformado las existentes.

Básicamente existen tres formas de crear y modificar las variables contenidas en la base
de datos:
a) Generar nuevas variables en función a expresiones matemáticas ya existentes.
b) Reemplazar algunos o todos los valores de una variable en función a una regla.
c) Agrupar los valores en intervalos prefijados, es decir recodificar.

a) Generar nuevas variables en función de expresiones


matemáticas ya existentes

Para crear nuevas variables en función de expresiones numéricas se utiliza el comando


generate

La sintaxis de generate es:

generate [tipo] nueva_variable [: Etiqueta] = exp [if] [in]

Ejemplo

Generate precio_pesetas = precio*166.

Nota
Si la variable a crear ya existe, el sistema dará un mensaje de error, pues este comando no
permite cambiar o alterar los valores de una variable ya existente. Si lo que deseamos es
alterar los valores, entonces deberemos utilizar el comando replace , que tiene la misma
sintaxis que generate

El número de funciones que podemos utilizar con el comando generate es realmente


amplio; a modo ilustrativo presentamos las más usuales:

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 18 / 33
Funciones aritméticas

+
-
*
/
^

Funciones matemáticas

abs(x)
acos(x) arcocoseno de x; -1 < x < 1
asin(x) arcoseno de x; -1 < x < 1
atan(x) arcotangente de x
ceil(x) retorna el entero mas pequeño mayor que x; n-1<x<=n
comb(n,k) numero de combinaciones posibles de n elementos tomados de k en k
cos(x) coseno de x
exp(x) exponencial de x, la function inversea es ln(x)
int(x) retorna el enetero de truncar x; int(1.2) = 1, and int(-1.2) = -1
ln(x) logaritmo en base e
log10(x) logaritmo en base 10
logit(x) logit de x, logit(x) = ln(x/(1-x))
max(x1,x2,...,xn) retorna el maximo de x1, x2, ..., xn
min(x1,x2,...,xn) retorna el minimo de x1, x2, ..., xn
mod(x,y) retorna el modulo de x respecto de y, mod(x,y) = x - y*int(x/y)
sin(x) seno de x
sqrt(x) raiz cuadrada de x
sum(x) suma acumulada de x
tan(x) tangente de x

Nota

Todas las funciones trigonométricas están en radianes.

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 19 / 33
b) El comando egen

El comando egen es una extensión del comando generate . El comando egen genera
variables en función de valores de otras variables; por ejemplo:

egen sdEdad= sd(edad) , by sexo

Genera una variable que contiene la desviación estándar de la edad en cada género.

Es importante saber que la aplicación de este comando desordena el fichero de datos.

c) Recodificación de variables

Para recodificar variables, tanto continuas como discretas, se puede utilizar el comando
recode .

recode variable (regla ) [(regla) ...] [, generate(nueva variable)]

Algunos ejemplos

recode edad 0/25 =1 25/50 = 2 50/ max = 3, gen(edad_agrupada)


recode x (1 2 3 =1) ( 4 5 6=2), gen(n_x)

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 20 / 33
Generación de retardos y diferencias

Cuando se está trabajando con series temporales es habitual tener que utilizar el
operador de retardos.
La forma de generar retardos de orden k es la siguiente:

gen temperatura_k=temperatura [_n-k]

Nota

Es indispensable que el dataset esté correctamente ordenado

y para generar diferencias de orden k:

gen dtempk=temp-temp[_n-k]

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 21 / 33
V. ESTADÍSTICOS DESCRIPTIVOS UNIVARIANTES

En general, todo análisis estadístico, por complejo que sea, empieza por un completo
análisis descriptivo. A continuación presentamos los comandos más utilizados.

1) Para crear el libro resumen de las variables está el comando codebook .

codebook lista de variables

Si omitimos la lista de variables entonces realiza un informe de todas las variables


contenidas en el dataset.

Ejemplo:
codebook salini

2) Para solicitar estadísticos de resumen como la media, varianza, …, etc., se utiliza el


comando sumaries .

Ejemplo:
sumamarize salini salario educ

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 22 / 33
3) Para construir tablas de estadísticos resumen se puede utilizar el comando tabstat .

tabstat salario salini , stat (min median mean max n cv )

En la última fila figura el coeficiente de variación.

4) Para solicitar tablas de frecuencias se utiliza el comando tabulate:

tabulate clima

También con este comando podemos solicitar tablas de doble entrada:

tabulate clima region , chi

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 23 / 33
5) Con el comando table podemos crear tablas de estadísticos resumen controlando el
contenido de cada casilla; por ejemplo, podemos calcular una tabla de doble entrada y
situar en cada celda el estadístico solicitado.

table sexo minoría , cont ( mean salario) col row format (%9.1f)

6) Para calcular el coeficiente de correlación de Pearson se utiliza el comando


correlate:

correlate espvidaf espvidaf alfabet pib_cap calorías)

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 24 / 33
Combinando los comandos y ajustando los formatos podemos crear tablas de resumen
realmente atractivas:

Ejemplo:
table region , cont (mean pib_cap sd pic_cap count pib_cap) format (%8,2f)

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 25 / 33
VI. MODELOS DE REGRESIÓN POR MÍNIMOS CUADRADOS

Introducción

A diferencia de otras aplicaciones, en Stata los modelos de regresión se ejecutan en dos


fases claramente diferenciadas:
- Estimación de los parámetros del modelo.
- Diagnosis del modelo estimado.

El comando para realizar una estimación de los parámetros de un modelo de regresión


lineal es:

regress depvar [indepvars] [if] [in] [weight] [, options]

Por ejemplo:
reg altura edad peso

Un ejemplo un poco más elaborado:


reg altura edad peso , beta noconstant

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 26 / 33
Diagnósticos sobre el modelo de regresión lineal simple

Con los parámetros del modelo estimados es habitual realizar una serie de diagnósticos
para contrastar si se cumplen determinadas hipótesis.

Contraste de homocedasticidad estat hettest

Contraste de multicolinealidad estat vif

Nota: VIF(Xk) = 1 − R 2 ( Xk , X 1... Xp)

Contraste RSET estat ovtest

Para guardar las estimaciones en predict nombre de variable


una variable

Ejemplo:

regres alfabet alfabfem espvidaf espvidam, beta


estat hettest
estat vif
predict alfabet_pronos

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 27 / 33
VII. REGRESIÓN LOGISTICA

Introducción

Las fases de un análisis de regresión logística son las siguientes:

• Estimación de los parámetros.


• Estudio de la capacidad de predicción del modelo.
• Interpretación de los parámetros.
• Generación de gráficos auxiliares.

Estimación de los parámetros


El comando para realizar una estimación de los parámetros de un modelo de regresión
logística es:

logit depvar [indepvars] [if] [in] [weight] [, options]

Por ejemplo:

logit voto genero ingresos estudios

Las opciones más importantes son:

• or: muestra los ODDS Ratio.


• noconstat: suprime la constante del modelo.

Ejemplo:

Logit voto genero ingresos estudios, or

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 28 / 33
Este comando puede ser combinado con el procedimiento stepwise para conseguir el
mejor conjunto de variables regresoras:

stepwise, pr(0.1): logit voto genero ingresos estudios

Estudio de la capacidad de predicción del modelo

Para estudiar la capacidad de predicción del modelo comparamos las estimaciones


ofrecidas por el modelo con los datos reales mediante el comando:

estat class

Así mismo podemos guardar en variables las estimaciones mediante el comando


predict para, posteriormente, realizar contrastes personalizados:

predict yhat, p Guarda en la variable yhat la probabilidad estimada


predict lfor, xb Guarda en la variable lfor el logit

Estudio de los parámetros

El comando mfx muestra las derivadas parciales evaluadas en el centro de gravedad de


la distribución o bien en puntos concretos.

mfx Muestra las derivadas parciales evaluadas en el


centro de gravedad de la distribución
mfx , at(sex=1, income=2000) Muestra las derivadas parciales calculadas en el
punto indicado

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 29 / 33
Generación de gráficos auxiliares

Las curvas de sensibilidad y especificidad nos ayudaraán a calibrar el modelo.Las


podemos calcular mediante los siguientes comandos:

lsens
Lroc
1.00 0.75
Sensitivity/Specificity
0.25 0.50
0.00

0.00 0.25 0.50 0.75 1.00


Probability cutoff

Sensitivity Specificity

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 30 / 33
VIII. LISTA DE COMANDOS

Comandos generales Gráficos

clear Eliminar el fichero de datos actual hbar Histogramas


display Mostrar valores scatter Diagramas de dispersión
cd Cambiar el directorio de trabajo
exit Salir de la aplicación
help Ayuda sobre el tema solicitado Estadísticos descriptivos
cd Cambiar de directorio de trabajo
save Guardar el actual conjunto de datos
codebook Resumen de variables
use Cargar un conjunto de datos en formato
hist Histograma
Stata
summarize Estadísticos muestrales
set Reservar una cantidad de memoria
memory concreta para el trabajo table Tablas de doble entrada
Mostrar el contenido del directorio de Tablas de 1 y 2 dimensiones con
dir tabulate
trabajo estadísticos resumen

Conjunto de datos y variables Análisis estadísticos habituales

collapse Cambiar la unidad muestral anova Análisis de varianza


encode Recodificación automática correlate Correlación
Describir las variables del conjunto de oneway Análisis de varianza
describe ranksum Test de Wilcoxon
datos
Convertir una variable cadena a tabulate crosstables (incl. tests de homogeneidad,
destring gamma, exact r*c test )
numérica
drop Eliminar variables y observaciones table Tablas de estadísticos resumen
by varlist Analizar por grupos ttest Contraste de medias
Recodificar automáticamente cadenas a
encode
números
format Definir un formato Modelos de regresión
generate Crear nueva variable
infile Leer datos en formato ASCII
clogit Regresión logística condicional
input Introducir datos por teclado
logit Regresión logística
label Añadir / cambiar etiquetas
logistic Regresión logística
list Listar casos
Poisson Regresión de Poisson
merge Combinar ficheros
predict prediction + indicator of fit
Cambiar la secuencia de variables en el
move regress Regresión lineal
actual dataset
Variable dummy:
log using Resultados a fichero
xi: comando …i . variable
log close Cerrar el fichero de resultados
order Reordenar la secuencia de variables
recode Recodificar variable
rename Renombrar variable
replace Cambiar el contenido de variable
set Ajustar parámetros opcionales
sort /gsort Ordenar el dataset

Introducción al paquete Stata 9.1 SE


por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 31 / 33
Introducción al paquete Stata 9.1 SE
por: José Manuel Rojo Abuín
Unidad de Análisis Estadístico, CCHS, CSIC 32 / 33

También podría gustarte