Analisis de Super Stata

Descargar como txt, pdf o txt
Descargar como txt, pdf o txt
Está en la página 1de 6

use https://stats.idre.ucla.edu/stat/data//stata/seminars/stata_survival/uis.

dta,
clear
gen ID = id
drop ID
stset time, failure(censor)
sts graph, na

*Por lo general, no podemos generar la funci�n de peligro, en lugar de eso,


generalmente observamos la curva de riesgo acumulativa.
variables :
El objetivo de los datos del UIS es modelar el tiempo hasta que los pacientes
inscritos en dos programas de tratamiento residencial diferentes que difieran en
duraci�n vuelvan al consumo de drogas
( treat(tratar) = 0 es el programa corto y treat(tratar) = 1 es el programa largo).
Los pacientes fueron asignados al azar a dos sitios diferentes ( site(sitio)= 0 es
sitio A y site(sitio)= 1 es sitio B). La variable age indica la edad al momento
de la inscripci�n, herco indica el uso de hero�na o coca�na en los �ltimos tres
meses ( herco = 1 indica uso de hero�na y coca�na, herco = 2 indica uso de hero�na
o coca�na y herco = 3 no indica consumo de hero�na ni coca�na) y ndrugtxIndica el
n�mero de tratamientos farmacol�gicos anteriores. El time de las variables contiene
el tiempo hasta el retorno al uso de drogas y la variable de censor indica si el
sujeto volvi� a usar drogas ( censor = 1 indica el retorno de uso de drogas y
censor = 0 de lo contrario).

observamos las 10 primeras observaciones de la base de datos


list id time censor age ndrugtx treat site herco in 1/10, nodisplay
Tenga en cuenta que el tema 5 est� censurado y no experiment� ning�n evento
mientras estaba en el estudio.
censor es bastante contraintuitiva, ya que el valor 1 indica un evento y 0 indica
la censura. Tal vez ser�a m�s apropiado llamar a esta variable "evento".

Para las variables categ�ricas, utilizaremos la prueba de igualdad de registros en


el rango, que es una prueba no param�trica. Para las variables continuas usaremos
una regresi�n de riesgo proporcional de Cox univariada que es un modelo
semiparam�trico
Consideraremos incluir el predictor si la prueba tiene un valor de p de 0,2 - 0,25
o menos.

sts test treat, logrank


sts graph, by(treat)

el p value es 0.00091 por lo que incuimos en el modelo , la variable treat

La prueba de log-rank de igualdad en los estratos para el sitio del predictor tiene
un valor de p de 0.1240, por lo que el sitio se incluir� como un candidato
potencial para el modelo final porque este valor de p es a�n menor que nuestro
valor de corte de 0.2. Del gr�fico podemos ver que las curvas de supervivencia no
son tan paralelas y que hay dos per�odos ([0, 100] y [200, 300]) donde las curvas
est�n muy juntas. Esto explicar�a el valor p bastante alto de la prueba de log-
rank.
sts test site, logrank
sts graph, by(site)
Esta falta de paralelismo podr�a plantear un problema cuando incluimos este
predictor en el modelo de riesgo proporcional de Cox, ya que uno de los supuestos
es la proporcionalidad de los predictores.

sts test herco


sts graph, by(herco) noborder

utilizamos el modelo cox para variables continuas ,Especificamos la opci�n nohr


para indicar que no queremos ver la relaci�n de riesgo sino que queremos ver los
coeficientes.

para ndrugtx:

stcox ndrugtx, nohr

para age:

stcox age, nohr

El predictor categ�rico herco tiene tres niveles y, por lo tanto, incluiremos este
predictor utilizando una variable ficticia con el grupo herco = 1 como grupo de
referencia. Podemos crear estas variables ficticias sobre la marcha utilizando el
comando xi con stcox.

stcox age ndrugtx i.treat i.site i.herco, nohr

vemos que la variable herco no es significativo (p-value > 0.05)

test 2.herco 3.herco 4.herco

el sitio del predictor tampoco es significativo, pero de investigaciones anteriores


sabemos que esta es una variable muy importante que se debe tener en el modelo
final y, por lo tanto, no eliminaremos el sitio del modelo.

entonces el modleo quedaria :

stcox age ndrugtx i.treat i.site, nohr

iteraciones:

stcox age ndrugtx i.treat i.site c.age # c.ndrug, nohr


cada variable#cada variable

solo se incluye las iteraciones significativas


podemos comparar el modelo con la interacci�n con el modelo sin la interacci�n
utilizando el comando lrtest ya que los modelos est�n anidados. El informe
significativo indica que rechazamos la hip�tesis nula de que los dos modelos se
ajustan a los datos por igual y concluimos que el modelo m�s grande con la
interacci�n se ajusta mejor a los datos que el modelo m�s peque�o que no incluy� la
interacci�n.

stcox age ndrugtx i.treat i.site c.age#i.site, nohr

estimates store m1

stcox age ndrugtx i.treat i.site, nohr

lrtest . m1

modelo final:
stcox age ndrugtx i.treat i.site c.age#i.site

si 100%-ratio(en porcentaje)= positivo ---> efecto negativo (disminuye)


negativo ---> efecto negativo (aumenta)

Todos estos resultados se basan en la salida utilizando relaciones de riesgo.

para discutir las variables que est�n involucradas en un t�rmino de interacci�n,


como la edad y el sitio en nuestro modelo, necesitamos usar los coeficientes sin
procesar y aqu� se enumeran a continuaci�n solo por conveniencia.

stcox, nohr

Al comparar 2 sujetos dentro del sitio A ( sitio = 0), un aumento en la edad de 5


a�os, mientras que todas las dem�s variables se mantienen constantes, produce una
proporci�n de riesgo igual a exp (-0.03369 * 5) = .84497351. Por lo tanto, la tasa
de reca�da se reduce en (100% - 84.5%) = 15.5% con un aumento de 5 a�os de edad .
Al comparar 2 sujetos dentro del sitio B, un aumento en la edad de 5 a�os mientras
se mantienen constantes todas las dem�s variables, produce una relaci�n de riesgo
igual a exp (-0.03369 * 5 + 0.03377 * 5) = 1.0004. Por lo tanto, la tasa de reca�da
se mantiene bastante plana para los sujetos en el sitio B desde 1.0004 si est� tan
cerca de 1.

Asunci�n de proporcionalidad

stcox age ndrugtx i.treat i.site c.age#i.site, nohr tvc(age ndrugtx treat site)
texp(ln(_t))

uno de los supuestos principales del modelo de riesgo proporcional de Cox es la


proporcionalidad. Existen varios m�todos para verificar que un modelo satisface el
supuesto de proporcionalidad. Verificaremos la proporcionalidad incluyendo
covariables dependientes del tiempo en el modelo usando las opciones tvc y texp en
el comando stcox . Las covariables dependientes del tiempo son interacciones de los
predictores y el tiempo. En este an�lisis, elegimos utilizar las interacciones con
log ( tiempo ) porque esta es la funci�n m�s com�n del tiempo usado en covariables
dependientes del tiempo pero cualquier funci�n del tiempopuede ser usado. Si una
covariable dependiente del tiempo es significativa, esto indica una violaci�n del
supuesto de proporcionalidad para ese predictor espec�fico.

La conclusi�n es que todas las variables dependientes del tiempo no son


significativas, ya sea de manera colectiva o individual, lo que apoya el supuesto
de riesgo proporcional.

Otro m�todo para probar el supuesto de proporcionalidad es mediante el uso de los


residuos de Schoenfeld y Schoenfeld escalados, que primero deben guardarse mediante
el comando stcox . En el comando stphtest probamos la proporcionalidad del modelo
como un todo y al usar la opci�n de detalle obtenemos una prueba de
proporcionalidad para cada predictor. Mediante el uso de la opci�n de gr�fico
tambi�n podemos obtener un gr�fico de la suposici�n de Schoenfeld escalada. Si las
pruebas en la tabla no son significativas (valores de p sobre 0.05), no podemos
rechazar la proporcionalidad y asumimos que no tenemos una violaci�n del supuesto
proporcional. Una l�nea horizontal en los gr�ficos es una indicaci�n m�s de que no
hay violaci�n del supuesto de proporcionalidad. El stphplot el comando usa log-log
parcelas para probar la proporcionalidad y si las l�neas en estas parcelas son
paralelas, tenemos otra indicaci�n de que los predictores no violan el supuesto de
proporcionalidad.

El tratamiento del predictor podr�a justificar un examen m�s detenido ya que tiene
una prueba significativa y la curva en el gr�fico no es completamente horizontal.
La gr�fica del comando stphplot no tiene curvas completamente paralelas. Sin
embargo, elegimos dejar el tratamiento en el modelo sin alterar en base a
investigaciones anteriores.

Si uno de los predictores no fuera proporcional, hay varias soluciones a


considerar. Una soluci�n es incluir la variable dependiente del tiempo para los
predictores no proporcionales. Otra soluci�n es estratificar en el predictor no
proporcional. El siguiente es un ejemplo de estratificaci�n en el tratamiento de
predictor . Tenga en cuenta que el tratamiento ya no se incluye en la declaraci�n
del modelo , sino que se especifica en la declaraci�n de estratos .

stcox age ndrugtx site c.age#i.site, nohr strata(treat)

Graficando funciones de supervivencia

n el siguiente ejemplo, queremos graficar la funci�n de supervivencia para un


sujeto que tiene 30 a�os ( edad = 30), ha recibido 5 tratamientos farmacol�gicos
anteriores ( ndrugtx = 5) y actualmente recibe el tratamiento prolongado ( tratar =
1) en sitio A ( sitio = 0 y agesite = 30 * 0 = 0). Primero generamos la funci�n de
supervivencia de l�nea de base para el patr�n de covariable donde todos los
predictores se establecen en cero. Luego elevamos la funci�n de supervivencia de
l�nea base a la combinaci�n exponencial a lineal de los coeficientes y los valores
de las covariables en el patr�n de inter�s de las covariables. Por lo tanto, en
este caso particular, la combinaci�n lineal ser�a: -0.0336943 * 30 + 0.0364537 * 5
- 0.2674113 * 1 - 1.245928 * 0 - .0337728 * 0.

uyilizamos el comando , el cual nos dice el modelo final:

stcox, nohr

stcox age ndrugtx treat site c.age#i.site, nohr basesurv(surv0)


generate surv1 = surv0^exp( (-0.0336943*30+0.0364537*5 - 0.2674113))
line surv1 _t, sort ylab(0 .1 to 1) xlab(0 200 to 1200)

Mirar la funci�n de supervivencia para un patr�n de covariable a veces no es


suficiente. A menudo es muy �til tener una gr�fica donde podamos comparar las
funciones de supervivencia de diferentes grupos. En el siguiente ejemplo, generamos
un gr�fico con las funciones de supervivencia para los dos grupos de tratamiento
donde todos los sujetos tienen 30 a�os ( edad = 30), han recibido 5 tratamientos
farmacol�gicos anteriores ( ndrugtx = 5) y actualmente se est�n tratando en el
sitio A ( sitio = 0 y agesite = 30 * 0 = 0). Por lo tanto, los dos patrones de
covariables difieren solo en sus valores para el tratamiento .

generate surv2 = surv0^exp( (-0.0336943*30+0.0364537*5))


label variable surv1 "long treatment"
label variable surv2 "short treatment"
line surv1 surv2 _t, sort ylab(0 .1 to 1) xlab(0 200 to 1200)
drop surv0-surv2

Bondad de ajuste del modelo final


Podemos evaluar el ajuste del modelo utilizando los residuos de Cox-Snell. Si el
modelo se ajusta bien a los datos, entonces la verdadera funci�n de riesgo
acumulativo condicional en el vector covariable tiene una distribuci�n exponencial
con una tasa de riesgo de uno. Esto se traduce en ajustar el modelo utilizando el
comando stcox y especificando la opci�n mgale que generar� los residuos de
martingala. Luego usamos el comando de predicci�n con la opci�n csnell para generar
los residuales de Cox-Snell para el modelo. Reiniciamos los datos usando el comando
stset que especifica la variable cs , la variable que contiene los residuos de Cox-
Snell, como la variable de tiempo. Luego utilizamos los pts generados. comando para
crear la funci�n de riesgo acumulativo Nelson-Aalen. Finalmente, graficamos la
funci�n de riesgo acumulativo de Nelson-Aalen y la variable cs para que podamos
comparar la funci�n de riesgo con la l�nea diagonal. Si la funci�n de peligro sigue
la l�nea de 45 grados, entonces sabemos que tiene aproximadamente una distribuci�n
exponencial con una tasa de riesgo de uno y que el modelo se ajusta bien a los
datos.
quietly stcox age ndrugtx treat site c.age#i.site, nohr mgale(mg)
predict cs, csnell

stset cs, failure(censor)


sts generate H = na
line H cs cs, sort xlab(0 1 to 4) ylab(0 1 to 4)
drop mg

También podría gustarte