TF MHI2sem2-2021
TF MHI2sem2-2021
TF MHI2sem2-2021
Instrucciones
La fecha de entrega es el lunes 24 de enero de 2022 a las 23:59 (atrasos serán penal-
izados). Enviar todos los archivos en un solo correo a [email protected] y
[email protected]. Pueden trabajar en grupos de máximo 4 integrantes.
□ Formato de Entrega
• Archivo word con todas las respuestas y análisis.
• Archivo R con el respaldo de los códigos que dan origen a las respuestas. No
redactar respuestas en el archivo R pero sı́ usar comentarios para identificar los
códigos por sub-pregunta.
□ Ponderación
• Claridad de los códigos y estructura: 5%.
• Desarrollo de las soluciones 95%.
□ Puntajes y Evaluación
• Notas por Claridad de los códigos y estructura (CCE) y Desarrollo de
las soluciones (DS) se evalúan de 1,0 a 7,0.
• Nota Final = Nota CCE · 0,05 + Nota DS · 0,95.
1
(1) [60 pts] Con el código de R adjunto SimConsistenciaPH (visto en clases) se pueden
simular datos de duración cuando el modelo subyacente es un proportional hazard
model (Cox, 1972) con dos variables explicativas (una binaria y otra continua). En
el código se proponen tres funciones para modelar la función de sobrevivencia base
(Weibull, Mixtura de distribuciones Weibull y Log-Logistica).
(a) Haga una extension del código adjunto agregando una función de sobrevivencia
base log-normal y evalué el desempeño de los estimadores del modelo de Cox
(Proportional hazard) para un tamaño de muestra de 500, 1000, 2000, 5000 y
10000 observaciones. Explique sus resultados
(b) Repita lo hecho en a) pero usando como función de sobrevicebcia base la dis-
tribución gama generalizada. Explique sus resultados.
(2) [40 pts] Simule datos de duración (use el archivo adjunto SimWeibull-Data ) y
estudie el comportamiento de los estimadores de máxima verosimilitud suponiendo
que la distribución de la población es:
(a) Log-normal
(b) Log-logı́stica
(c) Gamma Generalizada (en la pagina 8 del archivo adjunto DurationDist se en-
cuentra la expresión para esta distribución)
(3) [40 pts] En este ejercicio suponga que la variable aleatoria T sigue una distribución
Gamma generalizada (pagina 8 en DurationDist).