0% encontró este documento útil (0 votos)
89 vistas5 páginas

Programa MachineLearning 1

Este documento presenta el syllabus de la asignatura "Machine Learning I" que forma parte del programa de Magíster en Data Science. La asignatura introduce conceptos básicos de aprendizaje automático y presenta algoritmos de aprendizaje supervisado como regresión lineal múltiple, regresión logística y regresión de Cox, explicando su aplicación en Python. La asignatura se evaluará a través de talleres, tareas y exámenes teóricos.

Cargado por

Vero
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
89 vistas5 páginas

Programa MachineLearning 1

Este documento presenta el syllabus de la asignatura "Machine Learning I" que forma parte del programa de Magíster en Data Science. La asignatura introduce conceptos básicos de aprendizaje automático y presenta algoritmos de aprendizaje supervisado como regresión lineal múltiple, regresión logística y regresión de Cox, explicando su aplicación en Python. La asignatura se evaluará a través de talleres, tareas y exámenes teóricos.

Cargado por

Vero
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 5

SYLLABUS ACADEMICO

MAGISTER EN DATA SCIENCE

ASIGNATURA : Machine Learning I


NOMBRE PROFESOR : Javiera Figols
EMAIL : [email protected]

1. INTRODUCCIÓN

El machine learning o aprendizaje automático es un conjunto de algoritmos que se entrena


en un conjunto de datos para hacer predicciones o tomar acciones para optimizar algunos
sistemas. Por ejemplo, los algoritmos de clasificación supervisados se utilizan para
clasificar a los posibles clientes en prospectos buenos o malos, para fines de préstamo, con
base en datos históricos. Las técnicas del machine learning, junto a reglas de negocio se
pueden utilizar para reducir el riesgo y calificar objetivamente la calidad de un cliente.

Este curso presentará algoritmos de aprendizaje supervisados con foco en modelos


interpretables de ‘caja-blanca’, tales como: modelos de regresión lineal múltiple, modelos
de regresión logística, métodos de regularización y modelos de regresión de Cox. Se
explica cómo validar modelos supervisados de machine learning para evitar sobreajustes,
así como evaluar su performance mediante métricas de calidad predictiva. Para cada uno
de los temas revisados se muestran ejemplos de cómo usar los algoritmos en el lenguaje
de programación Python.

2. OBJETIVOS DE LA ASIGNATURA

Objetivos General:

Presentar las herramientas y desarrollos fundamentales en el aprendizaje automático


haciendo hincapié en las bases y fundamentos estadísticos de estas técnicas para su uso
en problemas de diversa índole. La orientación del curso es eminentemente práctica
haciendo uso del lenguaje de programación Python, enfocado a casos prácticos y
aplicaciones de las técnicas revisadas.

Objetivos Específicos:

1. Conocer diferentes técnicas de aprendizaje supervisado y su uso dependiendo del


dominio de aplicación
2. Aplicar las diferentes técnicas de aprendizaje supervisado usando datos reales
3. Evaluar la calidad predictiva de los modelos supervisados usando datos reales
4. Utilizar el lenguaje de programación Python con las diversas técnicas de aprendizaje
supervisado usando datos reales.

3. METODOLOGIA

La metodología de enseñanza es teórica-práctica con entendimiento académico de las teorías


y conceptos relacionados con la materia. Se profundizará en casos reales.

4. EVALUACION

El curso se evaluará por la realización de tres actividades:

1) Taller final (40%)


2) Tareas prácticas (40%).
3) Tests teóricos (20%).

La nota mínima de aprobación del curso tiene dos requisitos:


• Nota mínima del taller final: 4,0 (cuatro y cero décimas)
• Nota mínima aprobación de curso: 4,0 (cuatro y cero décimas).

El no cumplimiento de ambos requisitos conduce a reprobar la asignatura.

5. BIBLIOGRAFIA

o Hastie, T., Tibshirani, R. and Friedman, J. (2009). The Elements of Statistical


Learning. Second Edition. Springer Series in Statistics. New York: Springer.
Disponible en: https://hastie.su.domains/Papers/ESLII.pdf
o Kuhn, M. and Johnson, K. (2013). Applied Predictive Modeling. Springer.
http://appliedpredictivemodeling.com
o Müller, A. C. and Guido, S. (2017). Introduction to Machine Learning with Python: A
Guide for Data Scientists. O´Reilly.
o Murphy, K. P. (2012). Machine Learning: A Probabilistic Perspective. The MIT Press.
o Murphy, K. P. (2022). Probabilistic Machine Learning: An Introduction. The MIT
Press.
o Theobald, O. (2021). Machine Learning for Absolute Beginners. Third Edition.
Independently Published.
o Wang, P., Li, Y., and Reddy, C. K. (2018). Machine Learning for Survival Analysis:
A Survey. ACM Comput. Surv. 1, 1, Article 1.
Disponible en: https://arxiv.org/pdf/1708.04649.pdf

Lecturas Complementarias

o Davenport, T.H., Harris, J.G., and Morison, R. (2010). Analytics at Work: Smarter
Decisions, Better Results. Harvard Business School Press.
o Artículo de G. W. Loveman – “Diamonds in the Data Mine”. Harvard Business
Review. https://hbr.org/2003/05/diamonds-in-the-data-mine
o Artículo de A. Gallo – “A Refresher on Statistical Significance”. HarvardBusiness
Review. https://hbr.org/2016/02/a-refresher-on-statisticalsignificance
o Artículo de T. H. Davenport. “Competing on Analytics”. Harvard Business Review.
o Artículo de S. LaValle et al. “Analytics: The New Path to Value”. MIT Sloan
Management Review.

6. CURRICULUM RESUMIDO DEL PROFESOR

Javiera Figols es Ingeniera Civil Matemática y Magister en Matemáticas Aplicadas de la


Universidad de Chile. Cuenta con experiencia en programación, optimización, pricing y data
science, desempeñandose en empresas como Dafiti, Banco Estado y Mercado Libre.
Además tiene experiencia docente en cursos de programas de educación ejecutiva de la
Facultad de Ingeniería y Ciencias de la Universidad Adolfo Ibáñez.

7. PROGRAMA

Unidad 1: Introducción al Machine Learning

o Introducción
o Descripción general del aprendizaje automático
o Tabla de datos y sus características
o Proceso de Machine Learning

Objetivos de la Unidad:

1. Introducir al estudiante al aprendizaje automático


2. Describir los tipos de aprendizaje automático.
3. Identificar instancia, atributos y variable target de una tabla de datos
4. Conocer el proceso de machine learning

Unidad 2: Aprendizaje Supervisado: Modelo de regresión lineal múltiple

o Introducción. Formulación del modelo


o Métodos de Estimación: MCO, Gradiente Descendente, Máxima verosimilitud
o Uso de atributos categóricos. Interpretaciones
o Medidas de bondad de ajuste
o Identificación de atributos estadísticamente significativos
o Multicolinealidad. Técnicas de selección de atributos
o Métricas de calidad predictiva
o Aplicaciones con Python

Objetivos de la Unidad:

1. Conocer la importancia del modelo de regresión lineal múltiple


2. Formular y estimar un modelo de regresión lineal múltiple. Medidas de
dependencia.
3. Incorporar información cualitativa en el modelo de regresión lineal múltiple
4. Interpretar los pesos de los atributos
5. Calcular medidas de bondad de ajuste
6. Contrastar hipótesis para identificar atributos significativos
7. Identificar problemas de multicolinealidad
8. Seleccionar atributos
9. Calcular métricas de calidad predictiva
10. Aplicar Python para entrenar modelos de regresión lineal múltiple

Unidad 3: Aprendizaje Supervisado: Regresión logística

o Formulación de un modelo de regresión logística. Medidas de dependencia.


Estimación. Interpretaciones
o Técnicas de selección de variables
o WOE y Valor de la Información
o Matriz de confusión y Métricas
o Curva ROC, AUC, K-S, Gini, Briers
o Gain y Lift chart
o Caso desiquilibrio de clases. Soluciones
o Aplicaciones con Python

Objetivos de la Unidad:

1. Formular un modelo de regresión logística y conocer métodos de estimación


2. Interpretar los pesos de los atributos de la regresión logística
3. Crear variables usando WOE y Valor de la información
4. Conocer métricas de calidad predictiva para la clasificación binaria
5. Aplicar las métricas en casos prácticos
6. Construir e interpretar la curva de ganancia y lift chart
7. Conocer la problemática del desiquilibrio de clases y sus soluciones

Unidad 4: Métodos de Regularización

o Introducción
o Trade-off sesgo-varianza
o Métodos de regularización en regresión lineal múltiple y regresión logística: Ridge,
Lasso y Elastic Net
o ¿Cómo elegimos el parámetro que regula la importancia de cada penalización?
o Aplicaciones con Python

Objetivos de la Unidad:

1. Conocer y comprender métodos de regularización en modelos de regresión y


clasificación
2. Entrenar modelos de regresión y clasificación con técnicas de regularización para
producir modelos más simples que generalizan mejor
3. Aplicar el lenguaje de programación Python para entrenar modelos de regresión y
clasificación con regularización usando datos reales
Unidad 5: Aprendizaje Supervisado: Modelo de regresión de Cox

o Introducción a los datos censurados


o Función de supervivencia. Función de riesgo
o Estimador de Kaplan-Meier
o Formulación de un modelo de regresión de Cox. Estimación. Interpretaciones
o Técnicas de selección de variables
o Métricas
o Aplicaciones con Python

Objetivos de la Unidad:

1. Conocer y comprender sobre cómo se generan datos censurados


2. Estimar la función de supervivencia mediante el método de Kaplan-Meier
3. Formular un modelo de regresión de Cox y comprender sus usos
4. Entrenar modelos de regresión de Cox
5. Conocer y utilizar técnicas de selección de variables
6. Aplicar el lenguaje de programación Python para entrenar modelos de regresión de
Cox usando datos reales

También podría gustarte