Data Science Con Python - Plan de Estudio
Data Science Con Python - Plan de Estudio
Plan de estudio
Audiencia:
Aquellos que busquen especializarse en técnicas de programación avanzadas
en Python, con miras a proyectarse a la posición de Científicos de Datos (Data
Scientists).
Requisitos:
Poseer conocimientos generales de matemáticas y básicos de estadística y de
álgebra lineal.
Tener experiencia en desarrollo con lenguajes de uso actual, con paradigmas
estructurados y de orientación a objetos.
Conocer la programación básica en Python.
Egresados o estudiantes avanzados de carreras afines a la programación.
Modelo pedagógico:
Virtual:
Teoría asincrónica y sincrónica
Práctica basada en casos reales, con consulta sincrónica
Cada clase finaliza con una tarea de desarrollo relevante.
Materiales didácticos:
Uso de Github para la publicación del código fuente en Python, listo
para descargar y utilizar en cada proyecto.
Duración total:
36 hs reloj (12 clases semanales de 3 hs cada una)
Certificación:
80 % de asistencia obligatoria a las clases sincrónicas
100 % de aprobación de evaluaciones y trabajos prácticos
Requerimientos de infraestructura:
Cuentas en GitHub/GitLab (para repositorios de código), AWS para
procesamiento en Machine Learning (AWS Setup Functions, AWS Data
Science for Python, y/o AWS SageMaker).
Almacenamiento para descargas de software común (Júpiter / Jupiter Labs;
Cuentas en herramientas complementarias/suplementarias (Anaconda o
similares).
Objetivos:
Obtener un acercamiento al campo de la ciencia de datos, revisando las
funciones y características avanzadas de Python usadas por los científicos de
datos.
Representar visualmente la información procesada, realizando informes y
gráficos claros para la toma de decisiones, con perspectiva de diseño en
Python.
Dominar métodos avanzados de Machine Learning, utilizando las
herramientas de Python.
Contenidos generales:
Introducción.
Conceptos básicos del entorno de programación de Python
Técnicas fundamentales de programación de Python: lambdas, lectura y
manipulación de archivos CSV, biblioteca Numpy
Técnicas de manipulación y limpieza de datos utilizando la popular biblioteca
de ciencia de datos de Python (PANDAS)
Abstracción de Series y Dataframes como las estructuras de datos centrales
para el análisis de datos. Funciones como group by, merge y tablas dinámicas.
Clase 11 | Evaluación
Evaluación y selección de modelos; Matrices de confusión y métricas de evaluación básicas; Funciones de
decisión del clasificador; Curvas de recuperación de precisión y ROC; Evaluación de varias clases; Evaluación de
regresión; Selección de modelo: optimización de clasificadores para diferentes métricas de evaluación.