Presentacion
Presentacion
Presentacion
UNIDAD 1
MÓDULO 1
Presentación del
programa
www.digitalhouse.com
OBJETIVOS DE LA CLASE
www.digitalhouse.com 2
¿QUÉ ES DATA SCIENCE?
www.digitalhouse.com
¿QUÉ ES DATA SCIENCE?
www.digitalhouse.com 4
¿QUÉ ES DATA SCIENCE?
www.digitalhouse.com 5
¿QUÉ ES DATA SCIENCE?
www.digitalhouse.com 6
ROLES EN UN EQUIPO DE DATA SCIENCE
www.digitalhouse.com 7
WORKFLOW DE DATA SCIENCE
www.digitalhouse.com
WORKFLOW DE DATA SCIENCE
www.digitalhouse.com 10
WORKFLOW DE DATA SCIENCE
IDENTIFICAR EL PROBLEMA
R ● Identificar los objetivos del producto/negocio/problema.
A
IC ● Identificar y generar hipótesis sobre metas y criterios para el
T IF
EN éxito del análisis.
ID ● Generar un set de preguntas para identificar el dataset
“correcto”.
www.digitalhouse.com 11
WORKFLOW DE DATA SCIENCE
ESTIMAR UN MODELO
● Seleccionar un modelo apropiado (forma funcional,
estimación, etc.)
M AR ● Estimar el modelo
TI
ES ● Evaluar y refinar el modelo
www.digitalhouse.com 12
WORKFLOW DE DATA SCIENCE
www.digitalhouse.com 13
FILOSOFÍA DEL PROGRAMA
LINEAMIENTOS DE LA CLASE
www.digitalhouse.com
¿Cómo aprendemos? Nuestro pilares
2. Aprender a pensar
3. Aprender haciendo
4. Aprender a aprender
www.digitalhouse.com 15
FILOSOFIA
www.digitalhouse.com 16
FILOSOFIA
www.digitalhouse.com 17
Lineamientos de la Clase
1) Se expone lo que 1) Se
se debe saber presenta el
problema
(diseñado o
seleccionado)
2) Se incorpora la 4) Se resuelve 2) Se
información el problema o identifican las
se identifican necesidades
problemas de
nuevos aprendizaje
3) Se presenta un 3) Se
problema para incorpora la
evaluar lo aprendido nueva
información
www.digitalhouse.com 18
MÓDULOS
www.digitalhouse.com
OBJETIVOS DEL CURSO
— Los módulos del curso están organizados de manera tal que los asistentes sean
capaces de
www.digitalhouse.com 20
PROGRAMA - MÓDULOS
Intro a ML:
Regresión Lineal,
Regularización, 03 PROYECTO
INTEGRADOR 07
Validación de
Modelos , Web
Scraping, Pickle y
Flask
Problemas de
Clasificación,
04
GridSearch,
series de tiempo
y text mining
www.digitalhouse.com 21
PROGRAMA - MÓDULOS
Fundamentos:
POO, Numpy,
Pandas,
01
estadística
www.digitalhouse.com 22
PROGRAMA - MÓDULOS
EDA, Limpieza de
datos, Inferencia
Estadística, PCA
02
www.digitalhouse.com 23
PROGRAMA - MÓDULOS
www.digitalhouse.com 24
PROGRAMA - MÓDULOS
Problemas de
Clasificación,
GridSearch, 04
series de tiempo
y text mining
www.digitalhouse.com 25
PROGRAMA - MÓDULOS
www.digitalhouse.com 26
PROGRAMA - MÓDULOS
Árboles y
Métodos de
Ensamble
06
Proyecto Integrador
● Intro a CARTS Informe de avance:
● Árboles de Decisión y Bagging ● Análisis Exploratorio
● Random Forests y Boosting ● Primeros intentos con el/los
algoritmo(s) seleccionado(s)
● XGBoost
● Resultados preliminares
● Evaluación de Modelos y Feature
Importance
www.digitalhouse.com 27
PROGRAMA - MÓDULOS
www.digitalhouse.com
Desafíos y Proyecto Integrador
PROYECTO
INTEGRADOR
www.digitalhouse.com 30
Galería de Proyectos Integradores del Programa
www.digitalhouse.com 31
Galería de Proyectos Integradores del Programa
www.digitalhouse.com 32
Galería de Proyectos Integradores del Programa
Juan ARANGUREN
Jose Luis FINOCCHIARO
www.digitalhouse.com 33
Galería de Proyectos Integradores del Programa
www.digitalhouse.com 34
Conociendo a los
participantes del
programa
usando Data Science
(40 minutos)
www.digitalhouse.com
Te proponemos
● Que cada grupo defina una pregunta sobre algún aspecto que le interese
conocer acerca de los compañeros (motivación, formación, etc.)
www.digitalhouse.com
La idea es que...
● Cada grupo defina los siguientes roles:
○ 1 Project Manager (PM) - Data Business Person: responsable del
cumplimiento de los tiempos, de facilitar la comunicación y hacer
seguimiento del flujo de trabajo.
○ 1 a 3 Researchers: encargados de adecuar la pregunta a los datos
disponibles y de resumir la información para obtener la respuesta.
Arman visualizaciones lo más claras y sintéticas posibles de la
pregunta en cuestión.
○ 1 a 2 Comunicadores-Creativos: encargados de resumir y presentar
los hallazgos y conclusiones a los participantes.
www.digitalhouse.com
Por Ejemplo
● ¿Cuál es el perfil educativo del curso de Data Science-2017?
○ Primario incompleto
○ Primario completo
○ Secundario incompleto
○ Secundario completo
○ Universitario/Terciario incompleto
○ Universitario/Terciario completo
○ Posgrado o superior
○ Sin Estudios
www.digitalhouse.com
Cronograma
www.digitalhouse.com
Al final del curso, ustedes serán capaces de:
www.digitalhouse.com
Al final del curso, ustedes serán capaces de:
www.digitalhouse.com