Data-Science Digital House
Data-Science Digital House
D I G I T A L H O U S E . C O M por el Ministerio de
Educación del Gobierno
de la Ciudad de Buenos
DATA
SCIENCE
PROGRAMA DE ESTUDIO
D A T A S C I E N C E
I NF O SOBR E E L
P R O GR AMA
A Q U I E N E S TÁ D IRIGID O
El curso está orientado a estudiantes y profesionales de diversas disciplinas que deseen
aprender ciencia de datos para sumar nuevas habilidades, crear nuevos proyectos y mejorar
su comunicación con los Ingenieros de Big Data o
Especialistas en Machine Learning.
RE Q U IS ITO S
Conocimientos previos en razonamiento lógico formal. Conocimientos de estadística y progra-
mación ayudan (no son excluyentes). Nivel de lecto-comprensión de inglés medio. Aprobación
de la evaluación online y la entrevista de admisión.
E S P E C I A L I S TA S C A R GA H O R ARIA
+10 196 hs
digitalhouse.com
E TAPAS
D EL P R OGR AMA
AN TE S C HALLE NG E
Se pone a prueba lo aprendido.
E NT REVISTA
Se conoce al alumno y
PR EWO R K se verifica su nivel.
Contenidos
para hacer MACH IN E LEARN IN G
una Aprendizaje supervisado y no supervisado.
nivelación. Selección y Validación de Modelos.
DUR ANTE Ingeniería de Features.
VISUALIZACIÓN DE DATOS
Visualización para el análisis exploratorio.
ETL Visualización interactiva y web para la comuni-
Extracción de datos de distintas fuentes. cación de resultados.
SQL y Bases de Datos Relacionales.
Limpieza, imputación y preprocesamiento de
datasets.
Preparación y representación de los datos para
el modelado.
D E S PU É S
T EC N OLOGÍAS
Python COMUNIDAD
Scipy Contacto con la
Numpy comunidad y
Pandas actualización continua.
Scikit-Learn
Matplotlib
Seaborn FORMACIÓN
Plotly Jr Data Scientist.
Bokeh
PostgreSQL
P ORTFOLIO
JSON
Trabajo real con modelos
Scrapy
analíticos y visualización de
Beautyful Soup
datos.
JOB FAIR
Acceso a entrevistas laborales.
Coacheo personalizado para
mejorar tu perfil laboral, y encuen-
tros con empresas de primer nivel.
digitalhouse.com
PROGRAMA
DE ESTUDIO
D A T A S C I E N C E
P R O G R A M A D E E S T U D I O
digitalhouse.com
P R O G R A M A D E E S T U D I O
DATA
S C IE NCE
El curso está estructurado en base al ciclo de vida completo de los datos, desde su
recolección y preparación, hasta su análisis y visualización efectiva.
Vas a aprender las habilidades y conocimientos fundamentales para
desempeñarte en tu primer trabajo como analista de datos. Y vas a descubrir los posi-
bles caminos para continuar tu aprendizaje en aquellos temas de especialización que
más te interesan
01
Módulo 1
Fund a m e ntos : N u m py, D o ck e r, G i t,
Pa nd a s, Pro b a b i l i d a d
digitalhouse.com
P R O G R A M A D E E S T U D I O
* Repaso de Probabilidad.
Módulo 2
E x p l orator y D ata An a l ys i s (E DA), S ci P y,
G e oPa nd a s, Vi sua l i z a ci ó n , PC A, T- SN E, SQ L
* Geopandas para representar datos con geo referenciados.
* SQL y Bases de Datos: Introducirse a diferentes tipos de bases de datos, revisar expresiones
SQL y realizar prácticas obteniendo datos de una base remota.
P R O G R A M A D E E S T U D I O
02
Módulo 3
I ntrod ucc i ón a M a ch i n e Le a r n i n g y Sk l e a r n .
A P I s. We b S cra p p i n g, Fl a s k
* Machine Learning: Introducción a conceptos nodales: sesgo, varianza, overfitting, underfitting.
Identificación de diferentes tipos de algoritmos de Machine Learning (supervisados y no super-
visados). Formas de estimación del error de generalización (train-test split. cross-validation).
digitalhouse.com
Presentación general de las técnicas más utilizadas.
* Web Scraping: Nociones de HTML (tags, árboles). Uso de librerías urllib2 y BeatifulSoup para
scrapear sitios web.Introducción a selenium.
Módulo 4
Clasifi c a c i ón. G r i d S e a rch y Pi p e l i n e s. Tex t M i n i n g.
S e r i e s d e Ti e m p o
* Introducción a los Problemas de Clasificación: Problema de los K-Nearest
Neighbours.
* Algoritmos usados para problemas de clasificación: Regresión Logística. Naïve Bayes, Support
Vector Machines. Evaluación de algoritmos de clasificación: métricas de error, Accuracy, limita-
ciones de accuracy. Precision, recall, F1-Score, Curva ROC, Area Under the Curve (AUC).
digitalhouse.com
P R O G R A M A D E E S T U D I O
* Feature Selection: Motivación de Feature Selection. Filter Methods, Wrapper Methods, Embedding
Methods.
* Embeddings
* Topic modelling
* Sentiment analysis.
* Series de Tiempo: preprocesado de series. Enfoque clásico (tendencia, ciclo y residuo). Estaciona-
riedad. Modelos básicos: media constante, tendencia determinística, media móvil, suavizamiento
exponencial simple. Modelos AR, MA, ARMA, ARIMA y ARIMAX.
03
Módulo 5
Tóp i cos e n M a ch i n e Le a r n i n g
* Clustering: Algoritmo K-Means, clustering jerárquico, métricas para evaluación de algoritmos
de clustering.DBSCAN.
* Sistemas de recomendación.
* Feature Hashing
digitalhouse.com
P R O G R A M A D E E S T U D I O
Módulo 6
Ár b ol e s y E n s a m bl e Le a r n i n g
* Árboles de Decisión: Construcción de árboles a través del algoritmo CART. Evitando
el overfitting y underfitting en Árboles.
Módulo 7
Proye c to fi n a l
* Trabajo Integrador: Deberán entregar un notebook iPython con código,
visualizaciones y notas técnicas para los colegas del curso. A su vez, deberán realizar una exposición
de las conclusiones, con terminología no técnica, para una audiencia no experta.
digitalhouse.com
P R OCE SO D E
AD M ISIÓN
PAGO DE MATRÍCULA
Para completar la solicitud de inscripción.
MATERIAL DE NIVELACIÓN
Material online.
DESAFÍO ONLINE
Con ejercicios de evaluación.
digitalhouse.com
QU IÉ NE S
S OM OS
Digital House es una organización educativa que transforma la vida de las personas,
desarrollando competencias digitales para que generen impacto en la sociedad. Con
este objetivo ofrece capacitaciones bajo una metodología innovadora basada en la
práctica.
CO NTACTO
0810 220 3444
[email protected]
digitalhouse.com
DOND E
E STAM OS
SEDE BELGRANO
Av. Monroe 860, CABA
[email protected]
SEDE CENTRO
Lima 1111, CABA
[email protected]
SEDE CÓRDOBA
Av. Jose Baigorrí 653
[email protected]
SEDE LA PLATA
Diagonal 74 1681
[email protected]
SEDE NORDELTA
Av. De Los Lagos 7010
[email protected]
SEDE ROSARIO
Córdoba 2035
[email protected]
SEDE MENDOZA
Av. Emilio Civit 444
[email protected]
SEDE TUCUMÁN
Teléfono de Contacto [email protected]
0810 220 3444
digitalhouse.com