Programa Data Engineering (Flex)
Programa Data Engineering (Flex)
Engineering
PROGRAMA DEL CURSO
Educación digital
para el mundo real.
DATA ENGINEERING
Perfil profesional
Al finalizar el curso de Data Engineering podrás:
✔ Comprender los conceptos y desafíos del ecosistema
del Big Data
✔ Diseñar e implementar soluciones a problemas de
administración de grandes cantidades de datos
✔ Programar procesos ETL para la extracción,
transformación y carga de datos para su posterior
procesamiento de analítica.
✔ Administrar un data warehouse
Características generales
Nivel Duración
11 semanas + Semana 0
Avanzado
Pre-requisitos
Requerimientos técnicos
Para mejorar tu experiencia de cursada, te aconsejamos:
- Tener una PC o laptop con 8 GB de memoria RAM y
procesador de 4 núcleos.
- Sistema operativo: macOS Sierra/superior o Windows
7/superior.
Pre-requisitos
Conocimientos previos
✓ Manejo intermedio de SQL y análisis de datos.
Recomendamos ampliamente haber tomado el curso
"Data Analytics" de Coderhouse. Conocimientos de
bases de datos relacionales. En específico es
conveniente contar con los siguientes conocimientos:
● Saber qué es una clave primaria y una clave
foránea.
● Conocer el concepto de normalización y
preferentemente haber normalizado una base de
datos.
● Saber realizar consultas a una tabla, agrupar
resultados, utilizar funciones de agregación,
realizar JOINs, crear nuevas tablas, insertar, borrar
y actualizar registros.
● Instrucciones a conocer: JOINS, GROUP BY,
HAVING, INSERT, UPDATE, DELETE, CREATE.
✓ Manejo intermedio de Python. Recomendamos
ampliamente haber tomado el curso de "Python" en
Coderhouse. En especìfico es conveniente contar con
los siguientes conocimientos:
● Saber ejecutar scripts en Python, manejar
variables numéricas, strings, listas/arrays,
diccionarios y saber escribir y ejecutar funciones.
● A su vez conocer lo que es una API y haber usado
alguna para extraer datos de un sitio. maneja listas,
diccionarios, JSON. Preferentemente sabe cómo
consultar una API y extraer información de la
misma.
Clases en vivo
Proyecto final
00
Contenido nivelatorio
(Opcional)
✔ Uso de terminal unix
✔ Conceptos básicos de
arquitectura de una
computadora
✔ Ejercicios Python y SQL
01
Introducción a Data
Engineering
✔ Big Data y los problemas de
hoy
✔ Cómo trabaja un DE con un
Data Analyst y un Data
Scientist
✔ Conceptos base del mundo
de DE
✔ Review de una arquitectura
de datos base
02
Data Warehouse
✔ Bases de datos OLAP
✔ MPP, Clustering y Map
Reduce
✔ Amazon Redshift
✔ Apache Parquet
03
ETLs
✔ Pandas Dataframes
✔ Transformación de un
dataframe (de-duplicación,
merge, apply, etc)
04
Seguridad y Backup
de BD
✔ Conceptos de seguridad en
bases de datos
✔ Seguridad en Amazon
Redshift
✔ Backups manuales a S3
05
Docker
✔ Containerización y
Máquinas virtuales
✔ Dockerfiles, Docker images
✔ Práctica con Docker
06
Apache Airflow
✔ Introducción
✔ Arquitectura de los
procesos de Airflow
✔ DAGs, Tasks, Operators
✔ Conceptos avanzados:
sensores, subdags, XCOMs
07
Stream Processing
✔ Introducción
✔ PubSub
✔ Introducción teórica de
Apache Kafka
✔ Práctica con AWS Kinesis