0% encontró este documento útil (0 votos)
24 vistas

Programa Data Engineering (Flex)

Cargado por

Sebastian Rossi
Derechos de autor
© © All Rights Reserved
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
24 vistas

Programa Data Engineering (Flex)

Cargado por

Sebastian Rossi
Derechos de autor
© © All Rights Reserved
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 10

Data

Engineering
PROGRAMA DEL CURSO
Educación digital
para el mundo real.
DATA ENGINEERING

Acerca del curso


En este curso aprenderás los conceptos y prácticas del
manejo de grandes cantidades de datos a través de
procesos de extracción, transformación y carga (ETL).
A su vez, aprenderás a diseñar y administrar una
arquitectura de Data Warehousing aplicando las
tecnologías que se usan hoy en día en el mercado.
Implementarás procesos de manejo de datos utilizando el
lenguaje Python, haciendo uso de librerías como Pandas.
Utilizarás dialectos de SQL con bases de datos Amazon
Redshift. Al finalizar este curso, estarás capacitado para
administrar, mantener y realizar optimizaciones a
infraestructuras de datos modernas.

Perfil profesional
Al finalizar el curso de Data Engineering podrás:
✔ Comprender los conceptos y desafíos del ecosistema
del Big Data
✔ Diseñar e implementar soluciones a problemas de
administración de grandes cantidades de datos
✔ Programar procesos ETL para la extracción,
transformación y carga de datos para su posterior
procesamiento de analítica.
✔ Administrar un data warehouse

PROGRAMA DEL CURSO 03


DATA ENGINEERING

Características generales

Modalidad Curso Flex

✓ 1 clase en vivo semanal de 2 horas


✓ Más de 10 horas de contenidos audiovisuales on-demand,
disponibles en nuestra plataforma para acceder en cualquier
momento (videos, infografías, actividades gamificadas y desafíos)

Haz click aquí para conocer más acerca de CoderFlex

Nivel Duración

11 semanas + Semana 0
Avanzado

Pre-requisitos

Requerimientos técnicos
Para mejorar tu experiencia de cursada, te aconsejamos:
- Tener una PC o laptop con 8 GB de memoria RAM y
procesador de 4 núcleos.
- Sistema operativo: macOS Sierra/superior o Windows
7/superior.

PROGRAMA DEL CURSO 05


DATA ENGINEERING

Pre-requisitos

Conocimientos previos
✓ Manejo intermedio de SQL y análisis de datos.
Recomendamos ampliamente haber tomado el curso
"Data Analytics" de Coderhouse. Conocimientos de
bases de datos relacionales. En específico es
conveniente contar con los siguientes conocimientos:
● Saber qué es una clave primaria y una clave
foránea.
● Conocer el concepto de normalización y
preferentemente haber normalizado una base de
datos.
● Saber realizar consultas a una tabla, agrupar
resultados, utilizar funciones de agregación,
realizar JOINs, crear nuevas tablas, insertar, borrar
y actualizar registros.
● Instrucciones a conocer: JOINS, GROUP BY,
HAVING, INSERT, UPDATE, DELETE, CREATE.
✓ Manejo intermedio de Python. Recomendamos
ampliamente haber tomado el curso de "Python" en
Coderhouse. En especìfico es conveniente contar con
los siguientes conocimientos:
● Saber ejecutar scripts en Python, manejar
variables numéricas, strings, listas/arrays,
diccionarios y saber escribir y ejecutar funciones.
● A su vez conocer lo que es una API y haber usado
alguna para extraer datos de un sitio. maneja listas,
diccionarios, JSON. Preferentemente sabe cómo
consultar una API y extraer información de la
misma.

PROGRAMA DEL CURSO 05


DATA ENGINEERING

Metodología Curso Flex

La experiencia de aprender combinando encuentros prácticos y en


vivo con material teórico y práctico offline, pensado para que puedas
adaptar el proceso de aprendizaje a tu vida.

Contenido Audiovisual (On demand)

Este material, compuesto por videos, podcast, desafíos y


actividades interactivas, se encuentra disponible de
manera asincrónica (puedes acceder a cualquier hora y
las veces que quieras). Te sugerimos visualizarlo y realizar
las actividades cada semana antes de la clase en vivo.

Clases en vivo

Tendrás una clase en vivo semanal de dos horas. En este


encuentro de carácter práctico se profundizará el
contenido teórico con ejemplos, buenas prácticas e
instancias de intercambio colaborativo. El objetivo es
consolidar los conocimientos adquiridos y aplicarlos en la
elaboración de un proyecto integrador final.

Proyecto final

Durante tu recorrido aprenderás a partir de la elaboración


progresiva de un proyecto mediante entregas parciales y
una entrega final de carácter integrador.

PROGRAMA DEL CURSO 06


DATA ENGINEERING

Te presentamos el recorrido dividido en módulos:

00
Contenido nivelatorio
(Opcional)
✔ Uso de terminal unix
✔ Conceptos básicos de
arquitectura de una
computadora
✔ Ejercicios Python y SQL

01
Introducción a Data
Engineering
✔ Big Data y los problemas de
hoy
✔ Cómo trabaja un DE con un
Data Analyst y un Data
Scientist
✔ Conceptos base del mundo
de DE
✔ Review de una arquitectura
de datos base

02
Data Warehouse
✔ Bases de datos OLAP
✔ MPP, Clustering y Map
Reduce
✔ Amazon Redshift
✔ Apache Parquet

PROGRAMA DEL CURSO 07


DATA ENGINEERING

Te presentamos el recorrido dividido en módulos:

03
ETLs
✔ Pandas Dataframes
✔ Transformación de un
dataframe (de-duplicación,
merge, apply, etc)

04
Seguridad y Backup
de BD
✔ Conceptos de seguridad en
bases de datos
✔ Seguridad en Amazon
Redshift
✔ Backups manuales a S3

05
Docker
✔ Containerización y
Máquinas virtuales
✔ Dockerfiles, Docker images
✔ Práctica con Docker

PROGRAMA DEL CURSO 08


DATA ENGINEERING

06
Apache Airflow
✔ Introducción
✔ Arquitectura de los
procesos de Airflow
✔ DAGs, Tasks, Operators
✔ Conceptos avanzados:
sensores, subdags, XCOMs

07
Stream Processing

✔ Introducción
✔ PubSub
✔ Introducción teórica de
Apache Kafka
✔ Práctica con AWS Kinesis

PROGRAMA DEL CURSO 09


www.coderhouse.com

Coderhouse se reserva el derecho de modificar este programa, o cualquiera de los componentes


del curso, cuando lo considere necesario a fin de generar mejoras o actualizaciones.

También podría gustarte