Clase 0 - Introducción A La Ciencia de Datos
Clase 0 - Introducción A La Ciencia de Datos
Clase 0 - Introducción A La Ciencia de Datos
bienvenida!
¿Comenzamos?
Esta clase va a ser
grabada
José López Jorge Ruiz David Silvera Franklin Zhunio Juan Demaestri
Profesor Tutor Tutor Tutor Tutor
Clase 0. DATA SCIENCE
Introducción a la
Ciencia de Datos
Objetivos de la clase
Ciencia de datos
Habilidades
necesarias
Características de
Transformación Digital la industria 4.0
Introducción a la
ciencia de datos
Ciclo de vida de un
proyecto de ciencia
de datos
Valor y retorno de la
ciencia de datos
Fuente: Cambridge
REEMPLAZAR
POR IMAGEN
Data Science
Existen muchas
creencias de que es lo
que realmente hace un
Data Scientist, es por
esto a continuación
aclararemos los roles
que implica este cargo.
¿Qué hacen los
científicos de Datos?
¿Qué hacen lo
científicos de
datos?
Un flujo de trabajo típico para los Data Scientist es el
siguiente:
✔ Entender el negocio
✔ Recolectar y Explorar los datos
✔ Preparar y procesar los datos
✔ Crear y validar modelos
✔ Desplegar y monitorear performance de algoritmos
¿Qué habilidades
requieren los científicos
de Datos?
¿Qué habilidades
requieren los
científicos de
datos?
1. Inquisitivo: es una persona curiosa y algunas veces
escéptica
2. Conocimiento sólidos: en Machine Learning,
computación, matematicas, estadistica y probabilidad
3. Método científico: crea hipótesis, las pone a prueba y
actualiza su entendimiento de los problemas
¿Qué habilidades
requieren los
científicos de
datos?
4. Habilidades en programación: es bueno realizando
códigos, hacking y en la programación en general
5. Productos orientados: sabe como desarrollar productos
asociados a data y visualizaciones para hacer los datos más
entendibles para cualquier persona
6. Conocimiento del dominio: entiende los negocios y
cómo contar historias interesantes (Storytelling), es capaz
de responder preguntas.
Data Team
Data Team
REEMPLAZAR Es el grupo de cargos (roles) dentro de una organización que
POR IMAGEN se encargan de todo el proceso de manipulación,
estructuración y generación de insights a partir de los datos
disponibles. Está compuesto usualmente de 3 roles
importantes:
✔ Data Scientist
✔ Data Engineers
✔ Data Analysts
Data Scientist
Es capaz de tomar proyectos de Data Science desde el REEMPLAZAR
inicio al fin. Pueden almacenar grandes cantidade de POR IMAGEN
información, crear modelos predictivos y presentar
resultados.
✔ Tableau
✔ Power BI
✔ R- ggplot2, lattice, Shiny
✔ Python- Matplotlib, Seaborn, Plotly, Dash
✔ Kibana
✔ Grafana
✔ Spotfire
8. Despliegue
Se pone en producción (a disposición del público por
ejemplo el equipo de ventas) la herramienta desarrollada en
las etapas previas. Algunos Frameworks útiles son:
1. Flask
2. Django
3. FastAPI
1. AWS
2. Azure
3. Google Cloud
9. Toma de
decisiones
En esta etapa es posible la toma de decisiones con base
en insights. De igual forma al realizar el proceso podemos
aprender de resultados positivos o negativos que
puedan ocurrir
✔ Data analysis
✔ Data visualization
✔ Data Storytelling
✔ Entendimiento de negocio
✔ Capacidad de presentar
✔ Predicción de resultados deseados
Data Science para
máquinas
Data Science para
máquinas
Donde los consumidores finales son máquinas que se
alimentan de datos, modelos y algoritmos.
✔ Modelamiento automático
✔ Inteligencia artificial
✔ ETL
✔ Data Engineering
✔ Software Engineering
✔ Arquitecturas de optimización
Importancia de
Data Science
¿Por qué la Ciencia de
Datos es importante?
¿Porque la ciencia de datos es
importante?
Cada negocio tiene datos pero su valor
comercial depende de qué tanto conocen Nos permite conocer mejor nuestros clientes,
esos datos y puede ayudar a optimizar nuestros
procesos con el fin de tomar mejores
Data Science ha ganado importancia en decisiones
tiempos recientes porque ayuda a
incrementar el valor comercial de los datos
disponibles y cómo se pueden utilizar para
tomar ventaja respecto a los competidores
Ejemplos de la vida real
LYNA
Recientemente han desarrollado una herramienta
llamada LYNA para identificar cáncer de mama.
Glosario
Data Science: campo interdisciplinario que Data Engineers: personas versátiles capaces
utiliza métodos científicos, procesos, de usar la ciencia de computación para
algoritmos y sistemas con el fin de extraer procesar grandes cantidades de datos. Se
conocimientos e insights de datos enfocan en procesos de codigo, limpieza de
estructurados, no estructurados y datos e implementar solicitudes de los data
semiestructurados Scientists
Data Scientist: persona que es capaz de Data Analysts: personas que ayudan a otras
tomar proyectos de Data Science desde el personas dentro de la compañía a entender
inicio al fin. Pueden almacenar grandes solicitudes específicas por medio de gráficas
cantidade de información, crear modelos y resúmenes numéricos.
predictivos y presentar resultados.
Resumen
de la clase hoy
✓ Cuarta Revolución Industrial
✓ El Ambiente de la Industria 4.0
✓ Transformación Digital
✓ Ciclo de vida de un proyecto de ciencia de datos
✓ Valor y retorno de la Ciencia de Datos
Muchas gracias.