Brochure Cs de Datos Con R y Python
Brochure Cs de Datos Con R y Python
Presentación:
Certificado en Ciencia de Datos con R y Python: Modalidad Online. Tres clases
semanales en vivo, un fuerte componente práctico orientado a proyectos y
experiencias reales para que aprendas haciendo.
Duración: 30 semanas. Dedicación recomendada: 10 Hs semanales – Clases de 30 a 60
minutos dependiendo del tema, la cantidad de participantes y el nivel de intervenciones
conseguido. El estudiante tiene actividad complementaria con material de soporte de las
clases, material teórico para estudiar, ejercicios resueltos y para resolver. Se realizan
correcciones de ejercicios y autoevaluaciones.
Los grupos de participantes son reducidos y de varios países hispanoparlantes. Lo que
aporta diferentes visiones y la posibilidad de networking internacional. Soporte docente por
Grupo de WhatsApp, email y foro.
Objetivos:
Aprenderás los principales algoritmos de aprendizaje supervisado y no supervisado. Entre
los algoritmos supervisados verás árboles de decisión, redes neuronales, Todas las clases
quedan grabadas y no se exige asistencia. La duración de cada regla de asociación, bayes
ingenuos, bosques aleatorios. Y no está supervisado como agrupamiento. Descubrirás
además cómo usar series temporales, el método de Montecarlo, los algoritmos genéticos, y
las técnicas de regresión, minería de textos y big data. Estas aplicaciones podrás utilizarlas
en múltiples campos. Como negocios, salud, recursos humanos, cobranzas, finanzas,
publicidad, marketing, procesos de servicios y de producción, urbanismo, políticas públicas,
etc.
Introducción a R
● Variables, vectores y matrices
● Dataframes
● Paquetes y librerías
● Manejo de archivos csv
● Conversiones de tipos
● Conexión a bases de datos
● Ejecución condicional
● Bucles
● Funciones en R
● Medidas estadísticas
● Correlaciones
● Funciones estadísticas
Introducción a Python
● Descarga e instalación
● Principales librerías
● Variables y tipos de datos
● Listas, tuplas y diccionarios
● Ejecución condicional
● Ciclos definidos e indefinidos
● Manejo de Excepciones
● Funciones y Generadores
● Clases y objetos
● Manejo de archivos y directorios
● Conexión a archivos planos
● Conexión a Excel
● Conexión a Bases de Datos
Tests básicos
● Repaso de conceptos de probabilidad y estadística
● Test de Hipótesis
● Correlaciones
● AB Test
● Cálculo de correlaciones en R con cor
● Funciones de distribución en R
● Histogramas en R
● Gráficos de líneas en R
● Gráficos de áreas en R
● Uso de NumPy
● Uso de Pandas
● Uso de MatPlotLib
● Módulo matplotlib
● Módulo math
● Módulo numpy
● Módulo yt
● Módulo mayavi
Regresiones
● Regresión Lineal
● Regresión polinómica
● Regresión exponencial y logarítmica
● Regresión de dos variables
● Cálculo de regresiones en R con lm
● Cálculo de regresiones logísticas en R con glm
● Regresiones en Python
● Regresión logística en Python
Árboles de decisión
● Algoritmo básico en Excel
● División en entrenamiento y prueba
● Uso de Rpart y cp
● Predicción y valoración de la solución
● Uso de Party
● Aplicación al problema del call center
● Instalación y uso del paquete en Python
● Ejemplo en Python
● Principales parámetros de ajuste y control
Clusters
● Algoritmo básico en Excel
● Uso de kmeans en R
● Ejemplo de aplicación real en R
● Otros algoritmos de agrupamiento en R
● Ejercicio de aplicación de agrupamiento de mascotas
● Uso de Scikit-Learn en Python
● Análisis de componentes principales en Python
● K-Medias en Python
● Clustering jerárquico en Python
Reglas de Asociación
● Algoritmo básico en Access
● División en entrenamiento y prueba en R
● Uso de arules en R
● Ejemplo de una aplicación real votación de reglas en R
● Ejemplo de una aplicación real a datos de ventas en supermercados en
R
● Instalación y uso del paquete en Python
● Ejemplo en Python
● Principales parámetros de ajuste y control
● Esquema de votación de reglas en Python
Redes Neuronales
● Algoritmo básico en Excel
● División en entrenamiento y prueba en R
● Uso de neuralnet
● Predicción y valoración de la solución en R
● Discusión del problema de legibilidad de los resultados desde el
negocio
● Competencia entre árboles y redes en un caso concreto en R
● Instalación y uso del paquete en Python
● Ejemplo en Python
● Principales parámetros de ajuste y control en Python
● Problema concreto en Python
Algoritmos genéticos
● Algoritmo básico en Excel
● Discusión del tipo de problemas en los que se aplica
● Discusión de otros mecanismos de optimización
● Implementación en R del uso de algoritmos genéticos como Valores
reales
● Binarios
● Permutaciones
● Implementación en Python
Series temporales
● Taxonomía
● Separación de componentes
● Predicciones
● ARIMA implementado en R
● Predicción en series con un único período
● Predicción en series con múltiples períodos
● Predicción en series con períodos variables: renormalización
● Implementación en Python
Minería de textos
● Clasificación supervisada de piezas de texto
● Construcción de una red semántica
● Discusión de las posibilidades de reconocimiento de voz
● Ejemplos de aplicación real del algoritmo de clasificación
● Aplicación a la detección de sentimientos
● Ejemplo de implementación en Python
Bayes Ingenuo
● Implementación en Excel
● Ejemplo de aplicación en R
● Comparación de 4 algoritmos predictivos (Bayes ingenuo, árboles,
redes neuronales y regression logística)
● Ejemplo de aplicación en Python
Random Forest
● Bootstrap y bagging
● Descripción conceptual del método random forest
● Paquete randomForest para R
● Ejemplo de aplicación
● Comparación con otras técnicas
● Implementación en Python
Análisis de Fourier
● Descripción conceptual
● Ejemplo conceptual en Excel
● Instalación y uso del paquete en R
● Instalación y uso del paquete en Python
● Ejemplo en R
● Ejemplo en Python
Herramientas geográficas
● Distancias
● Implementación en RPaquete sf
● Paquete nngeo
● Aplicación práctica en R
● Implementación en Python
● Aplicación práctica en Python
Diseño de Datawarehouses
● Diferencias entre los DW y los OLTP
● Tipos de datos y soportes
● Dimensiones y jerarquías
● Estimación de recursos y tiempos según tipos de datos
● Ejemplos de staging
● Interacción entre equipos (DB-ETL-Soporte-FrontEnd-Usuarios)
● Ejercicios de diseño de DW
Big Data
● ¿Qué es Big Data?
● ¿Cuándo usar Big Data?
● ¿Cómo armar una infraestructura para Hadoop?
● Ejemplo de una aplicación de Map Reduce: wordcount
● Como evitar Hadoop
DÍAS Y HORARIOS
EQUIPO DOCENTE
● Ignacio Urteaga
● Laura Siri
● Susana Sarmiento
● Guillermo Garofalo
INSCRIPCIÓN: