Follete Ciencia de Datos
Follete Ciencia de Datos
Follete Ciencia de Datos
Internacional
de Ciencia
de Datos
5ta. edición
La toma de decisiones basadas en los datos es una
tendencia mundial. En todo ámbito se resalta la importan-
cia del Data Scientist o Científico de Datos, conocido como
la persona con habilidades estadísticas, computacionales y
de visualización de datos, que lo llevan a encontrar patro-
nes que le permiten a una empresa ‘capitalizar’ la informa-
ción recogida.
2
A QUIÉN VA DIRIGIDO
requisitos
3
objetivos
COMPETENCIAS ADQUIRIDAS
4
fecha
iniciO: Octubre 2020
Fin: Junio 2021
Modalidad: Online, en vivo.
horarioS a elegir
DESCUENTOS
5%
DESCUENTO 5% 10%
PRONTO PAGO DESCUENTO DESCUENTO
(Hasta el 15 Septiembre PAGO EFECTIVO GRUPO DE 3 O MÁS
de 2020).
clientes y
miembros
see 5%
DESCUENTO
Por haber tomado
un curso con la
SEE en 2020.
5%
DESCUENTO
Por haber tomado
2 O más cursos
con la SEE en 2020.
5
MÉTODOS DE PAGO
paypal https://www.paypal.me/seecapacitacion
Email: [email protected]
WhatsApp: 593 962907548
6
PLAN ACADÉMICO
Proporcionará los elementos básicos para empezar a resolver problemas aplicando Ciencia de
Datos. Incluye conocimientos de estadística para describir e inferir, a partir de la data, mientras
se desarrollan las destrezas para utilizar R y Python desde RStudio y Anaconda (Spyder, Jupyter),
respectivamente.
Desde las moléculas hasta los cuerpos celestes, existen fuerzas que hacen objetos cercanos más
similares. Esta semejanza nos permite clasificarlos en grupos o clusters. Un clúster es, por lo
tanto, una colección de objetos que son ‘similares’ entre ellos y ‘diferentes’ a los encontrados
en otros grupos.
Clustering se puede definir como el proceso de organizar objetos en grupos cuyos miembros
son similares de alguna manera. Este es uno de los problemas de aprendizaje no supervisado
más usado, puesto que puede aplicarse para encontrar grupos de clientes de comportamiento
similar, clasificar plantas o animales dadas sus características, identificación de grupos de titula-
res de pólizas de seguros con alto riesgo, etc.
7
PLAN ACADÉMICO
Shiny es un paquete desarrollado por RStudio, que permite la creación de aplicaciones web
interactivas directamente desde R y, por tanto, pensado en el usuario que no conoce sobre
desarrollo web, pero sí sobre R y análisis de información.
Dash es un framework de Python muy utilizado para construir aplicaciones web analíticas o
dashboards, que se pueden desplegar en un servidor y compartir mediante URL a nuestros
usuarios. Además, usa Bootstrap, lo que permite adaptarse a dispositivos móviles.
El estudiante recibirá las bases para desarrollar aplicaciones Dash, obteniendo elementos más
interactivos para contar la historia que sus datos representan y permitiendo que los usuarios
interactúen con sus datos y su análisis.
Este módulo está diseñado para darle al estudiante, los fundamentos de SQL necesarios para la
aplicación de la Ciencia de datos, empezando por entender la lógica relacional SQL, realizar
consultas simples y complejas (subquerys); trabajar con diferentes tipos de datos como String y
números; y aprender métodos para filtrar y reducir los resultados. Asimismo, podrá crear tablas
nuevas (temporales o no), mover datos a ellas y usar SQL para dar a la data la forma que necesi-
tan análisis específicos. Finalmente, se enseña la conexión entre R y los principales motores de
base de datos.
8
PLAN ACADÉMICO
En este curso se imparten las bases teóricas y prácticas para la resolución de problemas de
predicción o clasificación (es decir: aprendizaje supervisado) en Ciencia de datos. Se desarrollan
las estrategias train-test, remuestreo o cross validación, empleadas para la estimación de pará-
metros e hiper parámetros en Ciencia de Datos, todo esto empezando con modelos simples
como regresión lineal múltiple y regresión logística, para luego entrar en conceptos y modelos
más complejos: regularización, balanceo de muestras, modelos lineales generalizados o Regre-
sión Ridge, Lasso y ElasticNet Para este módulo se usa R, Python y sus librerías o frameworks
más conocidos como Caret, Tidymodels, Scikit-learn.
La estadística es la ciencia que facilita la toma de decisiones basadas en datos desde hace
siglos. Por ello, muchos modelos de aprendizaje tienen fundamentos estadísticos muy fuertes.
En este módulo, se extiende lo aprendido sobre modelos en el curso anterior, de tal manera que
se brinde más herramientas al científico de datos para tratar problemas del mundo real.
Se introducen las perspectivas no paramétrica y bayesiana del desarrollo de la estadística, man-
teniendo las estrategias train-test, remuestreo y demás conceptos esenciales.
El boom de las computadoras y la consecuente facilidad para recolectar y almacenar datos, así
como para procesarlos, ha sido un factor trascendental para el auge de la Ciencia de Datos y las
técnicas enfocadas en ‘sacar el jugo’ de los mismos. En el presente curso se aumentará la caja
de herramientas con un conjunto de técnicas, que se podría considerar vienen de la vena com-
putacional de esta materia.
Support vector machines, random forest o redes neuronales son parte de los métodos que se
impartirán, junto con un adelanto introductorio al Deep Learning y en particular a la visión por
computadoras.
9
PLAN ACADÉMICO
Una vez conocidas las bases para aplicar modelos de Deep Learning y con los primeros proble-
mas de clasificación de imágenes usando redes neuronales convolucionales resueltos, este
curso continúa en el área de visión por computadora, pero esta vez entrando en modelos que
permitan generar imágenes sintéticamente.
Además, se adentra en el problema del procesamiento natural del lenguaje con el aprendizaje
sobre redes recurrentes, útiles también en problemas de series temporales.
Este curso permitirá comprender las bases de la computación en paralelo; los conceptos y
destrezas claves para manejar Big Data. El objetivo es que el estudiante interactúe con las
herramientas más conocidas como son Hadoop con MapReduce, Spark y Cloudera.
No hay mejor manera de aprender que mediante la práctica, es por ello que, para aprobar el programa
de Ciencia de Datos de la SEE se requiere un Proyecto de graduación. El mismo se empieza a realizar
cuando han transcurrido alrededor de la mitad de las materias. Los estudiantes arman grupos y escogen
un tema que van desarrollando, mientras aprenden las últimas asignaturas del programa y con la ayuda
de un tutor asignado, para que la culminación del proyecto sea exitosa.
Adicional se realizará una sesión de Soft Skills, cuyo objetivo será desarrollar las habilidades comunica-
cionales de los estudiantes.
10
INSTRUCTORES
Karen Calva
Ingeniera Matemática especializada en Estadística y Ciencia de datos
Docente para estudiantes de pregrado o profesionales, con más de seis años de experiencia,
dictando cursos y conferencias relacionadas a matemáticas, técnicas estadísticas y manejo de
software libre como R y Python.
KATHERINE MORALES
Ingeniera Matemática con mención en Estadística e Investigación Operativa
por la Escuela Politécnica Nacional (EPN)
Yandira Cuvero
Magíster en Matemáticas Aplicadas de la ENSIIE. Docente de la Escuela Politécnica
Nacional desde 2018
11
Zulemma Bazurto Blacio
Magíster en Estadística por la Pontificia Universidad Católica de Chile e Ingeniera
Comercial de la ESPOL.
Christian Galarza
PhD en Estadística de la Universidad Estatal de Campinas, UNICAMP - BRASIL
Emanuel Yaselga
Máster en Economía del Desarrollo por la Facultad Latinoamericana de Ciencias Sociales
y Máster en Matemáticas Aplicadas por la USFQ.
VICTOR MORALES
Doctor en Estadística; Máster en Matemáticas Aplicadas, Economía del Desarrollo y
Filosofía; Ingeniero en Economía y Finanzas.
Once años de experiencia en el sector público y privado haciendo análisis de datos, modelos
econométricos y analítica de datos. Ha sido profesor en programas de Maestría en diferentes
Universidades del país. Forma parte de grupos de investigación en Estadística Espacial, Ciencia
de Datos y Desarrollo Territorial. Investigador, forma parte del Comité Científico de la Revista
Cuestiones Económicas.
12
Guillermo Pizarro
Ingeniero en Ciencias de la Computación (ESPOL), Magíster en Gestión de Bases
de Datos (UTA) y maestrante en Ciencias de la Computación (UPM, España).
Miembro Senior de IEEE y del Grupo de Investigación de Ingeniería de Software e Ingeniería del
Conocimiento (GIISIC). Posee experiencia profesional como Coordinador de Proyectos Informá-
ticos en Sambito, además de consultorías con la Corp. El Rosado, Municipio de Guayaquil, entre
otros. Es docente investigador en el área de la Inteligencia Computacional en la Universidad
Politécnica Salesiana y Presidente de la Sociedad de Inteligencia Computacional del Ecuador.
Néstor Montaño
Ingeniero y Máster en estadística por la ESPOL. Miembro electo del directorio nacional
de la Sociedad Ecuatoriana de Estadística (SEE) y del R User Group Ecuador RUGE.
Consultor con más de 10 años de experiencia en el sector privado desempeñando cargos como
Jefe de Planificación de Demanda e Inteligencia de negocios y Planificación de demanda; Data
Scientist, especialista en el área matemático-estadística y consultor en empresas importadoras,
mayoristas, de retail, etc. Capacitador en la SEE y diversas instituciones en temas de estadística,
ciencia de datos e inteligencia artificial, mediante R o Python.
Roberto Esteves
Subdirector del núcleo Guayas de la Sociedad Ecuatoriana de Estadística, cuenta
con un Nanodegree de Udacity en Data Science y Procesamiento de Lenguaje Natural.
Certificado por la SEE, IBM, Platzi en Ciencia de Datos. Cuenta con 18 años de experiencia en
Marketing Digital e innovación en banca, medios de comunicación y empresas de telecomuni-
caciones. Estudiante de Posgrado en Data Science y Machine Learning en IEBS, la Escuela de
Negocios de la Innovación y los Emprendedores; fellow AI Saturday, Udacity Scholarship en
programas de Intel y Microsoft.
Pablo Flores
Máster en Estadística e Investigación Operativa por la Universidad Politécnica de
Cataluña y la Universidad de Barcelona.
La Sociedad Ecuatoriana de Estadística (SEE) es una organización civil sin fines de lucro creada hace
más de 20 años, con el objetivo de promover la toma de decisiones basadas en datos, incentivar la investi-
gación científica y la actualización de conocimientos en el ámbito de la estadística a nivel nacional.
La SEE organiza eventos académicos, profesionales y de difusión como las 9 ediciones del Seminario
Internacional de Estadística Aplicada, 4 ediciones del Programa de capacitación en Ciencia de datos, la
Escuela de R-Estadística, encuentros profesionales, concursos colegiales, cursos y seminarios entre otras
actividades.
Dirección:
Alpallana 289 y Diego de Almagro, Edificio Alpallana II. Oficina 304.
Quito, Ecuador
Contáctenos:
593 962907548 / [email protected] / www.see-ec.org
14