Follete Ciencia de Datos

Programa
Internacional
de Ciencia
de Datos
5ta. edición
La toma de decisiones basadas en los datos es una
tendencia mundial. En todo ámbito se resalta la importan-
cia del Data Scientist o Científico de Datos, conocido como
la persona con habilidades estadísticas, computacionales y
de visualización de datos, que lo llevan a encontrar patro-
nes que le permiten a una empresa ‘capitalizar’ la informa-
ción recogida.
Desde PyMEs hasta grandes centros de investigación, los

datos están en todas partes y las compañías los acumulan
en diferentes actividades y de diversas formas. Registros
de ventas, compras, costos, mediciones de sensores, mo-
nitoreo de redes sociales son solo algunos ejemplos de
datos que son constantemente generados y almacenados
siendo necesaria la aplicación de técnicas estadísticas para
describir, relacionar y analizarlos.
La Sociedad Ecuatoriana de Estadística (SEE) abre la quinta

edición de su Programa de Ciencia de Datos con el objeti-
vo de responder a la demanda de perfiles profesionales,
con las capacidades y competencias necesarias para apor-
tar en el desarrollo empresarial a través de los datos.
Somos conscientes de los cambios del mercado, así como

los retos académicos y económicos, producto de la pan-
demia por COVID19. Por ello y por primera vez, la SEE abre
las puertas del programa a Latinoamérica, a través de la
modalidad online, ampliando las oportunidades de
networking entre nuestros estudiantes, en tiempos donde
no existen barreras físicas.
Mat. Emanuel Yaselga Alvarado, Msc

Presidente Sociedad Ecuatoriana de Estadística
2
A QUIÉN VA DIRIGIDO
Profesionales que trabajen en el manejo de información dentro de una

empresa u organización.
Jefes o analistas de departamentos de inteligencia de negocios, ciencia

de datos, analítica, estadística, Big Data, planificación de demanda o
información.
Analistas comerciales, de mercado, marketing, abastecimiento, etc.
requisitos
Conocimiento básico de matemáticas, El Programa Internacional de Ciencia de

habilidad para manejar herramientas Datos es casi autocontenido. Se empieza
como Excel y experiencia previa con pro- desde lo más básico: Instalación de los
gramación (macros de Excel o C++, etc) programas e importación de los datos.
3
objetivos
Formar APRENDER LAS

CIENTÍFICOS HERRAMIENTAS
DE DATOS FUNDAMENTALES
Los profesionales tendrán la capa- Desarrollarán scripts en R o Python,
cidad para formular nuevas pre- para realizar análisis exploratorios,
guntas e implementar soluciones descriptivos, modelos lineales o apli-
de alta tecnología, que permitan car Statistical, Machine o Deep Lear-
tomar mejores decisiones, que se ning a los problemas comunes que
traduzcan en mayores ingresos y afrontamos en nuestra labor diaria.
performance.
COMPETENCIAS ADQUIRIDAS
Manejo de conceptos para análisis de información.

Conocimiento de cuándo y cómo usar cada una de las técnicas más
importantes en Ciencia de Datos.
Manejo fluido de R y Python para Data Science.

Habilidad para desarrollar aplicaciones analíticas en Shiny o Dash.
Conocimiento necesario para entender e interactuar con

bases de datos relacionales o distribuidas (Big Data).
4
fecha
iniciO: Octubre 2020
Fin: Junio 2021
Modalidad: Online, en vivo.
horarioS a elegir
Lunes a Jueves 19:00 a 21:30 UTC -5
Sábados y Domingos 08:30 a 13:30 UTC -5
340 Horas 210 presenciales 80 autoaprendizaje 50 proyecto y tutorías Certificado de aprobación
inversión *DESCUENTOS ACUMULABLES HASTA un 20%
1500 USD + IVA Descuento especial por

primera edición online.
799 USD + IVA
Precio normal
Aplican otros descuentos*
DESCUENTOS
5%
DESCUENTO 5% 10%
PRONTO PAGO DESCUENTO DESCUENTO
(Hasta el 15 Septiembre PAGO EFECTIVO GRUPO DE 3 O MÁS
de 2020).
clientes y
miembros
see 5%
DESCUENTO
Por haber tomado
un curso con la
SEE en 2020.
5%
DESCUENTO
Por haber tomado
2 O más cursos
con la SEE en 2020.
5
MÉTODOS DE PAGO
tarjeta de crédito Online, vía link de pago.
paypal https://www.paypal.me/seecapacitacion
Banco Pacífico / Número de cuenta: 7964730

Tipo de cuenta: Corriente
efectivo a cuenta: RUC: 1791709381001
Nombre de la organización: Sociedad Ecuatoriana
de Estadística
contacto para información
Email: [email protected]
WhatsApp: 593 962907548
6
PLAN ACADÉMICO
MÓDULO 1 - Bases para Data Science: Estadística, R y Python.
Proporcionará los elementos básicos para empezar a resolver problemas aplicando Ciencia de
Datos. Incluye conocimientos de estadística para describir e inferir, a partir de la data, mientras
se desarrollan las destrezas para utilizar R y Python desde RStudio y Anaconda (Spyder, Jupyter),
respectivamente.
Incluye importación y exportación de información, manipulación de estructuras de datos con

paquetes Tidyverse en R o Pandas en Python; generación de gráficos y conceptos básicos de
estadística descriptiva e inferencial: estimación puntual, estimación por intervalos y algunas
pruebas de hipótesis tanto paramétricas como no paramétricas.
MÓDULO 2 - Clustering y descubrimiento de patrones.
Desde las moléculas hasta los cuerpos celestes, existen fuerzas que hacen objetos cercanos más
similares. Esta semejanza nos permite clasificarlos en grupos o clusters. Un clúster es, por lo
tanto, una colección de objetos que son ‘similares’ entre ellos y ‘diferentes’ a los encontrados
en otros grupos.
Clustering se puede definir como el proceso de organizar objetos en grupos cuyos miembros
son similares de alguna manera. Este es uno de los problemas de aprendizaje no supervisado
más usado, puesto que puede aplicarse para encontrar grupos de clientes de comportamiento
similar, clasificar plantas o animales dadas sus características, identificación de grupos de titula-
res de pólizas de seguros con alto riesgo, etc.
MÓDULO 3 - Reducción de dimensiones.
En ocasiones, el problema a examinar viene acompañado de una gran cantidad de observacio-

nes y variables. Esto si bien es beneficioso, en cuanto a disponibilidad de datos, también repre-
senta un desafío que puede ser computacionalmente intensivo. En el presente curso se apren-
derán técnicas cuyo objetivo es reducir la dimensionalidad de los datos manteniendo la mayor
cantidad de información posible.
7
PLAN ACADÉMICO
MÓDULO 4 - Desarrollo de aplicaciones Shiny.
Shiny es un paquete desarrollado por RStudio, que permite la creación de aplicaciones web
interactivas directamente desde R y, por tanto, pensado en el usuario que no conoce sobre
desarrollo web, pero sí sobre R y análisis de información.
En este módulo, el estudiante pasará de ser un programador de R a ser un desarrollador Shiny,

adoptando un enfoque interactivo para contar la historia que sus datos representan y permi-
tiendo que los usuarios interactúen con la data y su análisis, todo esto sólo usando R y tecnolo-
gías web.
MÓDULO 5 - Desarrollo de aplicaciones Dash.
Dash es un framework de Python muy utilizado para construir aplicaciones web analíticas o
dashboards, que se pueden desplegar en un servidor y compartir mediante URL a nuestros
usuarios. Además, usa Bootstrap, lo que permite adaptarse a dispositivos móviles.
El estudiante recibirá las bases para desarrollar aplicaciones Dash, obteniendo elementos más
interactivos para contar la historia que sus datos representan y permitiendo que los usuarios
interactúen con sus datos y su análisis.
MÓDULO 6 - Arquitectura de Datos para científicos de datos.
Este módulo está diseñado para darle al estudiante, los fundamentos de SQL necesarios para la
aplicación de la Ciencia de datos, empezando por entender la lógica relacional SQL, realizar
consultas simples y complejas (subquerys); trabajar con diferentes tipos de datos como String y
números; y aprender métodos para filtrar y reducir los resultados. Asimismo, podrá crear tablas
nuevas (temporales o no), mover datos a ellas y usar SQL para dar a la data la forma que necesi-
tan análisis específicos. Finalmente, se enseña la conexión entre R y los principales motores de
base de datos.
8
PLAN ACADÉMICO
MÓDULO 7 - Introducción a Modelos lineales bajo el enfoque Data Science.
En este curso se imparten las bases teóricas y prácticas para la resolución de problemas de
predicción o clasificación (es decir: aprendizaje supervisado) en Ciencia de datos. Se desarrollan
las estrategias train-test, remuestreo o cross validación, empleadas para la estimación de pará-
metros e hiper parámetros en Ciencia de Datos, todo esto empezando con modelos simples
como regresión lineal múltiple y regresión logística, para luego entrar en conceptos y modelos
más complejos: regularización, balanceo de muestras, modelos lineales generalizados o Regre-
sión Ridge, Lasso y ElasticNet Para este módulo se usa R, Python y sus librerías o frameworks
más conocidos como Caret, Tidymodels, Scikit-learn.
MÓDULO 8 - Statistical learning.
La estadística es la ciencia que facilita la toma de decisiones basadas en datos desde hace
siglos. Por ello, muchos modelos de aprendizaje tienen fundamentos estadísticos muy fuertes.
En este módulo, se extiende lo aprendido sobre modelos en el curso anterior, de tal manera que
se brinde más herramientas al científico de datos para tratar problemas del mundo real.
Se introducen las perspectivas no paramétrica y bayesiana del desarrollo de la estadística, man-
teniendo las estrategias train-test, remuestreo y demás conceptos esenciales.
MÓDULO 9 - Machine Learning.
El boom de las computadoras y la consecuente facilidad para recolectar y almacenar datos, así
como para procesarlos, ha sido un factor trascendental para el auge de la Ciencia de Datos y las
técnicas enfocadas en ‘sacar el jugo’ de los mismos. En el presente curso se aumentará la caja
de herramientas con un conjunto de técnicas, que se podría considerar vienen de la vena com-
putacional de esta materia.
Support vector machines, random forest o redes neuronales son parte de los métodos que se
impartirán, junto con un adelanto introductorio al Deep Learning y en particular a la visión por
computadoras.
9
PLAN ACADÉMICO
MÓDULO 10 - Deep learning.
Una vez conocidas las bases para aplicar modelos de Deep Learning y con los primeros proble-
mas de clasificación de imágenes usando redes neuronales convolucionales resueltos, este
curso continúa en el área de visión por computadora, pero esta vez entrando en modelos que
permitan generar imágenes sintéticamente.
Además, se adentra en el problema del procesamiento natural del lenguaje con el aprendizaje
sobre redes recurrentes, útiles también en problemas de series temporales.
MÓDULO 11 - Big Data y computación en paralelo.
Este curso permitirá comprender las bases de la computación en paralelo; los conceptos y
destrezas claves para manejar Big Data. El objetivo es que el estudiante interactúe con las
herramientas más conocidas como son Hadoop con MapReduce, Spark y Cloudera.
PROYECTO FINAL Tutoría personalizada
No hay mejor manera de aprender que mediante la práctica, es por ello que, para aprobar el programa
de Ciencia de Datos de la SEE se requiere un Proyecto de graduación. El mismo se empieza a realizar
cuando han transcurrido alrededor de la mitad de las materias. Los estudiantes arman grupos y escogen
un tema que van desarrollando, mientras aprenden las últimas asignaturas del programa y con la ayuda
de un tutor asignado, para que la culminación del proyecto sea exitosa.
Adicional se realizará una sesión de Soft Skills, cuyo objetivo será desarrollar las habilidades comunica-
cionales de los estudiantes.
10
INSTRUCTORES
Karen Calva
Ingeniera Matemática especializada en Estadística y Ciencia de datos
Graduada en la Escuela Politécnica Nacional. Actualmente, especialista de analítica avanzada en

una de las instituciones financieras más grandes de Ecuador.
Consultora independiente en temas de geo-estadística, gestión de procesos y logística para el
levantamiento de información, desarrollo de aplicativos webs con motores analíticos y aprendi-
zaje automático.
Docente para estudiantes de pregrado o profesionales, con más de seis años de experiencia,
dictando cursos y conferencias relacionadas a matemáticas, técnicas estadísticas y manejo de
software libre como R y Python.
KATHERINE MORALES
Ingeniera Matemática con mención en Estadística e Investigación Operativa
por la Escuela Politécnica Nacional (EPN)
Realizó sus estudios de maestría en Ciencia de Datos en École Polytechnique - Francia.

Se ha desempeñado como analista de datos en diferentes empresas del país, consultora inde-
pendiente y capacitadora de R (avalada por la EPN). Adicionalmente, ha participado en varios
retos empresariales en el área de ciencia de datos, en Francia y Ecuador. Cuenta con experien-
cia en aprendizaje bayesiano aplicado a la medicina, aprendizaje automático, procesamiento de
imágenes y procesamiento de lenguaje natural.
Actualmente trabaja en el Departamento de Comunicaciones, Imágenes y Procesamiento de la

Información de Télécom SudParis - Institute Polytecnique, y su área de estudio son las redes
neuronales recurrentes y sus aplicaciones.
Yandira Cuvero
Magíster en Matemáticas Aplicadas de la ENSIIE. Docente de la Escuela Politécnica
Nacional desde 2018
Ha realizado Investigación Educativa, en particular en la identificación de factores, que influyen

en el aprendizaje y patrones dentro de grupos educativos. Ha desarrollado diversas aplicacio-
nes de R desde la construcción de muestras hasta la construcción de espejos para preguntas de
opción múltiple para la plataforma Moodle. Instructora en cursos organizados por: Sociedad
Ecuatoriana de Estadística, R-User Grupo y Amarun desde 2016.
11
Zulemma Bazurto Blacio
Magíster en Estadística por la Pontificia Universidad Católica de Chile e Ingeniera
Comercial de la ESPOL.
Fundadora R-Ladies Guayaquil, Co-founder R-Ladies Galápagos, Docente de Estadística en la

Facultad de Ciencias Administrativas de la Universidad de Guayaquil y miembro de la Directiva
del Núcleo Guayas de la SEE.
Participa en proyectos colaborativos en la Comunidad Internacional de R, formó parte del

equipo traductor del libro online “R for Data Science” de Hadley Wickham y Garret Golemund
y actualmente colabora en la traducción de “Teaching Tech Together. How to create and deliver
lessons that work and build a teaching community around them” de Greg Wilson.
Christian Galarza
PhD en Estadística de la Universidad Estatal de Campinas, UNICAMP - BRASIL
Máster en Estadística. Docente investigador en la facultad de Matemáticas y Ciencias Naturales

de la ESPOL. Investigador cuyos trabajos iniciales le han permitido ganar varios premios nacio-
nales e internacionales, y difundir su investigación en congresos de todo el mundo. Es árbitro
de revistas científicas de alto impacto, miembro de varias sociedades estadísticas, joven emba-
jador 2020 del Instituto Internacional de Estadística (ISI) ante el IBC y autor de más de 10 paque-
tes R.
Emanuel Yaselga
Máster en Economía del Desarrollo por la Facultad Latinoamericana de Ciencias Sociales
y Máster en Matemáticas Aplicadas por la USFQ.
Matemático por la Universidad Jean Monnet de Francia e Ingeniero en administración de

empresas por la Universidad Central del Ecuador. Experiencia profesional de 12 años en institu-
ciones públicas, privadas y universidades en consultoría e investigaciones con énfasis en desa-
rrollos econométricos, estadísticos y ciencia de datos. Cuenta con 3 publicaciones en revistas
indexadas como Cuestiones Económicas y Analítica.
Es especialista en consistencia y previsiones macroeconómicas del Banco Central del Ecuador y

Presidente de la Sociedad Ecuatoriana de Estadística.
VICTOR MORALES
Doctor en Estadística; Máster en Matemáticas Aplicadas, Economía del Desarrollo y
Filosofía; Ingeniero en Economía y Finanzas.
Once años de experiencia en el sector público y privado haciendo análisis de datos, modelos
econométricos y analítica de datos. Ha sido profesor en programas de Maestría en diferentes
Universidades del país. Forma parte de grupos de investigación en Estadística Espacial, Ciencia
de Datos y Desarrollo Territorial. Investigador, forma parte del Comité Científico de la Revista
Cuestiones Económicas.
12
Guillermo Pizarro
Ingeniero en Ciencias de la Computación (ESPOL), Magíster en Gestión de Bases
de Datos (UTA) y maestrante en Ciencias de la Computación (UPM, España).
Miembro Senior de IEEE y del Grupo de Investigación de Ingeniería de Software e Ingeniería del
Conocimiento (GIISIC). Posee experiencia profesional como Coordinador de Proyectos Informá-
ticos en Sambito, además de consultorías con la Corp. El Rosado, Municipio de Guayaquil, entre
otros. Es docente investigador en el área de la Inteligencia Computacional en la Universidad
Politécnica Salesiana y Presidente de la Sociedad de Inteligencia Computacional del Ecuador.
Néstor Montaño
Ingeniero y Máster en estadística por la ESPOL. Miembro electo del directorio nacional
de la Sociedad Ecuatoriana de Estadística (SEE) y del R User Group Ecuador RUGE.
Consultor con más de 10 años de experiencia en el sector privado desempeñando cargos como
Jefe de Planificación de Demanda e Inteligencia de negocios y Planificación de demanda; Data
Scientist, especialista en el área matemático-estadística y consultor en empresas importadoras,
mayoristas, de retail, etc. Capacitador en la SEE y diversas instituciones en temas de estadística,
ciencia de datos e inteligencia artificial, mediante R o Python.
Roberto Esteves
Subdirector del núcleo Guayas de la Sociedad Ecuatoriana de Estadística, cuenta
con un Nanodegree de Udacity en Data Science y Procesamiento de Lenguaje Natural.
Certificado por la SEE, IBM, Platzi en Ciencia de Datos. Cuenta con 18 años de experiencia en
Marketing Digital e innovación en banca, medios de comunicación y empresas de telecomuni-
caciones. Estudiante de Posgrado en Data Science y Machine Learning en IEBS, la Escuela de
Negocios de la Innovación y los Emprendedores; fellow AI Saturday, Udacity Scholarship en
programas de Intel y Microsoft.
Pablo Flores
Máster en Estadística e Investigación Operativa por la Universidad Politécnica de
Cataluña y la Universidad de Barcelona.
Ingeniero en Estadística Informática por la Escuela Superior Politécnica de Chimborazo.

Actualmente cursa un Ph.d en Bioinformática de la Universidad Autónoma de Barcelona.
Docente - investigador de la ESPOCH, miembro del grupo de investigación en Bioestadística y
Bioinformática de la Universidad Politécnica de Cataluña y del grupo de investigación en Cien-
cia de Datos CIDED. Ha realizado publicaciones indexadas y participado en congresos interna-
cionales.
13
conócenos
La Sociedad Ecuatoriana de Estadística (SEE) es una organización civil sin fines de lucro creada hace
más de 20 años, con el objetivo de promover la toma de decisiones basadas en datos, incentivar la investi-
gación científica y la actualización de conocimientos en el ámbito de la estadística a nivel nacional.
La SEE organiza eventos académicos, profesionales y de difusión como las 9 ediciones del Seminario
Internacional de Estadística Aplicada, 4 ediciones del Programa de capacitación en Ciencia de datos, la
Escuela de R-Estadística, encuentros profesionales, concursos colegiales, cursos y seminarios entre otras
actividades.
Dirección:
Alpallana 289 y Diego de Almagro, Edificio Alpallana II. Oficina 304.
Quito, Ecuador
Contáctenos:
593 962907548 / [email protected] / www.see-ec.org
@socecuest Sociedad Ecuatoriana de Estadística @see_estadistica
@see_estadistica SEE Sociedad Ecuatoriana de Estadística GitHub: /see-ecuador
14

Follete Ciencia de Datos

Cargado por

Copyright:

Formatos disponibles

Follete Ciencia de Datos

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Follete Ciencia de Datos

Cargado por

Copyright:

Formatos disponibles

Programa

Desde PyMEs hasta grandes centros de investigación, los

La Sociedad Ecuatoriana de Estadística (SEE) abre la quinta

Somos conscientes de los cambios del mercado, así como

Mat. Emanuel Yaselga Alvarado, Msc

Profesionales que trabajen en el manejo de información dentro de una

Jefes o analistas de departamentos de inteligencia de negocios, ciencia

Analistas comerciales, de mercado, marketing, abastecimiento, etc.

Conocimiento básico de matemáticas, El Programa Internacional de Ciencia de

Formar APRENDER LAS

Manejo de conceptos para análisis de información.

Manejo fluido de R y Python para Data Science.

Conocimiento necesario para entender e interactuar con

Lunes a Jueves 19:00 a 21:30 UTC -5

Sábados y Domingos 08:30 a 13:30 UTC -5

340 Horas 210 presenciales 80 autoaprendizaje 50 proyecto y tutorías Certificado de aprobación

inversión *DESCUENTOS ACUMULABLES HASTA un 20%

1500 USD + IVA Descuento especial por

tarjeta de crédito Online, vía link de pago.

Banco Pacífico / Número de cuenta: 7964730

contacto para información

MÓDULO 1 - Bases para Data Science: Estadística, R y Python.

Incluye importación y exportación de información, manipulación de estructuras de datos con

MÓDULO 2 - Clustering y descubrimiento de patrones.

MÓDULO 3 - Reducción de dimensiones.

En ocasiones, el problema a examinar viene acompañado de una gran cantidad de observacio-

MÓDULO 4 - Desarrollo de aplicaciones Shiny.

En este módulo, el estudiante pasará de ser un programador de R a ser un desarrollador Shiny,

MÓDULO 5 - Desarrollo de aplicaciones Dash.

MÓDULO 6 - Arquitectura de Datos para científicos de datos.

MÓDULO 7 - Introducción a Modelos lineales bajo el enfoque Data Science.

MÓDULO 8 - Statistical learning.

MÓDULO 9 - Machine Learning.

MÓDULO 10 - Deep learning.

MÓDULO 11 - Big Data y computación en paralelo.

PROYECTO FINAL Tutoría personalizada

Graduada en la Escuela Politécnica Nacional. Actualmente, especialista de analítica avanzada en

Realizó sus estudios de maestría en Ciencia de Datos en École Polytechnique - Francia.

Actualmente trabaja en el Departamento de Comunicaciones, Imágenes y Procesamiento de la

Ha realizado Investigación Educativa, en particular en la identificación de factores, que influyen

Fundadora R-Ladies Guayaquil, Co-founder R-Ladies Galápagos, Docente de Estadística en la

Participa en proyectos colaborativos en la Comunidad Internacional de R, formó parte del

Máster en Estadística. Docente investigador en la facultad de Matemáticas y Ciencias Naturales

Matemático por la Universidad Jean Monnet de Francia e Ingeniero en administración de

Es especialista en consistencia y previsiones macroeconómicas del Banco Central del Ecuador y

Ingeniero en Estadística Informática por la Escuela Superior Politécnica de Chimborazo.

@socecuest Sociedad Ecuatoriana de Estadística @see_estadistica

@see_estadistica SEE Sociedad Ecuatoriana de Estadística GitHub: /see-ecuador

También podría gustarte