BigDataAnalitics Syllabus Final
BigDataAnalitics Syllabus Final
F ACULTAD DE INGENIER I A
SYLLABUS
PROYECTO CURRICULAR:
Alternativas metodológicas:
Clase Magistral ( ), Seminario ( ), Seminario – Taller ( X ), Taller ( ), Prácticas ( ), Proyectos
tutoriados ( ), Otro: _____________________
HORARIO:
El análisis de estos grandes volúmenes de datos están transformando los negocios, las
interacciones sociales, y el futuro de nuestra sociedad y ha generado una nueva profesión que
se ha llamado el Científico de Datos y que Harvard Business Revie ha llamado: “la profesión más
sexy del siglo 21” (https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/ ).
Big Data Analytics es el proceso de examinar grandes conjuntos de datos que contienen una
variedad de tipos- es decir, Big Data - para descubrir patrones ocultos, desconocidos
correlaciones, tendencias del mercado, las preferencias del cliente y otra información comercial
útil. Los resultados analíticos pueden dar lugar a una comercialización más eficaz, nuevas
oportunidades de ingresos, mejor servicio al cliente, la mejora de la eficiencia operativa, ventajas
competitivas frente a organizaciones rivales y otros beneficios de negocio.
OBJETIVO GENERAL
El objetivo principal del Big Data Analytics es ayudar a las empresas a tomar decisiones de
negocio más informadas al permitir que los científicos de datos, modeladores predictivos y otros
profesionales de análisis para analizar grandes volúmenes de datos de la emporesa, así como
otras formas de datos que pueden ser explotados por la inteligencia de negocio convencional
programas (BI) y Data Mining.
En este curso, el estudiante conocerá de las nuevas arquitecturas de Big Data
(Hadoop/Spark/Map-Reduce) y sus modelos de Bases de Datos NO-SQL y aprenderá cómo usar
los datos y análisis para darle una ventaja a su carrera y su vida.
OBJETIVOS ESPECÍFICOS
Conocer las arquitecturas de Big Data y los diferentes modelos de Base de Datos NO-SQL
Conocer que es el análisis de datos y su aplicación en los negocios
Conocer las diferentes etapas del análisis de datos
Conocer diferentes técnicas y herramientas de análisis de datos
Aplicar el lenguaje R y Python para análisis de datos
Aplicar el análisis de datos en un dominio de negocio utilizando R y Python
Conocer y aplicar el análisis predictivo utilizando R y Python.
PROGRAMA SINTÉTICO:
Big Data (8 Horas-Teóricas)
o Definiciones
o Arquitecturas
Map-Reduce
Hadoop
Spark
o Bases de Datos NO-SQL
Programación en R (20 horas-Practicas)
Análisis y ciencia de los datos (12 Horas-Teóricas)
o Los datos y la toma de decisiones en tu vida y en las organizaciones
o Etapas en el análisis de datos
o Tipos de Análisis
Descriptivo
Predictivo
Prescriptivo
o Machine Learning
Aplicación del Proceso de Análisis de Datos (40 horas)
o Definición del objeto de análisis y elaboración de las preguntas de
análisis (1 horas teóricas)
o Definición de las variables y las fuentes de datos (1 horas teóricas)
o Depuración de los datos (2 horas teóricas)
o Análisis Descriptivo y Estadística Básica (12 horas prácticas con
computador)
Análisis de una variable
Análisis de 2 variables
Análisis y presentación grafica de los datos
o Análisis Predictivo (20 horas prácticas con computador)
Linear regression modeling
Classification modeling and Text Mining
Clustering and Similarity: Retrieving Documents
Recommender systems
Otras Técnicas de Machine Learning
Trees
Etc.
Deep Learning
III. ESTRATEGIAS (El Cómo?)
Metodología Pedagógica y Didáctica:
(Centrada en núcleos conceptuales y resolución de problemas en pequeños proyectos de
investigación en grupos de estudiantes. Explicitar el tipo de metodología científica usada. Están
centradas en el trabajo didáctico de los intereses y las ideas previas de los estudiantes. Cada
unidad didáctica requiere determinar y trabajar las ideas previas, por ejemplo, en torno a la
resolución de pequeños proyectos de investigación). Aun que no se intenta únicamente enseñar
a los estudiantes la metodología científica de cada disciplina implicada, si se recomienda seguir
los procedimientos que siguen los investigadores de las disciplinas científicas e ingenieriles para
resolver problemas similares a los que se plantearan a los estudiantes.
Se debe procurar incentivar el trabajo de grupo más que el trabajo individual. (se recomienda
trabajar en grupos de tres o cuatro estudiantes)
Si es posible diseñar “tramas conceptuales evolutivas” que permitan seguir un curso de evolución
de las ideas previas de los estudiantes.
Trabajo Presencial Directo (TD): trabajo de aula con plenaria de todos los estudiantes.
Trabajo Mediado_Cooperativo (TC): Trabajo de tutoría del docente a pequeños grupos o de forma
individual a los estudiantes.
Trabajo Autónomo (TA): Trabajo del estudiante sin presencia del docente, que se puede realizar en
distintas instancias: en grupos de trabajo o en forma individual, en casa o en biblioteca, laboratorio, etc.)
IV. RECURSOS (Con Qué?)
Medios y Ayudas: Estos se refieren tanto a los físicos como humanos necesarios para la
actividad pedagógica y didáctica. No sólo se hacer referencia a las ayudas audiovisuales:
retroproyectores de acetatos, de filminas o diapositivas, y de presentación de imágenes de
computador, programas o software, sino también a la posibilidad de recursos para salidas de
campo trabajo práctico de laboratorio, requerimientos para la logística y el trabajo con invitados
o colaborativos con otros docentes en el aula.
BIBLIOGRAFÍA
TEXTOS Guías
Data Driven. DJ Patil
Cognitive Computing and Big Data Analytics.Judith Hurwitz
Building Data Science Teams.DJ Patil
Everydata: The Misinformation Hidden in the Little Data You Consume Every Day. John H.
Johnson.
Learn R in a Day. Steven Murray
Machine Learning with R Cookbook. Yu-Wei, Chiu (David Chiu)
Python Data Analysis. Ivan Idris
Python Machine Learning. Sebastian Raschka
TEXTOS COMPLEMENTARIOS
REVISTAS
DIRECCIONES DE INTERNET
V. ORGANIZACIÓN / TIEMPOS (De Qué Forma?)
Espacios, Tiempos, Agrupamientos:
Se recomienda trabajar una unidad cada cuatro semanas, trabajar en pequeños grupos de
estudiantes, utilizar Internet para comunicarse con los estudiantes para revisiones de avances y
solución de preguntas (esto considerarlo entre las horas de trabajo cooperativo).
Data Analytics
PREGRADO :
1.
2.
3.
_________________________________