Silabus Bigdata 2022-I
Silabus Bigdata 2022-I
Silabus Bigdata 2022-I
1. INFORMACION GENERAL
1.1. Nombre y código de la asignatura : BIG DATA -20118061
1.2. Número de Créditos : 03
1.3. Modalidad : No presencial (Virtual)
1.4. Número de horas semanales : 04 Horas (Teoría: 2 y Práctica: 2)
1.5. Ciclo de estudio : VI
1.6. Período académico : 2022-1
1.7. Pre – requisito : Base de datos /Diseño y análisis de algoritmos
1.8. Docentes : Ulises Román Concha
[email protected]
2. SUMILLA
La asignatura es de carácter teórico - práctico. Tiene el propósito de desarrollar habilidades
para el uso de técnicas, modelos y herramientas para el manejo de grandes volúmenes de
datos en las organizaciones e instituciones. Abarca los siguientes temas: Fundamentos de
Big Data, tipos y fuente de datos, herramientas y modelos de Data Science, Arquitectura,
infraestructura y gobierno de Big Data, Sistemas de toma de decisiones, extracción de datos
y gestión de datos-FAIR, minería de datos. Ecosistema de Hadoop/MapReduce, Aprendizaje
automatico y data warehouse. Base de datos NoSQL, Algoritmos y técnicas de explotación,
visualización y predicción de datos, Culmina con una aplicación práctica.
3. COMPETENCIAS
Sem. Estrategias
Contenidos Actividades Evaluación
Didácticas
INTRODUCCIÓN A BIG DATA Teoría (2 Hrs)
Defunción de Big Data. Modelo de
negocios. Metodologías y herramientas Definir y analizar los
para el análisis, visualización y Expositiva Conceptos y su importancia de
predicción de datos aplicadas. Casos de y Big data.
participativa Prueba de
1 éxito. Características, beneficios y entrada
arquitectura. (Video)45 min Trabajo en clase: Prueba de
Sincrónico entrada sobre Big Data
Alcances del desarrollo del curso.
Practica (2 Hrs) Explicación
del proyecto.
FUNDAMENTOS Y APLICACIÓN
DE BIOG DATA
Concepto de Data Science, data Lake, Expositiva Trabajo en clase: comprensión Participación
y continúa de
data Warehouse, Macrodatos. de los fundamentos y la los alumnos
participativa
Caracteristicas de las Vs. Arquitecura aplicación de Big data en las
de Big Data. Tipos de Big Data. organizaciones.
Aplicaciones.
Trabajo practico revisión de
2 Lectura 1: Big Data: ¿La ruta o el herramientas, metodologías a
destino? . Oracle- IEFundation, 2019 usar en un proyecto de Big
Data
FUENTE Y TIPOS DE DATOS EN
BIG DATA
Tipos de datos (Estructurados, no
estructurados y semiestructurados). Trabajo en clase:
fuentes de datos: públicos y privados. Expositiva Determinación de las fuentes
Alfabetización de los datos. Open Data. y de datos usando las Participación
Uso de las herramientas y sitio para la participativa herramientas definidas. de los
3
obtención de datos y su respectiva carga: alumnos en la
Tableau, Weka, Orange, Knime y R. Trabajo practico: Uso de las instalación y
herramientas para determinar prueba de las
herramientas
Trabajo practico: Revisión de las las fuentes de datos que
herramientas. soporta
METODOLOGIAS, HERRAMIENTAS
Y PROCESOS DE BIG DATA Trabajo en laboratorio: Uso
Internet de eventos. Descripción de las de las fuentes de datos bajo
metodologías para desarrollo de en concepto (ETL)
proyectos de Big Data. Etapas de data Expositiva
4 science. Procesos de Big Data. y Lecturas: La creación de Participación
Herramientas y plataformas para usar. participativa valor en las empresas a y desarrollo
través del Big Data practico en
laboratorios
Trabajo practico: Revisión de las etapas
de desarrollo de un proyecto de Big data
Sem. Estrategias
Contenidos Actividades Evaluación
Didácticas
MINERIA DE DATOS
Introducción a la
minería de datos.
BigData.
Aprendizaje
automático. El Trabajo en clase:
proceso KDD. La Definir la
minería de datos metodología de
9
como subproceso minería de datos y
del KDD. Conceptos Expositiva aplicar una técnica. Participación
de minería de datos. y Laboratorio: uso de y revisión de
Modelos de minería participativa WEKA, KNIME las técnicas de
MD.
de datos. Técnicas
empleadas.
Metodologías.
Herramientas de
Minería de datos.
APRENDIZAJE
AUTOMATICO-
CLASIFICACION y
REGRESION
Concepto. Aprendizaje
supervisado y no
supervisado. Trabajo de
Metodologías de laboratorio:
implementación. Instalación,
Clasificación con configuración y uso
árboles de decisión. A de anaconda
priori. Redes neuronales. navegador. Prueba
11-13 MS. Patrones de Expositiva del algoritmo de
asociación y uso de la y clasificación y de
herramienta Pyhton con participativa regresión.
las librerías sklearn.
Lectura 6: Aprendizaje
supervisado.
Exposición y
presentación de los Presentación de los
proyectos Expositiva trabajos
14-15 Participación
y en la
participativa exposición
Examen
16 EXAMEN FINAL Prueba escrita Notas
5. ESTRATEGIAS DE APRENDIZAJE
Fórmula = ( N1 + N2 + N3 )/3
7. REFERENCIAS BIBLIOGRAFICAS