Examen BIG DATA
Examen BIG DATA
Examen BIG DATA
0 TEMA 2
Alumno: Javier Ruiz Palafox
1.- Mediante un ejemplo explique las 8 dimensiones de BIG DATA
Los datos estructurados, son aquellos que se encuentran ordenados, por ejemplo
en:
Una tabla Excel
Hojas de calculo
Bases de datos de cualquier otro tipo
Aplicaciones para realizar cuestionario tipo test
Formularios web
Fichas estandarizadas de clientes
Encuestas a usuarios de un servicio
Se encuentran organizados mediante una serie de filas y columnas bien definidas.
Los datos no estructurados al contrario del pasado, los datos no se pueden usar
en una base de datos tradicional, ya que seria imposible ajustarlos a las filas y
columnas estandarizadas.
No obstante, existen aplicaciones que pueden procesar mas de 1000 tipos de
formatos no estructurados, hay tipos de datos no estructurados de uso común
como los siguientes:
Documentos de oficina en archivos de texto
Archivos de imágenes
Archivos PDF
Datos de redes sociales como Facebook y Twitter o de plataformas como
Youtube.
Grabaciones telefónicas, archivos de audio como MP3.
Los datos híbridos son la combinación de los datos estructurados y no
estructurados y un ejemplo de este tipo como antes lo mencione puede ser el
buscador GOOGLE ya que se encuentran estos dos tipos juntos.
4.- ¿Cuáles son y en qué consisten los tipos de datos de acuerdo a su origen?
Aunque no existe un criterio único para categorizar los tipos de datos lo mas
extendido es dividirlos en 5 grupos:
Web y redes sociales: Es toda la información sobre clicks en vínculos y
elementos, búsquedas en Google, contenido web.
Comunicación entre maquinas: Son las lecturas RFID, las señales GPS,
otros sensores como parquímetros, cajeros, etc.
Transacciones: Aquí entran los registros de comunicaciones como
llamadas, mensajería, los registros de facturación como pagos con tarjetas,
pago online, etc.
Biométricos: Es el reconocimiento facial, toda la información genética ADN.
Generados por personas: Pueden ser grabaciones a operadores de
atención al cliente, email y registros médicos electrónicos entre otros.
5.- ¿Cuáles son y en qué consisten las fases de BIG DATA?
Las fases del ciclo de vida del BIG DATA son las siguientes:
1. Análisis interno: Se debe comenzar con la comprensión del negocio y una
justificación de la necesidad de llevar a cabo un análisis de este tipo, así
como el establecimiento de los objetivos que se desean alcanzar.
2. Recogida y filtrado de datos: se dedica a identificar aquellos datos
relevantes para el análisis, identificando las fuentes para encontrar patrones
y correlaciones.
3. Extracción de datos: El objetivo principal de los datos es transformar éstos
en información. En esta etapa se lleva a cabo la extracción de datos y su
transformación en un formato comprensible para poder hacer un análisis de
datos.
4. Validación y limpieza de datos: Los datos erróneos o inválidos pueden dar
lugar a resultados falsos que perjudiquen al análisis. La naturaleza no
estructurada del Big Data dificulta la validación de los mismo. Por ello, esta
etapa del Ciclo de Vida del Big Data es fundamental, ya que permite llegar
a los datos más relevantes para los objetivos marcados.
5. Análisis de los datos: En esta etapa se desarrolla la integración de
conjuntos de datos con el fin de dar una visión unificada de la información.
A lo largo de esta etapa del ciclo se pueden presentar varios problemas de
estructura de los datos y etiquetas.
6. Visualización de los datos: Una vez organizados los datos, es necesario
transformarlos en información que aporte valor. Toda la información útil
extraída ha de “traducirse” en forma de informes que permitan la correcta
interpretación de estos.
6.- Elabore un mapa conceptual de los PODCAST en el cual incluya información
sobresaliente de cada episodio.