Examen BIG
Examen BIG
Examen BIG
Características principales
Acceso al código fuente
Licencias abiertas
Colaboración comunitaria
WordPress
Fase de Map
aplica una función a cada elemento de un conjunto de datos de entrada para generar
un conjunto intermedio de pares clave-valor. La función de mapa es responsable de
transformar los datos de entrada en un formato que pueda ser procesado en la fase
de reducción
Implementaciones Populares
Características de HDFS
• Escalabilidad:
• Alta disponibilidad
• Tolerancia a fallos:
• Optimización para lectura/escritura de grandes volúmenes
• Acceso basado en flujo de datos
Arquitectura de HDFS
La arquitectura de HDFS se compone de dos tipos principales de nodos: el
NameNode y los DataNodes
1. **NameNode**:
- Actúa como el maestro del clúster HDFS.
2. **DataNodes**:
- Son los nodos trabajadores que almacenan los datos reales.
- Cada archivo se divide en bloques de tamaño fijo (por defecto, 128 MB) y estos
bloques se replican en varios DataNodes.
1. Bibliotecas y Utilidades.
2. Configuración
3.Seguridad
Uso Monitoreo y análisis de logs en tiempo real para obtener información sobre el
rendimiento y el estado de los sistemas distribuidos.
Flume
Hive
Resumen
Simplicidad:
Interoperabilidad: Puede interactuar con otros componentes del ecosistema Hadoop, como HDFS y YARN.