0% encontró este documento útil (0 votos)
146 vistas2 páginas

Apache HBase

Una base de datos distribuida es un conjunto de múltiples bases de datos lógicamente relacionadas que se encuentran distribuidas en diferentes espacios lógicos y geográficos e interconectados por una red de comunicaciones. Apache HBase es un sistema de gestión de bases de datos distribuido y de alta eficiencia creado por la Fundación Apache que se ejecuta sobre Hadoop. HBase sigue un modelo maestro-esclavo donde el servidor maestro controla la administración y el equilibrio de carga, mientras que los servidores regionales

Cargado por

jordana
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
146 vistas2 páginas

Apache HBase

Una base de datos distribuida es un conjunto de múltiples bases de datos lógicamente relacionadas que se encuentran distribuidas en diferentes espacios lógicos y geográficos e interconectados por una red de comunicaciones. Apache HBase es un sistema de gestión de bases de datos distribuido y de alta eficiencia creado por la Fundación Apache que se ejecuta sobre Hadoop. HBase sigue un modelo maestro-esclavo donde el servidor maestro controla la administración y el equilibrio de carga, mientras que los servidores regionales

Cargado por

jordana
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 2

BASE DE DATOS DISTRIBUIDA

BASE DE DATOS QUE NO USA SQL COMO LENGUAJE PRINCIPAL DE CONSULTA

UNA BASE DE DATOS DISTRIBUIDA (BDD) ES UN CONJUNTO DE MÚLTIPLES BASES DE DATOS


LÓGICAMENTE RELACIONADAS

LAS CUALES SE ENCUENTRAN DISTRIBUIDAS EN DIFERENTES ESPACIOS LÓGICOS Y GEOGRÁFICOS


(PEJ. UN SERVIDOR CORRIENDO 2 MÁQUINAS VIRTUALES) E INTERCONECTADOS POR UNA RED DE
COMUNICACIONES.

DICHAS BDD TIENEN LA CAPACIDAD DE REALIZAR PROCESAMIENTOS AUTÓNOMOS, ESTOS


PERMITEN REALIZAR OPERACIONES LOCALES O DISTRIBUIDAS.

GOOGLE BIG TABLE

SISTEMA DE GESTION DE BASE DE DATOS CREADO POR GOOGLE CON LA CARACTERISTICA DE SER
DISTRIBUIDO Y DE ALTA EFIICIENCIA.

CARACTERISTICAS

NO GENERAN CUELLOS DE BOTELLAS

A DIFERENCIA DE SQL QUE NECESITA TRANSCRIBIR SENTENCIAS PARA SER EJECUTADA Y CADA
SENTENCIA REQUIERE NIVELES DE EJECUCION QUE SE VUELVEN MAS COMPLEJOS A MEDIDA QUE
LAS SENTENCIAS SON MAS COMPLEJAS.

ESTO RELENTIZA EL SISTEMA.

ATOMICIDAD

PROPIEDAD QUE ASEGURA QUE UNA OPERACIÓN SE REALICE O NO, NO PUEDE QUEDAR A MEDIAS.

CONSISTENCIA

PROPIEDAD QUE ASEGUA QUE EMPIEZA SOLO AQUELLO QUE PUEDE ACABAR.

AISLAMIENTO

PROPIEDAD QUE ASEGURA QUE UNA OPERACIÓN NO PUEDE AFECTAR A OTRAS.

ESTO ASEGURA QUE LA REALIZACION DE 2 TRANSACCIONES SOBRE LA MISMA INFORMACION SEAN


INDEPENDIENTES Y NO GENEREN NINGUN TIPO DE ERROR.

DURABILIDAD

PROPIEDAD QUE ASEGURA QUE UNA VEZ REALIZADA UNA OPERACIÓN ESTA PERSISTIRA EN EL
TIEMPO Y NO SE PODRA DESHACER AUNQUE FALLE EL SISTEMA.
ARQUITECTURA APACHE HBASE

MASTERSERVER - EL SERVIDOR MAESTRO.

NO FORMA PARTE DEL ALAMACENAMIENTO DE DATOS REAL PERO NEGOCIA EL EQUILIBRIO DE


CARGA EN TODOS LOS SERVIDORES DE REGION SERVER.

- MANTENER Y MONITOREAR CLUSTER HADOOP (Apache Hadoop es un framework de


software que soporta aplicaciones distribuidas bajo una licencia libre.)
- REALIZAR LA ADMINISTRACION (INTERFAZ PARA CREAR, ACTUALIZAR Y ELIMINAR TABLAS)
- CONTROLA LA COMPUTACION POR ERROR
- HMASTER MANEJA OPERACIONES DDL (Data Definition LanguagE, lenguaje de base de datos
o lenguaje de definición de datos ).

REGIONAL SERVER

NODO DE TRABAJO QUE MANEJA SOLICITUDES DE LECTURA, ESCRITURA, ACTUALIZACION Y


ELIMINACION DE CLIENTES.

EL SERVIOR DE REGION SE EJECUTA EN HDFS (Hadoop Distributed File System, sistema de ficheros
distribuido de Hadoop.)

ZOOKEEPER

SERVIDOR DE CODIGO ABIERTO QUE PERMITE UNA COORDINACION DISTRIBUIDA CONFIABLE.

ES UN SERVICIO CENTRALIZADO QUE MANTIENE LA INFORMACION DE CONFIGURACION, NOMBRES,


LA SINCRONIZACION DISTRIBUIDA Y LOS SERVICIOS DE GRUPOS.

QUIENES USAN APACHE HBASE?

ADOBE: TIENE ALREDEDOR DE 30 NODOS QUE EJECUTAN HDFS, HADOOP,

MAPREDUCE(modelo de programación para dar soporte a la computación paralela sobre grandes


colecciones de datos en grupos de computadoras)

Y HBASE DE 5 A 4 NODOS TANTO PARA PRODUCCION COMO DESARROLLO.

YAHOO: UTILIZA PARA CONSULTAR DOCUMENTOS DUPLICADOS CON TRAFICO TEMPORAL.

FACEBOOK: PARA ALIMENTAR SU INFRAESTRUCTURA DE MENSAJES

MOZILLA: MOVIERON EL PROYECTO SOCORRO A HBASE (PROYECTO PARA ESTADISTICA DE FALLAS)

MENDELEY: PLATAFORMA PARA QUE INVESTIGADORES COLABOREN Y COMPARTAN SUS


INVESTIGACIONES EN LINEA.

HBASE ESTA AYUDANDO EN LA CREACION DE COLECCIÓN DE DOCUMENTOS ALMACENANDO DATOS


IMPORTADOS SIN PROCESAR

TWITTER: EJECUTA HBASE EN TODO SU CLUTER HADOOP.

PROPORCIONA UNA COPIA DE SEGURIDAD DISTRIBUIDA DE LECTURA ESCRITURA DE TODAS LAS


TABLAS MYSQL EN EL BACKEND DE PRODUCCION DE TWITTER

También podría gustarte