0% encontró este documento útil (0 votos)
333 vistas5 páginas

Resumen Data Warehouse.

El documento trata sobre la definición y la historia del almacenamiento de datos. Explica que un almacén de datos centraliza y organiza los datos de toda la empresa para su análisis. También describe las diferentes metodologías de diseño propuestas por Bill Inmon y Ralph Kimball.

Cargado por

Huguito Barrios
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
333 vistas5 páginas

Resumen Data Warehouse.

El documento trata sobre la definición y la historia del almacenamiento de datos. Explica que un almacén de datos centraliza y organiza los datos de toda la empresa para su análisis. También describe las diferentes metodologías de diseño propuestas por Bill Inmon y Ralph Kimball.

Cargado por

Huguito Barrios
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 5

Almacenamiento de Datos.

Esta definicin del almacn de datos se centra en el almacenamiento de datos. La principal fuente de los datos se limpia, se transforma, catalogado y puesto a disposicin para su uso por los administradores de negocios y otros profesionales de la minera de datos , procesamiento analtico en lnea , estudios de mercado y apoyo a las decisiones (Marakas y O'Brien 2009). Sin embargo, los medios para recuperar y analizar los datos, para extraer, transformar y cargar datos, y para administrar el diccionario de datos tambin se consideran componentes esenciales de un sistema de almacenamiento de datos. Muchas referencias al almacenamiento de datos utilizan este contexto ms amplio. Por lo tanto, una definicin ms amplia para el almacenamiento de datos incluye herramientas de inteligencia empresarial , herramientas para extraer, transformar y cargar datos en el repositorio, y herramientas para gestionar y recuperar los metadatos .

Historia.
El concepto de almacenamiento de datos se remonta a finales de 1980, cuando los investigadores de IBM Barry Devlin y Paul Murphy desarroll el negocio de almacenamiento de datos ". En esencia, el concepto de almacenamiento de datos tena por objeto proporcionar un modelo de arquitectura para el flujo de datos de los sistemas operativos para entornos de apoyo a la decisin. En las grandes empresas era tpico para mltiples entornos de apoyo a la decisin de operar de forma independiente. Aunque cada entorno servido diferentes usuarios, que a menudo requiere gran parte de la misma los datos almacenados. El proceso de recoleccin, limpieza y la integracin de datos de diversas fuentes, por lo general de largo plazo de los sistemas operativos existentes (normalmente se conoce como sistemas de legado), era tpicamente en la parte replicada para cada entorno. Principales acontecimientos en los primeros aos de almacenamiento de datos fueron los siguientes: 1960 - General Mills y el Dartmouth College , en un proyecto conjunto de investigacin, desarrollar los trminos de dimensiones y hechos . 1970 - ACNielsen e IRI proporcionar data marts dimensionales para las ventas al por menor. 1970 - Bill Inmon comienza a definir y discutir el trmino: almacenamiento de datos 1983 - Teradata introduce un sistema de gestin de base de datos diseada especficamente para apoyar las decisiones. 1988 - Barry Devlin y Paul Murphy publicar el artculo Una arquitectura de la informacin y los sistemas empresariales de IBM Systems Journal en el que introducir el trmino "negocio de almacenamiento de datos". 1990 - Daniel Linstedt comienza a trabajar sobre el desarrollo de la Bveda de modelo de datos y la metodologa para almacenes de datos 1990 - Red Brick Systems lanza Red Brick Warehouse, un sistema de gestin de base de datos especficamente para el almacenamiento de datos. 1991 - Soluciones Prisma Prisma introduce Warehouse Manager, el software para el desarrollo de un almacn de datos. 1991 - Bill Inmon publica el libro Construyendo el almacn de datos . 1995 - El Data Warehousing Institute, una organizacin sin fines de lucro que promueve el almacenamiento de datos, es fundada. 1995 - Daniel Linstedt aade SEI / CMMI y Six Sigma a la Bveda de Metodologa de datos para gestionar los proyectos de almacenamiento de datos. 1996 - Ralph Kimball publica el libro El kit de herramientas de Data Warehouse . 2000 - Daniel Linstedt libera el almacenamiento de datos , lo que permite en tiempo real de datos auditables almacn de Almacenes.

Hacia Abajo Diseo Top


Bill Inmon , uno de los primeros autores sobre el tema del almacenamiento de datos, ha definido un almacn de datos como un repositorio centralizado para toda la empresa. Inmon es uno de los principales proponentes de la de arriba hacia abajo enfoque para el diseo de almacenamiento de datos, en el que el almacn de datos est diseada con una empresa normalizada modelo de datos . "Atomic" de datos , es decir, los datos en el nivel ms bajo de detalle, se almacenan en el data warehouse. data marts dimensionales que contienen los datos necesarios para los procesos de negocio especficos o departamentos especficos se crean a partir del almacn de datos. En la visin Inmon el almacn de datos est en el centro de la "Fbrica de Informacin Corporativa" (CIF), que proporciona un marco lgico para la entrega de Business Intelligence (BI) y gestin de capacidades empresariales. Inmon indica que el almacn de datos es: Asunto orientada Los datos en el almacn de datos est organizada de manera que todos los elementos de datos relativos al mismo evento en el mundo real o el objeto estn unidos entre s. No voltil Los datos en el almacn de datos nunca son sobre-escrito o eliminado - una vez cometidos, los datos son estticos y de slo lectura, y conservados para la presentacin de informes en el futuro. Integrado El almacn de datos contiene datos de la mayora o la totalidad de los sistemas operativos de una organizacin y estos datos se hacen compatibles. Tiempo de la variante El diseo de la metodologa abajo-arriba dimensiones genera opiniones muy consistente de datos a travs de mercados de datos ya que todos los puestos de datos se cargan desde el repositorio centralizado. Comienzo de la pgina hacia abajo diseo tambin ha demostrado ser robusto frente a los cambios del negocio. Generacin de nuevos puestos de datos dimensional frente a los datos almacenados en el almacn de datos es una tarea relativamente sencilla. La desventaja principal de la metodologa de arriba hacia abajo es que representa un proyecto muy grande con un alcance muy amplio. El costo inicial para la implementacin de un almacn de datos utilizando la metodologa de arriba hacia abajo es importante, y la duracin de tiempo desde el inicio del proyecto hasta el punto de que los usuarios experimentar los beneficios iniciales pueden ser considerables. Adems, la metodologa de arriba hacia abajo puede ser inflexible y no responde a las cambiantes necesidades de los departamentos durante las fases de ejecucin.

Beneficios.
Algunos de los Beneficios que Proporciona un Almacn de Datos son los Siguientes: Un almacn de datos proporciona un modelo de datos comn para todos los datos de inters independientemente de la fuente de los datos. Esto hace que sea ms fcil informar y analizar la informacin de lo que sera si los modelos de datos mltiples se utilizan para recuperar informacin, tales como facturas de venta, recibos de orden, los cargos del libro mayor, etc Antes de cargar datos en el almacn de datos, las inconsistencias se identifican y resuelven. Esto simplifica enormemente la presentacin de informes y anlisis. Informacin en el almacn de datos est bajo el control de los usuarios de almacenamiento de datos para que, incluso si el origen de datos del sistema se purga a travs del tiempo, la informacin en el almacn se puede almacenar de forma segura durante perodos prolongados de tiempo. Debido a que son independientes de los sistemas operativos , los almacenes de datos ofrecen la recuperacin de datos sin ralentizar los sistemas operativos.

Los almacenes de datos pueden trabajar en conjunto con y, por tanto, aumentar el valor de las aplicaciones de negocio operativos, en particular la gestin de relaciones con clientes (CRM). Los almacenes de datos facilitan la toma aplicaciones del sistema de apoyo, como informes de tendencias (por ejemplo, los elementos con la mayora de las ventas en un rea en particular en los ltimos dos aos), informes de excepcin, y los informes que muestran el rendimiento real en comparacin con los objetivos. Los almacenes de datos se puede registrar la informacin histrica para las tablas de origen de datos que no estn preparados para guardar un historial de actualizaciones.

Ejemplos de aplicacin:
Algunas de las aplicaciones de almacenamiento de datos se puede utilizar para son: Apoyo a las decisiones Anlisis de tendencias Previsin financiera Abandono de prediccin para los suscriptores de Telecom, los usuarios de tarjetas de crdito, etc Seguro de anlisis de fraudes Llame al anlisis de registros Logstica y Gestin de inventario Agricultura

Bill Inmon.

Fue uno de los primeros autores en escribir sobre el tema de los almacenes de datos, define un data warehouse (almacn de datos) en trminos de las caractersticas del repositorio de datos: Orientado a temas.- Los datos en la base de datos estn organizados de manera que todos los elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre s. Variante en el tiempo.- Los cambios producidos en los datos a lo largo del tiempo quedan registrados para que los informes que se puedan generar reflejen esas variaciones. No voltil.- La informacin no se modifica ni se elimina, una vez almacenado un dato, ste se convierte en informacin de slo lectura, y se mantiene para futuras consultas. Integrado.- La base de datos contiene los datos de todos los sistemas operacionales de la organizacin, y dichos datos deben ser consistentes. Inmon defiende una metodologa descendente (top-down) a la hora de disear un almacn de datos, ya que de esta forma se considerarn mejor todos los datos corporativos. En esta metodologa los Data marts se crearn despus de haber terminado el data warehouse completo de la organizacin.

Ralph Kimball.

Un conocido autor y el almacenamiento de datos, es un defensor de un enfoque para el diseo de almacenes de datos que describe como de abajo hacia arriba. En la de abajo hacia arriba enfoque datos marts son creados para proporcionar informacin y capacidad analtica para determinados procesos de negocio . Aunque es importante sealar que en la metodologa de Kimball, el proceso de abajo-arriba es el resultado de un negocio inicial orientada hacia abajo el anlisis de lbumes de la empresa los procesos pertinentes para ser modelada. Conocido autor en el tema de los data warehouse, define un almacn de datos como: "una copia de las transacciones de datos especficamente estructurada para la consulta y el anlisis". Tambin fue Kimball quien determin que un data warehouse no era ms que: "la unin de todos los Data marts de una entidad". Defiende por tanto una metodologa ascendente (bottom-up) a la hora de disear un almacn de datos.

Evolucin de la Organizacin del uso.

En lnea almacn de datos operacionales


Los almacenes de datos se desarrollan copiando los datos fuera de un sistema operativo a otro servidor donde la carga de procesamiento de la informacin contra los datos copiados no afecta el rendimiento del sistema operativo.

En lnea de almacenamiento de datos


Los almacenes de datos se actualizan los datos en los sistemas operativos de forma regular y se almacenan en una estructura de datos diseada para facilitar la presentacin de informes.

En tiempo real de almacenamiento de datos


Los almacenes de datos se actualizan cada vez que un sistema operativo realiza una transaccin (por ejemplo, una orden o un parto o una reserva).

Integrada de almacenamiento de datos


Estos almacenes de datos se encargan de reunir datos de diferentes reas de negocio, para que los usuarios pueden buscar la informacin que necesitan a travs de otros sistemas.

BENEFICIOS
Modelo de datos en comn Facilidad para informar y analizar la informacin Una mejor presentacin de informes y anlisis Ofrecen la recuperacin de datos sin ralentizar los sistemas operativos Facilitan la toma de aplicaciones del sistema de apoyo, como informes de tendencias Se puede registrar la informacin histricas para las tablas de origen de datos

Ejemplos de Aplicacin:
Apoyo a las decisiones Anlisis de tendencias Previsin financiera Abandono de precisin para los suscriptores telecom, los usuarios de tarjetas de crdito, etc. Seguir de anlisis de fraudes Llame al anlisis de registro Lgica y gestin de inventario

También podría gustarte