Bodega de Datos
PLASCENCIA LOPEZ BERENICE
SUAREZ CASILLAS DENISSE GUADALUPE
Características de la bodega de datos
Integradas: Porque consolidan y centralizan datos derivados de toda la
organización.
Orientada a un tema en particular: Ya que los datos que contienen, están
organizados por temas, totalizados y optimizados para dar respuestas a
preguntas de diversas áreas funcionales de la organización.
Variantes en el tiempo: Porque contrario a las bases de datos
operacionales que se centran en los datos actuales, las bodegas de datos
representan el flujo de información a través del tiempo.
No volátiles: Porque una vez que los datos son almacenados, estos nunca
son removidos, ya que representan la historia de la organización.
Una Bodega de Datos se modela generalmente de forma
multidimensional. Esta organización de la información facilita el
análisis de los datos y la concepción de las consultas. El modelo
multidimensional como su nombre lo sugiere, consiste de un
conjunto de dimensiones que son asociadas a un fenómeno
medible de interés para una organización, dicho fenómeno es
denominado hecho.
1.2 Diferencia entre las base de datos
transaccionales y base de datos de soporte en
la toma de decisiones
¿Qué es una base de datos transaccionales?
Es un tipo de sistema de información diseñado para recolectar, almacenar,
modificar y recuperar todo tipo de información que es generada por las
transacciones en una organización.
¿Qué es una base de datos de soporte en la toma de
decisiones?
Es un conjunto de programas y herramientas que permiten obtener de
manera oportuna la información que se requiere mediante el proceso de la
toma de decisiones que se desarrolla en un ambiente de incertidumbre.
Una de las diferencias es que como los nombres lo dicen una habla
de transacciones de una organización y la otra de soporte en la
toma de decisiones.
En la transaccional se permite recolectar, almacenar, modificar y
recuperar todo tipo de información que se genera al momento de
cualquier transacción.
Y en soporte en la toma de decisiones se obtiene de manera
oportuna la información que se requiere al momento de la toma de
decisión.
Arquitectura Física y Lógica
La arquitectura física expresa cuáles son los componentes físicos
(cliente, servidor, servidor web, BD, etc.) que participan en nuestra
solución, así como la relación entre ellos.
La especificación de la arquitectura física normalmente consta de
uno o más diagramas, y la explicación de los mismos (actores y
relaciones entre ellos).
En la explicación de los diagramas se debe especificar el nombre y
la función de cada actor, y el tipo de relación que existe entre ellos
(si existe alguna). También se puede incluir ejemplo aclaratorios de
puntos un tanto abstractos
La arquitectura lógica expresa cuáles son los componentes lógicos
(subsistemas, o macro-funciones) que participan en nuestra
solución, y la relación entre ellos.
La especificación de esta arquitectura es similar a la arquitectura
física. Se especifican los actores y las relaciones entre ellos, sólo
que los actores ahora son subsistemas de mi solución o macro-
funciones de la misma.
En los diagramas que expresan tanto la arquitectura lógica como
la física, se puede utilizar casi cualquier simbología que clarifique al
menos que existan restricciones al respecto.
Diseño de una bodega de Datos
Esquema de estrella: En
este diseño del almacén de
datos la tabla de Variables
(Hechos) esta rodeada por
Dimensiones y juntos
forman una estructura que
permite implementar
mecanismos básicos para
poder utilizarla con una
herramienta de consultas.
Esquema en copos de nieve: es
una variedad más compleja del
esquema estrella. El afinamiento
está orientado a facilitar
mantenimiento de dimensiones.
Lo que distingue a la arquitectura
en copo de nieve de la esquema
estrella, es que las tablas de
dimensiones en este modelo
representan relaciones
normalizadas y forman parte de
un modelo relacional de base de
datos.
Esquema de constelación de hechos:
Este esquema es más complejo que las
otras arquitecturas debido a que
contiene múltiples tablas de hechos.
Con esta solución las tablas de
dimensiones pueden estar compartidas
entre mas de una tabla.
Este tiene mucha flexibilidad, y este
factor es su grande virtud. Sin embargo,
el problema es que cuando el número
de las tablas vinculadas aumenta, la
arquitectura puede llegar a ser muy
compleja y difícil para mantener.
1.4 Herramientas OLAP y
DATASET
En principio, cabe destacar que el término OLAP son las siglas derivadas de su
nombre en inglés, On-Line Analytical Processing, que define la función de la
herramienta, la cual básicamente consiste en el procesamiento de la información Para su
funcionamiento,
mediante un método analítico en línea. OLAP se vale de
estructuras
Dentro del mundo de las soluciones empresariales para lo cual se utilizan multidimensionales,
sistemas informáticos basados en los parámetros del Business Intelligence, se ha denominadas
convertido en un elemento esencial para el procesamiento de la información también Cubos
OLAP, en las que se
trascendente para optimizar las operaciones productivas. contienen diferentes
resúmenes de los
datos extraídos de
Una de las características fundamentales por las cuales la herramienta OLAP es las bases de datos
ampliamente utilizada por distintas empresas, reside en que la misma brinda una mayores.
solución ideal para llevar a cabo consultas de los datos de manera sencilla y veloz.
El conjunto de herramientas Dataset de red contiene herramientas
utilizadas para realizar tareas de mantenimiento de datasets de red, tales
como generar y disolver datasets de red.
Herramienta Descripción
Construir red Reconstruye la conectividad de la red y la información del atributo
de un dataset de red. Es necesario reconstruir el dataset de red
después de realizar ediciones en los atributos o las entidades de
una clase de entidad de origen participante. Después de que se
editan las entidades de origen, la herramienta establece la
conectividad de la red sólo en las áreas que fueron editadas para
agilizar el proceso de construcción, sin embargo, cuando se editan
los atributos de la red, se reconstruye la extensión completa del
dataset de red. En el caso de un dataset de red grande,
posiblemente esta operación sea lenta.
Disolver red Crea un nuevo dataset de red que minimiza la cantidad de
entidades de línea requeridas para modelar correctamente el
dataset de red de entrada. El dataset de red de salida más eficiente
reduce el tiempo necesario para resolver análisis, dibujar resultados
y generar las indicaciones para conducir. Esta herramienta genera
como salida un nuevo dataset de red y clases de entidad de origen;
el dataset de red de entrada y las entidades de origen permanecen
sin cambios.
Actualizar red Actualiza el esquema del dataset de red. La actualización del
dataset de red permite que el dataset de red haga uso de las
nuevas funcionalidades disponibles en la versión actual del
software.
Barra de herramientas de dataset LAS en ArcMap