0% encontró este documento útil (0 votos)
38 vistas3 páginas

Resumen Cap2

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 3

Data warehouse 2

Tecnicas de modelado dimensional

1. CONCEPTOS FUNDAMENTALES
*Reúne datos y requisitos empresariales reales:
Agrupa las necesidades del equipo para entender las necesidades del negocio, y las realidades del dato subyacente.

*Workshops de diseño dimensional colaborativo:


Los modelos dimensionales tendrían que ser diseñados en colaboración con expertos de asunto

*Cuatro pasos de Proceso de diseño


1. Seleccionar el proceso empresarial.
2. Declarar el grano.
3. Identificar las dimensiones.
4. Identificar los hechos.

*Proceso de negocio:
son las actividades operacionales hechas por la organización, Generan la captura de métricas que se traducen en tablas de
hechos. Se elije el proceso como proceso específico y luego el grano, dimensiones y hechos para ser declarados.

*Grano
se refiere a la especificidad a la que se define un nivel de detalle en una tabla, es decir, si hablamos de una jerarquía la
granularidad empieza por la parte más alta de la jerarquía, siendo la granularidad mínima, el nivel más bajo. En Data
Warehouse, no solo existe granularidad para las tablas de hechos (Fact's), también existe granularidad en las dimensiones. ​El
grano establece
Exactamente lo que una fila de mesa de hecho sola representa. El grano declaration deviene un contrato obligatorio en el
diseño. El grano tiene que ser declarado antes de escoger dimensiones
O hechos porque cada dimensión de candidato o el hecho tienen que ser compatibles con el grano.
Esta consistencia aplica una uniformidad encima todos los diseños dimensionales que es crítico a
BI Rendimiento de aplicación y facilidad de uso. El grano atómico refiere al nivel más bajo en
Qué dato está capturado por un proceso empresarial dado.Se debe empezar seleccionando ese grano.

*Dimensiones para un contexto descriptivo


Proporciona el contexto que rodea a un acontecimiento de proceso empresarial. Se usan para filtering y agrupado de hechos.
El grano de un hecho permite identificar dimensiones.
*Hechos para Medidas
*Esquemas estrellas y cubos OLAP

2. TECNICAS BASICAS DE TABLAS DE HECHOS


*Estructura de la tabla de hechos:​ Contiene las medidas provenientes de una operacion, contiene llaves foraneas de las
tablas de dimensiones asociadas.

*Aditivo, semi aditivo, no aditivo, hechos: ​medida aditiva que puede ser sumada atraves de todas las dimensiones,
balances que son semiaditivas porque ignorar ciertas dimen. como el tiempo, los ratios son no aditivos.

*​Nulos en una tabla de hechos:​ No hay problema con funciones agregadas, solo evitarla como llaves foraneas en la tabla de
hechos por violar la integridad referencial. la dim deberia tener una columna por defecto como llave subrogada.

*Hechos conformados:​ cuando hay medidas iguales en dif TdH, evaluar si la def tecnica es correcta, si lo es, llamar a las
TdH conformados iguales, sino diferentes.

*Tablas de hechos de transacciones:​ columna en TdH=medida en spacetime, grano de transacción atómica permite el
máximo corte, Los hechos numéricos medidos deben ser
consistente con la transacción de grano.

*Snapshots periódicos de tablas de hechos: ​sumarizar acontecimientos sobre un periodo de un dia, semana, etc el grado
es el periodo no la transacción individual.

*Snapshots de tablas de hechos acumuladas:​ sumarizar ​los


acontecimientos de medida
Ocurriendo en pasos previsibles entre el principio y el fin de un proceso
*Tabla de hechos sin medidas (Factless):​ ​El
acontecimiento meramente graba un conjunto de las entidades
dimensionales que vienen juntos en un momento. No tener un hecho numérico grabado

*Tablas de hechos Agregadas o Cubos OLAP:​ ​Mesas


de hecho del conjunto son sencillas numéricos rollups
de dato de mesa de hecho atómico construyó sólo Para acelerar rendimiento de consulta.

c​ onveniente de combinar hechos de los procesos múltiples juntos a un solos


*​TdE consolidadas: ​
Mesa de hecho consolidado si pueden ser expresados en el mismo grano.

3. TÉCNICAS BÁSICAS DE DIMENSIONES


*Estructura de una TdD
*Llave subrogada
*LLave natural, durable y supernatural
*Drilling down
*Dimensiones degeneradas
*Dimensiones denormalizadas y aplanadas
*Múltiples jerarquías en Dimensiones
*Banderas e indicadores como atributos textuales
*Atributos nulos en Dimensiones
*Calendar Date en Dimensiones
*Juego de roles en dimensiones
*Dimensiones basura (junk)
*Dimensiones Copo de nieve (snowflaked)
*Outrigger Dimensions

4. INTEGRACIÓN VÍA DIMENSIONES CONFORMADAS


*Dimensiones conformadas
*Dimensiones encogidas
*Drilling cruzado
*Cadena de valor
*Arquitectura de bus de Data Warehouse Empresarial
*Bus matrix de Data Warehouse empresarial
*Implementación detallada del Bus Matrix
*​Oportunidad / Matriz de partes interesadas

5. Lidiando con los atributos de dimensión lentamente cambiantes


● Type 0: Retain Original
● T1: Sobre escribir
● T2: Add new row
● T3: Add new atributo
● T4: Add mini-dimension
● T5: Add mini-dimensión y un Tipo 1 Outrigger
● T6: Add atributos de tipo 1 a la dimensión de tipo 2
● T7: Dual en T1 y T2 para una dimensión
6. Lidiando con las jerarquías en una dimensión
● Jerarquías posicionales de profundidad fija:
Una jerarquía de profundidad fija es una serie de relaciones de varios a uno, como el producto
Marca a categoría a departamento. Cuando se define una jerarquía de profundidad fija y
los niveles de jerarquía han acordado los nombres, los niveles de jerarquía deben aparecer
como atributos posicionales separados en una tabla de dimensiones. Una jerarquía de profundidad fija es
de lejos, el más fácil de entender y navegar siempre que se cumplan los criterios anteriores.
También ofrece un rendimiento de consulta predecible y rápido. Cuando la jerarquía no es
una serie de relaciones de muchos a uno o la cantidad de niveles varía de tal manera que la
Los niveles no tienen nombres acordados, una técnica de jerarquía irregular, descrita
abajo, debe ser usado

● Jerarquías de profundidad levemente irregular / variable


● Jerarquías de profundidad irregular / variable con tablas de puente de jerarquía
● Jerarquías de profundidad irregular / variable con atributos de cadena de ruta
7. Técnicas avanzadas para Tablas de Hechos
● *Tabla de hechos Claves sustitutas (subrogadas)
● *Cifras de Ciempiés
● *Valores numéricos como Atributos o Hechos
● *Lag/Duration Hechos
● *Titular/Linea TdH
● *Hechos asignados
● *Tablas de datos de ganancias y pérdidas utilizando asignaciones
● *Hechos de divisas múltiples
● Unidades de medida múltiple hechos
● Hechos de Año a Fecha
● Multipass SQL para evitar uniones de tablas fact-to-fact
● Seguimiento del intervalo de tiempo en tablas de hechos
● Hechos de llegada tardía

8. Técnicas avanzadas de dimensión


● Dimensiones de una tabla de dimensiones
● Dimensiones multivaloradas y mesas puente.
● Tablas de puente multivalor que varían en el tiempo
● Comportamiento etiqueta serie temporal
● Grupos de estudio de comportamiento
● Hechos agregados como atributos de dimensión
● Bandas de valor dinámico
● Dimensión de los comentarios de texto
● Múltiples zonas horarias
● Tipo de medida Dimensiones
● Dimensiones del paso
● Dimensiones intercambiables en caliente
● Dimensiones genéricas abstractas
● Dimensiones de la auditoría
● Dimensiones de llegada tardía:

9. Esquemas de propósito especial


● Esquemas de supertipo y subtipo para productos heterogéneos:​ Construir las tablas core y custom fact tables
que contengan todas las intersecciones de los hechos de todos los tipos de cuenta junto con una tabla de
dimensiones con todos los atributos comunes, luego separar fact tables con DT por cada subtipo.
● Tablas de datos en tiempo real:​ Actualizadas con mayor frecuencia. Depende del DBMS o el cubo OLAP usado.
“Partición en caliente” se define como una fact table anclada en memoria física donde agregaciones e índices no son
construidos sobre tal partición. Aplazar actualizaciones para terminar consultas tambien es valido.
● Esquemas de evento de error:​ Un DW requiere un sistema a base de pantallas de calidad del dato, cuando se
detecta un error, se almacena en un tabla de hechos cuyo grano es el acontecimiento de error individual y otra tabla
de hechos cuyo grano es cada columna en cada tabla que participó en el evento de error.

También podría gustarte