Tema 06 - Inteligencia de Negocios (Parte 1)

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 19

Minería de Datos

ARQUITECTURA Y HERRAMIENTAS DE BI (PARTE I)

PROF. LEANDRO FONDEUR


ITLA
Qué vimos?
Granularidad
Agregación
Proceso ETL
Área Staging
Qué veremos?
Arquitectura BI
Metadata
Jerarquía
Herramientas OLAP
Concepto FASMI
Búsquedas en el cubo OLAP
Arquitectura de BI
Metadata
• Nos explicita todos los atributos de las tablas, de los sistemas de
donde provienen, así como la definición de cada uno de los atributos
de las mismas
• Puede incorporar también si los campos son recalculados o
transformados y el detalle de las transformaciones que se han
llevado a cabo
• Gestión del Metadata: Proveer un repositorio donde definir,
documentar y gestionar la información del proceso ETL y su
ejecución. El Metadata debería ser accesible también desde otras
aplicaciones
Metadata (Cont.)
• Es el repositorio central de información de la información
• Nos da el significado de cada uno de los componentes y sus
atributos que residen en el Data Warehouse (o Data Mart)
• La información que contiene el Metadata es útil para los
departamentos de tecnología y los propios usuarios
• Puede incluir definiciones de negocio, descripciones detalladas de
los tipos de datos, formatos y otras características
Metadata (Cont.)
• El personal de los departamentos de Tecnología necesita saber los
orígenes de la información: bases de datos de las que obtenemos
los datos, qué transformaciones realizamos, criterios de filtros de
información, nombre de las columnas y de las tablas, plazos de
carga, utilización, etc.

• Los usuarios necesitan saber las entidades y sus atributos, cómo


han sido calculados, quiénes son los responsables de los datos, los
informes disponibles, los flujos de distribución de la información,
etc.
Metadata (Cont.)
• La construcción del Metadata supone que se defina el significado de
cada una de las tablas y cada uno de los atributos que se cargan en el
Data Warehouse.
• Este es un punto complejo de todo proyecto, ya que obliga a que se
definan los conceptos de negocio y se homogeneicen entre los
distintos departamentos, filiales, etc.
• Obliga a que todos los componentes de la organización hablen
utilizando la misma terminología y con el mismo significado
Jerarquías
• La existencia de las jerarquías en las
dimensiones nos permite pasar del
máximo detalle a la agregación en
los distintos niveles
• Nos permite agregar o desagregar la
información
• Nos permiten hacer agrupaciones
• Cambiar el orden de las distintas
dimensiones en función de las
necesidades de consulta
Herramientas OLAP
• Los usuarios necesitan analizar información a distintos niveles
de agregación y sobre múltiples dimensiones
• Los usuarios pueden hacer este análisis al máximo nivel de
agregación o al máximo nivel de detalle
• A estos tipos de análisis les llamamos multidimensionales,
porque nos facilitan el análisis de un hecho desde distintas
perspectivas o dimensiones
• La visualización de la información es independiente respecto
de cómo se haya almacenado
Concepto FASMI que los productos OLAP
deben cumplir
FAST (Rápido): Debe ser rápido, necesitamos lanzar consultas y ver
los resultados inmediatamente
ANALYSIS (Análisis): Debe soportar la lógica de negocio y análisis
estadísticos que sean necesarios para los usuarios
SHARED (Compartido): Debe apoyar el intercambio y la
accesibilidad. Debe mantener la integridad de la información al
proporcionar confidencialidad (seguridad) y administrar el acceso
concurrente
MULTIDIMENSIONAL (Multidimensional): Tiene que proveer una
visión conceptual de la información a través de distintas dimensiones
INFORMATION (Información): Debe poder manejar toda la
información relevante y la información derivada
La representación gráfica del OLAP son
los cubos

Los contenidos de OLAP permite


cada uno de los que
cubos individuales cada uno de los
recogen lo que cubos
llamamos individuales
“hechos” pueda contener
más de un
hecho
Búsqueda: Slice and Dice

Slice: Selecciona una


dimensión en particular
de un cubo dado y
proporciona un nuevo
sub-cubo
Búsqueda: Slice and Dice (Cont.)

Dice: Selecciona dos o


más dimensiones de un
cubo dado y proporciona
un nuevo sub-cubo
Búsqueda: Pivot

Pivot: Rota el cubo,


proporcionando una vista
alternativa de los datos
Búsqueda: Roll-up and Drill-down
Búsqueda: Roll-up and Drill-down (Cont.)
Roll-up: Ver el máximo nivel de agregación en atributos de una
dimensión sobre los que se ha definido una jerarquía

Drill-down: Bajamos a más detalle en atributos de una


dimensión sobre los que se ha definido una jerarquía
Búsqueda: Roll-up and Drill-down (Cont.)

También podría gustarte