Analyse OLAP Et Algèbre Multidimensionnelle

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 26

Analyse OLAP et Algèbre

multidimensionnelle
Systèmes ROLAP, MOLAP
et HOLAP

1
Plan

1. Rappel sur les DWHs et Introduction aux systèmes OLAP , (1


séance)

2. Systèmes ROLAP (3 séances)

3. Systèmes MOLAP (3 séances)

4. Systèmes HOLAP ( 1 séance)

5. Évaluation (CC et examen)

2
Architecture du SI décisionnel DWH
Intranet Postes
COMPT Données client
A externes

PRODUCTIO
N Module Entrepôt Outils
STOC
K Interfaces de Resti-
(ETL)
données tution
COMMERCIA
L

GESTION
DES
1. Source : SI opérationnel
ACTIVITE
S
2. Interfaces : ETL
3. Organisation et Stockage : Entrepôt
données 4. Restitution : OLAP
opérationnelles
3
4

L’entrepôt de données Entrepôt de


données
• Modèle dimensionnel : hypercube
Réseau :
– Axes d’analyse (dimensions) Zone,
Pays,
– Indicateurs (table des faits) Région,
Produits : Département,
activité, Ville,
ligne produit, Agence
gamme,
produit

Client : Temps :
secteur, Données année, budget,
groupe, (Indicateur trimestre, N-1...
client, s) mois,
adresse livraison semaine,
jour
5

Entrepôt de données: un hypercube

Produit

Ville

Temps
Schéma multidimentionnel

• En étoile
• En flocon
• En constellation

6
Modèle en étoile
• Une table de fait centrale et des dimensions
• Les dimensions n’ont pas de liaison entre elles
• Avantages:
– Facilité de navigation
– Nombre de jointures limité

• Inconvénients:
– Redondance dans les dimensions
7– Toutes les dimensions ne concernent pas les mesures
8

Modèle en Etoile
Modèle en flocon
• Une table de fait et des dimensions décomposées en sous
hiérarchies
• On a un seul niveau hiérarchique dans une table de dimension
• La table de dimension de niveau hiérarchique le plus bas est reliée à
la table de fait. On dit qu’elle a la granularité la plus fine
• Avantages:
– Normalisation des dimensions
– Économie d’espace disque

• Inconvénients:
– Modèle plus complexe (jointure)
9
– Requêtes moins performantes
1
0

Modèle en Flocon de neige


1
1

Niveau de hiérarchisation
1
2

Modèle en Constellation
Outil ETL

• Extract
• Transform
• Load

• Mini Projet en Talend Open Studio-Data Integration

13
1 – Introduction aux systèmes
OLAP
• Caractéristiques des produits OLAP

• Différents types de systèmes OLAP

14
Les règles de CODD pour les produits OLAP

En 1993 Codd définit les bases du modèle OLAP : 12 règles de Codd


définissent l’évaluation des produits OLAP :

1. Vue multidimensionnelle : Une base OLAP offre une vue


multidimensionnelle des données

2. Transparence: éléments techniques mis en œuvre invisibles pour


l’utilisateur

3. Accessibilité: la complexité et l’hétérogénéité des données sont


masquées par les outils OLAP

4. Stabilité: performances stables indépendamment du contexte


d’analyse

5. Architecture Client/Serveur : le coté serveur a en charge


l’homogénéisation des données, les clients se connectent simplement
au serveur 15
Les règles de CODD pour les produits OLAP

6. Traitement générique des dimensions : une seule structure logique


pour toutes les dimensions. Tout calcul effectué sur une dimension
peut l’être sur les autres

7. Gestion dynamique des matrices creuses : gestion dynamique de la


mémoire physique nécessaire pour stocker les données non nulles

8. Support multi-utilisateurs : gestion des accès concurrents aux


données

9. Croisement des dimensions

10. Manipulation intuitive des données

11. Flexibilité des restitutions

12. Nombre illimité de niveaux d’agrégations et de dimensions


16
Stratégies d’implémentation d’ED
et d’analyse OLAP
🡺Base DOLAP (Desktop OLAP) : base OLAP très limitée en taille,
hébergée sur le poste client, et très rapide
🡺Base OOLAP (Object OLAP) : utilise un SGBD Orienté Object : peu
utilisé.

17
Principales Stratégies d’implémentation d’ED et d’analyse
OLAP
1 - Systèmes ROLAP (Relational OLAP) :
• avec un SGBD relationnel classique avec des adaptations spécifiques à l’OLAP
• la BD relationnelle de l’entrepôt est organisée comme une base OLAP
• lents et peu performants mais sans limites de taille
2 – Systèmes MOLAP (Multidimensionnal OLAP) :
• utilisent un SGBD multidimensionnel (MOLAP), ils sont l'application physique
du concept OLAP (réellement d'une structure multidimensionnelle)
• très rapides et performants mais limité au gigaoctet.
3 – Systèmes HOLAP (Hybrid OLAP) :
• c’est un compromis :
une MOLAP pour les données souvent consultées, une ROLAP pour les autres.

18
Quelques Solutions Commerciales

19
2
0
Analyse en ligne: Algèbre OLAP
• OLAP= navigation Interactive dans un cube de données
– Opérateurs ensemblistes
• Projection et restriction

– Opérateurs de restructuration
• Changement de point de vue

• Réorientation selon les dimensions

– Opérateur de granularité
• Zoomer

• DéZoomer
2
1
Projection
selon une dimension
• SLICE
2
2
Restriction

• DICE
2
3
Rotation (Pivot)
2
4

Forages: DRILL Down/ ROLLUP


2
5
MDX Vs SQL
2
6 Activités
E1 E2 E3 E4
S1 M1 10 12 14 16
M2 15 13 14 11
M3 10 8 16 19
S2 M1 9 11 10 13
M2 14 10 12 9
M3 7 14 15 19
1. Schématiser le cube
2. Projection sur Etudiant E1
3. Projection sur Semestre S2
4. Projection sur Matière M3
5. Restriction sur E1, E2 durant S2
6. Restriction sur M2, M3 pour E3, E4
7. Rotation de (E1, E2) ; (M1,M2) ;et (S1,S2) en (E1,E2); (S1, S2) et (M1,M2)
8. Rotation de (M1,M2,M3) et (E1, E2) en (E1,E2) et (S1, S2)
9. Rollup sur Etudiant
10. Rollup sur Semestre
11. Peut-on faire un Drill down sur Matière?
12. Peut-on faire un Drill down sur Etudiant?

Vous aimerez peut-être aussi