Business Intelligence - Les Entrepôts de Données - Cours (Version3 - 2017 - 4page)

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 38

Plan

Cours n Introduction à l’informatique décisionnelle


n Les entrepôts de données
Business intelligence (BI) n Alimentation
Les entrepôts de données n Modélisation multidimensionnelle
n Conception d’un DW
n Démonstration
3ième Année Ing

1 2

Le Contexte Vision globale d’un entreprise


Améliorer en permanence la qualité, le coût et la productivité :
C’est l’enjeu des années 2000 pour les entreprises Système de Pilotage
Décider des actions à conduire.
Diversité
Augmentation
des produits
Augmentation de la qualité
de la concurrence
Collecter,
Diminution des
mémoriser,
coûts de traiter,
Système
fabrication. d’INFORMATION
Augmentation distribuer,
de la réactivité l’information.
Ouverture des
Assurer les fonctions :
marchés
. facturer les clients,
. fabriquer les produits,
Quels outils donner au décideur pour comprendre, .… Système
dimensionner, piloter, et gérer ces systèmes OPERANT

3
4
Le contexte Trop d’information tue l’information
n Besoin: prise de décisions stratégiques et tactiques
n La capacité de l’absorption de l’information par le cerveau humain
n Pourquoi: besoin de réactivité est limitée à 800 informations (mot, son, couleur, mouvement…) par
n Qui: les décideurs (non informaticiens, non statisticiens) minute.
n Comment: répondre aux demandes d’analyse des données,
dégager des informations qualitatives nouvelles

Pourquoi et
Qui sont mes
comment le chiffre
meilleurs
d’affaire a
clients?
baissé?

A combien s’élèvent
Quels tunisiens
mes ventes
consomment
journalières?
beaucoup de
poisson? 5 6

Trop d’information tue l’information Problématique


n Données opérationnelles (de production)
n Une étude scientifique a également
n Bases de données (Oracle, SQL Server)
montré qu’un manager de haut n Fichiers ( Excel), …
niveau réceptionne en moyenne n Paye, gestion des RH, gestion des commandes…
4000 informations par minute.
n Caractéristiques de ces données:
n Étant donné que la mémoire de n Distribuées: systèmes éparpillés
court terme d’un être humain n Hétérogènes: systèmes et structures de données différents
normalement constitué ne lui permet n Détaillées: organisation des données selon les processus
de mémoriser que ce qui a été dit durant les 50 dernières secondes. On fonctionnels, données surabondantes pour l’analyse
comprend mieux les difficultés éprouvées par les managers et leur n Peu/pas adaptées à l’analyse : les requêtes lourdes peuvent
incapacité à traiter 100% de l’information qu’ils reçoivent. bloquer le système transactionnel
n Volatiles: pas d’historisation systématique
7 8
Problématique Solutions
n Comment sélectionner et transformer les données de production en n Disposer d’un outil qui permet de :
informations fiables, homogènes, utiles et accessibles par un traitement
n Ramener l’information à l’essentiel.
rapide, efficace et productif ?
n Transformer un système d’information qui avait une vocation de
production en système d’information décisionnel.
n Transformer des données de production en informations
stratégiques.

n La BI (informatique décisionnelle) recouvre


l’ensemble des technologies permettant de
gérer et d’exploiter les informations disponibles,
en particulier, le DW permet de stocker ces
informations stratégiques.
9 10

L’informatique décisionnelle
n Terme anglais: Business intelligence (BI)
n Définition 1: c’est la branche de l’informatique qui permet l'exploitation
des données de l'entreprise dans le but de faciliter la prise de décision.
C'est-à-dire, la compréhension du fonctionnement actuel et l'anticipation
des actions pour un pilotage éclairé de l'entreprise.
n Définition 2: désigne les moyens, les outils et les méthodes qui
permettent de collecter, consolider, modéliser et restituer les données,
MÉTRIQUES D’AIDE À LA
matérielles ou immatérielles, d'une entreprise en vue d'offrir une aide à la
décision et de permettre aux responsables de la stratégie d'entreprise
DÉCISION
d’avoir une vue d’ensemble de l’activité traitée.
n Objectifs:
n Vision globale de l’activité
n Aide à la décision
n Basée sur un entrepôt de données pour stocker des données
11 12
transverses provenant de plusieurs sources hétérogènes.
Concepts
p Clefs Concepts Clefs : Donnée
née
n Donnée: Donnée

n Résultat direct d’une mesure


Sagesse
n Peut être collectée par un outil de mesure, ou être
Connaissance
présente dans une base de données
Information
n Ne permet pas de prendre de décision sur une
action à lancer
n Exemple
Donnée
n Le mois dernier, on a enregistré 1217 incidents au
centre de services
n 10 nouveaux prestataires ont été employés à la
13
direction informatique 14

Concepts Clefs : Information


mation
n Concepts Clefs : Connaissance
aissannce Connaissance

Information
Information

n Information: Donnée

n Donnée à laquelle un sens et une interprétation


n ont
Donnée
on été donnés n Connaissance:
n Permet au responsable de prendre une décisionion
ion sur une action
n Résultat d’une réflexion sur les informations
n Exemple analysées
n Le mois dernier, on a enregistré une augmentation de 240% du nombre d’incidents
par rapport au mois précédent n Se base sur les expériences, les idées, valeurs,
n L’emploi des 10 prestataires est lié à une augmentation temporaire de la charge de avis des personnes consultées
travail
n Exemple
n Les gestionnaire de changement peut établir une
corrélation entre l’arrivée des nouveaux prestataires
et l’augmentation du nombre d’incidents en ayant
connaissance de certains éléments
Business Intelligence 15 16
Concepts Clefs : Sagesse
sse Sagesse
Connaissance
Illustration d’un reporting imprécis
Information

n Sagesse: Donnée

n État d’esprit général de discernementt final


fi l sur lle
contenu et de jugement de bon sens
n Permet de lancer des actions d’adaptation de
l’organisation, des personnes, des processus et
outils
n Exemple
n Le responsable sénior de l’organisation prend des
décisions à long terme et des décisions
stratégiques pour l’organisation informatique.
17 22/10/12 Business Intelligence 18

Mais une information peut en cacher


En fait, l’important est dans la variation
une autre…

22/10/12 Business Intelligence 19 22/10/12 Business Intelligence 20


L’informatique décisionnelle

CHAÎNE DÉCISIONNELLE

21 22

La chaîne décisionnelle Planification


Planification
ion ETL Stockage
age Analyses
ses Restitution

n Pour mettre en place une


ne pla
plate-forme
ate forrme
n Les 5 grandes étapes: décisionnelle d'entreprise intégrée, la première
étape est donc la planification de ce projet.
n Un tel projet nécessite une administration solide.
n Exemple: les ressources humaines
Planification
n ETL Stockage Analyses Restitution
n Un responsable peut voir le salaire des personnes
de son équipe
n Mais ne peut pas voir celui de son chef.
Ø Nécessité d'une stratégie de sécurité rigoureuse

Business Intelligence 23 Business Intelligence 24


ETL Stockage
Planification
ion ETL Stockage
age Analyses
ses Restitution Planification
ion ETL Stockage
age Analyses
ses Restitution

n ETL : Extract, Transform, Load n Plusieurs manières de stocker


t k la l d
donnée
é ddans un
n Extraction des données à partir d’une ou data Warehouse.
plusieurs sources de données : fichier texte, Excel, n Chacune ayant ses avantages et ses
base de données… inconvénients.
n Transformation des données agrégées n L'administrateur des bases de données
n Chargement des données dans la banque de décisionnelles pourra notamment choisir entre :
données de destination (datawarehouse). DDS (Detail Data Store), les schémas en étoile,
n La phase d’ETL est ici incontournable car elle schéma en flocon…
conditionne et influence la qualité du projet par la
Business Intelligence 25 Business Intelligence 26

suite.

Analyse Restitution
Planification
ion ETL Stockage
age Analyses
ses Restitution Planification
ion ETL Stockage
age Analyses
ses Restitution

n Regroupement de l'ensemble
emble
eddes techn
tec
techniques
niq ess d
de n La génération de tableau de bord,
ord, est
st la partie
part
rtie émergée
éme
mergée de
merg d
l'iceberg : l'informatique décisionnelle.
statistique, d'économétrie, de Data Mining, et de n C'est la partie que voient la plupart des utilisateurs.
recherche opérationnelle. n Ce sont généralement de jolies interfaces intuitives permettant à
un utilisateur lambda, en fonction de ses droits, de consulter des
n Demande souvent des compétences statistiques rapports, des tableaux de bord, de les annoter, voire de les
avancées. créer lui-même.

n Néanmoins certaines solutions embarquent ces


fonctionnalités pré-paramétrées à des cas de
figures bien définies, afin d'offrir leur valeur
ajoutée à des personnes fonctionnelles. 27 Business Intelligence 28
L’alimentation est la part la plus
Architecture d’un système décisionnel
importante d’un projet

22/10/12 Business Intelligence 29 22/10/12 Business Intelligence 30

Pourquoi les alimentations sont-elles


Risques et facteurs de succès
difficiles?
n Sur le plan des données n L’implication des utilisateurs est indispensable
n Définir un langage commun
n Localiser les données utiles dans les systèmes sources
n Harmoniser les nomenclatures
n Sur le plan technique
n Les règles d’alimentation changent sans cesse
n Développements modulaires, auto-documentés, et
traçabilité des données
n temps de chargement compatibles avec la fenêtre
d'exploitation Business Intelligence 31 Business Intelligence 32
L’informatique décisionnelle

33 34

E55 Etablissement des Représentation QF1 QF2 QF3 QF4


commandes des Entrées | | | |
Lancement Fournisseurs(E55) T1F T2F T3F T4F
Fournisseurs
Commande

SIO/SID Entrée Fournisseur E01


client
Saisie des Entrées
Fournisseurs (E01)

SIO
Stock
Saisie des sorties
n système de production Bon de Sortie E02
Magasin MP (E02)
n Informatique opérationnelle
Q0 +
n représente aujourd'hui la majeure partie du SI Max + + +
n focalisé sur le fonctionnement courant
Calcul
n procédures répétitives des
besoins
Min
n transactions
Transfert Produits
n données élémentaires Ouvraison E80
Ouvragés (E80)
n Utilisation des bases de données relationnelles normalisées
t0
- - - Temps

Limites du SIO -
Saisie des Entrées
n données détaillées surabondantes et peu lisibles, absence de synthèses Entrée Mag PF E30
Magasin PF (E30)

n mauvaise qualité informationnelle


n compartimentage, absence de sémantique commune, incohérences Livraison E29
Saisie des Livraisons
aux Clients (E29)
n manque de recul historique
E55 Représentation dans
Saisie des QC1 QC2 QC3 QC4
le temps des | | | |
commandes
Arrivée Livraisons aux T1C T2C T3C T4C
contenu très riche, Commande
Clients (E55)
Clients
35 36
client
faible valeur informationnelle
Le monde physique : Le terrain Le système de gestion : DAS-ERP
SIO/SID SIO/SID
SID
n Informatique décisionnelle
n destiné uniquement à produire de l'information et non à automatiser des opérations
Définition 1: Un SID est un système capable d'agréger
n découplé du SIO mais alimenté par le SIO
les données internes ou externes et de les transformer
n transforme les données pour améliorer leur valeur informationnelle
en informations servant à une prise de décision. n potentiellement concerné par tous les types de données
n Modélisation dimensionnelle
n Entrepôts de données, magasin de données
Définition 2: Un SID est un ensemble de technologies destinées à permettre aux
collaborateurs d’accéder et comprendre les données de pilotage plus rapidement, Limites du SID
n aller-retour SIO-SID malcommodé
de telle sorte qu’ils prennent des décisions meilleures et plus rapides pour atteindre
n besoins flous et changeants
les objectifs de son organisation. n prédominance des données internes
n manque de données instantanées
n Dénormalisation des bases de données
37 38

Architecture d’un SID Architecture d’un SID


Trois couches : alimentation, stockage, restitution

n ETL (Extract Transform Load)


ü Récupère des données hétérogènes, les transforme et les charge.
n Entrepôt de données
ü Stockage intelligent de l’information, associé à des outils de «navigation»
dans les données.
n Outils de restitution
ü Rapports prédéfinis, outils de requêtage, reporting de masse, tableaux de
bord dynamiques, …
n Un «portail» pour fédérer l’ensemble
ü Point d’entrée unique pour l’ensemble des applications.
ü Gestion des droits d’accès en fonction du profil de l’utilisateur.
39 40
SIO / SID OLTP/OLAP
Les applications informatiques peuvent être classées en deux catégories :
Système de pilotage
n Applications OLTP (On-Line Transactional Processing)
Entrepôt de n Applications OLAP (On-Line Analytical Processing)
OLAP
Système d’information données
décisionnel (SID)
ETL
Systèmes d’informations

Système d’information BD BD BD
opérationnel (SIO)
Base de OLTP
production

Système opérant
41 42

OLTP/OLAP OLTP/OLAP
Applications OLTP : Applications OLAP :
n L'intégrité et la sécurité des données sont privilégiées. n Catégorie de traitements dédiés à l’aide à la décision dont des requêtes interactives
n Requêtes simples complexes sur des gros volumes de données.
n Utilisées par des services de production : commerciaux, administratifs, production, n L'analyse et la manipulation des données sont privilégiées.
etc.. n Requêtes complexes
n Nécessitent la connaissance des structures des données. n Applications d'aide à l'élaboration de stratégies
n Utilisent des bases de données de production (relationnelles) n Utilisées par les DG, les services marketing, financiers, contrôleurs de gestion, etc..
n Manipulent des données homogènes. n Ne nécessitent pas la connaissance des structures des données.
n Nombre d'utilisateurs simultanés important. n Utilisent des entrepôts de données (modèle multidimensionnel)
n Applications critiques. n Manipulent des données hétérogènes.
Exemples d'applications : n Nombre d'utilisateurs simultanés faible.
n Gestion bancaire Exemples d'applications :
n Systèmes de réservation n Analyse des tendances
n Gestion commerciale, personnel, production, etc. n Analyse des comportements
Exemple de requête : Exemple de requête :
n Le 15/01/2002 à 13h12, le client X a retiré 500DT du compte Y 43 n Quel est le volume des ventes par produit et par région durant le troisième trimestre44
de 2002?
BD relationnelles / BD multidimensionnelles BD relationnelles / BD multidimensionnelles
Les données nécessaires pour effectuer des analyses et en déduire des orientations Bases de données relationnelles
stratégiques peuvent être stockées dans des structures : n Structure tabulaire.
n Croisement des données à l'aide des jointures.
n relationnelles ou
n Pas de redondance (doublons, agrégation).
n multidimensionnelles.
n Les résultats de requêtes sont sous forme de listes.
n Opérations : Sélectionner, ajouter, mettre à jour et supprimer des tuples.
n Structures peu adaptées aux applications de type OLAP.
Bases de données multidimensionnelles
n Les données sont organisées selon des axes.
n Hypercube comprend autant de dimensions que d'axes d'analyse.
n Possibilité de redondance des données.
n Les requêtes peuvent exploiter toutes les combinaisons d'axes.
n Temps d'accès stable.
n Moins de risque d'erreurs dans la formulation des requêtes.
n Langage MDX = Multidimensional Expressions (de Microsoft "OLE DB for OLAP")
Structures bien adaptées aux applications de type OLAP.
45 46

Plan Introduction-Problématique
n Introduction à l’informatique décisionnelle Une grande masse de données :
n Distribuée
n Les entrepôts de données
n Hétérogène
n Alimentation n Très détaillée
À traiter :
n Modélisation multidimensionnelle
n Synthétiser / Résumer
n Conception d’un DW n Visualiser
n Démonstration n Analyser
Pour une utilisation par :
n Des experts et des analystes d'un métier
n NON informaticiens
n NON statisticiens
47 48
Introduction-Problématique Introduction-Solution

Comment répondre aux besoins des décideurs afin d’améliorer les n Mettre en place un SI dédié aux applications décisionnelles : un
performances décisionnelles de l’entreprise? entrepôt de données (datawarehouse).
ü Transformer des données de production en informations
n En donnant un accès rapide et simple à l’information stratégique. stratégiques.
n En donnant du sens aux données.
n En donnant une vision transversale des données de l’entreprise (intégration
de différentes bases de données).
n En extrayant, groupant, organisant, corrélant et transformant (résumé,
agrégation) les données.

49 50

Entrepôt de Données
Définition d’un DW
Le DW est un système d’information dédié aux applications décisionnelles situé en :
n Aval des bases de production (bases opérationnelles)
n Amont des prises de décision basées sur des indicateurs (Key Business Indicators (KBI))

51 52
Les 4 caractéristiques des data warehouse Les 4 caractéristiques des data warehouse

1. Données orientées sujet: 2. Données intégrées:


n Regroupe les informations des différents métiers n Normalisation des données
n Ne tiens pas compte de l’organisation fonctionnelle n Définition d’un référentiel unique
des données h,f

1,0 h,f
Ass. Vie Ass. Auto Ass. Santé

Client homme, femme

Police GBP
EUR
CHF

53 USD 54

Les 4 caractéristiques des data warehouse Les 4 caractéristiques des data warehouse

3. Données non volatiles 4. Données historisées:


n Traçabilité des informations et des décisions prises n Les données persistent dans le temps
n Copie des données de production n Mise en place d’un référentiel temps
Image de la base en Mai 2005 Image de la base en Juillet 2006
Répertoire Répertoire
Bases de production Entrepôts de données Base de Nom Ville Nom Ville
production
Ajout Dupont Paris Dupont Marseille
Durand Lyon Durand Lyon
Suppression
Donnée Calendrier Répertoire
Ventes Accès
s Entrepôt
clients Code Année Mois Code Année
nom Ville
Mois
Modification Chargement de
1 2005 Mai 1 Dupont Paris
données
2 2006 Juillet 1 Durand Lyon
55 56
2 Dupont Marseille
Différence entre un DW et un datamart Différence entre un DW et un datamart
Un DW et un datamart se distinguent par le spectre qu'il recouvre : Pourquoi des datamarts ?
n Le DW recouvre l'ensemble des données et problématiques d'analyse visées par Les datamarts sont destinés à pré-agréger des données disponibles de façon
l'entreprise. plus détaillée dans les DW, afin de traiter plus facilement certaines questions
n Le datamart recouvre une partie des données et problématiques liées à un métier ou
spécifiques, critiques, etc.
un sujet d'analyse en particulier (finance, commercial, …)
Mini DW lié à un métier particulier de l ’entreprise
n Un DW est souvent volumineux (plusieurs centaines de Go voire qcqs To ) avec des
performances inappropriées (temps de réponse trop longs). Exemple : Ticket de caisse
n Un Data mart comporte moins de 50 Go, ce qui permet des performances Si un DW enregistre un ensemble de ventes d'articles avec un grain très fin, un
acceptables. datamart peut faciliter une analyse dite de ticket de caisse (co-occurrence de ventes
n La création d’un datamart peut être un moyen de débuter un projet de DW (projet de produits par exemple) en adoptant un grain plus grossier (le ticket plutôt que
pilote).
l'article).

57 58

Catégories des données stockées Architecture


n Données dans un DW : données du SIO + BD externes (ETL).
n Quatre catégories de données :
q Les données de détail : issues des systèmes transactionnels de l’entreprise
"socle de l’entreprise". Leur stockage permet d’offrir aux utilisateurs du SID les
détails des chiffres affichés, par exemple, sur un tableau de bord.
q Les données agrégées : correspondent à des éléments d’analyse représentant
les besoins des utilisateurs. Elles constituent déjà un résultat d’analyse et une
synthèse de l’information contenue dans le système décisionnel, et doivent être
facilement accessibles et compréhensibles..
q Les méta données : décrivent les caractéristiques des données stockées :
origine, date de dernière m-à-j, mode de calcul, procédure de transformation.
Elles sont utiles aussi bien aux utilisateurs (comprendre les données) qu’aux
administrateurs (fournir des moyens d’exploitation et de maintenance du DW).
q Les données historisées : Couches de données dans lesquelles chaque
nouvelle insertion de données provenant du SIO ne détruit pas les anciennes
valeurs, mais créée une nouvelle occurrence de la donnée.
59 60
Architecture Les différentes zones de l’architecture
Zone de n Zone de préparation (Staging area)
Zone de préparation Zone de stockage présentation n Zone temporaire de stockage des données extraites
E n Réalisation des transformations avant l’insertion dans le DW:
X C n Nettoyage
T H
n Normalisation…
R A
Transformations: Data Requêtes n Données souvent détruites après chargement dans le DW
A R
Nettoyage Rapports
C
Standardisation
G warehouse n Zone de stockage (DW, DM)
Visualisation
T E n On y transfère les données nettoyées
… Data Mining
I M
… n Stockage permanent des données
O E
N N n Zone de présentation
Datamart
Sources de T n Donne accès aux données contenues dans le DW
données n Peut contenir des outils d’analyse programmés:
n Rapports

n Requêtes…
61 62

Les flux de données Plan


n Flux entrant n Introduction à l’informatique décisionnelle
n Extraction: multi-source, hétérogène n Les entrepôts de données
n Transformation: filtrer, trier, homogénéiser, nettoyer n Alimentation
n Chargement: insertion des données dans l’entrepôt n Modélisation multidimensionnelle
n Flux sortant: n Conception d’un DW
n Mise à disposition des données pour les utilisateurs n Démonstration
finaux

63 64
Alimentation/ mise à jour de l’entrepôt Définition d’un ETL
n Entrepôt mis à jour régulièrement n L’ETL est une couche logicielle responsable de l’alimentation d’une BD à
partir de sources de données.
n Besoin d’un outil permettant d’automatiser les chargements
n Dans un SID, l’ETL sert à alimenter l’ED ou bien les magasins de données.
dans l’entrepôt
n L’ETL fait partie des middlewares (intergiciels)

Utilisation d’outils ETL (Extract, Transform, Load)

65 66

Importance de l’ETL Processus ETL


n Constitue 70 à 80% du temps passé dans un projet Objectif
décisionnel. n Obtenir des informations consolidées et stables dans l’entrepôt.
n Tâche difficile à mettre en œuvre
n La qualité de l’ED dépend de la qualité de l’ETL :
n Temps de chargement
Outils d’alimentation pour
n Fréquence de chargement Données
§ Extraire
n Qualité des données sources
§ Transformer
n Qualité des services § Charger dans un DW

ETL = Extract + Transform + Load

67 68
ETL – Extraction ETL – Extraction
n Objectif : Identifier et localiser les données sources pertinentes (BDR,
fichiers, …) puis les collecter et les extraire des différents systèmes
opérationnels.
n Fonctionnalités :
n Traiter différents formats (XML, HTML, TXT, CSV, DB2, Oracle…).
n Gérer les connexions aux sources (ODBC, JDBC...).
n Extraire le dictionnaire des sources (propriété des colonnes, clés…).
n Extraire les données de manière performante et sans perturber les
environnements de production.
n Détecter les données qui ont été modifiées dans les sources.
n Ajouter des contrôles (fichier de rejets, audits…).
n Stocker l’ensemble des règles d’extraction dans le référentiel.

69 70

ETL – Extraction ETL – Extraction


n Extraction complète: n Extraction temps-réel:
n Capture l'ensemble des données à un certain instant (snapshot de l'état opérationnel); n S'e!ectue au moment où les transactions surviennent dans les systèmes sources.
n Normalement employée dans deux situations:
1. Chargement initial des données;
2. Rafraîchissement complet des données (ex: modification d'une source).
n Peut être très coûteuse en temps (ex: plusieurs jours).
n Extraction incrémentale:
n Capture uniquement les données qui ont changées ou ont été ajoutées depuis la dernière
extraction;
n Peut être faite de deux façons:
1. Extraction temps-réel;
2. Extraction di!érée (en lot).

71 72
ETL – Extraction ETL – Extraction
n Option 1: Capture à l'aide du journal des transactions n Extraction di!érée:
n Utilise les logs de transactions de la BD servant à la récupération en cas de panne; n Extrait tous les changements survenus durant une période donnée (ex: heure, jour, semaine,
n Aucune modification requise à la BD ou aux sources; mois).
n Doit être fait avant le rafraîchissement périodique du journal;

n Option 2: Capture à l'aide de triggers


n Des procédures déclenchées (triggers) sont définies dans la BD pour recopier les données à
extraire dans un fichier de sortie;
n Meilleur contrôle de la capture d'évènements;
n Exige de modifier les BD sources;

n Option 3: Capture à l'aide des applications sources


n Les applications sources sont modifiées pour écrire chaque ajout et modification de données
dans un fichier d'extraction;
n Exige des modifications aux applications existantes;
n Entraîne des coûts additionnels de développement et de maintenance;

73 74

ETL – Extraction ETL – Transformation


n Option 1: Capture basée sur les timestamps Problématique
n Une estampille (timestamp) d'écriture est ajoutée à chaque ligne des systèmes n Existence de plusieurs sources
sources; n Non conformité des représentations
n L'extraction se fait uniquement sur les données dont le timestamp est plus récent n Découpages géographiques différents
que la dernière extraction; n 5 à 30 % des données des BD commerciales sont erronées
n Une centaine de type d’inconsistances ont été répertoriées
n Option 2: Capture par comparaison de fichiers
n Compare deux snapshots successifs des données sources;
n Extrait seulement les déférences (ajouts, modifications, suppressions) entre les
n Transformation : Étape importante garantissant que les données intégrées dans le DW
deux snapshots; seront cohérentes et fiables.
n Exige de conserver une copie de l'état des données sources;
Objectif:
n Approche relativement coûteuse.
n Transformer les données sources selon les unités de mesure et les formats de l’ED.
n Homogénéiser les données sources.
n Nettoyer les données.
n Suppression des incohérences sémantiques.
n Dater les données.
75 76
n Créer des clés.
ETL – Transformation ETL – Transformation
n Types de transformation:
6. Conversion de jeu de caractères:
1. Révision de format:
Ex: EBCDIC (IBM) vers ASCII.
Ex: Changer le type ou la longueur de champs individuels.
7. Conversion des unités de mesure:
2. Décodage de champs:
Ex: impérial à métrique.
• Consolider les données de sources multiples
8. Conversion de dates:
Ex: ['homme', 'femme'] vs ['M', 'F'] vs [1,2].
Ex: '24 FEB 2011' vs '24/02/2011' vs '02/24/2011'.
• Traduire les valeurs cryptiques
9. Pré-calcul des agrégations:
Ex: 'AC', 'IN', 'SU' pour les statuts actif, inactif et suspendu.
Ex: ventes par produit par semaine par région.
3. Pré-calcul des valeurs dérivées:
10. Déduplication
Ex: profit calculé à partir de ventes et coûts.
Ex: Plusieurs enregistrements pour un même client.
4. Découpage de champs complexes:
Ex: extraire les valeurs prénom, secondPrénom et nomFamille à partir d'une seule
chaîne de caractères nomComplet.
5. Fusion de plusieurs champs:
Ex: information d'un produit
- Source 1: code et description;
- Source 2: types de forfaits; 77 78

- Source 3: coût.

ETL – Chargement Fréquence de l’ETL


n Types de chargement:
n Dépend de :
1. Chargement initial:
- Se fait une seule fois lors de l'activation de l'entrepôt de données; n la granularité de la dimension Temps
- Peut prendre plusieurs heures. n la disponibilité des données sources
2. Chargement incrémental: n la fréquence d’utilisation de l’ED
- Se fait une fois le chargement initial complété; n Dans certains cas, pour gagner du temps, on peut avoir une fréquence de
- Peut être fait en temps-réel ou en lot. chargement inférieure à celle de la granularité de la dimension temps.
3. Rafraîchissement complet: n Exemple :
- Est employé lorsque le nombre de changements rend le chargement incrémental n Granularité Temps = mois
trop complexe;
n Fréquence de chargement = jour
Ex: lorsque plus de 20% des enregistrements ont changé depuis le dernier chargement.

79 80
La méthode pull et la méthode push
Cycle de vie de l’ETL (Différentes techniques d’extraction)
n La mise en place de l’ETL passe par les étapes suivantes : n Techniques de détection des mises à jour effectuées sur la BD opérationnelle
et son envoi à l ’entrepôt pour sa mise à niveau ultérieure.
1. Conception de l’ETL : n avec la méthode pull, c’est le SID qui recherche périodiquement les données
q Identification des sources de données
dans les BD opérationnelles. Cette méthode alimente le SID en temps différé,
cependant la quantité volumineuse de données à chaque transfert peut être
q Correspondance des données
coûteuse en temps ( Le système décisionnel cherche périodiquement les
q Définition des transformations données dans les bases de production)
q Structure de la zone d’attente
n avec la méthode push, c’est le SIO qui au fil de l’eau de ses
2. 1er chargement : transactions alimente le SID. Cette méthode alimente le SID en temps
q Chargement de toutes les données sources direct ce qui oblige à revoir le code des applications opérationnelles.
3. Rafraichissement de l’ED : (Le système opérationnel qui au fil des transactions alimente le
q Chargement périodique des données DW)

n Mise à jour de l’ETL lorsque les structures sources ou cibles changent

81 82

Outils ETL Plan


n Introduction à l’informatique décisionnelle
q BusinessObjects, Data Integrator, n Les entrepôts de données
http://www.businessobjects.fr/
n Alimentation
q Oracle Corporation, Warehouse builder,
http://www.oracle.com/technology/products/warehouse/index.html/
n Modélisation multidimensionnelle
IBM, Websphere Datastage , n Conception d’un DW
http://www.ascential.com/products/datastage.html
n Démonstration

83 84
Applications transactionnelles v.s
Des données aux décisions
Applications décisionnelles
Données : Les applications transactionnelles sont constituées de traitements factuels de
Points de ventes, géographiques, démographiques, … type OLTP (On Line Transaction Processing)
Les applications d'aide à la décision sont constituées de traitements ensembliste
Informations :
de type OLAP: On Line Analytical Processing
I vit dans R, I est âgé de A, …
Connaissances :
Dans X%, le produit Y est vendu en même temps que le produit Z, … Incompatibilités des deux activités
Les deux activités (OLTP & OLAP) ne peuvent co-exister sur des données dans le
Décisions
même système d’information: leurs objectifs de performance sont exactement
Lancer la promotion de Y & Z dans R auprès des clients plus âgés que opposés:
A, ... • Les requêtes complexes et lourdes dégradent les performances des systèmes
transactionnels,
• Les données temporelles sont réparties entre données actuelles et données
archivées, rendant la vue historique des données très difficile ou impossible,

Le support efficace d’une activité OLAP nécessite la constitution d’un système


d’information propre: Le Datawarehouse
85 86

Exemple: un DW dans les


télécoms
Sujets :
• Suivi du marché: lignes installées/ désinstallées, services et options choisis,
répartition géographique, répartition entre public et différents secteurs
d'organisations
• o Comportement de la clientèle
• o Comportement du réseau
Historique
• 5 ans pour le suivi du marché
• 1 an pour le comportement de la clientèle
• 1 mois pour le comportement du réseau
Sources
• Fichiers clients élaborés par les agences
• Fichiers de facturation
Requêtes
• Comportement clientèle
• Nombre moyen d'heures par client, par mois et par région
• Durée moyenne d'une communication urbaine par ville
87 • Durée moyenne d'une communication internationale 88
Modélisation Entité/Association Exemple
n Avantages: Mode
Transporteur
d’expédition
n Normalisation:
n Éliminer les redondances
Produit
Contrat Commande
n Préserver la cohérence des données
client
n Optimisation des transactions
Type de Groupe de
n Réduction de l’espace de stockage contrat Client produits
n Inconvénients pour un utilisateur final: Magasin

n Schéma très/trop complet: Famille de


n Contient des tables/champs inutiles pour l’analyse
Employé Région de produits
Stock ventes
n Pas d’interface graphique capable de rendre
utilisable le modèle E/A Fonction Division
89 Fournisseurs 90
n Inadapté pour l’analyse de ventes

Modélisation des DW Construction d’un DW


n Nouvelle méthode de conception autour des Caractéristiques:
Le DW est différent des bases de données de production:
concepts métiers • Les besoins pour lesquels on veut le construire sont différents
• Il contient des informations historisées, organisées selon les métiers de
n Ne pas normaliser au maximum l’entreprise pour le processus d’aide à décision
Le DW n’est pas un produit ou un logiciel mais un environnement, qui se bâtit et
n Introduction de nouveaux types de table: ne s’achète pas
n Table de faits
Phases de construction d’un DW:
n Table de dimensions
Il y’a trois parties interdépendante qui relève la construction d’un DW:
n Introduction de nouveaux modèles: • L’étude préalable qui va définir les objectifs, la démarche à suivre, le retour sur
n Modèle en étoile investissement,…
• L’étude du modèle de données qui représente le DW conceptuellement et
n Modèle en flocon logiquement

91 • L’étude de l’alimentation du DW 92
Construction d’un DW Construction d’un DW

Etude préalable q Coûts de déploiement:


• Nécessite des machines puissantes, souvent une machine parallèle
Etude des besoins: • Capacité de stockage très importante (historisation des données)
• Définir les objectifs du DW ü Evaluer la capacité de stockage
• Déterminer le contenu du DW et son organisation, d’après: • Equipes de maintenance et d’administration
ü Les résultats attendus par les utilisateurs, • Les coûts des logiciels
ü Les requêtes qu’ils formuleront, ü Les logiciels d’administration du DW
ü Les projets qui ont été définie ü Les outils ETL (Extract-Transform- Loading)
• Recenser les données nécessaires à un bon fonctionnement du DW: ü Les outils d’interrogation et de visualisation
ü Recenser les données disponibles dans les bases de production ü Les outils de Datamining
ü Identifier les données supplémentaires requises
• Choisir les dimensions
ü Typiquement: le temps, le client, le produit, le magasin...
• Choisir les mesures de fait
ü De préférences de quantités numériques additives
• Choisir la granularité des faits
ü Niveau de détails des dimensions 93 94

Data Mining
Modélisation DW
Les outils dits de Data Mining, traduisible par " forage des données ", ou " prospection q Niveau conceptuel:
des données ", permettent de sélectionner, à la place de l'utilisateur un certain nombre § Un DW est basé sur une modélisation multidimensionnelle qui
de données. Il en existe trois catégories : représente les données dans un cube

§ les outils de filtre, qui en fonction des informations reçues par l'utilisateur, § Un cube permet de voir les données suivant plusieurs dimensions:
sélectionne celles qui lui sont importantes. Par exemple la liste des agences dans
lesquelles le chiffre d'affaires est inférieur de plus de 20% à l'objectif. ü Tables de dimensions
ü La table des faits contient les mesures et les clés des
§ les outils basés sur des technologies proches de l'intelligence artificielle,
capables d'aller " plonger " dans les bases de données pour découvrir, à la place de dimensions
l'utilisateur de nouvelles connaissances. Par exemple un outil de Data Mining
découvrira pour vous que la vente des plans d'épargne dans les agences de la q Niveau Logique:
région Ouest est inférieure à celle de la région Sud. Ou encore que les acheteurs
d'un produit financier sont plutôt des professions libérales de plus de 40 ans. § Plusieurs schémas types sont proposés pour représenter un DW:
ü Schéma en étoile;
§ les agents intelligents (voir définition ci-dessus), qui sont capables de travailler ü Schéma en flocon;
même en l'absence de l'utilisateur et qui, en naviguant dans les bases, rapporteront
95 96
de nouvelles connaissances
Table de faits Table de faits (suite)
n Table principale du modèle dimensionnel n Fait:
n Contient les données observables (les faits) sur le sujet n Ce que l’on souhaite mesurer
étudié selon divers axes d’analyse (les dimensions) n Quantités vendues, montant des ventes…
Table de faits des ventes n Contient les clés étrangères des axes d’analyse
Clé date (CE) (dimension)
Clés étrangères
vers les n Date, produit, magasin
Clé produit (CE)
dimensions Clé magasin (CE) n Trois types de faits:
Quantité vendue n Additif
Faits n Semi additif
Coût
n Non additif
Montant des ventes
97 98

Typologie des faits Granularité de la table de faits


n Additif: additionnable suivant toutes les dimensions
n Répondre à la question :
n Quantités vendues, chiffre d’affaire
n Peut être le résultat d’un calcul: n Que représente un enregistrement de la table de
n Bénéfice = montant vente - coût faits?
n Semi additif: additionnable suivant certaines n La granularité définit le niveau de détails de la
dimensions
n Solde d’un compte bancaire: table de faits:
Pas de sens d’additionner sur les dates car cela
n n Exemple: une ligne de commande par produit, par
représente des instantanés d’un niveau
client et par jour
n Σ sur les comptes: on connaît ce que nous possédons
en banque
n Non additif: fait non additionnable quelque soit la - Précision des
analyses + Finesse
dimension
Taille de l’entrepôt
n Prix unitaire: l’addition sur n’importe quelle dimension donne
un nombre dépourvu de sens 99 100
Granularité de la table de faits Table de dimension
n Axe d’analyse selon lequel vont être étudiées les données
observables (faits)
n Contient le détail sur les faits

Dimension produit
Clé de substitution Clé produit (CP)
Code produit
Description du produit
Attributs de la Famille du produits
dimension Marque
Emballage
101 Poids 102

Table de dimension (suite) La dimension Temps


n Dimension = axe d’analyse n Commune à l’ensemble du Dimension Temps
n Client, produit, période de temps… DW Clé temps (CP)
n Contient souvent un grand nombre de colonnes n Reliée à toute table de Jour
faits Mois
n L’ensemble des informations descriptives des faits
n Contient en général beaucoup moins Trimestre
d’enregistrements qu’une table de faits Semestre
Année
Num_jour_dans_année
Num_semaine_ds_année

103 104
Granularité d’une dimension Évolution des dimensions
n Une dimension contient des membres organisés n Dimensions à évolution lente
en hiérarchie : n Dimensions à évolution rapide
n Chacun des membres appartient à un niveau
hiérarchique (ou niveau de granularité) particulier
n Granularité d’une dimension : nombre de niveaux
hiérarchiques
n Temps :
n année – semestre – trimestre - mois

105 106

Évolution des dimensions Dimensions à évolution lente (1/3)

n Dimensions à évolution lente n Écrasement de l’ancienne valeur :


n Correction des informations erronées
n Un client peut se marier, avoir des enfants…
n Avantage:
n Un produit peut changer de noms ou de
n Facile à mettre en œuvre
formulation:
n Inconvénients:
n « Raider » en « Twix »
n Perte de la trace des valeurs antérieures des attributs
n « yaourt à la vanille » en « yaourt saveur vanille »
n Perte de la cause de l’évolution dans les faits mesurés
n Gestion de la situation, 3 solutions:
n Écrasement de l’ancienne valeur
Clé produit Description du produit Groupe de produits
n Versionnement
12345 Intelli-Kids Logiciel
n Valeur d’origine / valeur courante Jeux éducatifs
107 108
n Dimensions à évolution rapide
Dimensions à évolution lente (2/3) Dimensions à évolution lente (3/3)
n Ajout d’un nouvel enregistrement: n Ajout d’un nouvel attribut:
n Utilisation d’une clé de substitution n Valeur origine/valeur courante
n Avantages: n Avantages:
n Permet de suivre l’évolution des attributs n Avoir deux visions simultanées des données :
n Permet de segmenter la table de faits en fonction de
n Voir les données récentes avec l’ancien attribut
l’historique n Voir les données anciennes avec le nouvel attribut
n Voir les données comme si le changement n’avait pas eu lieu
n Inconvénient:
n Inconvénient:
n Accroit le volume de la table
n Inadapté pour suivre plusieurs valeurs d’attributs intermédiaires
Clé produit Description du produit Groupe de produits
12345 Intelli-Kids Logiciel Clé produit Description du Groupe de Nouveau groupe
25963 produit produits de produits
Intelli-Kids Jeux éducatifs
109
12345 Intelli-Kids Logiciel Jeux éducatifs 110

Évolution des dimensions Dimensions à évolution rapide


n Dimensions à évolution lente n Changements fréquents des attributs dont on veut garder
l’historique
n Dimensions à évolution rapide
n Clients pour une compagnie d’assurance
n Subit des changements très fréquents (tous les n Isoler les attributs qui évoluent vite
mois) dont on veut préserver l’historique
n Solution: isoler les attributs qui changent
rapidement

111 112
Dimensions à évolution rapide (suite) Les types de modèles
Dim client

Faits Clé_client
Dim client
Nom Faits
Clé_client Clé_client
… Prénom Clé_client
Nom
Adresse Clé_démog
Prénom
Date_naissance
Adresse

Date_nais
… Dim_démographique
Revenus Clé_démog
Niveau_étude Revenus
Nb_enfants Niveau_étude
Statut_marital Nb_enfants
Profil_financier Statut_marital Modèle en étoile Modèle en flocon
Profil_achat Profil_financier 113
114
Profil_achat

Modèle en étoile Modèle en étoile


Dimension Temps
ID temps
n Une table de fait centrale et des dimensions année
mois
n Les dimensions n’ont pas de liaison entre elles jour
Dimension produit
Dimension Magasin ID produit

n Avantages: ID magasin nom
description code
n Facilité de navigation Table de faits Achat
ville prix
ID client
poids
n Nombre de jointures limité surface ID temps
groupe
… ID magasin
famille
n Inconvénients: ID région

ID produit
n Redondance dans les dimensions Dimension Region Quantité achetée Dimension Client
ID région Montant des achats ID client
n Toutes les dimensions ne concernent pas les pays nom
mesures description prénom
district vente adresse
115 …. … 116
Modèle en étoile Modèle en flocon
n Une table de fait et des dimensions décomposées en sous
hiérarchies
n On a un seul niveau hiérarchique dans une table de
dimension
n La table de dimension de niveau hiérarchique le plus bas
est reliée à la table de fait. On dit qu’elle a la granularité la
plus fine
n Avantages:
n Normalisation des dimensions
n Économie d’espace disque
n Inconvénients:
n Modèle plus complexe (jointure)

117 n Requêtes moins performantes 118

Modèle en flocon Dimension produit


Modèle en flocon
ID produit
Dimension Temps ID groupe
ID temps nom
annee code
mois prix
Dimension Magasin jour Dimension groupe
poids
ID magasin … ID groupe

description ID famille
Table de faits Achat
ville nom
ID client
surface …
ID temps

ID magasin
Dimension Region
ID région Dimension Famille
ID région
ID produit ID famille
ID division vente
Quantité achetée nom
pays
Montant des achats …
description
…. Dimension Client
Dimensionion
ID client
Division vente
nom
ID division vente
prénom
description 119 120
adresse
….

Modèle mixte Modèle en constellation

121 122

OLTP VS OLAP OLAP: Vue multidimensionnelle


Produits Pays
oranges
Produit poires
Espagne
PK id_produit
pommes Allemagne
Libellé
Famille
Achat France
PK id_achat
FK id_client
id_produit Vente de
client janvier avril pommes en
Quantité
PK id_client Allemagne
février
Temps en avril
Nom
adresse
123 124
Architecture du DataWarehouse Architecture OLAP
q La base de données
– constitue un support de données agrégées ou résumées (notion de niveaux
hiérarchiques).
– Les données qu’elle contient peuvent provenir d’un entrepôt de données.
– Elle possède une structure multidimensionnelle c’est-`a-dire basée sur un
SGDB multidimensionnel ou relationnel.

q La serveur OLAP permet


– la gestion de la structure multidimensionnelle dans le SGDB.
– la gestion de l’accès aux données de la part des utilisateurs.

q Le module client permet


– à l’utilisateur de manipuler et d’explorer les données.
– l’affichage des données sous formes de graphiques ou de tableaux.

En ce qui concerne la base de données, il existe plusieurs configurations


125 possibles. 126

ROLAP MOLAP
n Relational OLAP n Multi dimensional OLAP:
n Données stockées dans une base de données n Utiliser un système multidimensionnel « pur » qui
relationnelles gère les structures multidimensionnelles natives
(les cubes)
n Un moteur OLAP permet de simuler le
n Accès direct aux données dans le cube
comportement d’un SGBD multidimensionnel
n Plus difficile à mettre en place
n Plus facile et moins cher à mettre en place
n Formats souvent propriétaires
n Moins performant lors des phases de calcul
n Conçu exclusivement pour l’analyse
n Exemples de moteurs ROLAP: multidimensionnelle
n Mondrian n Exemples de moteurs MOLAP:
n Microsoft Analysis Services
127 128

n Hyperion
HOLAP Le cube
n Hybride OLAP: n Modélisation multidimensionnelle des données
n tables de faits et tables de dimensions stockées facilitant l’analyse d’une quantité selon différentes
dans SGBD relationnel (données de base) dimensions:
n données agrégées stockées dans des cubes n Temps
n Solution hybride entre MOLAP et ROLAP n Localisation géographique
n Bon compromis au niveau coût et performance n …
n Les calculs sont réalisés lors du chargement ou
de la mise à jour du cube

129 130

Manipulation des données


Exemple d’utilisation d’un cube multidimensionnelles (Opérations OLAP)
n Opération agissant sur la structure
n Rotation (rotate): présenter une autre face du cube

05 06 07 05 06 07
Œuf 221 263 139 Idf 101 120 52
Viande 275 257 116 Ain 395 400 203

131 132
Manipulation des données
multidimensionnelles
n Opération agissant sur la structure
n Tranchage (slicing): consiste à ne travailler que sur une
tranche du cube. Une des dimensions est alors réduite à une
seule valeur
05 06 07 06
Œuf Idf 220 265 284 Œuf Idf 265
Ain 225 245 240 Ain 245
Viande Idf 163 152 145 Viande Idf 152
Ain 187 174 184 Ain 174

133 134

Manipulation des données Manipulation des données


multidimensionnelles multidimensionnelles
n Opération agissant sur la structure n Opération agissant sur la granularité
n Extraction d’un bloc de données (dicing): ne travailler que n Forage vers le haut (roll-up): « dézoomer »
sous un sous-cube n Obtenir un niveau de granularité supérieur
05 06 07 n Utilisation de fonctions d’agrégation
Œuf Idf 220 265 284 05 06 07 n Forage vers le bas (drill-down): « zoomer »
Ain 225 245 240 Œuf Idf 220 265 284 n Obtenir un niveau de granularité inférieur
n Données plus détaillées
Viande Idf 163 152 145 Ain 225 245 240
Ain 187 174 184

135 136
Opérations sur le contenu des cubes:
Drill-up, drill-down Roll-up (passage au grain supérieur) / Drill-down (passage
au grain inférieur)
Roll up
05 06 07
Dimension
Roll up Alim. 496 520 255 Temps

05-07 05 06 07 1S05 2S05 1S06 2S06 1S07


Fruits 623 Fruits 221 263 139 Fruits 100 121 111 152 139
Viande 648 Viande 275 257 116 Viande 134 141 120 137 116

05 06 07
Drill down
Pomme 20 19 22
… … … …
Boeuf 40 43 48 Drill down
Dimension
Produit 137 138

Langage de requêtes MDX (Multidimensional Expressions)


n Langage permettant de définir, d'utiliser et de récupérer
Comme SQL pour les bases de données relationnels, il existe des langages
de requetés pour l’utilisation des OLAP. Il s’agit de langage de calcul avec des données à partir d'objets multidimensionnels
une syntaxe similaire `a celle des tableurs. L’inconvénient est qu’il n’y a pas n Permet d’effectuer les opérations décrites précédemment
de langage universel. Néanmoins, on peut distinguer deux tendances :
n Equivalent de SQL pour le monde OLAP
n Origine: Microsoft
§ MDX de l’anglais Multidimensional Expressions intégré à Microsoft
SQL Server 2005.

§ OLAP DML (Data Manipulation Language) intègre à Oracle 10g.

139 140
MDX, exemple Logiciels
Il existe de nombreux logiciels qui permettent d’utiliser des cubes
n Fournir les effectifs d’une société pendant les années 2004
OLAP pour l’analyse de données. Nous fournissons ci-après une
et 2005 croisés par le type de paiement liste non-exhaustive des logiciels classés en modules serveurs et
clients.
SELECT {([Time].[2004]), ([Time].[2005])} ON COLUMNS, Serveurs
– SAS Business Analytics – Panoratio
{[Pay].[Pay Type].Members} ON ROWS – SAP – Whitelight
Dimensions, – PALO OLAP Server (Open Source) – NCR
FROM RH Cube
– OlapCubes de AderSoft
axes d’analyse
– Oracle
WHERE ([Measures].[Count]) – SQL Server Services analysis
– ALG Software
– Applix
2004 2005 – Microstrategy
Heure 3396 4015 – Descisys
– INEA/Cartesis
Jour 3678 2056 141 142

Logiciels Plan
Il existe de nombreux logiciels qui permettent d’utiliser des cubes
n Introduction à l’informatique décisionnelle
OLAP pour l’analyse de données. Nous fournissons ci-après une
liste non-exhaustive des logiciels classés en modules serveurs et n Les entrepôts de données
clients.
n Alimentation
Clients
– Panorama Software n Modélisation multidimensionnelle
– Proclarity
– AppSource
n Conception d’un DW
– Cognos
– Business Objects
n Démonstration
– Brio Technology
– Crystal Reports
– Microsoft Excel
– Microsoft Reporting Services.
_ Datawarehouse
143 144
Structure de la base de donnée :
Oracle 10g OLAPCubeWriter
La base de données qui a été utilisée pour les tests porte sur la vente d’articles
(chaussures) d’une entreprise qui possède des magasins dans plusieurs villes
OLAPCubeWriter est un outil développé par AderSoft, il permet de
différentes à travers le monde. Elle est constituée de 5 tables : Les ventes qui
se connecter `a une base de données, de récupérer les tables
enregistre toutes les ventes effectuées dans différents magasins et concernant les
dont on a besoin pour créer les cubes OLAP, de créer les
chaussures de différents modelés pour différentes pointures et couleurs
dimensions ainsi que les mesures et champs calculés du cube.
On peut dés lors visualiser les données relatives au cube grâce à
OLAPCube Reader

145 146

Interface de OLAPCubeWriter
OLAPCube Reader
OLAPCube Reader est un outil de visualisation (reporting) des cubes OLAP. Il
permet entre autre d’appliquer des filtres sur les données, de générer des
diagrammes de différentes formes (camembert, histogrammes, tableaux, etc)

147 148
http://lig-membres.imag.fr/donsez/cours/dwdm/

149

Vous aimerez peut-être aussi