TD2 Bi
TD2 Bi
TD2 Bi
Exercice 1
Un opérateur propose à ses abonnés un routeur ADSL qui groupe un accès à IP, le
téléphone et un bouquet de chaînes de télévision interactives. Nous ne nous intéresserons
qu’à cette dernière fonction dans notre entrepôt de données.
Les chaînes de télévision proposées par cet opérateur dans son bouquet sont des
chaînes nationales et des chaînes à péage. Seulement, les interruptions publicitaires (des
chaînes nationales et à péage) peuvent être personnalisées en fonction du profil du foyer
(ou des adultes du foyer quand le contrôle parental est déverrouillé). Le téléspectateur
peut réagir (interactivement) de plusieurs manières aux émissions et aux publicités qu’il
reçoit au moyen de sa télécommande:
‒ A tout moment, il peut zapper vers une autre chaîne.
‒ A tout moment, il peut éteindre son poste.
‒ Pendant une publicité, il peut zapper à la pub suivante sans attendre la fin de la
publicité en cours (la durée de visualisation est importante).
‒ Pendant une publicité, il peut demander plus d’information sur le produit présenté
(la durée de visualisation est importante) puis revenir à l’émission en cours.
L’entrepôt de données est centré sur les actions du téléspectateur. L’objectif de cet
entrepôt est de profiler au plus précis le foyer (ou plutôt le téléspectateur qui détient la
télécommande) afin de maximiser la demande d’informations sur les produits présentés
par les publicités. En effet, l’opérateur perçoit plus d’argent de la part de l’annonceur
quand le spectateur demande plus d’informations au moment de l’annonce est passée !
Rétro-Conception
1. Quelle est la table de fait dans cet entrepôt ?
2. Que pensez vous de l’attribut TypeAction de Action ?
3. Donnez les nouvelles tables si on décide de diminuer la taille de la table Foyer par
une mini-dimension démographique.
Dimensionnement
Considérant les données ci-dessous :
‒ Nombre de foyers abonnés : 3 Millions
‒ Nombre d’actions par foyer et par heure : 10
‒ Un foyer regarde la télévision 320 jours par an, 5 heures par jour
‒ Nombre de tranche horaire : 24
‒ Nombre d’années : 3
‒ Taille des clés : 4 octets
‒ Taille des attributs numériques : 4 octets
Exercice 2
TU Hôtels est une petite chaîne d’hôtels ayant des propriétés dans plusieurs états
américains. L’entreprise possède une base de données centralisée pour stocker et faire le
suivi des réservations de ses clients. En 2008, ils ont installé des restaurants appelés Café
in the Hotel dans plusieurs de leurs hôtels. Un système est employé pour faire le suivi des
commandes et les relayer aux employés dans les cuisines.
TU Hôtels aimerait utiliser les données qu’ils ont emmagasinées pour mieux
comprendre la performance de leurs hôtels et restaurants. Ils ont également accès à une
base de données de critiques de clients provenant du site web HotelComplainer.com.
La tâche est de faire la conception de deux magasins de données (data marts)
utilisant les données provenant des trois sources mentionnées ci-haut. Vous devrez faire
un schéma en étoile pour chaque magasin de données en choisissant les dimensions, les
faits, et les attributs à partir des sources, dont le schéma relationnel est fourni à la page
suivante.
La table suivante présente les questions analytiques auxquelles devra répondre vos
magasins de données :
Data mart 1 : Performance des hôtels Data mart 2 : Performance des restaurants
▪ Durant quel mois y a-t-il le plus grand ▪ Quels restaurants génèrent le plus de
nombre de réservations de chambre? revenus?
▪ Quelle est la saison morte pour les hôtels ▪ Les restaurants les mieux cotés
génèrent ils plus de revenus?
situés dans une région particulière?
▪ Quel est l’item commandé le plus
▪ Quels hôtels génèrent le plus de revenus
souvent dans une région particulière?
(non attribuables aux restaurants)?
▪ Quel est la durée moyenne des séjours
dans les hôtels de 4.5 étoiles ou plus?
▪ Les fumeurs restent-ils plus longtemps que
les non-fumeurs?
▪ Pour un hôtel donné, combien y a-t-il de
clients provenant d’un autre état?
Pour compléter l’exercice, vous devrez suivre les étapes suivantes (pour chaque DM):
1. Identifiez le principal évènement d’affaires.
2. Identifiez la table de fait et les attributs associés aux faits.
3. Identifiez les dimensions et leurs attributs.
4. Élaborez le schéma en étoile final.