TP3 ETUDE CAS Tableau BI
TP3 ETUDE CAS Tableau BI
TP3 ETUDE CAS Tableau BI
RESTITUTION
A U T E U R : J O N AT H A N F O N TA N E L
D AT E : 1 9 / 0 5 / 2 0 2 2
T P M A S T È R E D ATA S C I E N C E S P O U R L ' I N G É N I E R I E
DE L’ETL À LA RESTITUTION
2
BUT DES 4 HEURES DE TP
• TP sur Tableau Desktop :
– Se connecter et manipuler un datawarehouse
– Comprendre le principe des tables de dimensions et de faits
– Créations de visualisations
– Création d’un tableau de bord
– Option : Introduction au data storytelling
– Débuter avec l’étude de cas sur l’entrepôt de données adventure work
• Source : https://yoono.fr/licences-tableau-software/
PRÉSENTATION DE TABLEAU
• Nouveau produit :
• Source : https://www.tableau.com/products/prep
PRÉSENTATION DE TABLEAU
PRÉSENTATION DE TABLEAU
PRÉSENTATION DE TABLEAU
• Un extrait du Gartner 2021 :
ABI platform functionality includes the following 12 critical capability areas, which have been updated to
reflect areas of change and differentiation, particularly in capabilities more closely associated with
augmented analytics:
• Security: Capabilities that enable platform security, administering of users, auditing of platform
access and authentication.
• Manageability: Capabilities that track usage of the ABI platform and manage how information is
shared (and by whom).
• Cloud analytics:The ability to support building, deployment and management of analytics in the
cloud, based on data stored both in the cloud and on-premises.
• Data source connectivity: Capabilities that enable users to connect to, query and ingest data,
while optimizing for performance.
• Data preparation: Support for drag-and-drop, user-driven combination of data from different
sources, and the creation of analytic models (such as user-defined measures, sets, groups and
hierarchies).
• Catalog: The ability to automatically generate and curate a searchable catalog of analytic content,
thus making it easier for analytic consumers to know what content is available.
• Automated insights: A core attribute of augmented analytics, this is the application of ML
techniques to automatically generate findings for end users (for example, by identifying the most
important attributes in a dataset).
PRÉSENTATION DE TABLEAU
• Suite extrait du Gartner 2021 :
• Data visualization: Support for highly interactive dashboards and exploration of data through
manipulation of chart images.
• Data storytelling: The ability to combine interactive data visualization with narrative techniques in
order to package and deliver analytic content in a compelling, easily understood form for
presentation to decision makers.
• Natural language query (NLQ): This enables users to ask questions and query data and analytic
content using terms that are either typed into a search box or spoken.
• Natural language generation (NLG): The automatic creation of linguistically rich descriptions of
answers, data and analytic content. Within the analytics context, as the user interacts with data, the
narrative changes dynamically to explain key findings or the meaning of charts or dashboards.
• Reporting: The ability to create and distribute (or “burst”) pixel-perfect, grid-layout, multipage
reports to users on a scheduled basis.
• Source : https://www.gartner.com/doc/reprints?id=1-254T1IQX&ct=210202&st=sb
PRÉSENTATION DE TABLEAU
• Un extrait du Gartner 2020 :
• By 2022, augmented analytics technology will be ubiquitous, but only
10% of analysts will use its full potential.
• By 2022, 40% of machine learning model development and scoring will
be done in products that do not have machine learning as their
primary goal.
• By 2023, 90% the world’s top 500 companies will have converged
analytics governance into broader data and analytics governance
initiatives.
• By 2025, 80% of consumer or industrial products containing
electronics will incorporate on-device analytics.
• By 2025, data stories will be the most widespread way of consuming
analytics, and 75% of stories will be automatically generated using
augmented analytics techniques.
PRÉSENTATION DE TABLEAU
• Salesforce rachète Tableau Software, leader dans la visualisation des
données. Montant : 15,7 milliards $ par échange d’actions.
• Grosse opération de concentration dans le domaine de l’analytics :
Salesforce achète Tableau Software, par échange d’actions, pour un
montant de 15,7 milliards $. Soit une prime de 42 % sur le cours moyen
de l’action de Tableau Software coté au New York Stock Exchange.
• Selon les chiffres communiqués, l’opération devrait augmenter le chiffre
d’affaires de Salesforce d’environ 350 à 400 millions $ pour l’exercice
2020. En 2018, Tableau a réalisé un chiffre d’affaires proche de 1,2
milliards $ sans atteindre la rentabilité opérationnelle.
• Source :
https://www.silicon.fr/analytics-salesforce-achete-tableau-software-
243615.html
PL ACE À L A
PRATIQUE
TA B L E A U D E S K T O P
TODO
• Installation de Tableau Desktop (lien par mail de la part du support
Tableau)
• Restaurer le datawarehouse AdventureWorkDW
• Connexion à votre entrepôt de données
• Création d'un premier graphique
• Drill dans les données
• Rajouter un premier filtre
• Rajouter de la couleur en fonction d'une autre métrique
• Rajouter une info bulle
• Créer une combinaison
• Créer une combinaison de graphique
• Filtrer les données
• Utiliser les noms et valeurs des mesures
• Créer une bande de référence
• Création d'un paramètre et d'un champ calculé
TO DO
• Etude de cas avec questions et création de visualisations, de tableau
de bord
• Découverte du data storytelling
• Bonnes pratiques sur les visualisations
LANCER SQL SERVER MANAGEMENT
• Se rendre dans SQL Server Management pour vérifier que l’entrepôt
de données « AdventureWorksDW2008R2 » est bien restaurée
VOTRE ENTREPÔT DE DONNÉES
• Cliquer sur Feuille 1 en bas dans les onglets, vous avez les dimensions
et les mesures qui sont dans la première colonne à gauche
CREATION D'UN PREMIER GRAPHIQUE
• Faire glisser dans Lignes le
champ « Full Date
Alternate Key » de la
dimension DimDate pour
la jointure
« OrderDateKey ».
• Faire glisser la mesure
« Sales Amount » sur les
« Abc » de la feuille
CREATION D'UN PREMIER GRAPHIQUE
• Il est possible de pouvoir choisir plusieurs ruptures pour le tableau.
CREATION D'UN
PREMIER
GRAPHIQUE
• Objectif principal :
Le but de cette étude de cas est de comprendre l’implantation des
magasins Starbucks à travers le monde.
• Objectif principal :
Le but de cette étude de cas est de créer un tableau de bord permettant
d’aider les clients McDonald’s à choisir leur menu en respectant les
apports de référence en énergie et en nutriments.
• Source : https://www.senat.fr/europe/textes_europeens/ue0120.pdf
ETUDE DE CAS SUR L’ANALYSE DES
INFORMATIONS NUTRITIONNELLES
• Cahier des charges du tableau de bord :
– Au moins 4 paramètres permettront de choisir les aliments sur le
tableau de bord (choix du burger, choix de l’accompagnement, choix des
boissons, choix des desserts, …)
– Dans un gramme de sel courant (NaCl), il y a un peu moins de 400 mg
de sodium (40% de Na). Créer un champ calculé permettant de
déterminer le sel dans les aliments sélectionnés pour le comparer aux
apports de référence.
– Une ou plusieurs visualisations permettra(ont) de comparer les sept
valeurs des métriques du slide précédent avec les valeurs des éléments
sélectionnés dans les paramètres.
– Une alerte sur un ou plusieurs surplus par rapport aux apports de
référence devra être prévue.
– Une visualisation montrera les 10 éléments les moins « riches » à
prendre pour aider aux choix.
– Créer une visualisation libre donnant du sens à ce tableau de bord
– Ajouter ce tableau de bord dans votre rapport final
ETUDE DE CAS SUR L’ANALYSE DES
INFORMATIONS NUTRITIONNELLES
• Répondre aux questions suivantes et insérer les réponses dans votre
rapport :
– Combien de calories sont contenues dans les burgers de McDonald ?
– Quelles sont les métriques qui sont le plus impactées par les boissons ?
– Quels sont les articles les plus équilibrés à commander pour un petit
déjeuner (boisson chaude, boisson froide et plat) ?
– Quels sont les métriques qui sont corrélées entre-elles sur ce jeu de
données ? Quel est la meilleure visualisation permettant de le montrer ?
Justifier ?
BONNES
PRATIQUES SUR
LES
VISUALISATIONS
BONNES PRATIQUES SUR LES
VISUALISATIONS
• Hiérarchie d'informations dans vos tableaux de bord (Du plus important vers le
moins important)
• Adapter les couleurs aux contenus pour les comparer (importance, nombres
négatifs, données différentes, …)
• Attention à mettre trop de couleurs qui fatiguent et complexifient au lieu de
simplifier et mettre en valeur
• Utiliser des polices lisibles par tous (Arial, Trebuchet MS,Verdana,Times New
Roman, Lucida sans)
• Utiliser des bulles d'informations pour montrer des informations plus précises et
secondaires. Cela allège votre graphique au premier regard mais donne toutes
les informations si cela est nécessaire.
• Travailler vos axes de graphique pour qu'ils soient bien calibrés à vos données et
renseignent facilement vos utilisateurs
• Source : http://onlinehelp.tableau.com/current/pro/desktop/en-
us/help.htm#visual_best_practices.html
BONNES PRATIQUES SUR LES VISUALISATIONS
http://www.visualisingdata.com/
• Explications :
– Representation : Forme physiques (lignes, barres, nuages de points,
...)
– Presentation : Couleurs, Interaction, bulle d'aide, ...
– Visual perception abilities : les yeux, le principe d''interprétation du
cerveau, le processus de reconnaissance de formes , le
raisonnement spatial, ...
– Amplify cognition : transformer l'information en perceptions et
connaissances