Mode Opératoire - TALEND

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 14

MODE OPERATOIRE

TALEND OPEN STUDIO For Data Integration

1. Accès à Talend
Une fois vous accédez au programme TOS, vous devez :
- Sélectionner « créer un nouveau projet »
- Saisir le nom d’un projet sur la case rouge, sous forme de texte et/ou chiffres sans mettre
d’espace : exemple « Test1 »

- Ou bien sélectionner le nom d’un projet déjà existant, Talend conserve tous les projets crées en
leur associant automatiquement le nom du langage comme ceci « nomprojet_Java : exemple
« Test1_java ». Dans ce cas, sélectionner l’option « Sélectionner un projet existant » puis cliquer
sur « Terminer »

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 1 sur 14


Une fois la connexion au projet est initialisée, la fenêtre d’affichage du programme Talend s’affiche
à nouveau pour confirmer l’accès au projet.

- Cliquer ensuite sur « Start now ! » sur la page d’accueil :

2. Interface de Talend

L’environnement de travail sur Talend s’appelle le « Studio Talend », il comprend les espaces
suivants :
- Le référentiel : espace qui comprend les trois fonctionnalités principales (Business models, Jobs
et Métadonnées)
- Interface du Jobs : espace dédié au traitement d’intégration des données par manipulation
« glisser / déposer »
« Business Intelligence » - M. Abdeljabbar BAIDADA Page 2 sur 14
- Détail des palettes : menu disposant de la liste des composants (ou connecteurs) répartis par
type, en plus de l’outil de recherche des composants.

- Détail des composants : aperçu sur le détail des composants utilisés


- Détail du Jobs : aperçu sur le détail du modèle de traitement des données

3. Référencement des données


Pour procéder à l’intégration des données, il faudra d’abord référencer les fichiers à traiter et
préciser leur chemin sur le bureau ou bien sur le répertoire du programme Talend :
- Sélectionner la fonctionnalité « métadonnées » sur le référentiel. Cette fonctionnalité permet
de référencer les bases de données, les fichiers ainsi que les sources de données (applications
telles que Salesforce, Marketo, etc)
- Choisir l’option fichier texte « délimité » pour le cas des fichiers de type texte
- Cliquer sur « fichier délimité » puis utiliser le bouton droit et cliquer sur « créer un fichier
délimité »

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 3 sur 14


- Une nouvelle fenêtre s’affiche « Etape 1 de 4 » pour indiquer le nom du fichier de données. Les
deux champs « Objectif » et « description » sont facultatifs, ils servent pour générer de la
documentation pour les équipes projet. Ensuite cliquer sur « Next ».

- Sur la fenêtre « Etape 2 de 4 », cliquer sur le bouton « parcourir » et indiquer le chemin d’accès
vers le dossier où se trouve le fichier de données. Cliquer sur le dossier pour afficher les fichiers.
Ensuite, sélectionner le fichier et cliquer sur « Ouvrir ». Puis cliquer sur « Next ».

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 4 sur 14


- Le fichier sélectionné s’affiche sur une nouvelle fenêtre à la même « Etape 2 de 4 ». Vérifier que
c’est le bon fichier et cliquer à nouveau sur « Next ».

- Une nouvelle fenêtre s’affiche « Etape 3 de 4 », relative aux options de codages et de noms de
colonnes. En cas de données textes séparées par des virgules (,), cliquer sur la liste déroulante
« Séparateur de champs » et sélectionner le type « Comma », ensuite cliquer sur « Définir les
lignes d’en-tête comme nom de colonnes » et sur « Rafraichir l’aperçu ». Puis, cliquer à nouveau
sur « Next ».

- En cas de données textes séparées par des points virgules ( ;), cliquer sur la liste déroulante
« Séparateur de champs » et sélectionner le type « Semicolon ».

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 5 sur 14


- Une nouvelle fenêtre s’affiche « Etape 4 de 4 » pour la définition du shéma du fichier de
données. On retrouve les colonnes avec les différentes caractéristiques notamment de type de
caractères et la longueur des champs de caractères. Les caractéristiques par défaut sont
considérées et affichées par défaut, valider en cliquant sur « Finish ».

4. Création du Job
Le Jobs étant le modèle de traitement d’intégration de données.
Sur le référentiel, on trouve différents types de modèles de traitement :
• le standard : généré sur la base du Java ;
• autres : quand on est sur des traitements de Big Data.

- Opter pour le traitement standard (Jobs)


- Cliquer sur « Jobs » et utiliser le bouton droit pour cliquer sur « Créer un Job »

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 6 sur 14


- Donner un nom au modèle de traitement « Job » sur la fenêtre Nouveau Job : exemple
« AtelierCDG » et cliquer sur « Finish ».

- Sur le studio de TALEND, le Job se charge automatiquement après. On le retouve aussi bien sur
le Référentiel, en déroulant l’option « Jobjs » par un simple clique sur la petite flèche à gauche
que sur l’entête de l’interface.

- Même principe, les fichiers de données référencés se trouvent sur l’option « Métadonnées »
« Fichier délimité ». On les retrouvent par simple clique sur la petite flèche à gauche.

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 7 sur 14


5. Intégration des données sur l’interface du Job
C’est sur l’espace de l’interface « Job » que les données sont importées pour modéliser la logique
de leur intégration.
Il suffit d’opérer de simples « glisser/déposer » des fichiers de données à partir de « Métadonnées»
vers l’espace de l’interface « Job ». Pour ce faire :
- Sélectionner le fichier de données et le faire glisser et le déposer sur l’epace de l’interface
« Job »

DEPOSER

GLISSER

- En déposant le fichier sur l’interface, une fenêtre « Composants » s’affiche pour confirmation
de type de composant souhaité pour le traitement :
Les composants sont repartis par par type. En général, il existe trois catégories de composants :
▪ Composants utilisés en entrée (mode lecture) ;
▪ Composants intermédiaire ;
▪ Composants utilisés en sortie (mode écriture).
Talend dispose aussi d’un outil de recherche des composants (voir ci-haut – page 3).
- A cette étape, les fichiers sont censés être lus. Donc à chaque fichier sélectionné, glissé et
déposé, il faut lui associer le composant de lecture « tFileInputDelimited ». Sélectionner et
cliquer sur ce dernier composant et valider sur « Ok ».

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 8 sur 14


- Voici le résultat :

- Refaire la même démarche pour l’intégration des autres fichiers et les déposer dans l’interface
de TALEND.

6. Jointure des fichiers de données


Pour enrichir les données par des informations transactionnelles, on fait appel un composant de
mapping pour opérer la jointure entre les deux fichiers.
- Chercher sur l’espace « Palette » le composant de mapping « tMap » et le sélectionner
- Le faire glisser/déposer sur l’interface « Job »

GLISSER

DEPOSER

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 9 sur 14


- Tracer un trait entre chaque fichier et le composant « tMap »

- Pour le premier fichier transactionnel (par exemple « Achats »), le modèle affecte un lien
principal de type « row1 ». Pour les autres fichiers il affecte des liens secondaires de type
« row2 ou 3 ou … (lookup) ;
- Pour modéliser la logique d’intégration, double cliquer sur le composant « tMap ». On obtient
l’interface de modélisation pour opérer la jointure entre les différentes données des différents
fichiers ;
- Les fichiers sont organisés par type de « row »
• « row1 » pour le lien principal (table de fait) ;
• « row2 » etc pour les autres liens secondaires (table de dimension) qui disposent
obligatoirement de « clé d’expression » ;

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 10 sur 14


- Sur la table « row1 » (table de fait), identifier le champ d’information pour critère de
modélisation
- Faire glisser/déposer le champ d’information vers la table de dimension « row2 » et le mettre
dans le champ « clé d’expression ». Le lien est maintenant établi entre les deux tables

GLISSER

DEPOSER

- Valider ensuite en cliquant sur « Appliquer » puis « Ok ».

7. Affichage de résultats
Pour afficher les résultats de la table de sortie, utiliser le composant « tLogRow » :
- Faire glisser/déposer le composant « tLogRow » sur l’interface du Job

GLISSER

DEPOSER

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 11 sur 14


-
- Faire un trait de lien entre le composant « tMap » et le « tLogRow » ;
- Une nouvelle fenêtre « tMap_1Ecriture » s’affiche, donner un nom à la nouvelle table de sortie
« out1 » et valider sur « Ok » pour compilation et affichage des résultats.

- Ensuite, cliquer deux fois sur le composant « tMap » pour modéliser la table de sortie « out1 »
sur l’espace « mapping auto » ;
- Sur la table de sortie « out1 », faire glisser/déposer les champs d’informations qu’on souhaite
intégrer.

- Valider ensuite en cliquant sur « Appliquer » puis « Ok ».

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 12 sur 14


- Cliquer deux fois sur le composant « tLogRow » pour afficher son détail sur « détail du Job » en
bas de l’interface
- Choisir le mode « tableau » pour affichage des résultats

- Cliquer sur « Exécuter le Job », pour compilation et affichage des résultats sur le « détail du
Job »
- Ensuite cliquer à nouveau sur l’option « Exécuter »

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 13 sur 14


- Le résultat s’affiche sous forme de tableau sur l’espace « détail du Job ».
- On peut refaire le choix des informations et de l’intégration des données autant de fois et
afficher ainsi les résultats pour répondre aux différents besoins de l’activité BI.

« Business Intelligence » - M. Abdeljabbar BAIDADA Page 14 sur 14

Vous aimerez peut-être aussi