Mode Opératoire - TALEND
Mode Opératoire - TALEND
Mode Opératoire - TALEND
1. Accès à Talend
Une fois vous accédez au programme TOS, vous devez :
- Sélectionner « créer un nouveau projet »
- Saisir le nom d’un projet sur la case rouge, sous forme de texte et/ou chiffres sans mettre
d’espace : exemple « Test1 »
- Ou bien sélectionner le nom d’un projet déjà existant, Talend conserve tous les projets crées en
leur associant automatiquement le nom du langage comme ceci « nomprojet_Java : exemple
« Test1_java ». Dans ce cas, sélectionner l’option « Sélectionner un projet existant » puis cliquer
sur « Terminer »
2. Interface de Talend
L’environnement de travail sur Talend s’appelle le « Studio Talend », il comprend les espaces
suivants :
- Le référentiel : espace qui comprend les trois fonctionnalités principales (Business models, Jobs
et Métadonnées)
- Interface du Jobs : espace dédié au traitement d’intégration des données par manipulation
« glisser / déposer »
« Business Intelligence » - M. Abdeljabbar BAIDADA Page 2 sur 14
- Détail des palettes : menu disposant de la liste des composants (ou connecteurs) répartis par
type, en plus de l’outil de recherche des composants.
- Sur la fenêtre « Etape 2 de 4 », cliquer sur le bouton « parcourir » et indiquer le chemin d’accès
vers le dossier où se trouve le fichier de données. Cliquer sur le dossier pour afficher les fichiers.
Ensuite, sélectionner le fichier et cliquer sur « Ouvrir ». Puis cliquer sur « Next ».
- Une nouvelle fenêtre s’affiche « Etape 3 de 4 », relative aux options de codages et de noms de
colonnes. En cas de données textes séparées par des virgules (,), cliquer sur la liste déroulante
« Séparateur de champs » et sélectionner le type « Comma », ensuite cliquer sur « Définir les
lignes d’en-tête comme nom de colonnes » et sur « Rafraichir l’aperçu ». Puis, cliquer à nouveau
sur « Next ».
- En cas de données textes séparées par des points virgules ( ;), cliquer sur la liste déroulante
« Séparateur de champs » et sélectionner le type « Semicolon ».
4. Création du Job
Le Jobs étant le modèle de traitement d’intégration de données.
Sur le référentiel, on trouve différents types de modèles de traitement :
• le standard : généré sur la base du Java ;
• autres : quand on est sur des traitements de Big Data.
- Sur le studio de TALEND, le Job se charge automatiquement après. On le retouve aussi bien sur
le Référentiel, en déroulant l’option « Jobjs » par un simple clique sur la petite flèche à gauche
que sur l’entête de l’interface.
- Même principe, les fichiers de données référencés se trouvent sur l’option « Métadonnées »
« Fichier délimité ». On les retrouvent par simple clique sur la petite flèche à gauche.
DEPOSER
GLISSER
- En déposant le fichier sur l’interface, une fenêtre « Composants » s’affiche pour confirmation
de type de composant souhaité pour le traitement :
Les composants sont repartis par par type. En général, il existe trois catégories de composants :
▪ Composants utilisés en entrée (mode lecture) ;
▪ Composants intermédiaire ;
▪ Composants utilisés en sortie (mode écriture).
Talend dispose aussi d’un outil de recherche des composants (voir ci-haut – page 3).
- A cette étape, les fichiers sont censés être lus. Donc à chaque fichier sélectionné, glissé et
déposé, il faut lui associer le composant de lecture « tFileInputDelimited ». Sélectionner et
cliquer sur ce dernier composant et valider sur « Ok ».
- Refaire la même démarche pour l’intégration des autres fichiers et les déposer dans l’interface
de TALEND.
GLISSER
DEPOSER
- Pour le premier fichier transactionnel (par exemple « Achats »), le modèle affecte un lien
principal de type « row1 ». Pour les autres fichiers il affecte des liens secondaires de type
« row2 ou 3 ou … (lookup) ;
- Pour modéliser la logique d’intégration, double cliquer sur le composant « tMap ». On obtient
l’interface de modélisation pour opérer la jointure entre les différentes données des différents
fichiers ;
- Les fichiers sont organisés par type de « row »
• « row1 » pour le lien principal (table de fait) ;
• « row2 » etc pour les autres liens secondaires (table de dimension) qui disposent
obligatoirement de « clé d’expression » ;
GLISSER
DEPOSER
7. Affichage de résultats
Pour afficher les résultats de la table de sortie, utiliser le composant « tLogRow » :
- Faire glisser/déposer le composant « tLogRow » sur l’interface du Job
GLISSER
DEPOSER
- Ensuite, cliquer deux fois sur le composant « tMap » pour modéliser la table de sortie « out1 »
sur l’espace « mapping auto » ;
- Sur la table de sortie « out1 », faire glisser/déposer les champs d’informations qu’on souhaite
intégrer.
- Cliquer sur « Exécuter le Job », pour compilation et affichage des résultats sur le « détail du
Job »
- Ensuite cliquer à nouveau sur l’option « Exécuter »