Vous êtes sur la page 1sur 2

BDDs Décisionnelles (DataWarehouse)

TP 3 (Talend)

Lire une table et ajouter un champ

1. Sur Talend, créer un projet, puis :


(a) Créer une connexion à un fichier excel : Métadonnéess − > Fichier Excel − >
(clique droit) Créer un fichier Excel.
Suivre les étapes en récupérant le fichier Excel voulu, et sélectionner seulement les
champs à utiliser par la suite. (Créer une connexion par fichier)

(b) Créer un premier job : Jobs - Clique droit - Créer un Job

(c) Faire glisser le tDBInput (Connexion Excel) dans la partie Design. Plus exactement
faire glisser la table ”auteur” autant que (tFileInputExcel).

(d) Ajouter un composant de log (tLogRow) pour visualiser les données.

(e) Configurer le composant de log en ”table” (Composant − > Mode: Table)

(f) Lier les deux composants et exécuter le job

2. Modification du job :
(a) Supprimer la liaison entre l’input et le tLogRow

(b) Ajouter un composant d’aiguillage : tMap (pour créer des règles d’extraction)

(c) Ajouter des lisaisons avec les autres composants : BDD source → tmap → log

(d) Ouvrir le tMap, puis appuyer sur mapping auto en haut à droite. Exécuter le job
à nouveau (normalement il n’y aura pas de changement)

(e) Ouvrer à nouveau le tMap, et créer le champ var1 dans la partie du milieu.

(f) Modifier ce champ dans la colonne du milieu en cliquant sur les ”...” pour éditer
l’expression : (row1.NUMERO A>100000)?”Auteur récent”:”Auteur ancien”

(g) Faire glisser le nouveau champ de la colonne du milieu vers la colonne de droite

(h) Exécuter à nouveau le job, vous devriez obtenir un résultat différent qu’avant avec
l’ajout d’une nouvelle colonne générée à partir de colonnes récupérées.

3. Modification du mapping :
(a) Créer une routine : Code - Routines - Créer une routine (nommée ”concatener”)

1/2
(b) Ajouter à cette routine une autre méthode de concaténation (concatenation.txt)

(c) Modifier le composant tMap :


(a) Double cliquer sur ce composant est ajouter un nouveau champ (nouvelle
variable de type ”string”)
(b) Ajouter une expression à ce champ : concatener.Concat(row1.NOM,row1.PRENOM)
(c) Ajouter maintenant une table de sortie (le plus en vert à droite), et faire glisser
les champs du tableau de gauche vers la droite, en plus du champ généré au
milieu

Lecture multiple et enregistrement dans une BDD

1. Créer une autre connexion avec le deuxième fichier qui représente une liste de livre

2. Dans le même job crée avant, glisser cette connexion

3. Ajouter un tLogRow pour la visualisation et un tMap pour le mapping

4. Créer les extractions/transformations nécessaire pour la deuxième connexion (change-


ment de type, concaténation, suppression, etc.)
* On peut utiliser le même tMap pour les deux connexions source et avoir une seule
sortie (BDD cible)

5. Optionnellement, chargement du résultat dans une base :


(a) Ajouter un composant pour écrire dans une BDD : Ecrire le mot clé ”Output” et
choisir un type

(b) Lier le tMap avec ce composant de sortie (au lieu du tLogRow)

Déploiement d’un job et gestion de configuration

1. Exporter le job pour programmer son lancement :


(a) Configurer votre studio pour inclure toutes les jars dans un fichier (Fenêtre -
Préférences - Talend - Import/Export - Cocher le 2ème choix)

(b) Faire un clic droit sur le job que vous voulez construire (”Construire le job”)

(c) Exécuter le .bat générer par le logiciel

(d) Créer via le planificateur de tâches (de l’ordinateur), une tâche pour lancer votre
script : Action - Créer une tâche - Actions - Nouveau (et choisir le .bat). Puis
dans Déclencheurs, programmer la répétition et les détails.

2/2

Vous aimerez peut-être aussi