Académique Documents
Professionnel Documents
Culture Documents
- Référenciel : quand on va utiliser la source de données dans plusieurs jobs -> il faut ajouter la source
dans métadonnées puis l'utiliser dans les jobs
Composants Transformation
tAggregateRow -> recevoir un flux de données en faisant une agrégation sur une ou plusieurs colonnes
ou bien pour chaque ligné de sortie -> faire l’opération de GROUP BY soit par une valeur ou par un
champs ou faire des opérations de SUM/MAX/MIN (exp : on a un fichier excel contenant 4 colonnes dont
la colonne année -> on veut afficher seulement les lignes qui ont l’année maximale et on veut les grouper
par destination : group by destination et dans opérations on va mettre année et l’opération MAX)
tAggregateSortedRow -> permet d’agréger les données d’entrée triées pour la colonne de sortie en se
basant sur un ensemble d’opérations (même rôle de tAggregateRow mais avec le tri des lignes)
tConvertType-> faire des conversions de types de données Java vers un autre types de données Talend
(souvent associé au composant tMap)
tExternalSortRow -> utilisé pour les applications externes trier les données d’entrée d’une ou plusieurs
colonnes en fonctions de leurs types et de leurs ordres (il faut une applications externes pour trier)
tFilterColumn -> faire des modifications spécifiques établies a partie d’un mapping du noms des colonnes
sur un schéma défini -> on a une table de 4 colonnes mais on ne veut afficher/prendre que 2 colonnes
parmi 4 donc on utilise tFilterColumn et on choisi les colonnes qu’on veut filtrer
tFilterRow -> permet de filtrer des lignes d’entrées en définissant une ou plusieurs conditions sur les
colonnes sélectionnées -> exp : on veut afficher les lignes dont le pays commencent par une majuscule /
on veut afficher les personnes qui ont 20 ans (age=20)
tMap -> permet de faire des jointures/ définir les propriétés d’aiguillage/ définir les propriétés de
transformation de données/ filtrage /concaténation /duplication (tMap peut remplacer
tJoin/tAggregate/tFilterRow)
tMap Filtrage
exp filtre -> (« filtre »).equals(row1.nomColonne) : on veut afficher les ligne qui ont le nom de pays
tunisie -> (« tunisie»).equals(row1.pays)
tMap concatenation
On met les deux colonnes à concaténer sur la même ligne de sortie dans le tableau Tmap : on va avoir
dans l’expression row1.nomColonne1 row1.nomColonne2-> puis on ajoute à l’expression
+ « séparateur » +
tReplace -> effectuer une recherche et remplacer une valeur par une autre dans les colonnes spécifiés
(Afficher les lignes 1 et 10 seulement -> écart= 1,10/ Afficher de la ligne 1 à la ligne 30 -> écart 1..30)
tSortRow -> trier les données d’entrées basées sur une ou plusieurs colonnes
tXMLMap -> même rôle que tMap mais utilisé sur des fichiers xml
Composants Système
- lookup: utilisé lorsqu'on a plus qu'1 flux de données (2 sources de données par exemple reliées à un
tMap) / permet de faire la recherche des données -> relier un composant d'un flux secondaire à un
composants d'un flux principal
-Filter: filtrer/utilisé uniquement avec le composant tFilterRow avec un autre composant=> permet de
regrouper les données
- Reject: isoler les données qui ne peuvent pas être traitées pour différentes raisons (exp: valeur nulle..)
- ErrorRejects: rassembler les données qui sont impossibles à traiter (dates erronées/valeurs nulles...)
2/Iterate
faire une boucle sur plusieurs fichiers d'un répertoire de données/ sur les lignes d'un fichier ou sur les
entrées d'une bdd
3/Trigger: Déclenchement
Subjob Triggers:
-OnSubjobError: exécuter le sous-job lorsque le sous-job précédent ne s'est pas déroulé correctement
Component Triggers:
-OnComponentOK: déclenche l'exécution du composant cible une fois que l'exécution du composant
source est terminé correctement/ peut servir à déclencher un sous job de notifications
-OnComponentError: déclenche l'exécution du composant cible une fois que l'exécution du composant
source n'a pas été faite correctement
4/Link
utilisé sur ELT et non pas sur ETL
Importation d’un fichier excel sur une bdd mysql avec l’invite
de commande du serveur :
1/ mettre le fichier excel dans htdocs du xampp
3/ Accédez au répertoire où MySQL est installé dans XAMPP. Le répertoire contenant l'exécutable MySQL
doit être quelque chose comme "xampp/mysql/bin".
=> cd C:\xampp\mysql\bin
4/ mysql -u nom_utiisateur nom_bdd --local-infile=1 -e "LOAD DATA LOCAL INFILE 'chemin du fichier’
INTO TABLE nom_table FIELDS TERMINATED BY ';' LINES TERMINATED BY '\n' IGNORE 1 LINES;"
Exemple : mysql -u root testuib --local-infile=1 -e "LOAD DATA LOCAL INFILE 'C:/xampp/htdocs/trans.csv'
INTO TABLE trans FIELDS TERMINATED BY ';' LINES TERMINATED BY '\n' IGNORE 1 LINES;"