Académique Documents
Professionnel Documents
Culture Documents
EXERCICE 2
Objectifs: Utiliser les métadonnées pour les fichiers délimités et trier les données
Pour lire et/ou écrire des données dans des fichiers délimités, vous pouvez centraliser les
métadonnées de ces fichiers dans le Repository afin de les réutiliser facilement. Les métadonnées
de type File Delimited peuvent être utilisées pour définir les propriétés des composants
tFileInputDelimited, tFileOutputDelimited.
Composants utilisés :
tFileInputDelimited
tSortRow : Ce composant permet le tri des données.
tFileOutputDelimited : ce composant permet de créer un fichier csv contenant des
données
Fichiers utilisés :
personne.csv
Procédure :
1. Créer un nouveau job job_metadonnees_sorting
2. Pour créer une connexion à un fichier délimité à partir de zéro, développez le
nœud Métadonnées du Référentiel. Ensuite, cliquez-droit sur fichier délimité puis
2/8
sélectionnez créer fichier délimité dans le menu contextuel afin d'ouvrir l'assistant
de configuration des métadonnées du fichier.
3. Définir le chemin et le format du fichier (fichier personne.csv)
4. Définir le parsing du fichier
5. En fonction de votre type de fichier (CSV ou Delimited), vous pouvez paramétrer
des caractères d'inclusion et d'exclusion (respectivement Text Enclosure et Escape
character).
6. Si l'aperçu du fichier indique un message d'en-tête, excluez cet en-tête de l'analyse.
Indiquez le nombre de lignes d'en-tête à ignorer. En outre, si le fichier contient
des informations de pied de page, indiquez le nombre de lignes à ignorer.
7. Vérifier et personnaliser le schéma du fichier
3/8
11. Vérifier le chemin du nouveau fichier à créer dans l’onglet composant de
tFileOutputDelimited. (nommée personne_sorted)
EXERCICE 3
Objectifs:
Utiliser les métadonnées pour les fichiers délimités, Utiliser le générateur
aléatoire des données.
Composants utilisés :
tRowGenerator est utilisé pour créer des entrées de façon aléatoire. Ces entrées
seront ensuite envoyées au composant tSortRow afin d'être triées selon une valeur
définie.
tSortRow : Ce composant permet le tri des données.
tFileOutputDelimited : ce composant permet de créer un fichier csv contenant des
données
Procédure :
1. Créer un nouveau job job_generator
2. Déposer les trois composants sur le panneau designer.
3. Modifier la configuration du composant tRowGenerator ainsi :
4/8