Académique Documents
Professionnel Documents
Culture Documents
Description générale
Ce tutoriel a pour objectif de vous familiariser avec les fonctionnalités de base de l’outil ETL de la
suite BI de Microsoft : SQL Server Integration Services (SSIS).
Dans le tutoriel, vous allez créer un projet d’intégration de données permettant d’insérer de
nouvelles lignes dans une table de faits modélisant le taux de change journalier de différentes
monnaies, à partir de fichiers textes. Pour insérer ces lignes, deux transformations devront être
définies au processus d’intégration: des lookups qui récupèrent les clés dimensionnelles à partir
de colonnes sources. Le concept de traitement en lot sera également abordé par la création d’un
contenant itérateur (ForEach loop container) qui exécute la tâche d’intégration sur un ensemble de
fichiers sources. Finalement, vous devrez définir un mécanisme de gestion d’erreurs, permettant
de sauvegarder les erreurs rencontrées dans un fichier journal.
https://msdn.microsoft.com/en-us/library/ms169917.aspx
1. Dans le client Remote Desktop, cliquer sur l’icône New pour ajouter une nouvelle VM;
2. Donner un nom à la connection, et ensuite entrer l’adresse IP (champs PC name), le nom
d’utilisateur et le mot de passe de votre équipe (envoyé par courriel par le professeur);
3. Une fois la VM créée, cliquer sur l’icône Start pour démarrer la VM.
Note : la VM peut recevoir une seule connexion à la fois. Toute connexion faite à une VM déjà en
cours d’utilisation sera bloquée.
• Microsoft SQL Server Management Studio : pour voir les tables de la BD OLTP
(AdventureWorks2014) et la BD OLAP (AdventureWorksDW2014), ainsi que faire des
requêtes sur ces tables;
• Visual Studio 2015: pour créer des projets SSIS, SSAS et SSRS.
Gestionnaire de connexion qui servira à lire fichiers textes contenant l’information sur le taux des
monnaies.
Gestionnaire de connexion vers l’entrepôt de données qui sera utilisé pour accéder aux tables de
dimensions et la table de faits.
1. Dans le menu Gestionnaire de connexions (en bas), cliquer-droit et choisir Nouvelle
connexion OLE DB;
2. Dans le menu Configurer le gestionnaire de connexions OLE DB, cliquer sur Nouveau;
3. Entrer le nom du serveur comme à l’étape II;
4. Dans le menu Connexion au serveur, choisissez Windows Authentification comme à
l’étape II.
5. Dans le menu Connexion à la base de données, choisir AdventureWorksDW2014 pour la
DB;
6. Tester la connexion en cliquant sur le bouton Tester la connexion;
7. Cilquer sur OK.
1. Aller dans l’onglet Flux de données (double-cliquer sur le Data Flow Task créé
précédemment si nécessaire);
2. À partir du menu Boîte à outils → Autres sources (à gauche), glisser-déposer un Flat File
Source sur le canevas;
3. Ouvrir le Flat File Source en double-cliquant sur la boîte créée;
4. Dans le Gestionnaire de connexions de fichiers plats, sélectionner la connexion Sample
Flat File Source Data créée précédemment;
5. Cliquer sur Columns (à gauche) et vérifier que les colonnes de la source sont toutes
présentes;
6. Cliquer sur OK.
Transformations de type lookup pour aller récupérer les clés dimensionnelles de l’entrepôt
correspondant aux clés d’affaires dans les fichiers plats.
Tâche permettant d’insérer des lignes traitées par le flux de données dans la table de faits
FactCurrencyRate.
Tester le processus:
Lancer le processus ETL (mode déboguage) en cliquant sur l’icône Démarrer dans la barre de
menu (triangle vert en haut).
Note : Une coche verte devrait apparaître à coté de chaque élément du flux de données, et un total
de 1096 lignes devrait arriver au OLE DB Destination.
IV. Gestion du traitement en lot
Modification au flux de contrôle pour appliquer le flux de données précédent à un ensemble de
fichiers plats se trouvant dans un répertoire.
Conteneur permettant d’exécuter la tâche de flux de données sur les fichiers texte d’un répertoire.
1. Si ce n’est pas encore fait, interrompre le mode déboguage en cliquant sur l’icône en forme
de carré rouge (en haut);
2. Cliquer sur l’onglet Flux de contrôle. Le flux de données (Extract Sample Currency Data)
devrait être visible sur le canevas;
3. À partir du menu Conteneurs de la Boîte à outils (à gauche), glisser-déposer un item de
type Conteneurs de boucles ForEach;
4. Ouvrir l’item créé en double-cliquant sur la boîte;
5. Dans le menu Collection (à gauche):
• Choisir ForEach File Enumerator pour l’option Enumerator
• Dans Dossier, cliquer sur parcourir et choisir le répertoire des fichiers de monnaie (voir
étape II);
• Dans Fichier, mettre : Currency_*.txt
6. Dans le menu Mappage de variables (à gauche), cliquer sur la colonne Variable, choisissez
l’option Nouvelle variable :
• Nom : varFileName;
• Espace de noms : User.
• Type de valeur : String.
7. Cliquer OK pour revenir au canevas, et cliquer-déplacer la boîte du DataFlow créé
précédemment à l'intérieur du conteneur de boucles.