Vous êtes sur la page 1sur 13

Introduction SSIS

Thibault Denizet

SSIS - Introduction

Sommaire

1 2

Introduction SQL Server 2008 Integration services ...................................................................... 3 Rappel sur la Business Intelligence.................................................................................................. 4 2.1 ETL (Extract, Transform, Load) ................................................................................................ 4

Lespace de travail dIntegration Services ....................................................................................... 6 3.1 Crer un projet ........................................................................................................................ 6 Lenvironnement ............................................................................................................. 7

3.1.1 4

Conclusion ..................................................................................................................................... 13

Dotnet France Association

SSIS - Introduction

1 Introduction SQL Server 2008 Integration services


Ce cours sadresse aux personnes souhaitant apprendre mettre en place un ETL (Extract, Transform, Load) ou sinformer sur ce sujet laide de loutil propos par Microsoft : Integration Services. Il devrait vous fournir une partie des connaissances ncessaires au passage de la certification MCTS sur la Business Intelligence. Il fait suite au cours SQL Server 2008 Analysis Services, et aborde donc une des deux autres principales fonctions lie la Business Intelligence : lETL. La dernire fonctionnalit tant les Reporting services que nous verrons dans le prochain cours. Dans ce chapitre dintroduction, nous allons donc voir ce quest un ETL aprs un bref rappel sur la Business Intelligence, puis nous dtaillerons les lments de linterface de SQL Server Business Development Studio.

Dotnet France Association

SSIS - Introduction

2 Rappel sur la Business Intelligence


Avant de commencer, nous allons faire un petit rsum de ce quest la Business Intelligence, afin que vous ne soyez pas perdu dans la suite du cours. Business Intelligence(BI) peut se traduire par informatique dcisionnelle. Elle apporte des aides aux socits sur les dcisions quelles ont prendre. Dans une priode telle que la notre o linformation est primordiale, la BI fournit un environnement daide la dcision trs efficace si conu de faon optimale. En effet, des analyses trs complexes sur les millions de donnes dune entreprise permettent davoir une bonne vision de lvolution de la socit, quels marchs ne sont pas rentables, quelles rgions sont les plus lucratives, etc. La BI est utile tous les niveaux dune entreprise, que ce soit le directeur qui doit prendre des dcisions mondiales pour son entreprise, ou un sous-chef quelconque qui a besoin de savoir lequel de ses secteurs est le moins rentable. Voici les principales fonctions de la BI :

Conception dune base de donnes de stockage, tel quun entrept de donnes et/ou des magasins de donnes.

Extraction puis transformation des donnes de lentreprise provenant des applications et des bases de donnes transactionnelles vers les destinations cres prcdemment.

Exploitation de ces donnes grce aux reporting services, au datamining, aux outils OLAP, aux tableaux de bord.

2.1 ETL (Extract, Transform, Load)


Mais avant de sattaquer SQL Server Integration Services, il est important de se demander ce quest un ETL. Et bien, cest un intergiciel (cest--dire un logiciel qui interagit entre plusieurs applications) dont la fonction est de dplacer, dpurer, dassembler de grosses quantits de donnes dune base de donnes vers une autre. Plus simplement, un ETL est divis en trois tapes comme son nom le suggre : Extraire des donnes dapplications et de bases de donnes de production (Fichier plat, Excel, bases de donnes transactionnelles, etc.). Transformer ces donnes afin de les rassembler sous un mme format exploitable par les outils danalyse et de reporting. Dotnet France Association

5 -

SSIS - Introduction Charger ces donnes rafraichies et nettoyes dans des lments de stockage permettant une exploitation dcisionnelle : entrepts de donnes, magasins de donnes, etc.

Transformation Des donnes

Extraction
Sources des donnes (fichier plats, OLTP, etc.)

Chargement
Entrept de donnes

Le schma ci-dessus reprsente un processus dETL, on voit que les donnes sont extraites des sources, puis transformes et enfin charges dans une base de donnes de destination, ici un entrept de donnes. Il faut savoir que lETL reprsente plus de 60% de la ralisation dune solution dcisionnelle, mais cest galement une fonction assez dlicate mettre en place en raison de la grande htrognit des sources de donnes. SSIS (SQL Server Integration Services) est une fonctionnalit dveloppe par Microsoft pour mettre en place des ETL laide dune interface graphique.

Dotnet France Association

SSIS - Introduction

Lespace de travail dIntegration Services


Dans cette partie, nous allons dcouvrir lenvironnement de travail de SSIS.

Afin de crer une solution dintgration, vous devez possdez Visual studio et SQL Server 2008 pour avoir accs au Business Intelligence Development Studio. La fonction SQL Server Integration Services nest malheureusement pas disponible avec les versions express. SQL Server 2008 Integration services propose de nombreux lments facilitant la cration dun processus dETL, automatis ou non. Nous allons dans cette partie voir lensemble de ces outils.

3.1

Crer un projet

Pour crer un nouveau projet, rien de plus simple, il suffit daller dans le menu Fichier puis Nouveau > projet. Slectionnez Business Intelligence puis projet Integration Services. Choisissez un nom et un emplacement pour votre solution.

Vous tes maintenant sur lespace de travail de SSIS que nous allons tudier plus en dtail.

Dotnet France Association

7 3.1.1 Lenvironnement

SSIS - Introduction

SQL Server 2008 Integration Services dispose de nombreuses fonctionnalits permettant une prise en main intuitive comme nous allons le voir tout de suite. 3.1.1.1 Lexplorateur de solutions Lexplorateur de solutions prsente larborescence de votre projet SSIS. Il vous permet ainsi de naviguer facilement au sein de vos solutions. Les sources de donnes reprsentent des connexions qui peuvent tre utilises dans plusieurs packages. Les vues de sources de donnes sont des sousensembles des sources de donnes, elles peuvent tre partages par plusieurs packages. Les packages SSIS sont tout simplement les packages prsents dans votre projet. Le dossier Divers stocke les fichiers tels que les images ou les documents.

Dotnet France Association

SSIS - Introduction 3.1.1.2 La Fentre proprits Cette fentre contient toutes les caractristiques techniques de votre package, mais galement celles des connexions, des lments de flux de contrle/donnes ainsi que des variables. Pour les proprits des packages, comme vous pouvez le voir, on retrouve la date de cration, lordinateur de cration, ses autorisations, son namespace, etc De plus, on retrouve en bas de la fentre, une zone affichant une explication sur la proprit slectionne. Nous nallons pas lister les proprits de chaque lment de SSIS, elles sont assez simples comprendre.

3.1.1.3

Les onglets et la bote outils Comme on le voit sur limage ci-dessous, on dispose de quatre onglets : Flux de contrles, flux de donnes, gestionnaires dvnements et explorateur de package.

La bote outils est aborde dans cette partie car elle est intimement lie ces onglets. En effet, il nexiste en fait pas une seule bote outils mais trois, une pour chacun des trois premiers onglets. Le dernier, lexplorateur de package, permet de naviguer dans le package, de voir le contenu des diffrents gestionnaires et daccder aux variables et aux excutables. Cet onglet ne ncessite donc pas doutil particulier.

*Ceci nest quun extrait de la bote outils du flux de contrle, elle contient de nombreuses autres fonctionnalits en ralit.*

Dotnet France Association

SSIS - Introduction

Il est temps dtudier plus en profondeur les onglets qui nous aideront grandement raliser nos solutions SSIS. 3.1.1.3.1 Flux de contrle Cet onglet permet de grer les tches et les lments de contrle que notre package devra excuter. Elle reprsente les actions que le packages doit accomplir.

La bote outils se divise en deux catgories : Tche du flux de contrle : Contient les boucles et les tches ncessaires la prparation de la transformation des donnes. Tche du plan de maintenance : Contient les tches de nettoyage (dhistorique par exemple), de reconstruction, de rorganisation, de notifications.

3.1.1.3.2 Flux de donnes

Cest au niveau de cet onglet que seffectue la slection des donnes transfrer, les transformations quelles vont subir, et leurs destinations, et ce pour chaque tche de flux de donnes dfinie dans longlet flux de contrle.

La bote outils de cet onglet se divise en trois catgories : - Sources de flux de donnes : Slectionner les sources des donnes dplacer. - Transformation du flux de donnes : Slection des transformations que lon va appliquer aux donnes (Sur notre exemple, un simple tri). - Destination du flux de donnes : Choisir o les donnes transformes seront stockes.

Dotnet France Association

10 3.1.1.3.3 Gestionnaire dvnements

SSIS - Introduction

Lorsque le package sexcute, les lments qui le contiennent peuvent dclencher des vnements. Par exemple, lvnement OnError qui se produit lorsquune erreur apparait, ou encore OnWarning lorsquun avertissement se produit. On peut par exemple envoyer un mail au responsable lorsquune tche ne parvient pas au terme de son excution. Le gestionnaire dvnements permet donc de rendre nos packages plus performants en dfinissant des actions accomplir lorsque des vnements inattendus se produisent. Les signifient que les caractristiques des tches nont pas encore t dfinis ou bien quil y eu une erreur durant la dfinition des proprits de la tche. 3.1.1.3.4 Explorateur de package

Cet onglet prsente le package sous forme arborescente. Nous verrons plus en dtail les sous-dossiers du package dans la suite du cours.

Dotnet France Association

11 3.1.1.3.5 Rsultats dexcution

SSIS - Introduction

Cet onglet napparait quune fois le package excut, il rpertorie les erreurs, les tches accomplies ou non, les vnements et des informations de bases propos de lexcution (dure, % davancement, etc.) 3.1.1.4 Gestionnaire de connexions

Les packages crs avec SSIS ont besoin dtre connects divers lments pour fonctionner. Etant donn le nombre assez consquent de telles connexions (banques de donnes sources, fichiers plats, tableaux Excel, etc.), il est ncessaire davoir une interface pour les grer. Cest le rle du Gestionnaire de connexions, comme son nom lindique.

*Le gestionnaire de connexions peut grer de nombreuses connexions, ici des connexions des fichiers Excel et .txt.* 3.1.1.5 Liste derreurs et sortie

La liste derreur est, comme vous lavez compris, une liste des erreurs et des avertissements qui sont apparues durant lexcution. Chaque erreur dispose dune description afin de comprendre ce quil sest pass.

Dotnet France Association

12

SSIS - Introduction

La sortie affiche le rsultat de lexcution du package. Si des erreurs et/ou des avertissements se sont produits, elle nous indiquera sur quelles tches cela est arriv. Si tout se passe bien, elle affichera plutt quelque chose comme cela :

Dotnet France Association

13

SSIS - Introduction

4 Conclusion
Vous connaissez maintenant tout lespace de travail de SSIS, nous allons pouvoir attaquer le second chapitre Mettre en place une solution SSIS dans lequel nous allons apprendre matriser Integration Services concrtement.

Dotnet France Association