Vous êtes sur la page 1sur 13

Introduction SSIS

Thibault Denizet

SSIS - Introduction

Sommaire

Introduction SQL Server 2008 Integration services ...................................................................... 3

Rappel sur la Business Intelligence.................................................................................................. 4


2.1

ETL (Extract, Transform, Load) ................................................................................................ 4

Lespace de travail dIntegration Services ....................................................................................... 6


3.1

Crer un projet ........................................................................................................................ 6

3.1.1
4

Lenvironnement ............................................................................................................. 7

Conclusion ..................................................................................................................................... 13

Dotnet France Association

SSIS - Introduction

1 Introduction SQL Server 2008 Integration services


Ce cours sadresse aux personnes souhaitant apprendre mettre en place un ETL (Extract,
Transform, Load) ou sinformer sur ce sujet laide de loutil propos par Microsoft : Integration
Services. Il devrait vous fournir une partie des connaissances ncessaires au passage de la
certification MCTS sur la Business Intelligence.
Il fait suite au cours SQL Server 2008 Analysis Services, et aborde donc une des deux autres
principales fonctions lie la Business Intelligence : lETL. La dernire fonctionnalit tant les
Reporting services que nous verrons dans le prochain cours. Dans ce chapitre dintroduction, nous
allons donc voir ce quest un ETL aprs un bref rappel sur la Business Intelligence, puis nous
dtaillerons les lments de linterface de SQL Server Business Development Studio.

Dotnet France Association

SSIS - Introduction

2 Rappel sur la Business Intelligence


Avant de commencer, nous allons faire un petit rsum de ce quest la Business Intelligence,
afin que vous ne soyez pas perdu dans la suite du cours.
Business Intelligence(BI) peut se traduire par informatique dcisionnelle. Elle apporte des
aides aux socits sur les dcisions quelles ont prendre. Dans une priode telle que la notre o
linformation est primordiale, la BI fournit un environnement daide la dcision trs efficace si
conu de faon optimale. En effet, des analyses trs complexes sur les millions de donnes dune
entreprise permettent davoir une bonne vision de lvolution de la socit, quels marchs ne sont
pas rentables, quelles rgions sont les plus lucratives, etc.
La BI est utile tous les niveaux dune entreprise, que ce soit le directeur qui doit prendre des
dcisions mondiales pour son entreprise, ou un sous-chef quelconque qui a besoin de savoir lequel
de ses secteurs est le moins rentable.
Voici les principales fonctions de la BI :

Conception dune base de donnes de stockage, tel quun entrept de donnes et/ou des
magasins de donnes.

Extraction puis transformation des donnes de lentreprise provenant des applications et


des bases de donnes transactionnelles vers les destinations cres prcdemment.

Exploitation de ces donnes grce aux reporting services, au datamining, aux outils OLAP,
aux tableaux de bord.

2.1 ETL (Extract, Transform, Load)


Mais avant de sattaquer SQL Server Integration Services, il est important de se demander
ce quest un ETL.
Et bien, cest un intergiciel (cest--dire un logiciel qui interagit entre plusieurs applications)
dont la fonction est de dplacer, dpurer, dassembler de grosses quantits de donnes dune base
de donnes vers une autre.
Plus simplement, un ETL est divis en trois tapes comme son nom le suggre :
-

Extraire des donnes dapplications et de bases de donnes de production (Fichier plat, Excel,
bases de donnes transactionnelles, etc.).
Transformer ces donnes afin de les rassembler sous un mme format exploitable par les outils
danalyse et de reporting.
Dotnet France Association

SSIS - Introduction
-

Charger ces donnes rafraichies et nettoyes dans des lments de stockage permettant une
exploitation dcisionnelle : entrepts de donnes, magasins de donnes, etc.

Transformation
Des donnes

Extraction

Chargement

Sources des donnes (fichier plats, OLTP, etc.)

Entrept de donnes

Le schma ci-dessus reprsente un processus dETL, on voit que les donnes sont extraites des
sources, puis transformes et enfin charges dans une base de donnes de destination, ici un entrept
de donnes. Il faut savoir que lETL reprsente plus de 60% de la ralisation dune solution
dcisionnelle, mais cest galement une fonction assez dlicate mettre en place en raison de la
grande htrognit des sources de donnes.
SSIS (SQL Server Integration Services) est une fonctionnalit dveloppe par Microsoft pour
mettre en place des ETL laide dune interface graphique.

Dotnet France Association

SSIS - Introduction

Lespace de travail dIntegration Services


Dans cette partie, nous allons dcouvrir lenvironnement de travail de SSIS.

Afin de crer une solution dintgration, vous devez possdez Visual studio et SQL Server 2008 pour
avoir accs au Business Intelligence Development Studio. La fonction SQL Server Integration
Services nest malheureusement pas disponible avec les versions express.
SQL Server 2008 Integration services propose de nombreux lments facilitant la cration
dun processus dETL, automatis ou non. Nous allons dans cette partie voir lensemble de ces outils.

3.1

Crer un projet

Pour crer un nouveau projet, rien de plus simple, il suffit daller dans le menu Fichier puis
Nouveau > projet.
Slectionnez Business Intelligence puis projet Integration Services.
Choisissez un nom et un emplacement pour votre solution.

Vous tes maintenant sur lespace de travail de SSIS que nous allons tudier plus en dtail.

Dotnet France Association

SSIS - Introduction
3.1.1

Lenvironnement

SQL Server 2008 Integration Services dispose de nombreuses fonctionnalits permettant une
prise en main intuitive comme nous allons le voir tout de suite.
3.1.1.1 Lexplorateur de solutions
Lexplorateur de solutions prsente larborescence de
votre projet SSIS. Il vous permet ainsi de naviguer facilement au
sein de vos solutions.
Les sources de donnes reprsentent des connexions
qui peuvent tre utilises dans plusieurs packages.
Les vues de sources de donnes sont des sousensembles des sources de donnes, elles peuvent tre
partages par plusieurs packages.
Les packages SSIS sont tout simplement les packages
prsents dans votre projet.
Le dossier Divers stocke les fichiers tels que les images
ou les documents.

Dotnet France Association

SSIS - Introduction
3.1.1.2 La Fentre proprits
Cette fentre contient toutes les caractristiques
techniques de votre package, mais galement celles des
connexions, des lments de flux de contrle/donnes ainsi que
des variables.
Pour les proprits des packages, comme vous pouvez le
voir, on retrouve la date de cration, lordinateur de cration, ses
autorisations, son namespace, etc De plus, on retrouve en bas
de la fentre, une zone affichant une explication sur la proprit
slectionne.
Nous nallons pas lister les proprits de chaque lment
de SSIS, elles sont assez simples comprendre.

3.1.1.3

Les onglets et la bote outils


Comme on le voit sur limage ci-dessous, on dispose de quatre onglets : Flux de contrles, flux
de donnes, gestionnaires dvnements et explorateur de package.

La bote outils est aborde dans cette partie car elle est intimement lie ces onglets. En
effet, il nexiste en fait pas une seule bote outils mais trois, une pour chacun des trois premiers
onglets.
Le dernier, lexplorateur de package, permet de naviguer dans le package, de voir le contenu
des diffrents gestionnaires et daccder aux variables et aux excutables. Cet onglet ne ncessite
donc pas doutil particulier.

*Ceci nest quun extrait de la bote outils du flux de contrle,


elle contient de nombreuses autres fonctionnalits en ralit.*

Dotnet France Association

SSIS - Introduction

Il est temps dtudier plus en profondeur les onglets qui nous aideront grandement raliser
nos solutions SSIS.
3.1.1.3.1 Flux de contrle
Cet onglet permet de grer les tches et les lments de contrle que notre package devra
excuter. Elle reprsente les actions que le packages doit accomplir.

La bote outils se divise en deux catgories :


Tche du flux de contrle : Contient les boucles et
les tches ncessaires la prparation de la transformation
des donnes.
Tche du plan de maintenance : Contient les tches
de nettoyage (dhistorique par exemple), de reconstruction,
de rorganisation, de notifications.

3.1.1.3.2 Flux de donnes

Cest au niveau de cet onglet que seffectue la slection des donnes transfrer, les
transformations quelles vont subir, et leurs destinations, et ce pour chaque tche de flux de
donnes dfinie dans longlet flux de contrle.

La bote outils de cet onglet se divise en trois catgories :


- Sources de flux de donnes : Slectionner les sources des donnes dplacer.
- Transformation du flux de donnes : Slection des transformations que lon va appliquer aux
donnes (Sur notre exemple, un simple tri).
- Destination du flux de donnes : Choisir o les donnes transformes seront stockes.

Dotnet France Association

10

SSIS - Introduction
3.1.1.3.3 Gestionnaire dvnements

Lorsque le package sexcute, les lments qui le contiennent peuvent dclencher des
vnements. Par exemple, lvnement OnError qui se produit lorsquune erreur apparait, ou encore
OnWarning lorsquun avertissement se produit. On peut par exemple envoyer un mail au
responsable lorsquune tche ne parvient pas au terme de son excution.
Le gestionnaire dvnements permet donc de rendre nos packages plus performants en
dfinissant des actions accomplir lorsque des vnements inattendus se produisent.
Les
signifient que les caractristiques des tches nont pas encore t dfinis ou bien quil y eu
une erreur durant la dfinition des proprits de la tche.
3.1.1.3.4 Explorateur de package

Cet onglet prsente le package sous forme arborescente. Nous verrons plus en dtail les
sous-dossiers du package dans la suite du cours.

Dotnet France Association

11

SSIS - Introduction
3.1.1.3.5 Rsultats dexcution

Cet onglet napparait quune fois le package excut, il rpertorie les erreurs, les tches
accomplies ou non, les vnements et des informations de bases propos de lexcution (dure, %
davancement, etc.)
3.1.1.4 Gestionnaire de connexions

Les packages crs avec SSIS ont besoin dtre connects divers lments pour fonctionner.
Etant donn le nombre assez consquent de telles connexions (banques de donnes sources, fichiers
plats, tableaux Excel, etc.), il est ncessaire davoir une interface pour les grer. Cest le rle du
Gestionnaire de connexions, comme son nom lindique.

*Le gestionnaire de connexions peut grer de nombreuses connexions, ici des connexions des
fichiers Excel et .txt.*
3.1.1.5 Liste derreurs et sortie

La liste derreur est, comme vous lavez compris, une liste des erreurs et des avertissements
qui sont apparues durant lexcution. Chaque erreur dispose dune description afin de comprendre
ce quil sest pass.

Dotnet France Association

12

SSIS - Introduction

La sortie affiche le rsultat de lexcution du package. Si des erreurs et/ou des


avertissements se sont produits, elle nous indiquera sur quelles tches cela est arriv.
Si tout se passe bien, elle affichera plutt quelque chose comme cela :

Dotnet France Association

13

SSIS - Introduction

4 Conclusion
Vous connaissez maintenant tout lespace de travail de SSIS, nous allons pouvoir attaquer le
second chapitre Mettre en place une solution SSIS dans lequel nous allons apprendre matriser
Integration Services concrtement.

Dotnet France Association

Vous aimerez peut-être aussi