Vous êtes sur la page 1sur 12

Editions ENI

Business Intelligence
avec SQL Server 2012
Maîtrisez les concepts
et réalisez un système décisionnel

Collection
Solutions Informatiques

Extrait
Alimenter l'entrepôt de données avec SSIS

1. Découverte de SSIS
Al im e n t er l' e n t r ep ô t d e d o n n é e s a v e c S S IS
Bu s i n es s I n te l li g en c e av ec S QL S e r v e r 2 0 1 2

Au cours des chapitres précédents, vous avez appris à modéliser un entrepôt de données. L'idée
était de faire abstraction des sources de données disponibles dans votre société. Au cours de ce
chapitre, vous allez apprendre et comprendre comment va se réaliser la remontée des données
du système source vers un entrepôt de données. La principale difficulté est que celui-ci dispose
d'une modélisation dimensionnelle conforme, très éloignée de la structure de vos données
actuelles.
Dans la gamme SQL Server, l'outil qui va permettre de réaliser le chargement de ces données est
SQL Server Integration Services (SSIS).
SSIS a deux aspects :
- Un aspect classique avec une logique de flux de tâches, organisées par des règles de précé-
dence. Cet aspect est appelé Flux de contrôles.
- Un aspect plus spécifique au décisionnel, avec une logique purement E-T-L. Cet aspect est
appelé Flux de données.
On peut utiliser SSIS sans pour autant faire de l'ETL. Par exemple, vous pouvez vous servir de
SSIS pour exécuter des tâches de maintenance de bases de données, pour lancer une suite de
batch un peu complexe ou pour réaliser de la réplication de données.
Toutefois, SSIS est aussi un ETL. Le monde de l'ETL a ses codes et ses règles issues de ces quinze
dernières années. L'objectif du chapitre, au-delà de la compréhension de ce qu'est l'outil SSIS, est
de vous faire découvrir certaines de ces pratiques bien spécifiques au monde du décisionnel. Des
pratiques auxquelles SSIS est assez bien adapté.
Un peu comme pour toute la gamme SQL Server, le développement des flux se fera sous SQL
Server Data Tools (SSDT). On utilisera en revanche SQL Server Management Studio pour l'admi-
nistration et l'exploitation.
Découvrons ensemble dès à présent l'interface de développement :
f Ouvrez SSDT.
f Cliquez dans la barre de menu sur Fichier - Nouveau - Projet.

© Editions ENI - Toute reproduction interdite


259
Business Intelligence avec SQL Server 2012

f Dans la fenêtre Nouveau projet, sélectionnez Projet Integration Services, puis saisissez le
nom et l'emplacement du projet comme ci-dessous :

Le projet s'ouvre par défaut sur l'onglet Flux de contrôle d'un package vide. Un package est un
fichier au format XML à l'extension .dtsx.
f Sur le côté gauche, ouvrez la boîte à outils pour découvrir les objets du flux de contrôle
disponibles.

© Editions ENI - Toute reproduction interdite


260
Alimenter l'entrepôt de données avec SSIS

Boîte à outils SSIS


Les tâches disponibles donnent une assez bonne idée du rôle que l'on pourrait faire jouer à SSIS
et de ses possibilités : connexion à un service web, exécution de requête SQL, exécution d'appli-
cation, écriture et exécution de scripts, connexion à un serveur FTP, tâche de traitement de
SSAS, tâche de sauvegarde de la base de données…
Dans un flux décisionnel, les tâches de flux de contrôle vont avoir des fonctions de support et
d'orchestration, mais ce ne sont pas ces tâches qui vont faire à proprement parlé le chargement
des données.

lAttention, dans le monde du décisionnel, un entrepôt de données ne se charge pas avec de


simples requêtes SQL. Vous verrez que les exigences de traçabilité et de maintenance de tels
flux sont trop élevées pour que des requêtes SQL remplissent ce rôle correctement.

© Editions ENI - Toute reproduction interdite


261
Business Intelligence avec SQL Server 2012

Le chargement de données va se réaliser avec la tâche de flux de données. Découvrons cet


aspect du produit :
f Glissez et posez la tâche de flux de données dans la zone de travail centrale.

Ajout d’une tâche de flux de données

f Puis double cliquez sur la tâche de flux de données pour accéder à l'onglet Flux de données.
Vous noterez que la barre d'outils propose maintenant de nouvelles tâches organisées autour de
trois thématiques :
- Les tâches Sources
- Les tâches de transformation
- Les tâches Destinations

© Editions ENI - Toute reproduction interdite


262
Editions ENI

Business Intelligence
avec SharePoint Server 2010
Créez un portail décisionnel
et pilotez la performance

Collection
Solutions Informatiques

Extrait
Business Intelligence avec SharePoint Server 2010

1 Introduction
Dans le chapitre précédent, nous avons créé une collection de sites et activé les fonctions de
restitution décisionnelles du serveur SharePoint Server 2010. Au cours de ce chapitre, desti-
né à des ingénieurs BI ou à de grands utilisateurs du décisionnel, nous allons apprendre à uti-
liser ces outils pour restituer les données et créer de l'information.
Microsoft dispose de très nombreux outils de restitution, ce qui peut donner une impression
de complexité. Chaque outil a néanmoins une spécialité et donc un rôle à jouer qui diffère
des autres. L'étendue de ce catalogue dessert l'éditeur dans sa communication, mais offre
une richesse fonctionnelle sans égal parmi ses concurrents. Il est donc essentiel que vous
fassiez connaissance avec chacun de ces outils, pour mieux les comprendre et les
appréhender.
Ces outils de restitution sont répartis dans les licences Office, SQL Server et SharePoint.
Mais seul SharePoint est capable d'agréger leur contenu, de les faire travailler ensemble et
ainsi de révéler la véritable puissance de la plate-forme Microsoft BI.
Dans ce chapitre, nous découvrirons donc chacun de ces outils dans leur capacité à interagir
avec le portail SharePoint. Nous verrons ainsi :
- Reporting Services : sans sortir de SharePoint, nous créerons un rapport que nous dépose-
rons dans une bibliothèque de documents.
- Excel Services : nous créerons ensuite un tableau croisé dynamique Excel que nous publie-
rons dans une bibliothèque de documents. Puis nous visualiserons ce tableau croisé dyna-
mique directement à partir du portail SharePoint.
- PowerPivot : nous réaliserons une analyse à l'aide de PowerPivot Excel. Puis, nous publie-
rons cette analyse pour l'exploiter directement au sein du portail.
- PerformancePoint : nous créerons des analyses et un tableau de bord composé d'indica-
teurs, pour en définitive, créer un grand espace de décision agrégeant des ressources
d'origines diverses.
Au cours du chapitre, nous réaliserons des manipulations sur les données du cube Distrisys
DM créé au cours du chapitre Réaliser un magasin de données, mais aussi sur le cube de
l'entrepôt de données Distrisys DW, créé dans l'ouvrage Business Intelligence avec SQL Ser-
ver 2008 R2 paru aux Éditions ENI dans la collection Solutions informatiques.
Si vous n'avez pas réalisé les manipulations précédentes, vous pourrez toutefois suivre ce
chapitre :
- Soit en utilisant la machine virtuelle proposée en téléchargement sur le site des Éditions
ENI. Cet environnement offre un environnement SharePoint complet parfaitement installé et
configuré. Vous y retrouverez aussi les bases de données évoquées au cours de ce
chapitre.

286 © Editions ENI - Toute reproduction interdite


Les outils de restitution de SharePoint

- Soit, si vous disposez de votre propre environnement SharePoint, en téléchargeant les


bases de données et les cubes Distrisys DM et Distrisys DW.

Tous ces éléments sont disponibles en téléchargement sur la page dédiée à l'ouvrage sur
le site http://www.editions-eni.fr.

2 Créer un rapport à partir du portail avec Reporting Services


2.1 Reporting Services et ses usages
Reporting Services est un outil inclus dans la licence SQL Server. Dans sa version de base, il
ne nécessite pas SharePoint et son utilisation est optimale lorsqu'il est utilisé pour construire
des rapports de masse. Le reporting de masse correspond à l'automatisation de la production
et de la diffusion de rapports prédéfinis.
Ces rapports sont alors construits et diffusés par le service informatique à un très grand
nombre d'utilisateurs sur demande d'un service fonctionnel. Il s'agit généralement de rapports
de suivis d'activités poussés et déposés périodiquement dans les boîtes aux lettres, dans un
portail ou dans un répertoire partagé.

Dans cet ouvrage, nous n'aborderons pas la réalisation du rapport de masse ni sa diffu-
sion automatisée. Si le sujet vous intéresse, reportez-vous à l'ouvrage Business Intelli-
gence avec SQL Server 2008 R2. Nous y proposons la création d'un tel rapport ainsi que
la programmation de sa diffusion automatique et périodique.
Lorsque Reporting Services est utilisé conjointement avec SharePoint en mode intégré, sa
nature diffère totalement de cet usage. On peut l'envisager comme un outil distinct de cette
première utilisation. Dans ce mode d'utilisation, ce sont les utilisateurs qui ont la possibilité,
sans l'aide du service IT, de créer des rapports et de les déposer dans une bibliothèque de
documents du portail SharePoint, accessible à d'autres utilisateurs.
Reporting Services en mode intégré n'est pas pour autant un outil d'analyse fin destiné aux
utilisateurs finaux. Comme nous le verrons plus tard dans le chapitre, d'autres outils sont
beaucoup plus adéquats pour cette tâche, tels qu'Excel ou PerformancePoint. Dans ce mode
d'utilisation, il s'agit plutôt de rendre autonomes les utilisateurs en leur permettant de réaliser
leurs propres états prédéfinis à partir des données du système décisionnel mais aussi du sys-
tème opérationnel.
C'est justement ce dont a besoin Distrisys. Dans le cadre de la future réalisation de l'espace
de décision de la direction des ventes, l'agence sud de Distrisys a besoin d'un rapport per-
mettant de suivre en temps réel l'émission des factures des clients.

© Editions ENI - Toute reproduction interdite 287


Business Intelligence avec SharePoint Server 2010

Au cours de cette partie, nous vous proposons d'aider le service des ventes de Distrisys à
réaliser ce rapport opérationnel. Ce sera l'occasion d'utiliser Reporting Services dans un envi-
ronnement SharePoint et de découvrir, si vous ne le connaissez pas encore, le serveur Repor-
ting Services et son concepteur de rapports Report Builder.
Les manipulations qui vont suivre suggèrent que vous disposez d'un environnement Share-
Point Server 2010 qui fonctionne correctement, et qu'une instance Reporting Services a été
installée et configurée en mode intégré SharePoint. Si vous ne disposez pas d'un tel environ-
nement, vous pouvez toutefois télécharger la machine virtuelle disponible dans les éléments
de téléchargement associés à cet ouvrage. Si vous disposez d'un environnement sain, il vous
suffira de télécharger et de restaurer la base de données DistrisysERP_AgenceSud.bak dispo-
nible dans les éléments de téléchargement du chapitre associés à ce livre. Cette base est la
base de données de l'ERP dont dispose l'agence Sud de Distrisys. Il s'agit en réalité d'une
version extrêmement simplifiée d'environ 4 Mo.

2.2 Création d'une source de données partagée


Pour commencer, nous allons créer une source de données partagée. C'est-à-dire que nous
allons créer une source de données qui sera potentiellement utilisée et réutilisée dans plu-
sieurs rapports Reporting Services.
La création d'une source de données nécessite des informations techniques telles que le nom
du serveur par exemple. Le simple fait de créer cet élément partagé et réutilisable par les uti-
lisateurs va donc faciliter par la suite la création des futurs rapports.
La création d'une source de données partagée ou d'un rapport nécessite de se positionner
dans une bibliothèque de documents qui a été étendue à l'utilisation de Reporting Services. Si
cette configuration vous est inconnue, référez-vous au chapitre Configuration des fonctions BI
de SharePoint - Reporting Services.
Dans notre environnement, nous allons utiliser la bibliothèque de documents Rapport du site
BI. Cette bibliothèque de documents a préalablement été configurée et étendue à SharePoint
au chapitre précédent.
K Ouvrez le navigateur Internet et connectez-vous sur le site BI accessible à l'adresse
http://bi.contoso.com/bi.
K Dans la barre de navigation verticale, à gauche, cliquez sur la bibliothèque de documents
Rapports.

288 © Editions ENI - Toute reproduction interdite


Les outils de restitution de SharePoint

La bibliothèque de rapports
Cette bibliothèque SharePoint est tout à fait classique. Elle a été créée à partir du modèle Bi-
bliothèque de rapports.
K Dans le ruban, cliquez sur l'onglet Documents, puis déroulez la liste Nouveau document
pour afficher les modèles de documents proposés.

© Editions ENI - Toute reproduction interdite 289


Business Intelligence avec SharePoint Server 2010

Les modèles de documents Reporting Services


La bibliothèque vous propose de créer trois types d'éléments :
- Modèle du générateur de rapports : il s'agit d'un modèle de données permettant de sim-
plifier la création des rapports. Ce modèle agit un peu comme un cube, à la différence que
le modèle du générateur de rapports est un modèle relationnel. Nous n'aborderons pas la
création de modèles du générateur de rapports dans cet ouvrage.
- Source de données du rapport : il s'agit de sources de données qui seront partagées et
accessibles lors de la création de rapports.
- Rapport du Générateur de rapports : il s'agit de créer un nouvel état Reporting Services.
- Pour créer une nouvelle source de données partagée, cliquez sur Source de données du
rapport.
Dans la fenêtre qui s'ouvre, nous allons saisir les paramètres de la source de données faisant
référence à la base de données SQL Server DistrisysERP_AgenceSud. Cette source de don-
nées est celle de l'agence sud de Distrisys. Nous utiliserons par la suite cette source de don-
nées pour créer le rapport affichant la liste de factures émises par ce site commercial.
K Au niveau du champ Nom, saisissez la zone de texte DistrisysERP_AgenceSud.
K Sélectionnez, dans la liste déroulante Type de source de données, le fournisseur Micro-
soft SQL Server.

290 © Editions ENI - Toute reproduction interdite


Les outils de restitution de SharePoint

Il est à noter, par la même occasion, que Reporting Services 2008 R2 permet nativement de
créer des rapports reposant sur des sources d'origines diverses :
- OLE DB,
- ODBC,
- Oracle,
- XML (et donc service Web),
- Microsoft SQL Server Azur,
- Microsoft SQL Server Analysis Services,
- Liste SharePoint,
- SAP NetWeaver BI,
- Hyperion Essbase.
K Dans le champ Chaîne de connexion, saisissez la chaîne de connexion suivante :

Data source=server1\r2;Initial catalog=DistrisysERP_AgenceSud

Dans cette chaîne de connexion, le mot clé Data source indique le nom du serveur et de son
instance. La clause Initial catalog indique, quant à elle, le nom du catalogue de base de données.
K Cliquez sur le bouton Tester la connexion puis, si le test est concluant, sur le bouton OK.

Création d'une source de données partagée Reporting Services


© Editions ENI - Toute reproduction interdite 291