Vous êtes sur la page 1sur 58

REPUBLIQUE DU CAMEROUN REPUBLIC OF CAMEROON

Paix-Travail-Patrie Peace-Work-Fatherland
MINISTERE DE L’ENSEIGNEMENT
MINISTERY OF HIGHER EDUCATION
SUPERIEUR
UNIVERSITY OF YAOUNDE I
UNIVERSITÉ DE YAOUNDÉ I
FACULTE DES SCIENCES FACULTY OF SCIENCES
DÉPARTEMENT D’INFORMATIQUE DEPARTMENT OF COMPUTER SCIENCES

Une Architecture Orientée Services (SOA) de


Business Intelligence pour la gestion de l’é ai
Mémoire
Présenté et soutenu par

ABOUBAKAR SIDDIKI
(Matricule : 09U0375)

En vue de l’obtention de

Master 2 recherche en Informatique


(Option : Système d’information et bases de données)
Sous la Direction de

Dr. Paulin Melatagia


Chargé de cours, Université de Yaoundé 1

Année Académique 2012-2013


Mémoire Master 2 Recherche Informatique UY1

Dédicaces

A mes deux parents Tanko Mohamadou et Rabiatou,

A mes frères, mes sœurs,

A ma famille de Yaoundé et tous ceux qui me sont chers

Présenté et soutenu par ABOUBAKAR SIDDIKI Page i


Mémoire Master 2 Recherche Informatique UY1

Remerciements

En tout premier lieu, je remercie mon Dieu, tout puissant, qui m'a éclairé le bon chemin et qui m'a aidé à réaliser
mes travaux dans les meilleures conditions.

Je tiens à remercier sincèrement mon encadreur Dr Paulin Melatagia sans qui rien de tout cela ne serait arrivé.
Merci pour votre soutien sans lequel je n‟aurais jamais réussi à aller au bout, vos conseils toujours lumineux,
votre patience et votre temps consacré pour lire et corriger à plusieurs reprises les parties de ce mémoire. Merci
enfin pour l‟effort effectué pour la bonne marche de notre promotion.

Je voudrais exprimer toute ma reconnaissance à mon encadreur en entreprise M. Jean Bosco Ki, Conseiller aux
statistiques, Bureau Multipays Yaoundé, pour m‟avoir permis de faire le stage au sein de l‟UNESCO. Merci pour
m‟avoir attribué un sujet, pour l‟accueil chaleureux au sein de l‟UNESCO et pour les conseils et corrections
apportées lors de la rédaction de mon rapport de stage. Soyez assuré de ma profonde gratitude et de mon très
grand respect.

Je remercie les membres du jury : Président Pr. ATSA ETOUNDI Roger, Examinateur Dr. TINDO Gilbert et
le Rapporteur Dr. MELATAGIA YONTA Paulin d‟avoir accepté évaluer ce travail

Je tiens à remercier le Chef de Département d‟Informatique le Pr ATSA ETOUNDI Roger ainsi que la
merveilleuse équipe d‟enseignants du Département d‟Informatique pour toutes les connaissances qu‟ils m‟ont
transmis.

Je remercie mes parents, mes frères, mes sœurs, mes tantes et oncles pour leur prière et encouragement à mon
égard.

Merci infiniment à tous mes collègues du travail, mes camarades de Master 2 et mes amis.

À tous ceux qui ont contribué de près ou de loin à l‟élaboration de ce travail.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page ii


Mémoire Master 2 Recherche Informatique UY1

Résumé

L‟Institut de Statistique de l‟UNESCO (ISU), dont le siège est à Montréal au Canada, a été créé en 1999
dans le cadre de la stratégie de l‟UNESCO pour promouvoir la culture d‟une politique reposant sur des éléments
factuels, tant au niveau national qu‟international, par la collecte et l‟exploitation de données récentes et de grande
qualité dans les domaines de l‟éducation, la science, la technologie, la culture et la communication. Dans le but
de faire passer les pays à un niveau supérieur de leur système d‟information grâce à l‟amélioration de la qualité
des données, l‟ISU souhaite améliorer l‟application informatique de saisie et de traitement des données
statistiques actuelle (StatEduc2.0) afin de répondre à plusieurs exigences demandées par les systèmes éducatifs.
L'une des améliorations importantes de cette application est la mise en œuvre d'une partie décisionnelle agile et
fiable permettant de transformer les données en information utile à la prise de décision. L'architecture de cette
application (StatEduc2.0) nécessite donc une reconfiguration afin de prendre en compte l'amélioration exprimée.
L‟architecture de type orientée services est celle adaptée pour cette reconfiguration. A cet effet, nous proposons
dans ce mémoire une architecture orientée services de Business Intelligence pour la gestion de l‟éducation. La
sélection des outils de Business Intelligence appropriées pour répondre aux besoins du système spécifié est l'une
des tâches la plus difficile dans un projet de type Business Intelligence. Compte tenu de cette difficulté, nous
proposons par la suite une architecture qui associe à StatEduc2.0 les outils BI appropriés pour l‟implémentation
du système dans le contexte indiqué. Une étude sur l'intégration des processus métiers éducatifs dans StatEduc2.0
a été faite et des conclusions sur l'adéquation de StatEduc2.0 avec ces processus analysés ont été dégagées.
L‟architecture proposée prend en compte ces conclusions et des directives pour son implémentation sont
données.

Mots clés: Business Intelligence, Service Oriented Architecture (SOA), Statistiques, Education.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page iii


Mémoire Master 2 Recherche Informatique UY1

Abstract
Institute for Statistics (UIS), headquartered in Montreal, Canada, was created in 1999 as part of UNESCO's
strategy to promote the culture of a policy based on evidence both nationally and internationally, for the
collection and analysis of recent data and high quality in the fields of education, science, technology, culture and
communication. In order to move the country to a higher level of their information systems through improving
the quality of data, the UIS wants to improve computer application entry and processing of current statistical data
(StatEduc2.0) in order to meet several requirements requested by the educational system. One of the major
improvements in this application is the implementation of a decision-making part agile and reliable to turn data
into useful information for decision making. The architecture of this application (StatEduc2.0) therefore requires
a reconfiguration in order to take into account the improvement expressed. The kind of service-oriented
architecture is one suited for this reconfiguration. To this end, we propose in this paper a service-oriented
Business Intelligence architecture for the education management. One of the major failures of BI project is the
selection of BI tools inadequate to meet the specified system; we propose the following architecture that
combines StatEduc2.0 BI tools appropriate for the implementation of the system in the specified context. A study
on the integration of business processes in educational StatEduc2.0 was made and conclusions on the adequacy
of StatEduc2.0 analyzed with these processes have been identified. The proposed architecture takes into account
these findings and guidelines for its implementation are given.

Keys word: Business Intelligence, Service Oriented Architecture (SOA), Statistics, Education.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page iv


Mémoire Master 2 Recherche Informatique UY1

Liste des Figures

Figure 1 :Schéma général de la démarche de BI [GHE10] ................................................................................................................. 6

Figure 2:Bénéfices d‟une SOA [Marks/Bell 2006] ........................................................................................................................... 10

Figure 3: Paradigme SOA [MBA10] ................................................................................................................................................ 11

Figure 4 : Architecture StatEduc2.0 .................................................................................................................................................. 19

Figure 5 : Illustration des nomenclatures. ......................................................................................................................................... 20

Figure 6: Configuration des thèmes dan StatEduc2 .......................................................................................................................... 21

Figure 7: Processus de déroulement de la campagne Statistique ...................................................................................................... 22

Figure 8: Diagramme BPMN du processus de conception d'outils de collecte ................................................................................. 28

Figure 9: Diagramme BPMN du processus de conception de l'annuaire statistique du secondaire .................................................. 29

Figure 10: Diagramme BPMN du processus d'élaboration du rapport d'analyse des données statistiques ...................................... 31

Figure 11: Architecture BI pour l‟éducation basée sur l‟Architecture Orientée Services (SOA) : cas du Cameroun ....................... 39

Figure 12: Architecture de la solution envisagée .............................................................................................................................. 41

Présenté et soutenu par ABOUBAKAR SIDDIKI Page v


Mémoire Master 2 Recherche Informatique UY1

Liste des abréviations

BAM Business Activity Monitoring


BI Business Intelligence
BPEL Business Process Execution Language
BPM Business Process Management
BPMN Business Process Model Notation
CELPLAN Cellule de la planification
CRM Customer Relationship Management
DDES Délégation Départemental des Enseignements Secondaires
DPPC Division des Projets, planification et Coopération
DRES Délégation régional des Enseignements Secondaires
EPT Education Pour Tous
ERP Enterprise Resource Planning
ESB Enterprise Service Bus
ETL Extraction Transform and Load
HTTP Hyper Text Transfer Protocol
IPES Institut Privé d'Enseignement Supérieur
ISU Institut Statistique de l‟UNESCO
JCA Java Component Architecture
JMS Java Message Service
MDX Multidimensional Expressions
MINEDUB Ministère de l‟éducation de base
MINESEC Ministère des Enseignements Secondaires
MINESUP Ministère de l‟Enseignement Supérieur
MOM Message-Oriented Middleware
MVC Modèle Vue Controleur
OLAP Online Analytic Processing
OMD Objectifs du Millénaire pour le Développement
OMG Object Management Group
SGBD Système de Gestion des Base des données
SIG Système d‟Information Géographique
SIGE Système d‟Information pour la Gestion de l‟éducation
SOA Service Oriented Architecture
SOAP Simple Object Access Protocol
SQL Structured Query Language
UDDI Universal Description, Discovery and Integration
UNESCO United Nations of Educational, Scientific and Cultural Organization
WSDL Web Service Description Language
XML L'Extensible Markup Language

Présenté et soutenu par ABOUBAKAR SIDDIKI Page vi


Mémoire Master 2 Recherche Informatique UY1

Sommaire
DEDICACES ........................................................................................................................................................................................................... I
REMERCIEMENTS ..............................................................................................................................................................................................II

RESUME ............................................................................................................................................................................................................... III


ABSTRACT .......................................................................................................................................................................................................... IV
LISTE DES FIGURES ........................................................................................................................................................................................... V
LISTE DES ABREVIATIONS ............................................................................................................................................................................ VI
SOMMAIRE ........................................................................................................................................................................................................ VII
CHAPITRE 1 : INTRODUCTION GENERAL.................................................................................................................................................... 1

1.1 Contexte .............................................................................................................................................. 1


1.2 Problématique...................................................................................................................................... 2
1.3 Solution proposée ................................................................................................................................ 3
1.4 Organisation du mémoire .................................................................................................................... 4
CHAPITRE 2 : BUSINESS INTELLIGENCE ET INTEGRATION D’UNE ARCHITECTURE ORIENTEE SERVICES ........................ 5

2.1 Business Intelligence ........................................................................................................................... 5


2.1.1 Différents niveaux d‟un système d‟information dans une organisation ...................................... 5
2.1.2 Business Intelligence dans l'environnement éducatif .................................................................. 8
2.2 L'Architecture Orientée Services (SOA) ............................................................................................. 9
2.2.1 Définitions.................................................................................................................................... 9
2.2.2 Concepts et généralités de SOA ................................................................................................. 11
2.2.3 Mise en œuvre d‟une architecture SOA ..................................................................................... 12
2.2.4 Conception des services ............................................................................................................. 13
2.3 Intégration des SOA dans des applications ....................................................................................... 14
2.3.1 Approches de mise en œuvre de SOA ....................................................................................... 14
2.3.2 Modélisation d‟une application SOA......................................................................................... 15
CHAPITRE 3 : UNE ARCHITECTURE ORIENTEE SERVICES POUR STATEDUC2.0 .......................................................................... 18

3.1 StatEduc2.0 et ses fonctionnalités ..................................................................................................... 18


3.1.1 Introduction ..................................................................................................................................... 18
3.1.2 Architecture de StatEduc2.0 ........................................................................................................... 19
3.1.3 Administration et configuration ...................................................................................................... 19
3.1.4 Traitement des données................................................................................................................... 21
3.1.5 Tableau de synthèse ........................................................................................................................ 23

Présenté et soutenu par ABOUBAKAR SIDDIKI Page vii


Mémoire Master 2 Recherche Informatique UY1

3.1.5 Création et configuration d'une instance OLAP ............................................................................. 23


3.2 Modélisation des processus métiers du système éducatifs ................................................................ 24
3.2.1- Langage de modélisation ............................................................................................................... 24
3.2.2- Description des processus métiers du système éducatifs............................................................... 25
3.1.3- Modélisation des processus métiers .............................................................................................. 27
3.3 Identification des services ................................................................................................................. 31
3.4 Etude d'intégration des processus listés dans StatEudc2.0 ................................................................ 33
Processus 1: Processus de conception des outils de collecte de données (Questionnaires) .................... 33
Processus 2: Processus de collecte de données ........................................................................................ 34
Processus 3: Processus de production de l'annuaire statistique de l‟éducation ....................................... 35
Processus 4: Processus d'élaboration du rapport d'analyse des données statistiques ............................... 36
Processus 5: Processus de production et de mise à jour de l'annuaire statistique et la carte Universitaire
du Cameroun ............................................................................................................................................ 36
Processus 6: Processus de révision de la carte Scolaire du secondaire.................................................... 37
3.5 Proposition d'une solution pour l'intégration des processus énumérés dans StatEduc2.0................. 37
3.5.1 Architecture BI générale du système éducatif basée sur SOA ....................................................... 38
3.5.2 Architecture BI du système en utilisant les outils décisionnels ...................................................... 40
3.6 Analyse de la solution proposée ........................................................................................................ 42
3.6.1 BI_EDUCAM 1.0 ........................................................................................................................... 42
3.6.2 Talend Open Studio ........................................................................................................................ 42
3.6.3 GeoServer .................................................................................................................................. 43
3.6.4 OpenLayers ................................................................................................................................ 44
3.6.5 Pentaho BI....................................................................................................................................... 44
3.6.6 Mondrian .................................................................................................................................... 44
CHAPITRE 4 : CONCLUSION GENERALE .................................................................................................................................................... 47

BIBLIOGRAPHIE ................................................................................................................................................................................................ 49

Présenté et soutenu par ABOUBAKAR SIDDIKI Page viii


Mémoire Master 2 Recherche Informatique UY1

Chapitre 1 : Introduction général


1.1 Contexte

L‟Organisation des Nations Unies pour l‟Education, la Science et la Culture (UNESCO) est née le 16
Novembre 1945. L‟objectif que s‟est fixé l‟organisation est de « construire la paix dans l‟esprit des hommes à
travers l‟éducation, la science, la culture et la communication ». Afin d‟assurer sa visibilité et sa présence
effective dans les états membres, l‟UNESCO a mis en œuvre une stratégie de décentralisation créant un réseau de
bureaux nationaux, multi-pays et régionaux dont le Bureau de Yaoundé.
Créé en 1991, le Bureau multi-pays de Yaoundé couvre trois pays : le Cameroun, la République
Centrafricaine et le Tchad. Il suit également les relations avec la CEMAC et la CEEAC dont les sièges se
trouvent respectivement à Bangui et à Libreville. La stratégie du Bureau de Yaoundé est en droite ligne avec les
objectifs de l‟EPT (Education Pour Tous), des OMD (Objectifs du Millénaire pour le Développement) et s‟inscrit
dans le cadre des politiques nationales définies par les documents de stratégie de réduction de la pauvreté. Elle
participe également à l‟intégration africaine.

Les cinq objectifs fondamentaux à moyen terme de l‟organisation guident son action à:
- Atteindre une éducation de qualité pour tous ;
- Mobiliser les politiques et les connaissances scientifiques au service du développement durable ;
- Relever les défis éthiques urgents ;
- Promouvoir la diversité culturelle et le dialogue interculturel ;
- Construire des sociétés inclusives du savoir à travers l‟information et la communication.

Les secteurs constituant le Bureau multi-pays de Yaoundé et recouvrant les domaines de compétence de
l‟UNESCO sont : le secteur éducation, le secteur de la science, le secteur de la culture, le secteur communication
et l‟Institut de Statistique de l‟UNESCO (ISU).

L‟Institut de Statistique de l‟UNESCO (ISU), dont le siège est à Mont


réal au Canada, a été créé en 1999 dans le cadre de la stratégie de l‟UNESCO pour promouvoir la culture d‟une
politique reposant sur des éléments factuels, tant au niveau national qu‟international, par la collecte et
l‟exploitation de données récentes et de grande qualité dans les domaines de l‟éducation, la science et la
technologie, la culture et la communication.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 1


Mémoire Master 2 Recherche Informatique UY1

A travers la stratégie de décentralisation entamée en 2009, l‟ISU a mis à la disposition du bureau de


l‟UNESCO Yaoundé, un conseiller statistique chargé de suivre les activités de l‟institut sur le terrain et
d‟apporter un appui technique au programme de travail du bureau cluster (multi-pays). Il a pour mission de :
- Collecter et diffuser les statistiques internationales en matière d‟éducation, de science et technologie, de
culture et de communication au Cameroun, au Tchad et en République Centrafricaine ;
- Elaborer et mettre en application des normes afin de rendre comparables les données internationales ;
- Appuyer les pays du cluster dans l‟amélioration de la qualité et l‟analyse de leurs données ;
- Renforcer les capacités des ressources humaines en charge de la production des statistiques ;
- Apporter un appui technique dans la mise en place des systèmes d‟information dans les domaines de
compétence de l‟UNESCO;
- Promouvoir l‟utilisation des statistiques en vue de l‟élaboration de politiques pertinentes;
- Suivre les progrès relatifs aux objectifs internationaux de développement, spécialement en ce qui
concerne l‟égalité homme-femme ;
- Créer de nouveaux indicateurs pour mieux rendre compte des besoins politiques des pays du cluster;
- Accompagner les aspects statistiques dans les processus d‟élaboration des stratégies sectorielles;
- Apporter un appui technique et participer aux activités statistiques du bureau cluster.
Pour atteindre de tels objectifs, le renforcement des capacités des ressources humaines et l‟appropriation
des méthodologies et normes appropriés de l‟ISU par les pays constituent des éléments stratégiques.
C‟est dans cette perspective, que l‟ISU a développé des partenariats avec des institutions de formation en
Afrique, dont l‟Université de Yaoundé 1 au Cameroun, afin d‟effectuer les transferts de compétences nécessaires
au profit du renforcement des capacités des cadres nationaux en charge de la production et de la diffusion des
statistiques dans le domaine de l‟éducation.
C‟est dans ce cadre partenarial qu‟il nous a été offert la possibilité d‟effectuer un stage académique afin
de nous approprier des normes et méthodologies promues par l‟ISU et d‟y apporter des améliorations.

1.2 Problématique

D‟après les interviews que nous avions effectué au prés du conseiller statistique de l‟ISU, l‟analyse des
problèmes auquel sont confrontés plusieurs pays africains en ce qui concerne le processus de recueil et de
diffusion des statistiques peut être vue sous plusieurs angles à travers les six dimensions du DQAF (Data Quality
Assessment Framework – Cadre d‟évaluation de la qualité des données) :
1. Conditions préalables à la qualité des données
2. Intégrité statistique
3. Rigueur méthodologique

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 2


Mémoire Master 2 Recherche Informatique UY1

4. Exactitude et fiabilité des données


5. Fonctionnalité / Utilité des données
6. Accessibilité aux données

L‟ensemble de ces difficultés se résument aux faiblesses du cadre institutionnel et organisationnel, au


manque des ressources matérielles, logistiques, financières, humaines et techniques et aux problèmes de
communication et de coordination de l‟activité statistique au sein du secteur de l‟éducation.
Pour ce qui est des problèmes spécifiques liés aux aspects informatiques, les déficiences suivantes sont à
mettre en exergue :
- Le manque de ressources humaines qualifiées dotées des compétences requises en informatique;
- Le manque des équipements informatiques ;
- La faiblesse des applications informatiques déployées dans les ministères dans le cadre de la production
et la diffusion des statistiques;
- La faiblesse du Système d‟Information de Gestion de l‟Education.

Dans le but donc de faire passer le Cameroun à un niveau supérieur de son système d‟information grâce
à l‟amélioration de la qualité des données, l‟application informatique de saisie et de traitement des données
statistiques actuelle (StatEduc2.0) doit être amélioré afin de répondre aux exigences suivantes :
- Etre accessible à partir des tous les niveaux hiérarchiques d‟enseignement (établissements,
arrondissements, départements et régions) afin d'assurer le partage les données ;
- Disposer d'une architecture souple du système éducatif Camerounais, en utilisant des outils appropriés
aux besoins du système;
- Disposer d'un outil décisionnel efficace permettant de générer l‟annuaire statistique, le tableau de bord et
le rapport d‟analyse selon le modèle voulu (XML, PDF, Word, Excel);
- Possibilité de déploiement des différents tiers de l‟application dans des serveurs différents (Vision
d‟architecture trois-tiers) ;
- Disposer d'un outil de visualisation et d‟accès aux données d‟un établissement sur une carte
géographique ;

1.3 Solution proposée

Pour atteindre les objectifs ci-dessus cités, les différentes activités que nous avons effectuées dans le cadre de
notre stage sont les suivantes :

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 3


Mémoire Master 2 Recherche Informatique UY1

- Elaboration d‟une approche et d‟une démarche qualité de mise en place du SIGE (Système d‟Information
de Gestion de l‟Education) ;
- Maitrise et proposition des améliorations de StatEduc2.0 selon les besoins de chaque pays;
- Elaboration du modèle conceptuel et physique des données pour la plateforme du MINEDUB et du
MINESEC ;
- Configuration avec StatEduc2.0 de la plateforme du MINEDUB et du MINESEC ;
- Création des cubes OLAP pour les données du MINESEC ;
- Conception d'un outil décisionnel de création de l‟annuaire statistique du MINESEC.

Dans le cadre de notre travail de recherche sur l'utilisation de Business Intelligence pour construire/améliorer le
système de recueil et d'analyse de données du système éducatif Camerounais, nous avons commencé par
recenser, décrire et modéliser avec BPMN (Business Process Management Notation) [OMG09] une liste
exhaustive des processus métiers pour l'intégration du Business Intelligence dans le système de collecte et
traitement de l'information sur l'éducation au Cameroun. Ensuite, une étude sur l'intégration de ces processus
dans StatEduc2.0 a été faite afin de voir si cette intégration est possible sans trop de difficultés (processus après
processus) compte tenu d'une certaine rigueur imposé par le logiciel. Cette partie nous a permis de dégager des
conclusions sur l'adéquation de StatEduc2.0 avec les processus analysés. Enfin, sur la base de l'analyse
précédente, une solution pour l'amélioration du StatEduc2.0 a été faite. Cette solution consistait en une
architecture orientée services pour l'implémentation du système. Plusieurs scénarios ont été analysés et comparés
et des éléments de la solution ont été décrit pour apporter plus de précision sur le modèle proposé.

1.4 Organisation du mémoire

La suite de ce mémoire est organisée comme suit : le chapitre 2 présente un état de l'art sur le Business
Intelligence et le Business Intelligence pour l'éducation d'une part et d'autre part sur l'intégration d'une
Architecture Orientée Services (cas spécifique) dans une plate-forme existante. Ce chapitre permet de
ème
comprendre les méthodes et les outils sur lesquels s'est appuyé notre travail. Le 3 chapitre présente en premier
lieu l'application StatEduc2.0 et ses fonctionnalités et en second lieu l'Architecture Orientée Services pour
StatEduc2.0 conçue avec des analyses de la solution proposée. Le mémoire se termine par une conclusion
générale et les perspectives pour les études ultérieures.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 4


Mémoire Master 2 Recherche Informatique UY1

Chapitre 2 : Business Intelligence et Intégration


d’une Architecture Orientée Services

Ce chapitre passe en revue la Business Intelligence, les architectures Orientée Services (SOA) et les approches
d‟intégration des SOA dans des applications.

2.1 Business Intelligence

La Business Intelligence (ou pour les habitués la BI) est devenue, dans les milieux qui gravitent autour de
l'informatique, un quasi-synonyme de l'information décisionnelle. Une première définition simple consiste à dire
que la Business Intelligence en français «l‟informatique décisionnelle» est la branche de l‟informatique qui
permet l'exploitation des données de l'entreprise dans le but de faciliter la prise de décision [GHE10]. C'est-à-
dire, la compréhension du fonctionnement actuel et l'anticipation des actions pour un pilotage éclairé de
l'entreprise. Elle désigne en effet un ensemble d'outils technologiques, méthodiquement assemblés, et déployés
en parfaite cohérence avec la stratégie d'entreprise préalablement élaborée [ALF13]. La BI n'a d'autre finalité que
de délivrer les informations pertinentes à chaque manager afin qu'ils puissent prendre le plus efficacement
possible les meilleures décisions selon son contexte d'action, ses prérogatives et ses objectifs tactiques et
stratégiques [ALF13]. Une deuxième définition plus technique veut que nous présentions en premier lieu les
différents niveaux d‟un système d‟information et par la suite nous définissions ce qu‟est un système
d‟information décisionnel.

2.1.1 Différents niveaux d’un système d’information dans une organisation


Comme le résume la figure 1, un système d‟information se décompose en trois niveaux :
 Le niveau opérationnel: Concerne les données relatives aux différentes fonctions de l‟entreprise, il
s‟agit des bases de données résultantes des sources d‟information internes;
 Le niveau décisionnel : Constitue une synthèse des données opérationnelles, choisies pour leur
pertinence. Ce niveau concerne des données qui, agrégées, intégrées et organisées sur base de structures
particulières de stockage volumineux, résultent en informations pertinentes à la décision ;
 Le niveau stratégique : le niveau le plus élevé dans la hiérarchie, concerne l‟orientation des
informations résidant au niveau décisionnel en vue de fournir des indicateurs pertinents. Ce niveau
fourni au décideur d‟une part, des systèmes de pilotage qui lui fournissent une série de tableaux de
bord et de synthèse, très souvent enrichis de fonctionnalités statistiques et de simulations, et d‟autre part

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 5


Mémoire Master 2 Recherche Informatique UY1

sur des outils d‟extraction, de gestion de connaissances qui permettent de mettre en évidence des
corrélations entre des événements apparemment non liés. La finalité du niveau stratégique est le
pilotage de l‟entreprise dans une vision stratégique à long terme [Van01].

Figure 1 :Schéma général de la démarche de BI[GHE10]

La description des éléments les plus importants de ce système d‟information sont :

 ETL
La notion d‟ETL (Extract Transform Loading), recouvre à la fois des outils et des processus d‟alimentation. Il
s‟agit d‟un élément clé dans l‟intégration des applications, en particulier dans le monde de la Business
Intelligence et du data warehousing. Outils et processus ETL sont des briques d‟une infrastructure de SI, dont la
valeur ajoutée et le retour sur investissement s‟expriment dans le temps en accompagnant l‟évolution du système
d‟information global ou du système d‟information décisionnel. L‟ETL est chargé d‟automatiser les traitements
(extraction, transformation et chargement) et de les rendre plus facilement paramétrables. Les données peuvent
être issues de différentes sources telles que : les bases de données, les applications métier, les fichiers, les
données externes, les ERP et les données saisies manuellement. Un outil ETL va permettre l‟extraction des
données issues des différentes sources, il récupère les données identifiées et sélectionnées. Au moment de
l‟extraction il faut prendre en compte la synchronisation et la périodicité des rafraichissements. Enfin les
données recueillis sont transformées en fonction des besoins de l‟entreprise, c‟est à dire qu‟elles sont vérifiées,
reformatées, nettoyées afin de supprimer les valeurs aberrantes et les doublons puis elles sont consolidées.
[DSM08].

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 6


Mémoire Master 2 Recherche Informatique UY1

 Le Data Warehouse
Le Data Warehouse (ou entrepôt des données) se trouve au cœur du système d‟information décisionnel car
c'est sont les données qu‟il contient, que les utilisateurs et les décideurs vont exploiter. Le Data Warehouse
comporte 4 caractéristiques :
 Les données sont organisées par thème.
 Les données sont issues de différentes sources qui ont chacune un format, elles sont donc intégrées avant
d‟être proposées à l‟utilisation.
 Les données non volatiles ne peuvent pas être supprimées, ni changées au cours du temps.
 Les données sont historiées et les données non volatiles sont aussi horodatées. On peut ainsi
visualiser l‟évolution dans le temps. Le degré de détail d‟archivage est relatif à la nature des données car
toutes les données ne doivent pas forcément être archivées [DSM08].
Le Data Warehouse comporte donc 4 caractéristiques principales:
 il est orienté sujet,
 intégré,
 non volatile et
 historié.
Du Data Warehouse, on peut obtenir un ou plusieurs Data Marts qui sont définis comme des versions plus
légères du Data Warehouse, car un Data Mart rassemble les données d‟un même sujet, d‟un même thème ou d‟un
même métier. Le fait que cette base soit plus légère, le temps de réponse est beaucoup plus court. Cependant la
multiplication des Data Marts tend à complexifier la gestion des données. Quand les données ont été collectées,
stockées, nettoyées, consolidées, et sont rendues accessibles, elles peuvent être utilisées, en fonction des besoins
des utilisateurs pour cela il existe différents outils d‟extraction et d‟exploitation [DSM08].

 Le Data Mining
Le Data Mining appelé aussi l’extraction de connaissances à partir de données ou Knowledge Discovery in
Databases [DSM08] a pour but de mettre en évidence des corrélations éventuelles dans un volume de données
important du système d‟information ou de l‟entrepôt de données et de dégager des tendances. Il s‟appuie sur des
techniques d‟intelligence artificielle pour mettre en évidence des liens cachés entre les données.

 OLAP
OLAP (Online Analytical Processing), désigne les bases de données multidimensionnelles (aussi appelées cubes
ou hyper cubes) destinées à des analyses complexes sur ces données. Ce concept est appliqué à un modèle virtuel

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 7


Mémoire Master 2 Recherche Informatique UY1

de représentation de données appelé cube ou hyper cube OLAP, qui nous intéresse plus particulièrement. Cet
hyper cube est une représentation abstraite des données prévue à des fins d'analyses interactives par une ou
plusieurs personnes (souvent ni informaticiens ni statisticiens) du métier [DSM08].

 Tableau de bord
Le tableau de bord est un instrument d‟aide à la décision qui permet de mesurer la performance pour faciliter
le pilotage d‟une ou plusieurs activités dans l‟objectif de faire progresser l‟entreprise. Il contribue à réduire
l‟incertitude et à faciliter la prise de risque inhérente à toutes décisions.

 Reporting
Le terme "Reporting" désigne une famille d'outils de Business Intelligence destinés à assurer la réalisation, la
publication et la diffusion de rapports d'activité selon un format prédéterminé. Ils sont essentiellement destinés à
faciliter la communication de résultats chiffrés ou d'un suivi d'avancement. L'outil de reporting assure
l'interrogation des bases de données selon les requêtes SQL préparées lors de l'élaboration du modèle. Le rapport
d'activité peut ensuite être publié sur l'Intranet, périodiquement en automatique ou ponctuellement à la demande.
L'outil offre bien entendu des fonctions spécifiques pour l'élaboration du modèle du rapport, des modules de
calcul et de présentation (graphiques) afin de concevoir des comptes rendus particulièrement seyants et pertinents
[PIL13].

2.1.2 Business Intelligence dans l'environnement éducatif

L'utilisation du Business Intelligence dans un environnement éducatif peut être vue sous deux angles
différents. Il peut signifier l'utilisation de la BI dans les ministères de l'éducation ou dans les entreprises qui
travaillent avec l'environnement éducatif pour trouver des solutions rendant les BI utiles dans les activités de
gestion des connaissances ou des activités de l'organisation d‟apprentissage. Le deuxième point de vue est centré
sur l'utilisation de la BI comme support de décision pour la gestion des établissements d'enseignement. Les deux
points de vue sont très proches et invitent peut-être à la coopération [PCV06].
Une des tâches de gestion des établissements d'enseignement est d'évaluer la façon dont les processus
d‟enseignement, de recherche, d‟évaluation sont exécutés. A cet effet, les méthodes et les technologies de BI
pourraient être vitales [PCV06]. Un des processus principaux évidents dans l‟enseignement éducatif est
l'enseignement. La difficulté est dans la question de comment mesurer le succès ou l'échec des activités
d'enseignement d'où la tâche principale de la mise en œuvre BI dans l'environnement éducatif est de trouver un
ensemble approprié de mesures qui pourraient être utilisés pour les activités d'enseignement. On se rend compte

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 8


Mémoire Master 2 Recherche Informatique UY1

donc que la particularité du BI dans l‟environnement éducatif se situé au niveau de l‟analyse et des résultats
obtenus.
Pour le processus d‟analyse, des dimensions et des mesures appropriées doivent être utilisées (lors de la
construction de l‟entrepôt des données) pour les activités d'enseignement.
Pour la présentation des résultats obtenus, la particularité est dans les rapports publiés. Par exemple, les
universités pourraient créer des rapports qui montrent l'évolution du nombre d'étudiants qui ont terminé avec
succès ou sans succès les études, le nombre d'étudiants candidats à une spécialisation ou une matière, le nombre
d'étudiants effectivement inscrits dans une année scolaire particulière, etc. Préparer des rapports et l'analyse de
ces mesures permet aux universités de juger l'intérêt d‟augmentation ou de diminution de certaines
spécialisations et pourrait aider à décider de l'ouverture de la procédure d'agrément de nouvelles spécialisations.
De même, la base de la prise de décision pourrait résulter de la connexion de données internes réunis avec les
données externes. La connexion de données sur les élèves avec des sources externes est très utile, car elle aide
par exemple à analyser le succès des étudiants sur le marché du travail. Pour l'université, il pourrait être très
intéressant d'avoir accès à des données du Ministère. La solution BI peut prendre des données sur les taux de
chômage de certains diplômés de l'enseignement et des liens vers des spécialisations qu'ils avaient étudiés. Une
telle analyse sert à la planification stratégique de l'université et peut également être utilisé pour comparer la
qualité de l'éducation (et le succès sur le marché du travail, respectivement) dans les différents établissements
d'enseignement [PCV06].
En somme, la Business Intelligence est une branche de l‟informatique qui permet de collecter, de stocker,
de distribuer et d'exploiter des données de l'entreprise dans le but de faciliter la prise de décision. Le point qui
suit présente l'architecture Orientée Services, sa mise en œuvre et la conception des services, élément central de
cette architecture.

2.2 L'Architecture Orientée Services (SOA)

2.2.1 Définitions

SOA est l‟acronyme de Service Oriented Architecture qui est traduit comme « Architecture Orientée
Service ». SOA est une architecture métier conceptuel où les fonctionnalités métiers, ou la logique de
l’application, est mise à disposition aux utilisateurs, en tant que services réutilisables et partagés dans un
environnement informatique. Les services dans une SOA sont les modules d‟une fonctionnalité de l‟application
avec des interfaces exposées et qui sont invoquées par messages. [MBA10].
L‟architecture orientée services (SOA) s‟inscrit dans une démarche d’urbanisation qui guide la
mise en place des applications « métiers » et fixe la frontière entre réutilisation de l‟existant et nouveaux
développements. La SOA favorise la réutilisation fonctionnelle au travers de l’approche service. Cette

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 9


Mémoire Master 2 Recherche Informatique UY1

approche est un modèle d'interaction applicative mettant en œuvre des composants logiciels avec une
forte cohérence interne et des couplages externes « lâches ». Elle permet en outre de contractualiser la mise à
disposition des grandes fonctions métier de l‟entreprise et induit une mise à disposition homogène de ces
fonctions. De plus cette approche permet d‟envisager de manière uniforme la mise en place de fonctions
communes comme l‟administration, l‟exploitation, la sécurité, etc.
Ce type d‟architecture suit des principes de modélisation modernes. Quelques un de ces principes sont les
suivants [MBA10]:
 L‟architecture doit reposer sur le concept d‟offre et de demande de services.
 Les composants doivent pouvoir communiquer entre eux de manière asynchrone et doivent être couplés
faiblement.
 L‟architecture doit être découpée en plusieurs couches:
Ces principes doivent permettre de rendre le système flexible pour s‟adapter à la stratégie des
entreprises. Cette flexibilité découle du fait que les services sont réutilisables grâce à une interface standardisé,
une facilité d‟intégration accrue pour une complexité plus faible.
Outre sa flexibilité, les bénéfices de la SOA peuvent être nombreux comme le montre la figure2.
L‟agilité métier permet à la SOA de s‟adapter rapidement à son environnement métier en maintenant des
services s‟alignant aux demandes clientes. Une réduction des coûts est atteinte par une meilleure réutilisation
des services existants ainsi qu‟une meilleure maintenance grâce à une consolidation des applications par des
services réutilisables.

Figure 2:Bénéfices d’une SOA [Marks/Bell 2006]

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 10


Mémoire Master 2 Recherche Informatique UY1

2.2.2 Concepts et généralités de SOA


Le paradigme SOA se résume à trois verbes Chercher, Publier et Consommer comme le schéma ci-dessous :

Figure 3: Paradigme SOA[MBA10]

Dans cette représentation, l‟élément central est le service. Un service est un comportement défini par contrat,
qui peut être réalisé et fourni par tout composant pour être utilisé par tout composant, sur la base unique du
contrat [BAC02].
Le contrat est passé entre le fournisseur de service et le consommateur de service. Il est alors:
o Lié à la syntaxe du service (opération, messages d‟entrée, messages de sortie, …)
o Lié à la sémantique du service (définition de règles et de contraintes d‟usage, …)
o Lié à la qualité de service (temps de réponse attendu, procédures en cas de panne, temps de reprise
après interruption, …)
Le contrat s‟appuie sur des standards d‟interopérabilité pour faciliter le dialogue (exemple : WSDL). Un
accord de niveau de service est un contrat souscrit entre le fournisseur d'un service et un usager de ce service
définissant les engagements de ces deux parties. Ces engagements, contenant le niveau de service fourni ainsi
que les pénalités encourues en cas de manquement de part et d'autre, sont définis par des critères objectifs de
qualité de service pouvant être évalués par les deux parties.
L‟échange entre le fournisseur de service et le consommateur doit se faire à travers des messages
(couplage lâche vis-à-vis de son environnement) et l‟utilisation d‟une orchestration évite que les services aient
besoin de connaître les autres services. En plus, le contrat du service ne doit contenir que les informations
pertinentes à son invocation. Le fonctionnement du service est alors dit en « boîte noire » c'est-à-dire seul le
contrat exposé au consommateur du service est connue et le fonctionnement interne du service ne doit pas être

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 11


Mémoire Master 2 Recherche Informatique UY1

visible (Logique métier, Implémentation). Il est par conséquent important d‟assurer la prédictibilité d‟un service ;
pas de variation dans le comportement et dans la réponse d‟un service lors de la réception d‟une requête.
Un service doit être accessible depuis un entrepôt ou un annuaire pour faciliter sa découverte. Ainsi le
fournisseur de services à la charge de déposer et de mettre à jour ses services depuis l‟annuaire et le service est
enrichi par un ensemble de métadonnées pour faciliter la recherche du consommateur de services.
Un service doit disposer de l‟ensemble des informations nécessaires à son exécution et ne doit dépendre
d‟aucun service externe (couplage lâche). Ceci garantie l‟autonomie d‟un service et permet de s‟assurer de sa
prédictibilité. En plus, un service doit être sans état de façon à minimiser la consommation de ressources.
Un service doit fonctionner de manière modulaire et non pas intégrée. Pour se faire, il faut toujours
assurer la décomposition d‟un service complexe en sous services plus simples entre eux (garantir l‟autonomie) et
s‟inscrire dans une logique de composition de services à travers l‟utilisation de l‟orchestration (couplage lâche) ;

2.2.3 Mise en œuvre d’une architecture SOA

 Services Web : réponses au SOA


Le premier standard d‟exposition et d‟invocation de services le plus important est les Web Services
(WS)[MBA10]. Le service web est l'une des solutions technologiques adaptées et couramment utilisé pour
développer une architecture orientée service. Mais même si SOA et Web Services sont intimement liés, les Web
Services ne sont pas le seul moyen d'exposer des services notamment dans le cadre d'environnements
techniques homogènes. Le standard Web Service entend fournir, à l'instar de CORBA [MBA10], une
technologie unifiée pour décrire et invoquer des services, quelque soit leur localisation physique ou leur
technologie d'implémentation. Le cœur des Web Services est constitué des standards SOAP, UDDI et WSDL
[MBA10].
SOAP (Simple Object Access Protocol) est le protocole utilisé par les services web pour définir l‟échange
entre un client et un fournisseur de service. En effet, SOAP permet la transmission de messages entre objets
distants, en invoquant des méthodes sur des objets physiquement situés sur une autre machine. Le transfert se fait
le plus souvent à l'aide du protocole HTTP.
UDDI (Universal Description, Discovery and Integration) est la spécification définissant la manière de
publier et de retrouver des services web. C'est un annuaire qui offre des mécanismes d'enregistrement et de
recherche de services web développés et publiés par des entreprises. UDDI fournit des informations sur l'auteur
de services web (adresse, contact...), sur la classification (société informatique, hôpital, ...) et sur les moyens
techniques permettant de les invoquer.
WSDL (Web Service Description Language) est le format XML spécifié par le W3C permettant de définir un
service web qui utilise le protocole SOAP. Cette définition inclut les opérations exposées, le type de ses

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 12


Mémoire Master 2 Recherche Informatique UY1

paramètres d'entrées-sorties, et l'adresse réseau à laquelle nous pourrons l'invoquer. UDDI permet de retrouver
un service web, et WSDL de décrire ses méthodes.
Deux familles de Services Web se distinguent actuellement :
 Services Web « étendues » : s‟appuie sur des standards UDDI / WSDL / SOAP
 Services Web REST (Representational State Transfer) : utilise directement HTTP au lieu d‟utiliser une
enveloppe SOAP.
Avant d‟implémenter une architecture SOA comme les Web services ou tout autre technologie, il importe de
faire une modélisation des systèmes avec des outils capables de les décomposer en services. Le BPM, fait parti
de cette classe d‟outils.

 Le Couple BPM et SOA


Le BMP (Business Process Management ou Gestion des Processus Métier) est la discipline qui
fournit l‟ensemble des méthodes, technologies et outils destinés à améliorer l‟efficacité, la traçabilité et l‟agilité
des processus métiers au sein desquels collaborent des systèmes, des logiciels, des personnes et aussi des clients,
des fournisseurs et des partenaires...[MGU08].
Pour décrire de manière unifiée les processus d‟entreprise, un standard de langage de modélisation des
processus est apparu le BPMN (Business Process Model Notation). Il a été développé par le BPMI (Business
Process Management Initiative) et est maintenu par l‟OMG. Ce langage est supporté par les principaux éditeurs
de solution SOA [XGO09].
Dans la discipline de BPM, on définit SOA comme "un style Architecture logicielle pour lequel les
processus métier de l’entreprise sont des composants logiciels paramétrables, orchestrant des tâches
avec les acteurs de l’entreprise et des appels à des composants de services pour s’exécuter."

2.2.4 Conception des services

L‟apport d‟une méthodologie dans la mise en œuvre de SOA devient une nécessité pour l‟adoption de SOA
dans les entreprises. Comme méthodes de conception de services on peut citer les trois méthodes les plus
populaires qui sont : SOMA (IBM), SODA (De Gamma) et Praxeme (Unilog Management et Orchestra
Networks). Praxeme est considérée comme publique et la plus utilisée [OCA12]. C‟est une méthodologie
ouverte avec un référentiel d'entreprise complet formalisant le métier, l'organisation de l'entreprise, le SI.
Les étapes de la méthode Praxeme :
 Analyse du cahier des charges pour identifier les objectifs, le vocabulaire et les règles métier;
 Définition du cadre métier pour identifier les entités métier et les domaines sémantiques

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 13


Mémoire Master 2 Recherche Informatique UY1

 Définition du savoir-faire de l‟entreprise pour identifier : les départements, les processus et les
indicateurs clés de performance (KPI);
 Déduction de l‟architecture logique et accostage avec l‟existant pour identifier : les composants, les
services, ...
 Calquer l‟architecture logique sur le physique pour identifier la fédération d‟ESB.

2.3 Intégration des SOA dans des applications

Comme nous l‟avons définie dans la partie précédente, l‟architecture orientée services (SOA) s‟inscrit
dans une démarche d’urbanisation qui guide la mise en place des applications « métiers » et fixe la
frontière entre réutilisation de l‟existant et nouveaux développements. Deux phases sont utilisées pour la mise en
œuvre de SOA : la phase d’urbanisation et la phase post-urbanisation [OCM12].
La phase d‟urbanisation est la phase où l‟ensemble du système d‟information est urbanisé en s‟appuyant
sur la cartographie des domaines métiers de l‟entreprise et sur le code existant. Pour la phase post-urbanisation,
au démarrage de chaque projet, il est nécessaire de s‟appuyer sur les processus et services répertoriées
précédemment afin d‟étendre correctement l‟architecture mise en place.
Pour l‟intégration des SOA dans des applications, nous allons expliquer la mise en œuvre d‟une SOA à
travers deux approches et ensuite détailler l‟une des étapes de ces approches qui est la modélisation d‟une
application SOA.

2.3.1 Approches de mise en œuvre de SOA


SOA n'est pas une technologie, ni une recette, encore moins un produit. C'est une façon de penser et de
concevoir le Système d'Informations. Deux approches (Bottom –up et Top-down) sont utilisées lors de la mise en
œuvre d‟une architecture SOA ou d‟un SI basé sur SOA [OCM12].

 Approche Bottom-up
Traditionnellement, la mise en place est proposée suivant une approche Bottom-up, en suivant les étapes
suivantes :
1-) Chaque application fournit des connecteurs propriétaires. La première étape est de développer des
services façade permettant d‟exposer les fonctionnalités offertes par les applications en suivant un modèle
unique. Les services développés doivent fournir un niveau d‟abstraction par rapport aux applications
2-) Une fois tous les services développés, on ajoute une couche de service management. Les outils
permettent de superviser les échanges et d‟anticiper les problèmes techniques ou fonctionnels.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 14


Mémoire Master 2 Recherche Informatique UY1

3-) La troisième et dernière étape est de les utiliser dans les processus métiers de l‟entreprise.
Les problèmes de la mise en place d‟une SOA en suivant ces étapes sont [CDA08]:
- Les décideurs ne voient l‟utilité de la SOA qu‟à partir de la troisième étape, c'est-à-dire quand il est
possible de composer les services pour les utiliser dans les processus métiers.
- La réalisation des services est une tâche transverse. L‟approche souvent employée est d‟inclure la
réalisation des services dans la mise en place d‟une application dans le SI, ou dans un projet d‟intégration
entre deux applications. Or la réalisation d‟un service transverse a un surcoût qui dépasse le cadre du
projet, et qui est généralement sous-estimée.
- Le surcoût de la réalisation d‟un service transverse ne se justifie que sur le long terme, quand le service a
été utilisé dans un certain nombre de processus.
Cette approche de la SOA est uniquement technique, elle ne prend absolument pas en compte les contraintes des
décideurs, et la nécessité de justifier les investissements IT sur leurs apports fonctionnels.

 L’approche Top-down
L‟approche Top-down est beaucoup plus pragmatique que l‟approche détaillée précédemment. Elle permet la
définition des services en fonction de leurs cas d‟utilisation :
1. Modélisation des processus métiers exécutables. Ces processus métiers exécutables définissent des
services techniques permettant d‟accéder au SI, utilisant tout type de connecteurs, y compris les Web Services.
Ces services techniques ne sont à priori pas transverses lors de la première modélisation : il y a possibilité qu‟un
même service technique soit mis en place différemment par plusieurs équipes.
2. Identification des services transverses : cela est facilité par les capacités d‟analyse des dépendances
entre processus que proposent les outils de BPM. Une fois les services transverses implémentés, ils sont
référencés dans l‟annuaire de l‟entreprise.
3. Ajout de Service Management, ou plutôt de Business Activity Monitoring(BAM).
Le principal problème de l‟approche Top-down est de considérer que les services sont des Web Services. On est
beaucoup trop proche du modèle objet (opérations atomiques et sans états) pour garantir une réutilisabilité. Dans
l‟approche top-down, un service a un niveau d‟abstraction supérieur : il s‟agit plutôt de processus BPEL
réutilisable, masquant les détails d‟implémentation, mais capitalisant sur les connecteurs permettant d‟accéder au
SI ; un service peut être technique ou fonctionnel.

2.3.2 Modélisation d’une application SOA


La modélisation des applications de type SOA passe par trois grandes activités qui sont [OCM12]:
- La modélisation des processus métier ;

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 15


Mémoire Master 2 Recherche Informatique UY1

- La conception des diagrammes BPMN supporté par la majorité des modeleurs ;


- La modélisation des services.

Un processus métier est une « séquence organisée d‟activités connexes qui, ensemble, créent un résultat
ayant de la valeur pour les clients ou les usagers (institution ou administration)» (M.HAMMER) [CNAM13].
Un processus décrit en général le métier, et non le système informatique. On distingue trois catégories des
processus métier :
- Processus clients/customer process : fournissent les produits ou services aux clients ; Exemple : la
souscription à des produits bancaires ;
- Processus supports/sustaining process : responsables de la valeur ajoutée aux clients indirectement
Exemple : la mise à jour du catalogue des produits bancaires ;
- Processus internes/enabling process : fournissent des services de gestion interne (pas de lien avec le
client) ; Exemple : le traitement des salaires, l‟embauche, l'inventaire

La modélisation des services consiste d‟abord à identifier les services et ensuite à les nommer (verbe ou nom)
et les publier. L‟identification des services est l‟un des problèmes centraux pour mettre en œuvre une SOA car la
granularité des services est fondamentale, il faut éviter une granularité trop fine qui entraîne beaucoup
d‟interactions et des problèmes de performance. On recommande des services à “gros grain” mais attention à une
granularité trop “épaisse”, un service qui fait trop de chose, risque de ne pas être réutilisable. Il faut trouver en
tout cas le juste milieu. Pour obtenir une granularité pertinente des services, il est nécessaire de concilier les deux
analyses (Top-down, Buttom-up) et de comparer les services “remontés” avec ceux “déduits”. Ensuite faire les
compromis nécessaires pour réutiliser le maximum de code [OCM12].
Comme point d‟entrée de la modélisation des applications SOA, trois démarches sont utilisées :
- La démarche orientée métier dont le but est de réaliser la cartographie des processus ;
- La démarche orientée applications conduit à la cartographie des échanges de flux inter applicatifs ;
- La démarche orientée données pour réaliser la cartographie des référentiels.

Après avoir identifié et décrit les processus métiers, la modélisation BPMN permet d‟illustrer à l‟aide d‟un
diagramme l‟enchainement des activités, des événements et résultats d‟un processus entre les acteurs qui
participent à la réalisation de ce processus.

Ce chapitre a passé en revue les notions de Business Intelligence, d'Architecture Orientée Services
(SOA) et des approches d'intégration de SOA dans une application. On retient que deux approches (le Bottom-
Up et le Top-down) sont utilisées pour la mise en œuvre de SOA. Le chapitre qui suit mettra en pratique ces

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 16


Mémoire Master 2 Recherche Informatique UY1

approches pour intégrer une Architecture Orientée Services dans l'application StatEudc2.0 existant. Pour ce faire
nous avons utilisé l‟approche Top-down et choisis la démarche orientée métier pour construire le système.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 17


Mémoire Master 2 Recherche Informatique UY1

Chapitre 3 : Une architecture orientée services


pour StatEduc2.0
3.1 StatEduc2.0 et ses fonctionnalités

3.1.1 Introduction

L‟application StatEduc2/ISU est une plateforme de saisie, traitement et exploitation des données
développée par l‟Institut de Statistique de l‟UNESCO. C‟est un outil spécialisé dans la gestion des bases de
données scolaires, un produit qui s‟adapte à de multiples contextes de collecte et de traitement de données
statistiques scolaires. StatEduc2.0 a été conçue dans la continuité de « StatEduc 1.0 » mais avec une souplesse
plus accrue. Selon les spécificités de chaque pays, l‟application pourra être configurée. C'est un outil utilisé dans
une quinzaine de pays africains (Cameroun, RCA, RDC, Sénégal, Mali, Burkina Faso, Niger, Guinée Conakry,
Burundi, Ethiopie, Ouganda, Tanzanie, Angola, Ghana, Sierra Leone …), les spécifications de cette plateforme
sont entre autres [ABS12]:
• Application libre «Open Source», fonctionnant sous Windows ;
• Application PHP hébergé dans le serveur Wamp et compatible avec plusieurs type de système de gestion
de base de données (Oracle, SQL server, Ms Access, Mysql, etc.)
• Configuration d‟écrans de saisie conviviaux à l‟image des questionnaires avec un module de contrôle
dynamique de cohérence interne des données
• Grande adaptabilité aux besoins variés, aux changements du découpage administratif et du système
éducatif
• Modèle de base de données pluriannuelle et multidimensionnel
• Application fonctionnant sur un poste ou en réseau d‟ordinateurs connectés permettant d‟effectuer la
saisie des données à partir de plusieurs postes, les données étant centralisées sur un serveur
• Mode d‟accès sécurisé aux données avec cryptage et différencié selon le droit accordé aux utilisateurs
• Application orientée Web compatible et accessible à distance à l'aide d'Internet Explorer
• Facilité de déploiement, d‟utilisation et de maintenance
• Module de reportage automatique des données – tableaux de synthèse dynamiques exportable sous
MICROSOFT EXCEL
• Comporte un module d‟exploration multidimensionnelle des données de type OLAP (OnLine Analytical
Processing)

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 18


Mémoire Master 2 Recherche Informatique UY1

• Module d‟imputation des données manquantes


• Application flexible et évolutive
L‟application doit s‟affranchir des contraintes liées au choix du type de système de gestion de base de données.
Elle intégrera une flexibilité de connectivité aux différents standards de SGBDR. Les standards qui devront être
opérationnels avec l‟application sont : Microsoft SQL Server, Oracle, Mysql, Microsoft Access
 Installation et configuration
Les caractéristiques matérielles requises sont : Pentium II ou plus, Microsoft Windows (Win 32) : NT/2000 /XP
ou LINUX, IE 5.0 ou ultérieur. Pour son installation, il faut installer d‟abord un serveur web. On pourra utiliser
Wamp pour les environnements de type Windows et ensuite copier le répertoire de l‟application dans C:/Wamp/.
L‟application peut être installée sur un poste serveur. Des postes clients pourront ainsi accéder à l‟application via
le Navigateur WEB. Si ces postes sont liés en réseau le nom du Poste Serveur sera utilisé. Dans le cas où les
machines sont connectées à Internet utiliser l‟adresse IP du Serveur.
L‟application « StatEduc2 », pour des raisons de d‟abstraction et de flexibilité, intègre un dictionnaire de
données qui stocke la description des traitements ou des interfaces hommes machines sous forme de méta
données et de méta structure. Toutes les tables qui constituent le dictionnaire de données sont indispensables au
bon fonctionnement de l‟application.

3.1.2Architecture de StatEduc2.0 Arbre


Css dragndrop
Client Side Fonts Menus
Image

Js adodb
Questionnaire
Affichage
StatEduc 2
Classes arbre

Server Side Db métier

Include Accueil

Instances Administration
Fichiers à la
racine Lib
Saisies données
Template
Tableaux Synthèse
s
Fichier racine
Figure 4 : Architecture StatEduc2.0

3.1.3 Administration et configuration

La configuration de l‟application StatEduc2.0 comprend les étapes suivantes :

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 19


Mémoire Master 2 Recherche Informatique UY1

 Définition des paramètres généraux;


 Saisie de l‟atlas ;
 Saisie des nomenclatures ;
 Configuration des masques de saisie ;
 Intégration des règles de saisie
 Intégration des contrôles cohérence.

 Définition des paramètres généraux


La définition des paramètres généraux consiste à configurer le système d‟enseignement (le secteur
d‟enseignement), de spécifier l'année de collecte des données, de choisir la langue de fonctionnement et enfin de
choisir le type de SGBD (Access par défaut).
 Saisie de l’ « atlas »
La fonctionnalité « Saisie de l‟atlas » permet de structurer une représentation du découpage administratif
ou pédagogique afin de faciliter la localisation d‟un établissement. L‟instanciation de l‟Atlas est fonction de la
réalité de chaque pays. La construction de l‟Atlas passe par 4 étapes successives dont la première est la
configuration des types de regroupement (catégorisation de type d‟entité de la division administrative ou scolaire
dans un pays donné), ensuite la configuration de chaine de regroupement (hiérarchisation entre les types de
regroupement), ensuite vient l'édition des chaînes et enfin la sélection du regroupement sur lequel on rattache les
regroupements en cours d‟ajout.
 Nomenclature
L‟objectif est de mettre en place une application facilement maintenable et évolutive, pour ce faire un
ensemble de paramètres sont décrits dans des structures de données afin de permettre une flexibilité accrue en
termes d‟évolution. C‟est ce que l‟on appelle ici les nomenclatures ou tables de nomenclature ou tables de
paramètres. Certains de ces paramètres sont des valeurs qualitatives prises par des variables de saisie. Les
différents paramètres sont regroupés dans des tables dites de nomenclature. Toutes les tables de nomenclature
sont liées aux tables de données. Afin de réaliser l‟acquisition de ces nomenclatures, on va procéder par trois
étapes. Il faut tout d‟abord identifier les nomenclatures, c‟est à dire dresser la liste des nomenclatures qui seront
réellement utilisées en fonction des choix de l‟utilisateur. Puis on va saisir de façon manuelle ou semi-
automatique les valeurs de ces nomenclatures. Enfin on va gérer les modifications qui pourront leur être
apportées ultérieurement.

Figure 5 : Illustration des nomenclatures.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 20


Mémoire Master 2 Recherche Informatique UY1

 Paramétrage des interfaces


Le paramétrage des interfaces consiste à créer les pages du questionnaire, à créer les composants thématiques liés
aux pages du questionnaire créées et enfin configurer les zones de saisie pour chaque thème crée. Au niveau de
l‟application, il existe un ensemble de thèmes génériques qui correspondent à une logique de traitement
particulier pour l‟ensemble des thèmes ayant les mêmes caractéristiques. On peut distinguer les types de thèmes
génériques suivants : matrice, formulaire, grille, mat_grille, grille_eff_1, grille_eff_2, grille_eff_3.
 Configuration des thèmes
La configuration d‟un questionnaire passe par l'instanciation des thèmes, la création des zones de saisie (selon le
type de thème en cours de configuration) et enfin la création des règles de zone permettant d‟appliquer des
contrôles de saisie sur une zone.

Figure 6: Configuration des thèmes dan StatEduc2

 Gestion des traductions


Le multilinguisme a été une contrainte forte de spécification technique, c‟est ainsi qu‟un module de gestion
de traduction a été intégré pour rendre possible l‟utilisation de l‟application dans d‟autres contextes
linguistiques.
 Gestion des utilisateurs et des profils
La gestion des utilisateurs consiste à définir des profils des utilisateurs (qui permet d‟organiser les utilisateurs
par groupe fonctionnel, afin d‟avoir une vue globale des actions autorisées par ces derniers) et des droits
associés (Administrateur ou opérateur de saisie) et enfin de créer des utilisateurs en fonction du profil auquel ils
doivent appartenir.

3.1.4 Traitement des données

L‟application « StatEduc2.0 » a été conçue en intégrant un contexte de décentralisation des opérations de saisie
des données enquêtes. Ainsi des outils ont été mis au point afin de permettre l‟intégration des données

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 21


Mémoire Master 2 Recherche Informatique UY1

éventuellement saisies sur plusieurs sites de saisie dans une seule base de données pour en constituer la base
globale. Le processus de déroulement de la campagne statistique peut se résumer selon le graphique ci-dessous :

Constitution des sous bases par zone Saisie / Vérification / Correction


de saisie (Extraction de données)
des données

Réception des bases de données des


zones de saisie
Vérification de la cohérence (Exportation de données)
globale

Intégration des différentes bases de


données
(Consolidation de données)

Figure 7: Processus de déroulement de la campagne Statistique

 Extraction des données

L‟extraction des données est une opération essentielle au niveau de la préparation des sous bases de données pour
le démarrage de la campagne statistique. En effet avant la campagne il est souhaitable de partir de la base de
données centrale pour constituer les sous bases de données destinées aux zones de saisie déconcentrée. Cette
opération se fait en considérant une base de données ne contenant que certaines informations dont leur évolution
est presque nulle (informations statiques : Atlas, Nomenclature, Etablissements, Personnels enseignants).A partir
de ces informations supposées statiques on peut alors démarrer la saisie d‟une campagne statistique.

 Exportation des données


Une fois les opérations de saisie de données terminées, suivies de la vérification de la cohérence des données,
alors le responsable de la base de données de la zone de saisie procède alors à l‟exportation des données en vue
de la constitution de la base de données centrale. L‟opération d‟exportation des données consiste à extraire
uniquement la partie donnée au niveau de la base de données considérée. Le fichier résultant est un fichier
compressé.
Du fait que les données aient été saisies dans plusieurs sites différents, il existerait probablement un
problème de duplication de clefs au niveau de certaines tables de données (« Etablissement », « Enseignant », …)
et cela nécessite un traitement préalable pour avoir des valeurs uniques de clefs afin de permettre une
consolidation de données sans risques d‟erreurs notables. Le problème ne se pose pas si le principe de la
définition des plages de clefs est respecté.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 22


Mémoire Master 2 Recherche Informatique UY1

Les critères utilisés pour l‟exportation des données sont : le système d‟enseignement, la chaîne de
regroupement, le type de regroupement, l‟occurrence du regroupement, l‟année scolaire et enfin la liste des tables
à exporter.
La procédure d'exportation passe par cinq étapes successives qui sont la sélection du système
l‟enseignement, la sélection des localités, la sélection des périodes scolaires, la sélection du chemin destination
des fichiers et enfin la sélection de la liste des tables à exporter.

 Consolidation des données


Une fois la réception des différents fichiers d‟exportation issus des différents sites de saisie, alors
l‟administrateur de données au niveau central procède alors à la consolidation des données. Pour se faire, il doit
stocker tous les fichiers d‟export (« *.zip ») dans un seul dossier et disposer d‟une base de données qui contient
uniquement les nomenclatures, l‟atlas sans les établissements.

3.1.5 Tableau de synthèse

Stateduc2.0 intègre un module appelé « Tableaux de synthèse ». Ce module permet d‟éditer les états
pour avoir les premiers chiffres, l‟état d‟avancement de la saisie. Ces états peuvent aussi servir aux contrôles de
cohérence des données saisies.
Ce module comporte cependant plusieurs limites. Il ne permet pas de reproduire l‟annuaire statistique.
Certains états peuvent être édités par ce module mais pas l‟ensemble des états. Le calcul des taux est une
faiblesse de ce module et surtout au niveau des totaux par division administration.
La configuration d‟un état de synthèse comporte plusieurs éléments que sont :les divisions
administratives, les mesures (valeurs quantitatives dans la base de données que vous voulez analyser),les
dimensions(variable dont les modalités servent à catégoriser des données), les filtres éventuels (critère permettant
de filtrer les données à afficher lors de l‟édition de l‟état) et enfin les agrégations représentant les niveaux
hiérarchiques des différentes divisions administratives.

3.1.5 Création et configuration d'une instance OLAP


StatEduc2.0 intègre le module de création et de configuration d‟une Instance OLAP, pour la création des cubes
OLAP. Les cubes OLAP crées permettent la représentation des données de la base des données en dimensions et
mesures. Les mesures produites par dimensions sont intégrés et l‟annuaire statistique et utilisés pour les calculs
des indicateurs de l‟éducation. Pour créer et configurer une instance OLAP quelques options de configuration
sont prises en compte. Il existe trois (3) types de champs :
 Champs de type mesure : il s‟agit du type de champs utilisé pour les mesures

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 23


Mémoire Master 2 Recherche Informatique UY1

 Champs de type dimension : il s‟agit du type de champs utilisé pour les « Levels (niveaux) » rattachés
aux dimensions ;
 Champs de type identifiant : il s‟agit du type de champs qui servent essentiellement aux jointures entre
les tables utilisées comme source de données du cube.

L‟application supporte la plupart des SGBD standard. On a entre autres :


 Access : Base de données « Microsoft Office Access »
 Local Cube : Cubes locaux (physiques) avec l‟extension « .cub »
 MySql : Base de données « MySql »
 OlapServer : Serveur OLAP contenant des bases OLAP et des catalogues (cubes)
 Oracle : Base de données « Oracle »
 SqlServeur : Base de données « SqlServeur »
Les types « LocalCube » et « OlapServer » ne sont utilisables dans la présente version. Ils serviront à la
génération de cubes virtuels (cubes basés sur d‟autres cubes) dans les prochaines versions de l‟application.

Après la présentation du système de recueil et d'analyse de données statistiques actuelles (StatEduc 2.0),
nous passons à la modélisation des processus métiers du système éducatifs afin de faire une étude d'intégration de
ces processus dans le système StatEduc2.0 présenté.

3.2 Modélisation des processus métiers du système éducatifs


Dans cette partie, nous présentons en premier lieu le langage de modélisation utilisé à savoir BPMN,
ensuite nous décrivons les processus métiers du système éducatifs recensés. La partie de modélisation de ces
processus qui vient en clôturer cette partie consiste à donner pour chaque processus décrit, son (ses) déclencheur
(s), son (ses) résultat (s), les acteurs qui y participent, les activités et enfin le diagramme BPMN montrant
l‟enchainement des taches entre les acteurs et les activités.

3.2.1- Langage de modélisation


Pour la modélisation des processus métiers de recueil et d'analyse de données du système éducatifs, nous
avons utilisé une notation graphique standardisée portant sur la modélisation des processus métiers, à savoir le
langage BPMN (Business Process Management Language).
BPMN est un langage développé par un consortium d‟organisations sous la responsabilité du BPMI
(Business Process Management Initiative). C'est une notation graphique standardisée portant sur la modélisation
des processus métiers. Elle est basée sur différentes normes existantes: UML, Activity-décision flow diagram,

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 24


Mémoire Master 2 Recherche Informatique UY1

Event-Process Chains, BPSS, etc. Son rôle est de fournir une notation facilement compréhensible par les
utilisateurs métiers (y compris les analystes métiers, les développeurs et ceux qui devront gérer et surveiller le
processus âpres leur mise en œuvre) mais aussi à créer une passerelle standardisée pour combler le vide entre la
modélisation des processus métiers XML, tels que BPEL4WS et Sybase Intégration Orchestrator [KMN09].
L‟outil que nous avons utilisé pour la modélisation BPMN des processus ci-dessous est l‟outil Yaoqiang
BPMN Editor 2.1. C‟est un outil libre, flexible et conforme pour les diagrammes BPMN version 2. Aucune
installation n‟est requis, il est directement lancé et utilisé sur le disque.

3.2.2- Description des processus métiers du système éducatifs

En nous inspirant des articles [GTN10, PCV06, PLW11, LYW11, LWTM98]et grâce aux interviews effectués
dans les ministères en charge de l'éducation au Cameroun, nous avons identifié six processus métiers pour le
recueil et l'analyse des données du système éducatifs Camerounais. Ces processus sont :
1) Processus de conception des outils de collecte des données;
2) Processus de collecte des données statistiques de l'éducation ;
3) Processus de production de l‟annuaire statistique de l'éducation (CELPLAN/DPPC /MINESEC) ;
4) Processus d‟élaboration du rapport d‟analyse des données statistiques de l'éducation;
5) Processus de production et mise à jour de l‟annuaire statistique et de la carte universitaire du Cameroun
(MINESUP) ;
6) Processus de Révision de la Carte Scolaire du Secondaire (CELPLAN/DPPC /MINESEC) ;
La suite donne la description de trois(3) processus les plus importants.

Processus 1:Processus de conception des outils de collecte de données (Questionnaires)


Description : La mise en place d‟une architecture de Business Intelligence pour l‟éducation nécessite de savoir
quels types des données seront nécessaires pour le système de gestion de prise de décision. Pour acquérir ces
données, il faut disposer d‟un bon outil de collecte. Le système éducatif camerounais distingue plusieurs niveaux
d‟enseignement qui sont :
- L‟enseignement préscolaire ;
- L‟enseignement primaire ;
- L‟enseignement secondaire général ;
- L‟enseignement secondaire technique ;
- L‟enseignement normal d‟instituteurs de l‟enseignement général;
- L‟enseignement normal d‟instituteurs de l‟enseignement technique;
- L‟enseignement professionnel ;
- L‟enseignement supérieur

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 25


Mémoire Master 2 Recherche Informatique UY1

Ainsi, chaque niveau disposera d‟un outil de collecte spécifique à son niveau d‟enseignement. La conception ou
la mise à jour de l‟outil de collecte se fait à chaque début d‟année académique. Le planificateur recense les
besoins en données de chaque direction et vérifie si l‟outil existant ne contient pas déjà les données demandées. Il
arrive de concevoir un nouvel outil ou de mettre à jour l‟existant. Une fois les questionnaires montés et/ou mise à
jour, les directeurs et certains décideurs s‟asseyent et valident les outils conçus ; en cas d‟ambiguïté les erreurs
sont corrigés par le planificateur. Après la validation, les outils sont testés dans les services déconcentrés. Si le
système est informatisé alors le teste se fait en ligne par les établissements choisis, sinon les questionnaires
papiers sont envoyés dans ces établissement pour le teste. Au terme de ce teste, des observations sont recueillies
et prises en compte dans les questionnaires. Une fois les outils validés et testés, ils sont envoyés à l‟imprimerie
pour l‟impression ou bien ils sont mis en ligne dans le cas du système informatisé. Le résultat de ce processus est
que les outils sont actualisés et disponibles.

Processus 2 : Processus de production de l’annuaire statistique de l’éducation;


Description : Le processus de production de l‟annuaire statistique est un processus qui permet de produire et de
publier l‟annuaire statistique. Ce dernier contient toutes les données nécessaires pour le calcul des indicateurs
nécessaire à la prise de décision des décideurs. Ce processus se déclenche à chaque début d‟année académique et
contient les sous processus conception des outils de collecte et de collecte des données dont le premier est cité ci-
dessus. Le résultat de ce processus est l‟édition et la mise à disponibilité de l‟annuaire statistique.

Processus 3: Processus d’élaboration du rapport d’analyse des données statistiques ;


Description : Le processus d‟élaboration du rapport d‟analyse des données statistiques est un processus qui
permet de produire un rapport d‟analyse des données statistiques du ministère. Après la production de l‟annuaire
statistique contenant toutes les données nécessaires au calcul des indicateurs s‟enchaine l‟élaboration du rapport
d‟analyse qui est un document permettant de mettre à la disposition du décideur toutes les indicateurs de
l‟éducation calculés sur la base des données disponibles illustrés par des histogrammes, des diagrammes, des
camemberts, des tableaux de pourcentage et aussi des cartes. Ces indicateurs pourront se prêter à une utilisation,
aussi bien dans le cadre de la Stratégie Sectorielle de l‟Éducation (Enseignements Secondaires) que dans
l‟évaluation de la cible 4 de l‟objectif 3 des Objectifs du Millénaire pour le Développement[ABS12].Les axes
thématiques retenus dans le rapport d‟analyse s‟organisent autour des points suivants :
- Le contexte des enseignements au Cameroun du (contexte institutionnel, la place de la carte scolaire,
l‟environnement démographique, l‟environnement économique) ;
- La demande d‟éducation ;
- L‟offre d‟éducation ;
- Le rendement interne ;

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 26


Mémoire Master 2 Recherche Informatique UY1

- Le financement de l‟éducation ;
- Le rapport d‟une étude ou deux études thématiques ;

3.1.3- Modélisation des processus métiers


Dans cette partie, nous donnons pour chacun de trois processus ci-dessus décrits, son (ses) déclencheur (s), son
(ses) résultat (s), les acteurs qui y participent, les activités et enfin le diagramme BPMN correspondant

a) Processus de conception des outils de collecte de données (Questionnaires)


Déclencheurs : Début année académique
Résultats : Questionnaires conçus et testés
Acteurs :
- Planificateur de l’éducation : chargé de recenser les besoins en données ;
- Informaticien /Statisticiens : chargé de montage et mise à jour du questionnaire ;
- Directeurs et Partenaires : chargés de validation ;
- Acteurs régionaux et chefs d’établissements : chargés de renseignement des données.
- Imprimerie : Impression des outils de collecte
Activités :
- Recensement des besoins ;
- Vérification de données recensées ;
- Montage des questionnaires ;
- Mise à jour des questionnaires ;
- Validation des questionnaires ;
- Testing des questionnaires ;
- Prise en compte des observations ;
- Impression des questionnaires;
- Publication de l'outil en ligne.
Diagramme BPMN du processus

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 27


Mémoire Master 2 Recherche Informatique UY1

Figure 8: Diagramme BPMN du processus de conception d'outils de collecte

b) Processus de production de l’annuaire statistique du secondaire;

Evénement(s) déclencheur(s) : Nouvelle rentrée scolaire


Résultat(s) du processus : Annuaire statistique disponible
Les acteurs qui y participent et leur rôle :
Acteurs Rôles
Planificateur, informaticien, Directeurs, Experts Unesco Conception outils de collecte des données statistiques
Personnels de la cellule de la planification et personnels Collecte des données statistiques
régionaux et départementaux en charge de la carte scolaire
Informaticiens et statisticiens de la CELPLAN Apurement, tabulation, Création des cubes de l‟annuaire,
Sélection des tableaux pour l‟annuaire
Opérateurs de saisie Saisie des données statistiques
Maison d‟imprimerie Impression des annuaires statistiques
Cellule informatique Publication de l‟annuaire sur le site du MINESEC
SG, SEESEC, MINESEC Validation de l‟annuaire et proposition avant-propos

Les activités (tâches) effectués dans le processus :


- Conception des outils de collecte des données statistiques (sous-processus) ;

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 28


Mémoire Master 2 Recherche Informatique UY1

- Collecte des données statistiques (sous-processus) ;


- Saisie des données
- Apurement et tabulation des données ;
- Création des cubes pour l‟annuaire statistique ;
- Sélection des tableaux pour l‟annuaire statistique ;
- Validation de l‟annuaire et proposition avant-propos ;
- Publication sur le site du MINESEC ;
- Edition des annuaires statistiques ;
- Distribution de l'annuaire;
Diagramme BPMN du processus

Figure 9: Diagramme BPMN du processus de conception de l'annuaire statistique du secondaire

c) Processus d’élaboration du rapport d’analyse des données statistiques ;


Evénement(s) déclencheur(s) : Annuaire statistique produit ;
Résultat(s) du processus : Rapport d‟analyse des données statistiques disponible

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 29


Mémoire Master 2 Recherche Informatique UY1

Les acteurs qui y participent et leur rôle :


Acteurs Rôles
Planificateur, Directeurs, Ministre, Experts Unesco et Détermination liste des indicateurs
INS, partenaires nationaux et internationaux
Informaticiens et statisticiens de la CELPLAN Calcul des indicateurs sélectionnés; Génération et Interprétation des
histogrammes, diagrammes et camemberts
Directeurs, Ministre, Experts Unesco et INS Correction et validation du rapport d‟analyse
Maison d‟imprimerie Impression du rapport d‟analyse
Cellule informatique Publication du rapport sur le site du MINESEC

Les activités (tâches) effectués dans le processus :


- Détermination liste des indicateurs appropriés pour les activités d‟aide à la décision;
- Calcul des indicateurs sélectionnés
- Génération des histogrammes, Tableaux pourcentages, diagrammes et camemberts;
- Interprétation des histogrammes, Tableaux pourcentages, diagrammes et camemberts;
- Correction et validation du rapport d‟analyse;
- Impression du rapport d‟analyse;
- Publication du rapport sur le site du MINESEC;

Diagramme BPMN du processus

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 30


Mémoire Master 2 Recherche Informatique UY1

Figure 10: Diagramme BPMN du processus d'élaboration du rapport d'analyse des données statistiques

3.3 Identification des services

Dans cette partie, nous présentons les services par processus et selon l'organisation hiérarchique des
enseignements. Le tableau suivant donne les services par processus retenus. Ces services sont déduits de
différentes activités que forme le processus. Ils seront considérés dans le dernier niveau de granularité du
système et seront implémentés directement.

Tableau 1 : Spécification des services selon les processus

Processus Services
Processus de conception des outils de collecte des données  Recenser besoins
(Questionnaires)  Envoyer Questionnaire pour testing
 Mettre à jour Questionnaire
 Publier Questionnaire
 Enregistrer Observations

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 31


Mémoire Master 2 Recherche Informatique UY1

 Inviter à tester
 Tester Questionnaire
 Imprimer Questionnaire
 Remplir Questionnaire
 Enregistrer en ligne
Processus de production de l'annuaire statistique de
l‟éducation
 Inviter à saisir
 Vérifier Questionnaire
 Mettre à jour données
 Apurer données
 Créer cube pour l'annuaire
 Sélectionner tableaux pour annuaire
 Générer Annuaire
 Mettre à jour Annuaire
 Publier annuaire
 Imprimer Annuaire
 Déterminer Indicateurs
 Calculer Indicateurs
Processus d'élaboration du Rapport d'analyse des données

 Générer graphique
statistiques

 Générer Tableau des indicateurs


 Exécuter requête
 Interpréter Graphique
 Mettre à jour Rapport d'analyse
 Imprimer Rapport d'analyse
 Publier Rapport d'analyse

Le tableau qui suit décrit plutôt des services métiers selon l'organisation hiérarchique de l'enseignement. Un
Service métier se trouve au « plus haut » niveau. Il s‟agit du service qui fait sens pour le métier, donc pour la
maîtrise d‟ouvrage du fournisseur mais aussi pour la maîtrise d‟ouvrage du consommateur. Cette dualité
des maîtrises d‟ouvrage est aussi un point particulier des SOA.

Tableau 2 :Tableau de spécification des services selon l'organisation hiérarchique des enseignements

Niveau Services

Etablissement Testing Questionnaire, Remplissage des données de l'établissement dans l'application, Consultation
des données de son établissement, consultation du tableau de bord de son établissement

Arrondissement Consultation et mise à jour des données des établissements de son arrondissement, Consultation du
tableau de bord de son arrondissement, consultation des situations géographiques des établissements

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 32


Mémoire Master 2 Recherche Informatique UY1

de son arrondissement.

Départemental Consultation et mise à jour des données des établissements de son département, Consultation du
tableau de bord de son département, génération de l'annuaire statistique de son département,
consultation des situations géographiques des établissements de son département.

Régional Consultation et mise à jour des données des établissements de sa région, génération de l'annuaire
statistique, du tableau de bord et du rapport d'analyse des données statistiques liés aux établissements
de sa région. Mise à jour de la carte universitaire de sa région, consultation des situations
géographiques des établissements de sa région, etc...

National Consultation, mise à jour, suppression et sauvegarde des données des établissements nationaux.
Génération de l'annuaire statistique, du tableau de bord et du rapport d'analyse des données
statistiques nationales. Mise à jour de la carte universitaire nationale, consultation et mise à jour des
situations géographiques des établissements nationales. Publication des outils de collecte, de l'annuaire
statistique et rapport d'analyse national et régional, de l'annuaire statistique départemental, de la carte
universitaire et du tableau de bord national. bref tous les services des autres niveaux sont accessibles à
ce niveau.

3.4 Etude d'intégration des processus listés dans StatEudc2.0

L'objectif de cette étude est d‟évaluer les coûts de l'intégration des processus ci-dessus dans StatEduc2.0 afin de
dégager des conclusions sur l'adéquation de StatEduc2.0 avec les activités énumérés.
Dans cette partie, nous allons analyser et vérifier pour chaque processus, si ses activités figurent ou pas dans
l'application StatEduc2.0 et enfin conclure si le processus est déjà intégrer ou pas dans la plateforme. Un
processus sera considéré comme intégrer dans l'application lorsque ses activités interactives et/ou automatiques
font déjà partie intégrante de l'application.

Processus 1: Processus de conception des outils de collecte de données (Questionnaires)

Le processus de conception des outils de collecte se déclenche à chaque début d'année scolaire et le résultat
de ce processus est la disponibilité de l'outil de collecte. Parmi les activités de ce processus, les activités
interactives/automatiques sont: le montage ou la mise à jour des questionnaires, le testing des questionnaires,
l'édition et la publication de l'outil en ligne. La configuration de la plateforme StatEduc2.0 se fait sur la base de
l'outil de collecte (questionnaire) de l'année académique en cours, il est configuré en plusieurs secteurs selon les
différents types de questionnaires répartis selon le secteur d'enseignement (préscolaire, primaire, secondaire,

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 33


Mémoire Master 2 Recherche Informatique UY1

normal, supérieur) et le sous-système d'enseignement (général francophone, général anglophone, technique


francophone, technique anglophone, normale général, etc.). En faisant l'analyse activité par activité, il en ressort:
 L'activité de montage veut dire qu'on a créé un tout nouveau système d'enseignement au sein de la
structure et qu'il faut concevoir un nouveau questionnaire. Concevoir donc un nouveau questionnaire
revient aussi à configurer un nouveau système d'enseignement dans l'application StatEduc2.0 et cela est
prévu dans l'application.
 L'activité de mise à jour de questionnaire implique la mise à jour des pages de l'application StatEduc2.0
pour la rendre conforme à l'outil;
 le testing des questionnaires implique qu'on donne l'accès de StatEduc2.0 à d'autres établissements en
ligne pour pouvoir tester l'application vue qu'elle est conforme aux questionnaires;
 un lien pourra être ajouté à l'application pour l'édition du questionnaire sous format PDF ou WORD afin
de pouvoir imprimer une fiche de collecte d'un établissement donné. Quant à la publication de
l'application en ligne, la fonctionnalité est déjà intégrée et fonctionnelle. Il suffit juste aux clients d'avoir
l'adresse IP du serveur hébergent l'application.
En résumé, le processus de conception de l'outil de collecte fait déjà partie intégrante de l'application StatEduc2.0
puisque toutes ses activités sont intégrer mais quelques améliorations restent à faire pour rendre cela effective,
notamment:
- L'ajout d'un champ dans StatEduc2.0 pour la prise en compte des observations des acteurs régionaux lors
de la phase de testing;
- L'ajout d'un lien pour l'impression des questionnaires sous différents formats;
- L'ajout d'un lien pour la publication en ligne de l'application.

Processus 2: Processus de collecte de données

Le processus de collecte des données est la suite du processus de conception de l'outil de collecte. Il se
déclenche lorsque l'outil de collecte est testé et validé; le résultat est que le questionnaire dédié à un
établissement soit renseigné par les données ou bien que les données soient enregistrées dans la base de
StatEduc2.0. Compte tenu de la situation désenclavé des certains établissements, deux solutions sont envisagées:
le cas où le système est informatisé, c'est à dire que l'application StatEduc2.0 est publié et accessible pour les
établissements disposant de la connexion Internet et le cas où le système n'est pas informatisé, c'est à dire que les
questionnaires papiers sont distribués aux établissements par les missionnaires. Dans ce processus, les activités
interactives/automatiques sont les suivantes : l'enregistrement des données, la vérification et la correction des
données incohérents.
 L'enregistrement des données est une activité pour le cas où le système est informatisé. L'application
StatEduc2.0 étant publié en ligne, les établissements disposant de la connexion Internet enregistre
directement leurs données sur la plateforme; Ils n'ont pas besoin des questionnaires papiers;

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 34


Mémoire Master 2 Recherche Informatique UY1

 La vérification et la correction des données incohérentes sont des fonctionnalités figurant dans
StatEduc2.0 (Onglet Contrôle/Validation de la plateforme).
En résumé, le processus de collecte de données fait partie intégrante de la plateforme StatEduc2.0. Pour le cas
des établissements possédant la connexion Internet, tous le processus se traite sur StatEduc2.0 (Enregistrement,
Vérification et Correction des données). Pour les établissements ne disposant pas de la connexion, il suffit juste
de renseigner les questionnaires distribués par les missionnaires et de le retourner au niveau central ou régional et
la plateforme StatEduc2.0 finalise le processus (Saisie des données, Vérification et Correction).

Processus 3: Processus de production de l'annuaire statistique de l’éducation

Ce processus permet de produire et de publier l'annuaire statistique. Il se déclenche à chaque début


d'année académique à travers ses sous-processus (conception de l'outil de collecte et processus de collecte des
données). Après ces deux sous-processus déjà cité ci-haut, les autres activités interactives/automatiques de la
production de l'annuaire statistique sont : la saisie des données statistiques, l'apurement des données, la création
des cubes Olap pour l'annuaire, la sélection des tableaux à intégrer dans l'annuaire, l'édition et la publication de
l'annuaire.
L'activité de saisie des données statistiques concerne les données des établissements ne disposant pas de
la connexion Internet. Ces questionnaires sont retournés au niveau des délégations régionales ou départementales
qui organisent la saisie de ces questionnaires dans la plateforme StatEduc2.0. De même en ce qui concerne
l'apurement des données, le module de contrôle de cohérence permet de vérifier et de corriger les données
incohérentes (Etablissement sans effectifs, établissement sans enseignants, etc.). Il est vrai que tous les contrôles
n'y figurent pas, mais il est bien possible de les ajouter sans difficultés.
Le module de création des cubes OLAP existe mais n'est pas tout à fait fonctionnelle. Il présente quelques
erreurs qu'il faut corriger afin de rendre ce module fonctionnel. L'activité Sélection des tableaux à intégrer dans
l'annuaire ne figure pas dans StatEduc2.0, à présent cette activité se fait manuellement. L'annuaire statistique
étant un document dynamique qui change au cours des années, les tableaux qui y sont intégrés ne sont pas fixes
et connus à l'avance, mais il existe des tableaux qui sont indispensable dans ce document. Dans la solution
envisagée, on tiendra compte de l'intégration de ces tableaux. Comme StatEduc2.0 n'intègre pas tous les activités
de ce processus, la production de l'annuaire à travers StatEduc2 n'est donc pas complète, elle est intégrée en
partie. La publication peut être ajoutée dans le future mais ne figure pas à présent dans l'application.
En résumé, les activités déjà intégrées dans l'application en ce qui concerne ce processus sont : la saisie
des données (fonctionnelle), l'apurement des données saisies (fonctionnelle), la création des cubes à intégrer dans
l'application (intégrer mais pas tout à fait fonctionnelle). Pouvoir intégrer tous les activités de ce processus
revient à intégrer l'activité de sélection des cubes, la rédaction et l'édition de l'annuaire sous différent format et la
publication de l'annuaire en ligne. Une proposition de la solution en ce qui concerne cette partie est faite dans la
partie de la solution proposée.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 35


Mémoire Master 2 Recherche Informatique UY1

Processus 4: Processus d'élaboration du rapport d'analyse des données statistiques


Ce processus permet de produire un rapport d'analyse des données statistiques du système éducatif. La
réalisation de ce processus a comme prérequis l'annuaire statistique produit et validé puisqu'il utilise les données
de l'annuaire. Les activités interactives/automatiques du processus d'élaboration du rapport d'analyse sont: le
calcul des indicateurs sélectionnés, la génération et l'interprétation des histogrammes, des tableaux, des
camemberts et des diagrammes, l'édition et la publication du rapport.
Dans StatEduc2.0, aucun de ces activités n'est intégré. L'intégration de ces activités dans cette application
demande un outil décisionnel générant les histogrammes, tableaux, camemberts et diagrammes et StatEduc2
n‟est pas doté de cet outil afin d'implémenter ce type des tâches. Il faut pouvoir ajouter un outil qui génère les
états et qui permet d'ajouter les commentaires et les interprétations sur ces états générés. La solution proposée
permet de résoudre ce problème.
En résumé, aucun des activités de ce processus n'existe encore dans la plateforme StatEduc2.0. Une
solution envisagée est de pouvoir intégrer un outil décisionnel permettant de calculer les indicateurs, de générer
et d'interpréter les états sous différents types de diagrammes ou histogrammes voulus. Vu que StatEduc2.0
n'utilise pas un Datawarehouse dans son architecture, il sera intéressant de commencer par concevoir un entrepôt
de données et de pouvoir le jumeler avec la base de données de StatEduc2.0.

Processus 5: Processus de production et de mise à jour de l'annuaire statistique et la carte


Universitaire du Cameroun

L'Annuaire Statistique Universitaire est un document annuel qui permet d'avoir une situation des
effectifs des étudiants, des enseignants, des institutions universitaires publics et privées, des infrastructures et des
ressources financières. Ce document est produit chaque année et permet de mettre à jour la carte universitaire. Il
est au même titre que l'annuaire statistique du secondaire et le processus qui permet de le produire est analysé ci-
dessus. Comme nous l'avons résumé dans le processus 3, les activités déjà intégrées dans StatEduc2.0 sont : la
saisie des données (fonctionnelle), l'apurement des données saisies (fonctionnelle), la création des cubes à
intégrer dans l'application (intégrer mais pas tout à fait fonctionnelle).
La carte universitaire est un document qui se rédige et ne peut donc être automatisé et intégré dans
StatEduc2.0, elle utilise les données de l'annuaire pour produire des tableaux, histogrammes, diagrammes et
camemberts et les interprète par la suite. Une partie de ce document pourra être automatisée en l'occurrence la
partie de la cartographie, le module du SIG (Système d'Information Géographique) peut être intégré dans la
solution envisagée afin de présenter graphiquement l'image du système universitaire camerounais et notamment
la position géographique de chaque institution universitaire public et privée.
En résumé, l'annuaire statistique universitaire s'intègre en partie dans l'application comme l'a était analysé
dans le processus 3. En ce qui concerne la carte universitaire, c'est un document rédigé en utilisant les données

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 36


Mémoire Master 2 Recherche Informatique UY1

de l'annuaire et ne peut donc pas être intégré complètement dans StatEduc2.0 dans le but d'une automatisation. Il
sera possible d'intégrer ou d'associer un module de SIG à StatEduc2.0 pour illustrer la cartographie universitaire.

Processus 6: Processus de révision de la carte Scolaire du secondaire


Ce processus est le récapitulatif des tous les processus ci-dessus cités. Mais on peut noter deux de ses
activités qui ne sont pas citées: l'élaboration de la carte géo-référencée du MINESEC et la conception du tableau
de bord. Le module d'élaboration de la carte géo-référencée du MINESEC n'est pas intégré dans StatEduc2.0 et
sera difficile car c'est un module de type SIG comme nous venons de l'expliquer dans le processus 5 et il faut
utiliser les serveurs de géo-référencement pour l'implémenter. Une solution envisagée sera présentée dans le
point suivant. Le module de conception de tableau de bord n'est pas aussi intégré dans StatEduc2.0, pour le faire,
il faudra un outil décisionnel qui génère les états sous différents formats et présente les données pertinentes du
système. Une solution en ce qui concerne ce module sera proposé dans la suite de ce mémoire.
En résumé, le processus de révision de la carte scolaire englobe le processus de production de l'annuaire
statistique et du rapport d'analyse. En plus de ces processus, ce processus contient aussi les activités d'élaboration
de la carte géo-référencée et la conception du tableau de bord qui ne font pas encore partie intégrante de
l'application StatEduc2.0. Une solution intégrant ces activités sera proposée dans la suite de ce mémoire.

3.5 Proposition d'une solution pour l'intégration des


processus énumérés dans StatEduc2.0

D‟après la modélisation des processus métiers du système éducatifs ci-dessus, nous avons constaté que
dans tous le cycle de production et de diffusion des données décisionnelles de l'éducation camerounais,
StatEudc2 participe à la réalisation des processus de conception de l'outil de collecte, de la collecte des données,
de la saisie des données , de l'apurement de ces données et de la création des cubes OLAP pour le traitement des
données . Les processus de diffusion des données ne font pas encore partie intégrante de cette application.
L'intégration de certains s'avèrent être très difficile et voire même impossible, vu la nécessité de disposer des
outils décisionnelles de génération des états, des tableaux, de tableau de bord et de carte géo-référencée.
Dans le souci de disposer d‟un outil qui intègre tous ces processus, nous proposons une solution
architecturale permettant de mieux maitriser le système. Cette solution est structurée en deux modèles : le
premier modèle donne une vue globale du système éducatif répartie selon l‟organisation hiérarchique de
l‟enseignement (établissements, arrondissements, départements, régions, National) et le deuxième modèle
s‟appuie sur le premier et utilise des outils décisionnels appropriés pour répondre aux besoins spécifiques du
système camerounais.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 37


Mémoire Master 2 Recherche Informatique UY1

3.5.1 Architecture BI générale du système éducatif basée sur SOA


Cette architecture montre pour chaque niveau hiérarchique de l‟enseignement, les services qu‟il fournit aux
utilisateurs. A chaque niveau, un accès au système de BI permettant d'obtenir les informations de ce niveau est
prévu. Le niveau national est évidement le niveau où le système est le plus complet possible mais cela n‟empêche
pas que l'on ait des informations parcellaires à chaque niveau. Cette architecture BI générale orientée Services est
structurée en six couches et permet aux systèmes de déployer des applications BI plus agile, souple, réutilisables,
fiables et adaptés à des supports de processus décisionnel. La figure 11 illustre l‟architecture logique de BI que
nous proposons pour le système éducatif camerounais.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 38


BUCREP Services Middleware: Niveau: National
Application GeoDashboard National
DM d’Analyse Spatiale
WSDL et UDDI
MINFI

DM
Serveur Annuaire Statistique National
DW
ETL Application
BD Spatiale des Cube d’Analyse
établissements OLAP éducative Rapport d’analyse éducatif et
Carte Universitaire National

Niveau : Région
Annuaire Statistique régional
Interface des
DW Cube services des

Bus BI et Services Middleware


OLAP régions
Rapport d’analyse
éducatif Régional

Niveau : département

DW Cube Interface des


services des Annuaire Statistique
OLAP départements départemental

Niveau :
Arrondissement
Cube Interface des
DW Tableau de bord
services
OLAP des
d'arrondissements
arrondissements

Niveau :
Etablissement
Serveur
Cube Interface
BD DW Tableau de bord
ETL Etablissement Bus BI: SOAP, XML,
établissements OLAP
APIs, HTPP

Organisation
Couche Sources de données Couche Couche Entrepôt des Couche d’analyse (application et Couche communication Couche Présentation
Hiérarchique de
opérationnelles d’intégration données services éducatifs) (orientée service)
l'enseignement
Figure 11: Architecture BI pour l’éducation basée sur l’Architecture Orientée Services (SOA) : cas du Cameroun
Mémoire Master 2 Recherche Informatique UY1

3.5.2 Architecture BI du système en utilisant les outils décisionnels

L‟une des principales raisons d'un échec du projet BI est largement due à la sélection des outils de BI
inappropriées qui ne parvient pas à répondre aux besoins de l'entreprise spécifiés. Pour trouver une solution,
Ponniah (2001) [PCV06] recommande aux entreprises de concevoir l'architecture d'abord, ensuite de choisir
seulement les outils pour correspondre à des fonctions et des services prévus pour les éléments architecturaux.
L'architecture est le fondement de BI et mettre l‟attention sur l'architecture sera d'assurer le succès dans la mise
en œuvre de BI. Voilà pourquoi nous avons commencé par proposer l‟architecture de BI général du système.

Le modèle ci-dessous est un modèle qui associe à StatEduc2.0 les outils décisionnels appropriés pour
pouvoir implémenter les processus n'ont encore intégrés dans ce dernier. Nous proposons une solution qui est
moins difficile à mettre en œuvre à travers les outils permettant la construction de solutions décisionnelles à
savoir : Pentaho, SapoBI, SAS, Congnos… Nous nous proposons dans notre cas d'utiliser la suite Pentaho vu sa
consistance, sa fiabilité et sa facilité de manipulation par rapport à ses concurrents.

Pour se faire, nous présentons en premier lieu l'architecture de la solution envisagée, centrée sur l‟outil
Pentaho BI avec ses différents modules, accentuée sur le data warehouse, étendue par le module SIG (à travers
le serveur cartographique GeoServer et son client OpenLayers) et résultant sur l‟application BI_EDUCAM 1.0
avec une architecture SOA fournissant l‟accès à tous les services nécessaires au système. Puis en second lieu plus
précisément dans la partie de l‟analyse de la solution, nous allons parler plus en détails de l‟application
BI_EDUCAM 1.0 , des services fournis par pentaho BI, du serveur GeoServer et de son client OpenLayers, de
l‟ETL Talend, des cubes OLAP ; leur construction et leur visualisation sur Mondrian, et enfin, la construction des
rapports.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 40


Mémoire Master 2 Recherche Informatique UY1

Plateforme StatEduc2

BD StatEduc2

Bus BI et Services Middleware


ETL (TALEND)

BI_EDUCAM 1.0
Données Financiers

Données
démographiques

Figure 12: Architecture de la solution envisagée

Les éléments caractéristiques de l’architecture présentée ci-dessus sont les suivants :


 Datawarehouse avec stockage des données au format OLAP. Les schémas en étoile et en flocons sont
gérés par Mondrian, ainsi que de nombreux autres concepts propres à l‟OLAP ;
 Serveur web J2EE Pentaho. Ce serveur embarque le moteur ROLAP Mondrian qui permet d‟effectuer
des requêtes multidimensionnelles (langage MDX) sur des données stockées dans un SGBD relationnel
(interrogation SQL).
 Pour la partie conception, les cubes sont modélisés avec « Pentaho Schema Workbench », un client riche
open source (en java) de modélisation et de publication de schémas Mondrian sur un serveur Pentaho
 Pour la partie restitution, les vues métiers sont accessibles en client léger via un navigateur web (Internet,
Explorer, Firefox, Safari, Opera, …). La mise en place d‟un serveur Pentaho Enterprise permettra
d‟effectuer des analyses avancées avec le composant Pentaho Analyzer, si on veut rester en open source
on utilisera JPivot.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 41


Mémoire Master 2 Recherche Informatique UY1

3.6 Analyse de la solution proposée

3.6.1 BI_EDUCAM 1.0

BI_EDUCAM 1.0 est le nom qu‟on donne à notre future plateforme d‟analyse et de diffusion des données du
système éducatif camerounais. Il sera une application Java web basée sur l‟architecture SOA permettant l‟accès
aux services fournis par les différentes applications. Pour qu‟elle respecte l‟architecture SOA, BI_EDUCAM sera
dotée d‟un ESB (Entreprise Service Bus) qui permet le couplage faible des services. L‟ESB propose une
méthode standard et fournit une couche partagée pour réaliser l‟interopérabilité, l‟interaction et l‟intégration des
services distribués. Ainsi, il (ESB) aura pour rôle, d‟une part d‟assurer l‟interconnexion et d‟autre part de gérer
la médiation des communications et des interactions entre services et applications. Les services (peut être un
composant, une application business, un processus business, etc.) sont basés sur Web services, chacun a sa
propre description décrite par WSDL, ils se connaissent par leurs description, puis se communiquent via le bus
en façon transparente. Le bus s‟occupe de la transmission de message entre des services par des différentes
façons, soit par message („call‟ou „one-way‟), soit par événement (pub./sub.). Nous pouvons dynamiquement et
librement changer, supprimer un service, ou ajouter un nouveau service. Quelques-uns des services métiers qui
seront implémentés par BI_EDUCAM sont :
- Services d‟accès à l‟interface d‟application de StatEduc2 pour la saisie et l‟apurement des données sur les
établissements ;
- Services d‟accès à l‟interface d‟OpenLayers pour la visualisation des données géographiques des
établissements ;
- Services d‟accès à l‟interface Jpivot permettant d‟effectuer des analyses OLAP dans l‟environnement
Pentaho ;
- Services d‟accès à l‟interface web Pentaho Analyser, pentaho Report Designer et pentaho reporting pour
l‟analyse et la création des rapports qui vont être générés.

3.6.2Talend Open Studio

Pour le processus d'Extraction-Transformation-Chargement (ETL) l'outil Talend Open Studio (Talend


OS) devra être déployé. TalendOS est un outil d‟intégration de données utilisé pour l'ETL et l‟intégration de

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 42


Mémoire Master 2 Recherche Informatique UY1

données opérationnelle développé par Talend1. Il est distribué sous licence GPL (General Public License). Talend
Open Studio propose une interface permettant de concevoir graphiquement les connexions aux sources et les
traitements sur les données.

3.6.3 GeoServer

GeoServer est un serveur informatique open source écrit en Java qui permet aux utilisateurs de partager et
modifier des données géographiques. Conçu pour l'interopérabilité, il publie les données de toutes les sources
principales de données spatiales qui utilisent des normes ouvertes. GeoServer a évolué pour devenir une méthode
simple de connexion d'informations existantes à des globes virtuels tels que Google Earth2 et NASA World Wind3,
ainsi que pour les cartes à base de services web tels que OpenLayers, Google Maps4 et Bing Maps5. GeoServer
fonctionne en tant qu'implémentation de référence pour la mise en œuvre du standard du Web Feature Service de
l'Open Ge spatial Consortium ; il implémente aussi le Web Map Service [ALI12].
GeoServer fonctionne comme un nœud dans une infrastructure de données spatiales libre et ouverte. Tout
comme le serveur HTTP Apache offre une solution de serveur web libre pour publier du HTML, GeoServer vise
à faire de même pour les données géo spatiales [ALI12].
Grâce à des protocoles standards qu'il produit KML, GML, Shapefile, GeoRSS, PDF, GeoJSON, JPEG, GIF,
SVG, PNG etc. En outre, on peut modifier les données via le SMA profil transactionnelle (WFS-T). GeoServer
comprend un client intégré (OpenLayers) pour la prévisualisation des couches de données.
GeoServer supporte en outre la publication efficace des données géo spatiales de Google Earth grâce à
l'utilisation de liaisons réseau, utilisation des fichiers KML. Les fonctionnalités avancées de Google Earth de
sortie comprennent les modèles de mesure des pop-ups, des visualisations de temps et de la hauteur, et "super-
overlays".
GeoServer s'appuie sur GeoTools, une bibliothèque d'outils en Java pour manipuler le SIG (système
d'information géographique)[ALI12].

1www.talend.com/Open-Source-MDM

2Google earth permet de visualiser des images satellite, des cartes, des reliefs ou des bâtiments en 3D. Accessible sur www.earth.google.fr
3NASA World Wind est un logiciel d'exploration de planètes via photographiessatellites et aériennes développé par l'Ames Research Center de la NASA
4Google Maps est un service gratuit de cartographie en ligne. Il est accessible sur http://maps.google.com/
5Bing Maps (auparavant Live SearchMaps, Windows Live Maps et Windows Live Local) est un service web de cartographie faisant partie du moteur de recherche bing et
utilisant le service de bing Maps for Enterprise. Il est accessible sur http://www.bing.com/maps/

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 43


Mémoire Master 2 Recherche Informatique UY1

3.6.4 OpenLayers

Le client SIG OpenLayer est constitué d‟une bibliothèque de fonctions JavaScript assurant un noyau de
fonctionnalités orienté vers la mise en place d'applications clientes Web cartographiques fluides.
Il permet d'afficher des fonds cartographiques tuilés ainsi que des marqueurs provenant d'une grande variété
de sources de données. Une partie de cette bibliothèque permet aussi de gérer l'ergonomie proposée à l'utilisateur,
mais ce n'est pas directement son rôle [ALI12] .
Pour construire une visionneuse (client SIG), une structure HTML est requise pour les pages. OpenLayers
insère les données à l'intérieur de tout élément de type bloc ce qui signifie qu'il peut être utilisé pour mettre une
carte dans presque n'importe quel élément HTML. Le client ainsi obtenu est un client léger [ALI12].

3.6.5 Pentaho BI
Pentaho6 BI permettra d'implémenter les parties non encore fonctionnelles dans StatEduc2.0. On note en
l'occurrence la production de l'annuaire statistique, l'élaboration du rapport d'analyse, de la carte universitaire et
de la carte géo-référencée du secondaire et du primaire et enfin la conception du tableau de bord. Tous ces
modules seront possibles à l'aide de Pentaho BI. Mais avant d'arriver à cet outil, il faut d'abord concevoir un DW
qui contient les données apurées et vérifiées par StatEduc2, en plus de ces données, on utilisera aussi les données
démographiques, financières et satellitaires à fin d'implémenter aussi la partie de la carte scolaire géo-référencée
et de la carte universitaire. Pentaho BI est doté des outils tels que Mondrian, Pentaho Report Designer, et plus
encore permettant d'effectuer graphiquement les cubes OLAP, les graphiques, les rapports et les états sous
différents formats. Ces outils nous permettront d'automatiser la génération de tous les documents ci-dessus cités.
La suite illustre en quelques points les fonctionnalités de ces outils.

3.6.6 Mondrian

Mondrian est un moteur OLAP (Online Analytical Processing) écrit en Java par Julian Hyde qui permet la
conception, la publication et le requêtage de cubes multidimensionnels. Il permet l‟exécution de requêtes en
langage MDX sur des entrepôts de données s‟appuyant sur des SGBDR, d‟où sa caractérisation de « ROLAP »
(Relational OLAP). En matière de ROLAP, Mondrian est la référence open source.
Mondrian permet d‟accéder aux résultats dans un format multidimensionnel compréhensible par une API de
présentation côté client, le plus souvent en mode Web, avec par exemple JPivot, Pentaho Analyzer, Pentaho
AnalysisTool, GeoAnalysisTool(G.A.T.)

6 http://www.pentaho.com/

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 44


Mémoire Master 2 Recherche Informatique UY1

Mondrian s‟appuie sur une modélisation OLAP standard et peut donc se connecter à n‟importe quel
entrepôt de données conçu dans les règles de l‟art de la Business Intelligence. Il est intéressant de noter que
Mondrian est le composant OLAP utilisé par la plupart des suites de BI Open Source notamment Pentaho,
JasperServer et SpagoBI.
Pentaho est l‟éditeur qui héberge et soutient la communauté Mondrian, mais toute fois, un serveur
Mondrian peut être utilisé en tant que tel, sans être embarqué dans une plate-forme décisionnelle OSBI…
Les caractéristiques fonctionnelles de Mondrian sont les suivantes :
 Stockage des données dans un SGBDR: les données sont entreposées dans des tables de faits et de
dimension, selon la modélisation habituelle en étoile et/ou flocons (Mondrian sait gérer les 2)
 Mondrian permet (si nécessaire) l‟utilisation de tables d‟agrégation afin d‟optimiser au mieux les
performances. Ces tables doivent être chargées en même temps que l‟entrepôt de données, via les
mécanismes habituels d‟alimentation ETL. Il est également possible de s‟appuyer sur des « vues
matérialisées » si le SGBD les supporte. Le serveur Mondrian fournit également un mécanisme de mise
en cache qui permet d‟obtenir des délais de réponse minimums.
 Utilisation des dimensions partagées (« shared dimension », ou « dimensions conformes ») pour la
mutualisation de celles-ci entre plusieurs cubes
 Ajout de membres calculés (très utile pour effectuer des calculs de pourcentage par exemple, recalculés
dynamiquement selon le niveau d‟agrégation choisi)
 Gestion des hiérarchies multiples, dimensions dégénérées et « inline tables »
 Gestion de la sécurité d‟accès aux cubes via des rôles: sécurisation au niveau du cube, des dimensions,
des hiérarchies et des membres à afficher ou non
 Internationalisation possible (multilinguisme) via l‟implémentation du standard i18n7
Mondrian s‟appuie sur des schémas XML pour la définition des cubes. Un schéma Mondrian permet donc de
définir le modèle logique ainsi que le mapping sur le modèle physique :
 Le modèle logique décrit les cubes, les dimensions, les hiérarchies, les niveaux et les membres (et plus
encore…) sur lesquels vont s‟appuyer les requêtes MDX.
 Le modèle physique correspond à la source de données sur laquelle s‟appuie le modèle logique (le
modèle en étoile et/ou flocon)
Les schémas Mondrian sont créés par les concepteurs et analystes avec l‟outil « Pentaho Schema
Workbench ».Schema Workbench ou encore « Jasper Workbench » est une application JAVA permettant de
définir les axes du cube ROLAP dans le fichier de description XML. Il se connecte via des drivers JDBC aux
bases relationnelles et permet de définir pour chaque cube, les dimensions et les mesures qui le composent.

7 On abrège souvent internationalization en i18n car, en anglais, comme en français, dix-huit lettres séparent la première lettre du mot (i) de la dernière (n)

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 45


Mémoire Master 2 Recherche Informatique UY1

 JPivot
JPivot est l‟outil permettant d‟effectuer des analyses OLAP dans l‟environnement Pentaho. JPivot est une
librairie JSP permettant d‟accéder à un cube Mondrian.
Il permet de mettre à disposition au travers d‟une simple, interface WEB un set de données sur lequel
l‟utilisateur pourra naviguer, créer des graphiques, ajouter des formules et se créer ses propres rapports.
Les données que nous venons d‟aggréger peuvent être représentées à l'aide d'un graphique. Pour lequel on
peut choisir le type et éventuellement changer ses propriétés via ces deux boutons. Le graphique peut être sous
format de bar 3D verticaux ou horizontaux, Stacked bars ver ticaux ou horizontaux, Camember…

 Reporting :
La dernière étape dans la chaîne décisionnelle est la création des rapports qui vont être générés via
l'outil Pentaho Report Designer qui se base sur le moteur de Reporting Java jFree Report.
Pentaho Report Designer permet :
 Le support de sources de données multiples dans les mêmes rapports,
 Le support de sous rapports,
 Le support multi langues,
 Une possibilité de contrôler le formatage au moment de l‟exécution du rapport,
 Une large gamme de graphiques à disposition,
 La production de différents types de format de sortie (pdf, html,xml,…),
Une fois le rapport mis en place on le publie sur la plateforme du serveur Pentaho.

En résumé ce chapitre illustre le travail effectué et la solution obtenue. Il commence par la description de
StatEduc2.0 et ses fonctionnalités, ensuite la modélisation des processus métiers du système éducatif et une étude
d'intégration de ces processus dans StatEduc2.0 et enfin par la proposition d'une solution pour l'intégration des
processus énumérés et l'analyse de cette solution. Le chapitre qui suit donne une conclusion général du travail
éffectué et de la solution obtenue et les perspectives pour les études ulterieures.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 46


Mémoire Master 2 Recherche Informatique UY1

Chapitre 4 : Conclusion générale

D‟après les études faites par l‟Institut Statistique de l‟UNESCO (ISU) sur les problèmes spécifiques liés
aux aspects informatique dont sont confrontés plusieurs pays africains, les déficiences suivantes sont à mettre en
exergue :
- Le manque de ressources matérielles et des ressources humaines qualifiées dotées des compétences
requises en informatique;
- La faiblesse des applications informatiques déployées dans les ministères dans le cadre de la production
et la diffusion des statistiques.
- Le manque d‟une architecture orientée services souple des applications du système éducatif.

Dans le but donc de faire passer le pays à un niveau supérieur de son système d‟information grâce à
l‟amélioration de la qualité des données, l‟application informatique actuelle de saisie et de traitement des
données statistiques (StatEduc2.0) doit être amélioré afin de répondre aux exigences suivantes :
- Possibilité d‟accéder à l‟application à partir des établissements, des arrondissements, des départements et
des régions afin de partager les données ;
- Possibilité de disposer d'un outil décisionnel efficace permettant de générer l‟annuaire statistique, le
tableau de bord et le rapport d‟analyse selon le modèle voulu (XML, PDF, Word, Excel);
- Possibilité de déploiement des différents tiers de l‟application dans des serveurs différentes
(Vision d‟architecture trois-tiers) ;
- Possibilité de visualiser et d‟accéder aux données d‟un établissement sur une carte géographique ;
- Disposer d'une architecture souple du système éducatif Camerounais, en utilisant des outils appropriés
aux besoins du système;

De manière générale, la solution proposée est une architecture de Business Intelligence basée sur les
SOA. Cette architecture permet de construire/améliorer le système de recueil et d'analyse de données du système
éducatif Camerounais.
De manière détaillé et en décrivant les étapes utilisées pour atteindre cette solution, nous avons
commencé par recenser, décrire et modéliser en BPMN (Business Process Management Notation) une liste
exhaustive des processus métiers pour l'intégration du BI dans le système de collecte et traitement de
l'information sur l'éducation au Cameroun. Ensuite, une étude sur l'intégration de ces processus dans StatEduc2.0
a été faite afin de voir si cette intégration est possible sans trop de difficultés (processus après processus) compte

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 47


Mémoire Master 2 Recherche Informatique UY1

tenue d'une certaine rigueur imposé par le logiciel. Cette partie nous a permis de dégager des conclusions sur
l'adéquation de StatEduc2.0 avec les processus analysés. Enfin, sur la base de cette analyse, une proposition
(BI_EDUCAM 1.0) de solution pour l'amélioration du StatEduc2.0 a été faite. Cette proposition consiste en une
architecture basée sur les SOA pour l'implémentation du système. Plusieurs scénarios ont été analysés et
comparés et des éléments de la solution ont été décrit pour apporter plus de précision sur le modèle proposé.
L‟analyse de la proposition faite a consisté à décrire les constituants et le fonctionnement de la
plateforme BI_EDUCAM 1.0. Dans cette partie les rôles et l‟utilisation des outils suivants ont été donnée :
 Talend Open Studio (Outil ETL) ;
 GeoServer (Serveur géographique);
 OpenLayers (Client SIG de GeoServer);
 Pentaho BI (Outil décisionnel);
 Mondrian (moteur OLAP);
 Jpivot (Analyse OLAP);
 Reporting (outil creation rapport).

L‟application BI_EDUCAM 1.0 n‟est pas encore mise en œuvre. Les services, les outils et les classes de
cette application sont modélisés. Il reste actuellement l‟implémentation de la solution en respectant l‟architecture
proposée c'est-à-dire basée sur SOA et utilisant éventuellement un Entreprise Services Bus (ESB). Nous
utiliserons la méthode Praxeme pour la conception des services et l‟implémentation à travers les Web Services.
Nous comptons dans l‟avenir rendre cette application internationale et paramétrable comme un Framework
composé des fonctionnalités réutilisables et paramétrables selon les besoins de chaque pays.

Un point qui nous semble important consiste à reconfigurer l‟architecture de l‟application StatEduc2.0
afin qu‟elle corresponde au modèle SOA; car notre solution améliore l‟application StatEduc2.0 en l‟associant à
des outils décisionnels externes pour construire une autre application basée sur le modèle souhaité et répondant
aux besoins du système éducatif camerounais.

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 48


Mémoire Master 2 Recherche Informatique UY1

Bibliographie
[ABS12]: ABOUBAKAR SIDDIKI, Rapport de stage professionnel à l’UNESCO, Juin 2012
[ALF13]: Alain Fernandez, "Business Intelligence, comprendre et conduire le projet", http://www.piloter.org/business-
intell+999999igence/index.htm, janvier 2013
[BAC02] : Bieber and Carpenter, « Architecture Orientée Services (SOA), de Didiez Donsez», Université Joseph
Fourier, Année 2002.
[CDA08]:Cyrille Devaux, , Livre Blanc : "URBANISATION & ARCHITECTURE ORIENTÉE SERVICE (SOA), Quelques
bonnes pratiques pour leur mise en œuvre", Aubay Management, Année 2008
[DSM08] : Didier MOUNIEN & Samantha MOINEAUX, Projet 15:"Outils informatiques et l'aide à la prise de décision en
Entreprise", Année académique 2007-2008
[GHE10] : GHELLAB Abdelkrim « Mémoire Magister sur la conception d’une base de données décisionnelle »,
Université*Mohamed Boudiaf* De M‟sila sous la présidence de Mr. BOUDERAH BRAHIM, Année Académique 2009-
2010.
[GSC10]:Groupe SCOrWare, "SOA (Service-Oriented Architecture) Concepts et points de vue, infrastructure service-
composants et outillage de développement Eclipse", - 2010
[GTN10]: Gurupratap Singh Dsor, Tata Consultancy Services Limited, Noida, India: A Business Intelligence Solution to
Improve Educational Standards and Performance for an Australian State Education Authority, Paper 129-2010
[LYW11]: Lee-Kwun Chan, Yee-WaiSim and William Yeoh, “A SOA-Driven Business Intelligence Architecture”,
1Faculty of Information and Communication Technology, University Tunku Abdul Rahman, Perak, Malaysia, School of
Information Systems, Deakin University, Victoria, Australia
[LWTM98]: Ricky, W.H. Yeung, Derek, T.W. Ngan, and Martin, C.Y. Cheung, “Application of Business Intelligence
Tools In Education Institutes: A Case Study Of Meem Laboratory“, Department of Manufacturing Engineering and
Engineering Management. City University of Hong Kong
[MBA10]: Mickaël BARON, "SOA – Services Web Introduction SOA " – 2010 (Rev. Janvier 2011).
[MGU08]: Muriel Guénon analyst CXP, Forum du CXP du 21 octoble 2008 « BPM : le défi de l’agilité ».
[OCM12]:Ocello Audrey : Mise en œuvre d’une SOA & meilleures pratiques de modélisation, Module Architecture SOA
– SI5/Master IFI, Publication 2011-2012
[OCA12]:Ocello Audrey : Méthodologies SOA, Module Architecture SOA – SI5/Master IFI, Publication 2011-2012
[OMG09]: OMG (Object Management Group): « Business Process Modeling Notation » du 03 Janvier2009
[PCV06]: P. Čechand V. Bureš:”Utilisation of Business Intelligence in an Education Environment “, University Of Hradec
Kralove, Faculty of informatics and management, Rokitanskeho 62, 500
03 Hradec Kralove, Czech Republic. Current Developments in Technology-Assisted Education (2006)
[PLW11]: Philip Wik, Lead Information Architect at Choice Hotels International, “Service-Oriented Architecture and
Business Intelligence”, SERVICE TECHNOLOGY MAGAZINE • Issue LIII • August 2011
[VAN01] : Jean Vanderdonckt et Stéphane Faulkner : Présentation des données dans les systèmes d‟information
opérationnels et décisionnels : « Environnement évolué et évolution de l’IHM », Année 2001
[XBI07]:Xebia Business Integration Architects, Livre Blanc : "Comprendre et savoir utiliser un ESB dans une SOA",
Copyright © Xebia 2007
[XGO09]: Xavier Godefroy, CNAM cours NFE107 : "Urbanisation et architecture des SI", Rapport sur le BPM, Mai 2009
[KMN09] : Kholladi Mohamed Naoufel, Mémoire de Magister en Informatique sur le thème « Une Approche de
transformation de la notation BPMN vers BPEL basée sur la transformation de graphe », Dans le cadre de l‟école doctorale
de l‟est, Algérie, Université Mentouri Constantine, N°358/MAG/2009, Série : 015/INF/2009
[ALI12] : ALIOUM, Rapport de Stage licence professionnel de l’IUT de Ngaoundéré, année 2012

[CNAM13] : CNAM / U & ARSI / Chapitre 3 : Vision Métier

Présenté et soutenu par ABOUBAKAR SIDDIKI Page 49

Vous aimerez peut-être aussi