Académique Documents
Professionnel Documents
Culture Documents
Une Architecture Orientee Services SOA D
Une Architecture Orientee Services SOA D
Paix-Travail-Patrie Peace-Work-Fatherland
MINISTERE DE L’ENSEIGNEMENT
MINISTERY OF HIGHER EDUCATION
SUPERIEUR
UNIVERSITY OF YAOUNDE I
UNIVERSITÉ DE YAOUNDÉ I
FACULTE DES SCIENCES FACULTY OF SCIENCES
DÉPARTEMENT D’INFORMATIQUE DEPARTMENT OF COMPUTER SCIENCES
ABOUBAKAR SIDDIKI
(Matricule : 09U0375)
En vue de l’obtention de
Dédicaces
Remerciements
En tout premier lieu, je remercie mon Dieu, tout puissant, qui m'a éclairé le bon chemin et qui m'a aidé à réaliser
mes travaux dans les meilleures conditions.
Je tiens à remercier sincèrement mon encadreur Dr Paulin Melatagia sans qui rien de tout cela ne serait arrivé.
Merci pour votre soutien sans lequel je n‟aurais jamais réussi à aller au bout, vos conseils toujours lumineux,
votre patience et votre temps consacré pour lire et corriger à plusieurs reprises les parties de ce mémoire. Merci
enfin pour l‟effort effectué pour la bonne marche de notre promotion.
Je voudrais exprimer toute ma reconnaissance à mon encadreur en entreprise M. Jean Bosco Ki, Conseiller aux
statistiques, Bureau Multipays Yaoundé, pour m‟avoir permis de faire le stage au sein de l‟UNESCO. Merci pour
m‟avoir attribué un sujet, pour l‟accueil chaleureux au sein de l‟UNESCO et pour les conseils et corrections
apportées lors de la rédaction de mon rapport de stage. Soyez assuré de ma profonde gratitude et de mon très
grand respect.
Je remercie les membres du jury : Président Pr. ATSA ETOUNDI Roger, Examinateur Dr. TINDO Gilbert et
le Rapporteur Dr. MELATAGIA YONTA Paulin d‟avoir accepté évaluer ce travail
Je tiens à remercier le Chef de Département d‟Informatique le Pr ATSA ETOUNDI Roger ainsi que la
merveilleuse équipe d‟enseignants du Département d‟Informatique pour toutes les connaissances qu‟ils m‟ont
transmis.
Je remercie mes parents, mes frères, mes sœurs, mes tantes et oncles pour leur prière et encouragement à mon
égard.
Merci infiniment à tous mes collègues du travail, mes camarades de Master 2 et mes amis.
Résumé
L‟Institut de Statistique de l‟UNESCO (ISU), dont le siège est à Montréal au Canada, a été créé en 1999
dans le cadre de la stratégie de l‟UNESCO pour promouvoir la culture d‟une politique reposant sur des éléments
factuels, tant au niveau national qu‟international, par la collecte et l‟exploitation de données récentes et de grande
qualité dans les domaines de l‟éducation, la science, la technologie, la culture et la communication. Dans le but
de faire passer les pays à un niveau supérieur de leur système d‟information grâce à l‟amélioration de la qualité
des données, l‟ISU souhaite améliorer l‟application informatique de saisie et de traitement des données
statistiques actuelle (StatEduc2.0) afin de répondre à plusieurs exigences demandées par les systèmes éducatifs.
L'une des améliorations importantes de cette application est la mise en œuvre d'une partie décisionnelle agile et
fiable permettant de transformer les données en information utile à la prise de décision. L'architecture de cette
application (StatEduc2.0) nécessite donc une reconfiguration afin de prendre en compte l'amélioration exprimée.
L‟architecture de type orientée services est celle adaptée pour cette reconfiguration. A cet effet, nous proposons
dans ce mémoire une architecture orientée services de Business Intelligence pour la gestion de l‟éducation. La
sélection des outils de Business Intelligence appropriées pour répondre aux besoins du système spécifié est l'une
des tâches la plus difficile dans un projet de type Business Intelligence. Compte tenu de cette difficulté, nous
proposons par la suite une architecture qui associe à StatEduc2.0 les outils BI appropriés pour l‟implémentation
du système dans le contexte indiqué. Une étude sur l'intégration des processus métiers éducatifs dans StatEduc2.0
a été faite et des conclusions sur l'adéquation de StatEduc2.0 avec ces processus analysés ont été dégagées.
L‟architecture proposée prend en compte ces conclusions et des directives pour son implémentation sont
données.
Mots clés: Business Intelligence, Service Oriented Architecture (SOA), Statistiques, Education.
Abstract
Institute for Statistics (UIS), headquartered in Montreal, Canada, was created in 1999 as part of UNESCO's
strategy to promote the culture of a policy based on evidence both nationally and internationally, for the
collection and analysis of recent data and high quality in the fields of education, science, technology, culture and
communication. In order to move the country to a higher level of their information systems through improving
the quality of data, the UIS wants to improve computer application entry and processing of current statistical data
(StatEduc2.0) in order to meet several requirements requested by the educational system. One of the major
improvements in this application is the implementation of a decision-making part agile and reliable to turn data
into useful information for decision making. The architecture of this application (StatEduc2.0) therefore requires
a reconfiguration in order to take into account the improvement expressed. The kind of service-oriented
architecture is one suited for this reconfiguration. To this end, we propose in this paper a service-oriented
Business Intelligence architecture for the education management. One of the major failures of BI project is the
selection of BI tools inadequate to meet the specified system; we propose the following architecture that
combines StatEduc2.0 BI tools appropriate for the implementation of the system in the specified context. A study
on the integration of business processes in educational StatEduc2.0 was made and conclusions on the adequacy
of StatEduc2.0 analyzed with these processes have been identified. The proposed architecture takes into account
these findings and guidelines for its implementation are given.
Keys word: Business Intelligence, Service Oriented Architecture (SOA), Statistics, Education.
Figure 10: Diagramme BPMN du processus d'élaboration du rapport d'analyse des données statistiques ...................................... 31
Figure 11: Architecture BI pour l‟éducation basée sur l‟Architecture Orientée Services (SOA) : cas du Cameroun ....................... 39
Sommaire
DEDICACES ........................................................................................................................................................................................................... I
REMERCIEMENTS ..............................................................................................................................................................................................II
BIBLIOGRAPHIE ................................................................................................................................................................................................ 49
L‟Organisation des Nations Unies pour l‟Education, la Science et la Culture (UNESCO) est née le 16
Novembre 1945. L‟objectif que s‟est fixé l‟organisation est de « construire la paix dans l‟esprit des hommes à
travers l‟éducation, la science, la culture et la communication ». Afin d‟assurer sa visibilité et sa présence
effective dans les états membres, l‟UNESCO a mis en œuvre une stratégie de décentralisation créant un réseau de
bureaux nationaux, multi-pays et régionaux dont le Bureau de Yaoundé.
Créé en 1991, le Bureau multi-pays de Yaoundé couvre trois pays : le Cameroun, la République
Centrafricaine et le Tchad. Il suit également les relations avec la CEMAC et la CEEAC dont les sièges se
trouvent respectivement à Bangui et à Libreville. La stratégie du Bureau de Yaoundé est en droite ligne avec les
objectifs de l‟EPT (Education Pour Tous), des OMD (Objectifs du Millénaire pour le Développement) et s‟inscrit
dans le cadre des politiques nationales définies par les documents de stratégie de réduction de la pauvreté. Elle
participe également à l‟intégration africaine.
Les cinq objectifs fondamentaux à moyen terme de l‟organisation guident son action à:
- Atteindre une éducation de qualité pour tous ;
- Mobiliser les politiques et les connaissances scientifiques au service du développement durable ;
- Relever les défis éthiques urgents ;
- Promouvoir la diversité culturelle et le dialogue interculturel ;
- Construire des sociétés inclusives du savoir à travers l‟information et la communication.
Les secteurs constituant le Bureau multi-pays de Yaoundé et recouvrant les domaines de compétence de
l‟UNESCO sont : le secteur éducation, le secteur de la science, le secteur de la culture, le secteur communication
et l‟Institut de Statistique de l‟UNESCO (ISU).
1.2 Problématique
D‟après les interviews que nous avions effectué au prés du conseiller statistique de l‟ISU, l‟analyse des
problèmes auquel sont confrontés plusieurs pays africains en ce qui concerne le processus de recueil et de
diffusion des statistiques peut être vue sous plusieurs angles à travers les six dimensions du DQAF (Data Quality
Assessment Framework – Cadre d‟évaluation de la qualité des données) :
1. Conditions préalables à la qualité des données
2. Intégrité statistique
3. Rigueur méthodologique
Dans le but donc de faire passer le Cameroun à un niveau supérieur de son système d‟information grâce
à l‟amélioration de la qualité des données, l‟application informatique de saisie et de traitement des données
statistiques actuelle (StatEduc2.0) doit être amélioré afin de répondre aux exigences suivantes :
- Etre accessible à partir des tous les niveaux hiérarchiques d‟enseignement (établissements,
arrondissements, départements et régions) afin d'assurer le partage les données ;
- Disposer d'une architecture souple du système éducatif Camerounais, en utilisant des outils appropriés
aux besoins du système;
- Disposer d'un outil décisionnel efficace permettant de générer l‟annuaire statistique, le tableau de bord et
le rapport d‟analyse selon le modèle voulu (XML, PDF, Word, Excel);
- Possibilité de déploiement des différents tiers de l‟application dans des serveurs différents (Vision
d‟architecture trois-tiers) ;
- Disposer d'un outil de visualisation et d‟accès aux données d‟un établissement sur une carte
géographique ;
Pour atteindre les objectifs ci-dessus cités, les différentes activités que nous avons effectuées dans le cadre de
notre stage sont les suivantes :
- Elaboration d‟une approche et d‟une démarche qualité de mise en place du SIGE (Système d‟Information
de Gestion de l‟Education) ;
- Maitrise et proposition des améliorations de StatEduc2.0 selon les besoins de chaque pays;
- Elaboration du modèle conceptuel et physique des données pour la plateforme du MINEDUB et du
MINESEC ;
- Configuration avec StatEduc2.0 de la plateforme du MINEDUB et du MINESEC ;
- Création des cubes OLAP pour les données du MINESEC ;
- Conception d'un outil décisionnel de création de l‟annuaire statistique du MINESEC.
Dans le cadre de notre travail de recherche sur l'utilisation de Business Intelligence pour construire/améliorer le
système de recueil et d'analyse de données du système éducatif Camerounais, nous avons commencé par
recenser, décrire et modéliser avec BPMN (Business Process Management Notation) [OMG09] une liste
exhaustive des processus métiers pour l'intégration du Business Intelligence dans le système de collecte et
traitement de l'information sur l'éducation au Cameroun. Ensuite, une étude sur l'intégration de ces processus
dans StatEduc2.0 a été faite afin de voir si cette intégration est possible sans trop de difficultés (processus après
processus) compte tenu d'une certaine rigueur imposé par le logiciel. Cette partie nous a permis de dégager des
conclusions sur l'adéquation de StatEduc2.0 avec les processus analysés. Enfin, sur la base de l'analyse
précédente, une solution pour l'amélioration du StatEduc2.0 a été faite. Cette solution consistait en une
architecture orientée services pour l'implémentation du système. Plusieurs scénarios ont été analysés et comparés
et des éléments de la solution ont été décrit pour apporter plus de précision sur le modèle proposé.
La suite de ce mémoire est organisée comme suit : le chapitre 2 présente un état de l'art sur le Business
Intelligence et le Business Intelligence pour l'éducation d'une part et d'autre part sur l'intégration d'une
Architecture Orientée Services (cas spécifique) dans une plate-forme existante. Ce chapitre permet de
ème
comprendre les méthodes et les outils sur lesquels s'est appuyé notre travail. Le 3 chapitre présente en premier
lieu l'application StatEduc2.0 et ses fonctionnalités et en second lieu l'Architecture Orientée Services pour
StatEduc2.0 conçue avec des analyses de la solution proposée. Le mémoire se termine par une conclusion
générale et les perspectives pour les études ultérieures.
Ce chapitre passe en revue la Business Intelligence, les architectures Orientée Services (SOA) et les approches
d‟intégration des SOA dans des applications.
La Business Intelligence (ou pour les habitués la BI) est devenue, dans les milieux qui gravitent autour de
l'informatique, un quasi-synonyme de l'information décisionnelle. Une première définition simple consiste à dire
que la Business Intelligence en français «l‟informatique décisionnelle» est la branche de l‟informatique qui
permet l'exploitation des données de l'entreprise dans le but de faciliter la prise de décision [GHE10]. C'est-à-
dire, la compréhension du fonctionnement actuel et l'anticipation des actions pour un pilotage éclairé de
l'entreprise. Elle désigne en effet un ensemble d'outils technologiques, méthodiquement assemblés, et déployés
en parfaite cohérence avec la stratégie d'entreprise préalablement élaborée [ALF13]. La BI n'a d'autre finalité que
de délivrer les informations pertinentes à chaque manager afin qu'ils puissent prendre le plus efficacement
possible les meilleures décisions selon son contexte d'action, ses prérogatives et ses objectifs tactiques et
stratégiques [ALF13]. Une deuxième définition plus technique veut que nous présentions en premier lieu les
différents niveaux d‟un système d‟information et par la suite nous définissions ce qu‟est un système
d‟information décisionnel.
sur des outils d‟extraction, de gestion de connaissances qui permettent de mettre en évidence des
corrélations entre des événements apparemment non liés. La finalité du niveau stratégique est le
pilotage de l‟entreprise dans une vision stratégique à long terme [Van01].
ETL
La notion d‟ETL (Extract Transform Loading), recouvre à la fois des outils et des processus d‟alimentation. Il
s‟agit d‟un élément clé dans l‟intégration des applications, en particulier dans le monde de la Business
Intelligence et du data warehousing. Outils et processus ETL sont des briques d‟une infrastructure de SI, dont la
valeur ajoutée et le retour sur investissement s‟expriment dans le temps en accompagnant l‟évolution du système
d‟information global ou du système d‟information décisionnel. L‟ETL est chargé d‟automatiser les traitements
(extraction, transformation et chargement) et de les rendre plus facilement paramétrables. Les données peuvent
être issues de différentes sources telles que : les bases de données, les applications métier, les fichiers, les
données externes, les ERP et les données saisies manuellement. Un outil ETL va permettre l‟extraction des
données issues des différentes sources, il récupère les données identifiées et sélectionnées. Au moment de
l‟extraction il faut prendre en compte la synchronisation et la périodicité des rafraichissements. Enfin les
données recueillis sont transformées en fonction des besoins de l‟entreprise, c‟est à dire qu‟elles sont vérifiées,
reformatées, nettoyées afin de supprimer les valeurs aberrantes et les doublons puis elles sont consolidées.
[DSM08].
Le Data Warehouse
Le Data Warehouse (ou entrepôt des données) se trouve au cœur du système d‟information décisionnel car
c'est sont les données qu‟il contient, que les utilisateurs et les décideurs vont exploiter. Le Data Warehouse
comporte 4 caractéristiques :
Les données sont organisées par thème.
Les données sont issues de différentes sources qui ont chacune un format, elles sont donc intégrées avant
d‟être proposées à l‟utilisation.
Les données non volatiles ne peuvent pas être supprimées, ni changées au cours du temps.
Les données sont historiées et les données non volatiles sont aussi horodatées. On peut ainsi
visualiser l‟évolution dans le temps. Le degré de détail d‟archivage est relatif à la nature des données car
toutes les données ne doivent pas forcément être archivées [DSM08].
Le Data Warehouse comporte donc 4 caractéristiques principales:
il est orienté sujet,
intégré,
non volatile et
historié.
Du Data Warehouse, on peut obtenir un ou plusieurs Data Marts qui sont définis comme des versions plus
légères du Data Warehouse, car un Data Mart rassemble les données d‟un même sujet, d‟un même thème ou d‟un
même métier. Le fait que cette base soit plus légère, le temps de réponse est beaucoup plus court. Cependant la
multiplication des Data Marts tend à complexifier la gestion des données. Quand les données ont été collectées,
stockées, nettoyées, consolidées, et sont rendues accessibles, elles peuvent être utilisées, en fonction des besoins
des utilisateurs pour cela il existe différents outils d‟extraction et d‟exploitation [DSM08].
Le Data Mining
Le Data Mining appelé aussi l’extraction de connaissances à partir de données ou Knowledge Discovery in
Databases [DSM08] a pour but de mettre en évidence des corrélations éventuelles dans un volume de données
important du système d‟information ou de l‟entrepôt de données et de dégager des tendances. Il s‟appuie sur des
techniques d‟intelligence artificielle pour mettre en évidence des liens cachés entre les données.
OLAP
OLAP (Online Analytical Processing), désigne les bases de données multidimensionnelles (aussi appelées cubes
ou hyper cubes) destinées à des analyses complexes sur ces données. Ce concept est appliqué à un modèle virtuel
de représentation de données appelé cube ou hyper cube OLAP, qui nous intéresse plus particulièrement. Cet
hyper cube est une représentation abstraite des données prévue à des fins d'analyses interactives par une ou
plusieurs personnes (souvent ni informaticiens ni statisticiens) du métier [DSM08].
Tableau de bord
Le tableau de bord est un instrument d‟aide à la décision qui permet de mesurer la performance pour faciliter
le pilotage d‟une ou plusieurs activités dans l‟objectif de faire progresser l‟entreprise. Il contribue à réduire
l‟incertitude et à faciliter la prise de risque inhérente à toutes décisions.
Reporting
Le terme "Reporting" désigne une famille d'outils de Business Intelligence destinés à assurer la réalisation, la
publication et la diffusion de rapports d'activité selon un format prédéterminé. Ils sont essentiellement destinés à
faciliter la communication de résultats chiffrés ou d'un suivi d'avancement. L'outil de reporting assure
l'interrogation des bases de données selon les requêtes SQL préparées lors de l'élaboration du modèle. Le rapport
d'activité peut ensuite être publié sur l'Intranet, périodiquement en automatique ou ponctuellement à la demande.
L'outil offre bien entendu des fonctions spécifiques pour l'élaboration du modèle du rapport, des modules de
calcul et de présentation (graphiques) afin de concevoir des comptes rendus particulièrement seyants et pertinents
[PIL13].
L'utilisation du Business Intelligence dans un environnement éducatif peut être vue sous deux angles
différents. Il peut signifier l'utilisation de la BI dans les ministères de l'éducation ou dans les entreprises qui
travaillent avec l'environnement éducatif pour trouver des solutions rendant les BI utiles dans les activités de
gestion des connaissances ou des activités de l'organisation d‟apprentissage. Le deuxième point de vue est centré
sur l'utilisation de la BI comme support de décision pour la gestion des établissements d'enseignement. Les deux
points de vue sont très proches et invitent peut-être à la coopération [PCV06].
Une des tâches de gestion des établissements d'enseignement est d'évaluer la façon dont les processus
d‟enseignement, de recherche, d‟évaluation sont exécutés. A cet effet, les méthodes et les technologies de BI
pourraient être vitales [PCV06]. Un des processus principaux évidents dans l‟enseignement éducatif est
l'enseignement. La difficulté est dans la question de comment mesurer le succès ou l'échec des activités
d'enseignement d'où la tâche principale de la mise en œuvre BI dans l'environnement éducatif est de trouver un
ensemble approprié de mesures qui pourraient être utilisés pour les activités d'enseignement. On se rend compte
donc que la particularité du BI dans l‟environnement éducatif se situé au niveau de l‟analyse et des résultats
obtenus.
Pour le processus d‟analyse, des dimensions et des mesures appropriées doivent être utilisées (lors de la
construction de l‟entrepôt des données) pour les activités d'enseignement.
Pour la présentation des résultats obtenus, la particularité est dans les rapports publiés. Par exemple, les
universités pourraient créer des rapports qui montrent l'évolution du nombre d'étudiants qui ont terminé avec
succès ou sans succès les études, le nombre d'étudiants candidats à une spécialisation ou une matière, le nombre
d'étudiants effectivement inscrits dans une année scolaire particulière, etc. Préparer des rapports et l'analyse de
ces mesures permet aux universités de juger l'intérêt d‟augmentation ou de diminution de certaines
spécialisations et pourrait aider à décider de l'ouverture de la procédure d'agrément de nouvelles spécialisations.
De même, la base de la prise de décision pourrait résulter de la connexion de données internes réunis avec les
données externes. La connexion de données sur les élèves avec des sources externes est très utile, car elle aide
par exemple à analyser le succès des étudiants sur le marché du travail. Pour l'université, il pourrait être très
intéressant d'avoir accès à des données du Ministère. La solution BI peut prendre des données sur les taux de
chômage de certains diplômés de l'enseignement et des liens vers des spécialisations qu'ils avaient étudiés. Une
telle analyse sert à la planification stratégique de l'université et peut également être utilisé pour comparer la
qualité de l'éducation (et le succès sur le marché du travail, respectivement) dans les différents établissements
d'enseignement [PCV06].
En somme, la Business Intelligence est une branche de l‟informatique qui permet de collecter, de stocker,
de distribuer et d'exploiter des données de l'entreprise dans le but de faciliter la prise de décision. Le point qui
suit présente l'architecture Orientée Services, sa mise en œuvre et la conception des services, élément central de
cette architecture.
2.2.1 Définitions
SOA est l‟acronyme de Service Oriented Architecture qui est traduit comme « Architecture Orientée
Service ». SOA est une architecture métier conceptuel où les fonctionnalités métiers, ou la logique de
l’application, est mise à disposition aux utilisateurs, en tant que services réutilisables et partagés dans un
environnement informatique. Les services dans une SOA sont les modules d‟une fonctionnalité de l‟application
avec des interfaces exposées et qui sont invoquées par messages. [MBA10].
L‟architecture orientée services (SOA) s‟inscrit dans une démarche d’urbanisation qui guide la
mise en place des applications « métiers » et fixe la frontière entre réutilisation de l‟existant et nouveaux
développements. La SOA favorise la réutilisation fonctionnelle au travers de l’approche service. Cette
approche est un modèle d'interaction applicative mettant en œuvre des composants logiciels avec une
forte cohérence interne et des couplages externes « lâches ». Elle permet en outre de contractualiser la mise à
disposition des grandes fonctions métier de l‟entreprise et induit une mise à disposition homogène de ces
fonctions. De plus cette approche permet d‟envisager de manière uniforme la mise en place de fonctions
communes comme l‟administration, l‟exploitation, la sécurité, etc.
Ce type d‟architecture suit des principes de modélisation modernes. Quelques un de ces principes sont les
suivants [MBA10]:
L‟architecture doit reposer sur le concept d‟offre et de demande de services.
Les composants doivent pouvoir communiquer entre eux de manière asynchrone et doivent être couplés
faiblement.
L‟architecture doit être découpée en plusieurs couches:
Ces principes doivent permettre de rendre le système flexible pour s‟adapter à la stratégie des
entreprises. Cette flexibilité découle du fait que les services sont réutilisables grâce à une interface standardisé,
une facilité d‟intégration accrue pour une complexité plus faible.
Outre sa flexibilité, les bénéfices de la SOA peuvent être nombreux comme le montre la figure2.
L‟agilité métier permet à la SOA de s‟adapter rapidement à son environnement métier en maintenant des
services s‟alignant aux demandes clientes. Une réduction des coûts est atteinte par une meilleure réutilisation
des services existants ainsi qu‟une meilleure maintenance grâce à une consolidation des applications par des
services réutilisables.
Dans cette représentation, l‟élément central est le service. Un service est un comportement défini par contrat,
qui peut être réalisé et fourni par tout composant pour être utilisé par tout composant, sur la base unique du
contrat [BAC02].
Le contrat est passé entre le fournisseur de service et le consommateur de service. Il est alors:
o Lié à la syntaxe du service (opération, messages d‟entrée, messages de sortie, …)
o Lié à la sémantique du service (définition de règles et de contraintes d‟usage, …)
o Lié à la qualité de service (temps de réponse attendu, procédures en cas de panne, temps de reprise
après interruption, …)
Le contrat s‟appuie sur des standards d‟interopérabilité pour faciliter le dialogue (exemple : WSDL). Un
accord de niveau de service est un contrat souscrit entre le fournisseur d'un service et un usager de ce service
définissant les engagements de ces deux parties. Ces engagements, contenant le niveau de service fourni ainsi
que les pénalités encourues en cas de manquement de part et d'autre, sont définis par des critères objectifs de
qualité de service pouvant être évalués par les deux parties.
L‟échange entre le fournisseur de service et le consommateur doit se faire à travers des messages
(couplage lâche vis-à-vis de son environnement) et l‟utilisation d‟une orchestration évite que les services aient
besoin de connaître les autres services. En plus, le contrat du service ne doit contenir que les informations
pertinentes à son invocation. Le fonctionnement du service est alors dit en « boîte noire » c'est-à-dire seul le
contrat exposé au consommateur du service est connue et le fonctionnement interne du service ne doit pas être
visible (Logique métier, Implémentation). Il est par conséquent important d‟assurer la prédictibilité d‟un service ;
pas de variation dans le comportement et dans la réponse d‟un service lors de la réception d‟une requête.
Un service doit être accessible depuis un entrepôt ou un annuaire pour faciliter sa découverte. Ainsi le
fournisseur de services à la charge de déposer et de mettre à jour ses services depuis l‟annuaire et le service est
enrichi par un ensemble de métadonnées pour faciliter la recherche du consommateur de services.
Un service doit disposer de l‟ensemble des informations nécessaires à son exécution et ne doit dépendre
d‟aucun service externe (couplage lâche). Ceci garantie l‟autonomie d‟un service et permet de s‟assurer de sa
prédictibilité. En plus, un service doit être sans état de façon à minimiser la consommation de ressources.
Un service doit fonctionner de manière modulaire et non pas intégrée. Pour se faire, il faut toujours
assurer la décomposition d‟un service complexe en sous services plus simples entre eux (garantir l‟autonomie) et
s‟inscrire dans une logique de composition de services à travers l‟utilisation de l‟orchestration (couplage lâche) ;
paramètres d'entrées-sorties, et l'adresse réseau à laquelle nous pourrons l'invoquer. UDDI permet de retrouver
un service web, et WSDL de décrire ses méthodes.
Deux familles de Services Web se distinguent actuellement :
Services Web « étendues » : s‟appuie sur des standards UDDI / WSDL / SOAP
Services Web REST (Representational State Transfer) : utilise directement HTTP au lieu d‟utiliser une
enveloppe SOAP.
Avant d‟implémenter une architecture SOA comme les Web services ou tout autre technologie, il importe de
faire une modélisation des systèmes avec des outils capables de les décomposer en services. Le BPM, fait parti
de cette classe d‟outils.
L‟apport d‟une méthodologie dans la mise en œuvre de SOA devient une nécessité pour l‟adoption de SOA
dans les entreprises. Comme méthodes de conception de services on peut citer les trois méthodes les plus
populaires qui sont : SOMA (IBM), SODA (De Gamma) et Praxeme (Unilog Management et Orchestra
Networks). Praxeme est considérée comme publique et la plus utilisée [OCA12]. C‟est une méthodologie
ouverte avec un référentiel d'entreprise complet formalisant le métier, l'organisation de l'entreprise, le SI.
Les étapes de la méthode Praxeme :
Analyse du cahier des charges pour identifier les objectifs, le vocabulaire et les règles métier;
Définition du cadre métier pour identifier les entités métier et les domaines sémantiques
Définition du savoir-faire de l‟entreprise pour identifier : les départements, les processus et les
indicateurs clés de performance (KPI);
Déduction de l‟architecture logique et accostage avec l‟existant pour identifier : les composants, les
services, ...
Calquer l‟architecture logique sur le physique pour identifier la fédération d‟ESB.
Comme nous l‟avons définie dans la partie précédente, l‟architecture orientée services (SOA) s‟inscrit
dans une démarche d’urbanisation qui guide la mise en place des applications « métiers » et fixe la
frontière entre réutilisation de l‟existant et nouveaux développements. Deux phases sont utilisées pour la mise en
œuvre de SOA : la phase d’urbanisation et la phase post-urbanisation [OCM12].
La phase d‟urbanisation est la phase où l‟ensemble du système d‟information est urbanisé en s‟appuyant
sur la cartographie des domaines métiers de l‟entreprise et sur le code existant. Pour la phase post-urbanisation,
au démarrage de chaque projet, il est nécessaire de s‟appuyer sur les processus et services répertoriées
précédemment afin d‟étendre correctement l‟architecture mise en place.
Pour l‟intégration des SOA dans des applications, nous allons expliquer la mise en œuvre d‟une SOA à
travers deux approches et ensuite détailler l‟une des étapes de ces approches qui est la modélisation d‟une
application SOA.
Approche Bottom-up
Traditionnellement, la mise en place est proposée suivant une approche Bottom-up, en suivant les étapes
suivantes :
1-) Chaque application fournit des connecteurs propriétaires. La première étape est de développer des
services façade permettant d‟exposer les fonctionnalités offertes par les applications en suivant un modèle
unique. Les services développés doivent fournir un niveau d‟abstraction par rapport aux applications
2-) Une fois tous les services développés, on ajoute une couche de service management. Les outils
permettent de superviser les échanges et d‟anticiper les problèmes techniques ou fonctionnels.
3-) La troisième et dernière étape est de les utiliser dans les processus métiers de l‟entreprise.
Les problèmes de la mise en place d‟une SOA en suivant ces étapes sont [CDA08]:
- Les décideurs ne voient l‟utilité de la SOA qu‟à partir de la troisième étape, c'est-à-dire quand il est
possible de composer les services pour les utiliser dans les processus métiers.
- La réalisation des services est une tâche transverse. L‟approche souvent employée est d‟inclure la
réalisation des services dans la mise en place d‟une application dans le SI, ou dans un projet d‟intégration
entre deux applications. Or la réalisation d‟un service transverse a un surcoût qui dépasse le cadre du
projet, et qui est généralement sous-estimée.
- Le surcoût de la réalisation d‟un service transverse ne se justifie que sur le long terme, quand le service a
été utilisé dans un certain nombre de processus.
Cette approche de la SOA est uniquement technique, elle ne prend absolument pas en compte les contraintes des
décideurs, et la nécessité de justifier les investissements IT sur leurs apports fonctionnels.
L’approche Top-down
L‟approche Top-down est beaucoup plus pragmatique que l‟approche détaillée précédemment. Elle permet la
définition des services en fonction de leurs cas d‟utilisation :
1. Modélisation des processus métiers exécutables. Ces processus métiers exécutables définissent des
services techniques permettant d‟accéder au SI, utilisant tout type de connecteurs, y compris les Web Services.
Ces services techniques ne sont à priori pas transverses lors de la première modélisation : il y a possibilité qu‟un
même service technique soit mis en place différemment par plusieurs équipes.
2. Identification des services transverses : cela est facilité par les capacités d‟analyse des dépendances
entre processus que proposent les outils de BPM. Une fois les services transverses implémentés, ils sont
référencés dans l‟annuaire de l‟entreprise.
3. Ajout de Service Management, ou plutôt de Business Activity Monitoring(BAM).
Le principal problème de l‟approche Top-down est de considérer que les services sont des Web Services. On est
beaucoup trop proche du modèle objet (opérations atomiques et sans états) pour garantir une réutilisabilité. Dans
l‟approche top-down, un service a un niveau d‟abstraction supérieur : il s‟agit plutôt de processus BPEL
réutilisable, masquant les détails d‟implémentation, mais capitalisant sur les connecteurs permettant d‟accéder au
SI ; un service peut être technique ou fonctionnel.
Un processus métier est une « séquence organisée d‟activités connexes qui, ensemble, créent un résultat
ayant de la valeur pour les clients ou les usagers (institution ou administration)» (M.HAMMER) [CNAM13].
Un processus décrit en général le métier, et non le système informatique. On distingue trois catégories des
processus métier :
- Processus clients/customer process : fournissent les produits ou services aux clients ; Exemple : la
souscription à des produits bancaires ;
- Processus supports/sustaining process : responsables de la valeur ajoutée aux clients indirectement
Exemple : la mise à jour du catalogue des produits bancaires ;
- Processus internes/enabling process : fournissent des services de gestion interne (pas de lien avec le
client) ; Exemple : le traitement des salaires, l‟embauche, l'inventaire
La modélisation des services consiste d‟abord à identifier les services et ensuite à les nommer (verbe ou nom)
et les publier. L‟identification des services est l‟un des problèmes centraux pour mettre en œuvre une SOA car la
granularité des services est fondamentale, il faut éviter une granularité trop fine qui entraîne beaucoup
d‟interactions et des problèmes de performance. On recommande des services à “gros grain” mais attention à une
granularité trop “épaisse”, un service qui fait trop de chose, risque de ne pas être réutilisable. Il faut trouver en
tout cas le juste milieu. Pour obtenir une granularité pertinente des services, il est nécessaire de concilier les deux
analyses (Top-down, Buttom-up) et de comparer les services “remontés” avec ceux “déduits”. Ensuite faire les
compromis nécessaires pour réutiliser le maximum de code [OCM12].
Comme point d‟entrée de la modélisation des applications SOA, trois démarches sont utilisées :
- La démarche orientée métier dont le but est de réaliser la cartographie des processus ;
- La démarche orientée applications conduit à la cartographie des échanges de flux inter applicatifs ;
- La démarche orientée données pour réaliser la cartographie des référentiels.
Après avoir identifié et décrit les processus métiers, la modélisation BPMN permet d‟illustrer à l‟aide d‟un
diagramme l‟enchainement des activités, des événements et résultats d‟un processus entre les acteurs qui
participent à la réalisation de ce processus.
Ce chapitre a passé en revue les notions de Business Intelligence, d'Architecture Orientée Services
(SOA) et des approches d'intégration de SOA dans une application. On retient que deux approches (le Bottom-
Up et le Top-down) sont utilisées pour la mise en œuvre de SOA. Le chapitre qui suit mettra en pratique ces
approches pour intégrer une Architecture Orientée Services dans l'application StatEudc2.0 existant. Pour ce faire
nous avons utilisé l‟approche Top-down et choisis la démarche orientée métier pour construire le système.
3.1.1 Introduction
L‟application StatEduc2/ISU est une plateforme de saisie, traitement et exploitation des données
développée par l‟Institut de Statistique de l‟UNESCO. C‟est un outil spécialisé dans la gestion des bases de
données scolaires, un produit qui s‟adapte à de multiples contextes de collecte et de traitement de données
statistiques scolaires. StatEduc2.0 a été conçue dans la continuité de « StatEduc 1.0 » mais avec une souplesse
plus accrue. Selon les spécificités de chaque pays, l‟application pourra être configurée. C'est un outil utilisé dans
une quinzaine de pays africains (Cameroun, RCA, RDC, Sénégal, Mali, Burkina Faso, Niger, Guinée Conakry,
Burundi, Ethiopie, Ouganda, Tanzanie, Angola, Ghana, Sierra Leone …), les spécifications de cette plateforme
sont entre autres [ABS12]:
• Application libre «Open Source», fonctionnant sous Windows ;
• Application PHP hébergé dans le serveur Wamp et compatible avec plusieurs type de système de gestion
de base de données (Oracle, SQL server, Ms Access, Mysql, etc.)
• Configuration d‟écrans de saisie conviviaux à l‟image des questionnaires avec un module de contrôle
dynamique de cohérence interne des données
• Grande adaptabilité aux besoins variés, aux changements du découpage administratif et du système
éducatif
• Modèle de base de données pluriannuelle et multidimensionnel
• Application fonctionnant sur un poste ou en réseau d‟ordinateurs connectés permettant d‟effectuer la
saisie des données à partir de plusieurs postes, les données étant centralisées sur un serveur
• Mode d‟accès sécurisé aux données avec cryptage et différencié selon le droit accordé aux utilisateurs
• Application orientée Web compatible et accessible à distance à l'aide d'Internet Explorer
• Facilité de déploiement, d‟utilisation et de maintenance
• Module de reportage automatique des données – tableaux de synthèse dynamiques exportable sous
MICROSOFT EXCEL
• Comporte un module d‟exploration multidimensionnelle des données de type OLAP (OnLine Analytical
Processing)
Js adodb
Questionnaire
Affichage
StatEduc 2
Classes arbre
Include Accueil
Instances Administration
Fichiers à la
racine Lib
Saisies données
Template
Tableaux Synthèse
s
Fichier racine
Figure 4 : Architecture StatEduc2.0
L‟application « StatEduc2.0 » a été conçue en intégrant un contexte de décentralisation des opérations de saisie
des données enquêtes. Ainsi des outils ont été mis au point afin de permettre l‟intégration des données
éventuellement saisies sur plusieurs sites de saisie dans une seule base de données pour en constituer la base
globale. Le processus de déroulement de la campagne statistique peut se résumer selon le graphique ci-dessous :
L‟extraction des données est une opération essentielle au niveau de la préparation des sous bases de données pour
le démarrage de la campagne statistique. En effet avant la campagne il est souhaitable de partir de la base de
données centrale pour constituer les sous bases de données destinées aux zones de saisie déconcentrée. Cette
opération se fait en considérant une base de données ne contenant que certaines informations dont leur évolution
est presque nulle (informations statiques : Atlas, Nomenclature, Etablissements, Personnels enseignants).A partir
de ces informations supposées statiques on peut alors démarrer la saisie d‟une campagne statistique.
Les critères utilisés pour l‟exportation des données sont : le système d‟enseignement, la chaîne de
regroupement, le type de regroupement, l‟occurrence du regroupement, l‟année scolaire et enfin la liste des tables
à exporter.
La procédure d'exportation passe par cinq étapes successives qui sont la sélection du système
l‟enseignement, la sélection des localités, la sélection des périodes scolaires, la sélection du chemin destination
des fichiers et enfin la sélection de la liste des tables à exporter.
Stateduc2.0 intègre un module appelé « Tableaux de synthèse ». Ce module permet d‟éditer les états
pour avoir les premiers chiffres, l‟état d‟avancement de la saisie. Ces états peuvent aussi servir aux contrôles de
cohérence des données saisies.
Ce module comporte cependant plusieurs limites. Il ne permet pas de reproduire l‟annuaire statistique.
Certains états peuvent être édités par ce module mais pas l‟ensemble des états. Le calcul des taux est une
faiblesse de ce module et surtout au niveau des totaux par division administration.
La configuration d‟un état de synthèse comporte plusieurs éléments que sont :les divisions
administratives, les mesures (valeurs quantitatives dans la base de données que vous voulez analyser),les
dimensions(variable dont les modalités servent à catégoriser des données), les filtres éventuels (critère permettant
de filtrer les données à afficher lors de l‟édition de l‟état) et enfin les agrégations représentant les niveaux
hiérarchiques des différentes divisions administratives.
Champs de type dimension : il s‟agit du type de champs utilisé pour les « Levels (niveaux) » rattachés
aux dimensions ;
Champs de type identifiant : il s‟agit du type de champs qui servent essentiellement aux jointures entre
les tables utilisées comme source de données du cube.
Après la présentation du système de recueil et d'analyse de données statistiques actuelles (StatEduc 2.0),
nous passons à la modélisation des processus métiers du système éducatifs afin de faire une étude d'intégration de
ces processus dans le système StatEduc2.0 présenté.
Event-Process Chains, BPSS, etc. Son rôle est de fournir une notation facilement compréhensible par les
utilisateurs métiers (y compris les analystes métiers, les développeurs et ceux qui devront gérer et surveiller le
processus âpres leur mise en œuvre) mais aussi à créer une passerelle standardisée pour combler le vide entre la
modélisation des processus métiers XML, tels que BPEL4WS et Sybase Intégration Orchestrator [KMN09].
L‟outil que nous avons utilisé pour la modélisation BPMN des processus ci-dessous est l‟outil Yaoqiang
BPMN Editor 2.1. C‟est un outil libre, flexible et conforme pour les diagrammes BPMN version 2. Aucune
installation n‟est requis, il est directement lancé et utilisé sur le disque.
En nous inspirant des articles [GTN10, PCV06, PLW11, LYW11, LWTM98]et grâce aux interviews effectués
dans les ministères en charge de l'éducation au Cameroun, nous avons identifié six processus métiers pour le
recueil et l'analyse des données du système éducatifs Camerounais. Ces processus sont :
1) Processus de conception des outils de collecte des données;
2) Processus de collecte des données statistiques de l'éducation ;
3) Processus de production de l‟annuaire statistique de l'éducation (CELPLAN/DPPC /MINESEC) ;
4) Processus d‟élaboration du rapport d‟analyse des données statistiques de l'éducation;
5) Processus de production et mise à jour de l‟annuaire statistique et de la carte universitaire du Cameroun
(MINESUP) ;
6) Processus de Révision de la Carte Scolaire du Secondaire (CELPLAN/DPPC /MINESEC) ;
La suite donne la description de trois(3) processus les plus importants.
Ainsi, chaque niveau disposera d‟un outil de collecte spécifique à son niveau d‟enseignement. La conception ou
la mise à jour de l‟outil de collecte se fait à chaque début d‟année académique. Le planificateur recense les
besoins en données de chaque direction et vérifie si l‟outil existant ne contient pas déjà les données demandées. Il
arrive de concevoir un nouvel outil ou de mettre à jour l‟existant. Une fois les questionnaires montés et/ou mise à
jour, les directeurs et certains décideurs s‟asseyent et valident les outils conçus ; en cas d‟ambiguïté les erreurs
sont corrigés par le planificateur. Après la validation, les outils sont testés dans les services déconcentrés. Si le
système est informatisé alors le teste se fait en ligne par les établissements choisis, sinon les questionnaires
papiers sont envoyés dans ces établissement pour le teste. Au terme de ce teste, des observations sont recueillies
et prises en compte dans les questionnaires. Une fois les outils validés et testés, ils sont envoyés à l‟imprimerie
pour l‟impression ou bien ils sont mis en ligne dans le cas du système informatisé. Le résultat de ce processus est
que les outils sont actualisés et disponibles.
- Le financement de l‟éducation ;
- Le rapport d‟une étude ou deux études thématiques ;
Figure 10: Diagramme BPMN du processus d'élaboration du rapport d'analyse des données statistiques
Dans cette partie, nous présentons les services par processus et selon l'organisation hiérarchique des
enseignements. Le tableau suivant donne les services par processus retenus. Ces services sont déduits de
différentes activités que forme le processus. Ils seront considérés dans le dernier niveau de granularité du
système et seront implémentés directement.
Processus Services
Processus de conception des outils de collecte des données Recenser besoins
(Questionnaires) Envoyer Questionnaire pour testing
Mettre à jour Questionnaire
Publier Questionnaire
Enregistrer Observations
Inviter à tester
Tester Questionnaire
Imprimer Questionnaire
Remplir Questionnaire
Enregistrer en ligne
Processus de production de l'annuaire statistique de
l‟éducation
Inviter à saisir
Vérifier Questionnaire
Mettre à jour données
Apurer données
Créer cube pour l'annuaire
Sélectionner tableaux pour annuaire
Générer Annuaire
Mettre à jour Annuaire
Publier annuaire
Imprimer Annuaire
Déterminer Indicateurs
Calculer Indicateurs
Processus d'élaboration du Rapport d'analyse des données
Générer graphique
statistiques
Le tableau qui suit décrit plutôt des services métiers selon l'organisation hiérarchique de l'enseignement. Un
Service métier se trouve au « plus haut » niveau. Il s‟agit du service qui fait sens pour le métier, donc pour la
maîtrise d‟ouvrage du fournisseur mais aussi pour la maîtrise d‟ouvrage du consommateur. Cette dualité
des maîtrises d‟ouvrage est aussi un point particulier des SOA.
Tableau 2 :Tableau de spécification des services selon l'organisation hiérarchique des enseignements
Niveau Services
Etablissement Testing Questionnaire, Remplissage des données de l'établissement dans l'application, Consultation
des données de son établissement, consultation du tableau de bord de son établissement
Arrondissement Consultation et mise à jour des données des établissements de son arrondissement, Consultation du
tableau de bord de son arrondissement, consultation des situations géographiques des établissements
de son arrondissement.
Départemental Consultation et mise à jour des données des établissements de son département, Consultation du
tableau de bord de son département, génération de l'annuaire statistique de son département,
consultation des situations géographiques des établissements de son département.
Régional Consultation et mise à jour des données des établissements de sa région, génération de l'annuaire
statistique, du tableau de bord et du rapport d'analyse des données statistiques liés aux établissements
de sa région. Mise à jour de la carte universitaire de sa région, consultation des situations
géographiques des établissements de sa région, etc...
National Consultation, mise à jour, suppression et sauvegarde des données des établissements nationaux.
Génération de l'annuaire statistique, du tableau de bord et du rapport d'analyse des données
statistiques nationales. Mise à jour de la carte universitaire nationale, consultation et mise à jour des
situations géographiques des établissements nationales. Publication des outils de collecte, de l'annuaire
statistique et rapport d'analyse national et régional, de l'annuaire statistique départemental, de la carte
universitaire et du tableau de bord national. bref tous les services des autres niveaux sont accessibles à
ce niveau.
L'objectif de cette étude est d‟évaluer les coûts de l'intégration des processus ci-dessus dans StatEduc2.0 afin de
dégager des conclusions sur l'adéquation de StatEduc2.0 avec les activités énumérés.
Dans cette partie, nous allons analyser et vérifier pour chaque processus, si ses activités figurent ou pas dans
l'application StatEduc2.0 et enfin conclure si le processus est déjà intégrer ou pas dans la plateforme. Un
processus sera considéré comme intégrer dans l'application lorsque ses activités interactives et/ou automatiques
font déjà partie intégrante de l'application.
Le processus de conception des outils de collecte se déclenche à chaque début d'année scolaire et le résultat
de ce processus est la disponibilité de l'outil de collecte. Parmi les activités de ce processus, les activités
interactives/automatiques sont: le montage ou la mise à jour des questionnaires, le testing des questionnaires,
l'édition et la publication de l'outil en ligne. La configuration de la plateforme StatEduc2.0 se fait sur la base de
l'outil de collecte (questionnaire) de l'année académique en cours, il est configuré en plusieurs secteurs selon les
différents types de questionnaires répartis selon le secteur d'enseignement (préscolaire, primaire, secondaire,
Le processus de collecte des données est la suite du processus de conception de l'outil de collecte. Il se
déclenche lorsque l'outil de collecte est testé et validé; le résultat est que le questionnaire dédié à un
établissement soit renseigné par les données ou bien que les données soient enregistrées dans la base de
StatEduc2.0. Compte tenu de la situation désenclavé des certains établissements, deux solutions sont envisagées:
le cas où le système est informatisé, c'est à dire que l'application StatEduc2.0 est publié et accessible pour les
établissements disposant de la connexion Internet et le cas où le système n'est pas informatisé, c'est à dire que les
questionnaires papiers sont distribués aux établissements par les missionnaires. Dans ce processus, les activités
interactives/automatiques sont les suivantes : l'enregistrement des données, la vérification et la correction des
données incohérents.
L'enregistrement des données est une activité pour le cas où le système est informatisé. L'application
StatEduc2.0 étant publié en ligne, les établissements disposant de la connexion Internet enregistre
directement leurs données sur la plateforme; Ils n'ont pas besoin des questionnaires papiers;
La vérification et la correction des données incohérentes sont des fonctionnalités figurant dans
StatEduc2.0 (Onglet Contrôle/Validation de la plateforme).
En résumé, le processus de collecte de données fait partie intégrante de la plateforme StatEduc2.0. Pour le cas
des établissements possédant la connexion Internet, tous le processus se traite sur StatEduc2.0 (Enregistrement,
Vérification et Correction des données). Pour les établissements ne disposant pas de la connexion, il suffit juste
de renseigner les questionnaires distribués par les missionnaires et de le retourner au niveau central ou régional et
la plateforme StatEduc2.0 finalise le processus (Saisie des données, Vérification et Correction).
L'Annuaire Statistique Universitaire est un document annuel qui permet d'avoir une situation des
effectifs des étudiants, des enseignants, des institutions universitaires publics et privées, des infrastructures et des
ressources financières. Ce document est produit chaque année et permet de mettre à jour la carte universitaire. Il
est au même titre que l'annuaire statistique du secondaire et le processus qui permet de le produire est analysé ci-
dessus. Comme nous l'avons résumé dans le processus 3, les activités déjà intégrées dans StatEduc2.0 sont : la
saisie des données (fonctionnelle), l'apurement des données saisies (fonctionnelle), la création des cubes à
intégrer dans l'application (intégrer mais pas tout à fait fonctionnelle).
La carte universitaire est un document qui se rédige et ne peut donc être automatisé et intégré dans
StatEduc2.0, elle utilise les données de l'annuaire pour produire des tableaux, histogrammes, diagrammes et
camemberts et les interprète par la suite. Une partie de ce document pourra être automatisée en l'occurrence la
partie de la cartographie, le module du SIG (Système d'Information Géographique) peut être intégré dans la
solution envisagée afin de présenter graphiquement l'image du système universitaire camerounais et notamment
la position géographique de chaque institution universitaire public et privée.
En résumé, l'annuaire statistique universitaire s'intègre en partie dans l'application comme l'a était analysé
dans le processus 3. En ce qui concerne la carte universitaire, c'est un document rédigé en utilisant les données
de l'annuaire et ne peut donc pas être intégré complètement dans StatEduc2.0 dans le but d'une automatisation. Il
sera possible d'intégrer ou d'associer un module de SIG à StatEduc2.0 pour illustrer la cartographie universitaire.
D‟après la modélisation des processus métiers du système éducatifs ci-dessus, nous avons constaté que
dans tous le cycle de production et de diffusion des données décisionnelles de l'éducation camerounais,
StatEudc2 participe à la réalisation des processus de conception de l'outil de collecte, de la collecte des données,
de la saisie des données , de l'apurement de ces données et de la création des cubes OLAP pour le traitement des
données . Les processus de diffusion des données ne font pas encore partie intégrante de cette application.
L'intégration de certains s'avèrent être très difficile et voire même impossible, vu la nécessité de disposer des
outils décisionnelles de génération des états, des tableaux, de tableau de bord et de carte géo-référencée.
Dans le souci de disposer d‟un outil qui intègre tous ces processus, nous proposons une solution
architecturale permettant de mieux maitriser le système. Cette solution est structurée en deux modèles : le
premier modèle donne une vue globale du système éducatif répartie selon l‟organisation hiérarchique de
l‟enseignement (établissements, arrondissements, départements, régions, National) et le deuxième modèle
s‟appuie sur le premier et utilise des outils décisionnels appropriés pour répondre aux besoins spécifiques du
système camerounais.
DM
Serveur Annuaire Statistique National
DW
ETL Application
BD Spatiale des Cube d’Analyse
établissements OLAP éducative Rapport d’analyse éducatif et
Carte Universitaire National
Niveau : Région
Annuaire Statistique régional
Interface des
DW Cube services des
Niveau : département
Niveau :
Arrondissement
Cube Interface des
DW Tableau de bord
services
OLAP des
d'arrondissements
arrondissements
Niveau :
Etablissement
Serveur
Cube Interface
BD DW Tableau de bord
ETL Etablissement Bus BI: SOAP, XML,
établissements OLAP
APIs, HTPP
Organisation
Couche Sources de données Couche Couche Entrepôt des Couche d’analyse (application et Couche communication Couche Présentation
Hiérarchique de
opérationnelles d’intégration données services éducatifs) (orientée service)
l'enseignement
Figure 11: Architecture BI pour l’éducation basée sur l’Architecture Orientée Services (SOA) : cas du Cameroun
Mémoire Master 2 Recherche Informatique UY1
L‟une des principales raisons d'un échec du projet BI est largement due à la sélection des outils de BI
inappropriées qui ne parvient pas à répondre aux besoins de l'entreprise spécifiés. Pour trouver une solution,
Ponniah (2001) [PCV06] recommande aux entreprises de concevoir l'architecture d'abord, ensuite de choisir
seulement les outils pour correspondre à des fonctions et des services prévus pour les éléments architecturaux.
L'architecture est le fondement de BI et mettre l‟attention sur l'architecture sera d'assurer le succès dans la mise
en œuvre de BI. Voilà pourquoi nous avons commencé par proposer l‟architecture de BI général du système.
Le modèle ci-dessous est un modèle qui associe à StatEduc2.0 les outils décisionnels appropriés pour
pouvoir implémenter les processus n'ont encore intégrés dans ce dernier. Nous proposons une solution qui est
moins difficile à mettre en œuvre à travers les outils permettant la construction de solutions décisionnelles à
savoir : Pentaho, SapoBI, SAS, Congnos… Nous nous proposons dans notre cas d'utiliser la suite Pentaho vu sa
consistance, sa fiabilité et sa facilité de manipulation par rapport à ses concurrents.
Pour se faire, nous présentons en premier lieu l'architecture de la solution envisagée, centrée sur l‟outil
Pentaho BI avec ses différents modules, accentuée sur le data warehouse, étendue par le module SIG (à travers
le serveur cartographique GeoServer et son client OpenLayers) et résultant sur l‟application BI_EDUCAM 1.0
avec une architecture SOA fournissant l‟accès à tous les services nécessaires au système. Puis en second lieu plus
précisément dans la partie de l‟analyse de la solution, nous allons parler plus en détails de l‟application
BI_EDUCAM 1.0 , des services fournis par pentaho BI, du serveur GeoServer et de son client OpenLayers, de
l‟ETL Talend, des cubes OLAP ; leur construction et leur visualisation sur Mondrian, et enfin, la construction des
rapports.
Plateforme StatEduc2
BD StatEduc2
BI_EDUCAM 1.0
Données Financiers
Données
démographiques
BI_EDUCAM 1.0 est le nom qu‟on donne à notre future plateforme d‟analyse et de diffusion des données du
système éducatif camerounais. Il sera une application Java web basée sur l‟architecture SOA permettant l‟accès
aux services fournis par les différentes applications. Pour qu‟elle respecte l‟architecture SOA, BI_EDUCAM sera
dotée d‟un ESB (Entreprise Service Bus) qui permet le couplage faible des services. L‟ESB propose une
méthode standard et fournit une couche partagée pour réaliser l‟interopérabilité, l‟interaction et l‟intégration des
services distribués. Ainsi, il (ESB) aura pour rôle, d‟une part d‟assurer l‟interconnexion et d‟autre part de gérer
la médiation des communications et des interactions entre services et applications. Les services (peut être un
composant, une application business, un processus business, etc.) sont basés sur Web services, chacun a sa
propre description décrite par WSDL, ils se connaissent par leurs description, puis se communiquent via le bus
en façon transparente. Le bus s‟occupe de la transmission de message entre des services par des différentes
façons, soit par message („call‟ou „one-way‟), soit par événement (pub./sub.). Nous pouvons dynamiquement et
librement changer, supprimer un service, ou ajouter un nouveau service. Quelques-uns des services métiers qui
seront implémentés par BI_EDUCAM sont :
- Services d‟accès à l‟interface d‟application de StatEduc2 pour la saisie et l‟apurement des données sur les
établissements ;
- Services d‟accès à l‟interface d‟OpenLayers pour la visualisation des données géographiques des
établissements ;
- Services d‟accès à l‟interface Jpivot permettant d‟effectuer des analyses OLAP dans l‟environnement
Pentaho ;
- Services d‟accès à l‟interface web Pentaho Analyser, pentaho Report Designer et pentaho reporting pour
l‟analyse et la création des rapports qui vont être générés.
données opérationnelle développé par Talend1. Il est distribué sous licence GPL (General Public License). Talend
Open Studio propose une interface permettant de concevoir graphiquement les connexions aux sources et les
traitements sur les données.
3.6.3 GeoServer
GeoServer est un serveur informatique open source écrit en Java qui permet aux utilisateurs de partager et
modifier des données géographiques. Conçu pour l'interopérabilité, il publie les données de toutes les sources
principales de données spatiales qui utilisent des normes ouvertes. GeoServer a évolué pour devenir une méthode
simple de connexion d'informations existantes à des globes virtuels tels que Google Earth2 et NASA World Wind3,
ainsi que pour les cartes à base de services web tels que OpenLayers, Google Maps4 et Bing Maps5. GeoServer
fonctionne en tant qu'implémentation de référence pour la mise en œuvre du standard du Web Feature Service de
l'Open Ge spatial Consortium ; il implémente aussi le Web Map Service [ALI12].
GeoServer fonctionne comme un nœud dans une infrastructure de données spatiales libre et ouverte. Tout
comme le serveur HTTP Apache offre une solution de serveur web libre pour publier du HTML, GeoServer vise
à faire de même pour les données géo spatiales [ALI12].
Grâce à des protocoles standards qu'il produit KML, GML, Shapefile, GeoRSS, PDF, GeoJSON, JPEG, GIF,
SVG, PNG etc. En outre, on peut modifier les données via le SMA profil transactionnelle (WFS-T). GeoServer
comprend un client intégré (OpenLayers) pour la prévisualisation des couches de données.
GeoServer supporte en outre la publication efficace des données géo spatiales de Google Earth grâce à
l'utilisation de liaisons réseau, utilisation des fichiers KML. Les fonctionnalités avancées de Google Earth de
sortie comprennent les modèles de mesure des pop-ups, des visualisations de temps et de la hauteur, et "super-
overlays".
GeoServer s'appuie sur GeoTools, une bibliothèque d'outils en Java pour manipuler le SIG (système
d'information géographique)[ALI12].
1www.talend.com/Open-Source-MDM
2Google earth permet de visualiser des images satellite, des cartes, des reliefs ou des bâtiments en 3D. Accessible sur www.earth.google.fr
3NASA World Wind est un logiciel d'exploration de planètes via photographiessatellites et aériennes développé par l'Ames Research Center de la NASA
4Google Maps est un service gratuit de cartographie en ligne. Il est accessible sur http://maps.google.com/
5Bing Maps (auparavant Live SearchMaps, Windows Live Maps et Windows Live Local) est un service web de cartographie faisant partie du moteur de recherche bing et
utilisant le service de bing Maps for Enterprise. Il est accessible sur http://www.bing.com/maps/
3.6.4 OpenLayers
Le client SIG OpenLayer est constitué d‟une bibliothèque de fonctions JavaScript assurant un noyau de
fonctionnalités orienté vers la mise en place d'applications clientes Web cartographiques fluides.
Il permet d'afficher des fonds cartographiques tuilés ainsi que des marqueurs provenant d'une grande variété
de sources de données. Une partie de cette bibliothèque permet aussi de gérer l'ergonomie proposée à l'utilisateur,
mais ce n'est pas directement son rôle [ALI12] .
Pour construire une visionneuse (client SIG), une structure HTML est requise pour les pages. OpenLayers
insère les données à l'intérieur de tout élément de type bloc ce qui signifie qu'il peut être utilisé pour mettre une
carte dans presque n'importe quel élément HTML. Le client ainsi obtenu est un client léger [ALI12].
3.6.5 Pentaho BI
Pentaho6 BI permettra d'implémenter les parties non encore fonctionnelles dans StatEduc2.0. On note en
l'occurrence la production de l'annuaire statistique, l'élaboration du rapport d'analyse, de la carte universitaire et
de la carte géo-référencée du secondaire et du primaire et enfin la conception du tableau de bord. Tous ces
modules seront possibles à l'aide de Pentaho BI. Mais avant d'arriver à cet outil, il faut d'abord concevoir un DW
qui contient les données apurées et vérifiées par StatEduc2, en plus de ces données, on utilisera aussi les données
démographiques, financières et satellitaires à fin d'implémenter aussi la partie de la carte scolaire géo-référencée
et de la carte universitaire. Pentaho BI est doté des outils tels que Mondrian, Pentaho Report Designer, et plus
encore permettant d'effectuer graphiquement les cubes OLAP, les graphiques, les rapports et les états sous
différents formats. Ces outils nous permettront d'automatiser la génération de tous les documents ci-dessus cités.
La suite illustre en quelques points les fonctionnalités de ces outils.
3.6.6 Mondrian
Mondrian est un moteur OLAP (Online Analytical Processing) écrit en Java par Julian Hyde qui permet la
conception, la publication et le requêtage de cubes multidimensionnels. Il permet l‟exécution de requêtes en
langage MDX sur des entrepôts de données s‟appuyant sur des SGBDR, d‟où sa caractérisation de « ROLAP »
(Relational OLAP). En matière de ROLAP, Mondrian est la référence open source.
Mondrian permet d‟accéder aux résultats dans un format multidimensionnel compréhensible par une API de
présentation côté client, le plus souvent en mode Web, avec par exemple JPivot, Pentaho Analyzer, Pentaho
AnalysisTool, GeoAnalysisTool(G.A.T.)
6 http://www.pentaho.com/
Mondrian s‟appuie sur une modélisation OLAP standard et peut donc se connecter à n‟importe quel
entrepôt de données conçu dans les règles de l‟art de la Business Intelligence. Il est intéressant de noter que
Mondrian est le composant OLAP utilisé par la plupart des suites de BI Open Source notamment Pentaho,
JasperServer et SpagoBI.
Pentaho est l‟éditeur qui héberge et soutient la communauté Mondrian, mais toute fois, un serveur
Mondrian peut être utilisé en tant que tel, sans être embarqué dans une plate-forme décisionnelle OSBI…
Les caractéristiques fonctionnelles de Mondrian sont les suivantes :
Stockage des données dans un SGBDR: les données sont entreposées dans des tables de faits et de
dimension, selon la modélisation habituelle en étoile et/ou flocons (Mondrian sait gérer les 2)
Mondrian permet (si nécessaire) l‟utilisation de tables d‟agrégation afin d‟optimiser au mieux les
performances. Ces tables doivent être chargées en même temps que l‟entrepôt de données, via les
mécanismes habituels d‟alimentation ETL. Il est également possible de s‟appuyer sur des « vues
matérialisées » si le SGBD les supporte. Le serveur Mondrian fournit également un mécanisme de mise
en cache qui permet d‟obtenir des délais de réponse minimums.
Utilisation des dimensions partagées (« shared dimension », ou « dimensions conformes ») pour la
mutualisation de celles-ci entre plusieurs cubes
Ajout de membres calculés (très utile pour effectuer des calculs de pourcentage par exemple, recalculés
dynamiquement selon le niveau d‟agrégation choisi)
Gestion des hiérarchies multiples, dimensions dégénérées et « inline tables »
Gestion de la sécurité d‟accès aux cubes via des rôles: sécurisation au niveau du cube, des dimensions,
des hiérarchies et des membres à afficher ou non
Internationalisation possible (multilinguisme) via l‟implémentation du standard i18n7
Mondrian s‟appuie sur des schémas XML pour la définition des cubes. Un schéma Mondrian permet donc de
définir le modèle logique ainsi que le mapping sur le modèle physique :
Le modèle logique décrit les cubes, les dimensions, les hiérarchies, les niveaux et les membres (et plus
encore…) sur lesquels vont s‟appuyer les requêtes MDX.
Le modèle physique correspond à la source de données sur laquelle s‟appuie le modèle logique (le
modèle en étoile et/ou flocon)
Les schémas Mondrian sont créés par les concepteurs et analystes avec l‟outil « Pentaho Schema
Workbench ».Schema Workbench ou encore « Jasper Workbench » est une application JAVA permettant de
définir les axes du cube ROLAP dans le fichier de description XML. Il se connecte via des drivers JDBC aux
bases relationnelles et permet de définir pour chaque cube, les dimensions et les mesures qui le composent.
7 On abrège souvent internationalization en i18n car, en anglais, comme en français, dix-huit lettres séparent la première lettre du mot (i) de la dernière (n)
JPivot
JPivot est l‟outil permettant d‟effectuer des analyses OLAP dans l‟environnement Pentaho. JPivot est une
librairie JSP permettant d‟accéder à un cube Mondrian.
Il permet de mettre à disposition au travers d‟une simple, interface WEB un set de données sur lequel
l‟utilisateur pourra naviguer, créer des graphiques, ajouter des formules et se créer ses propres rapports.
Les données que nous venons d‟aggréger peuvent être représentées à l'aide d'un graphique. Pour lequel on
peut choisir le type et éventuellement changer ses propriétés via ces deux boutons. Le graphique peut être sous
format de bar 3D verticaux ou horizontaux, Stacked bars ver ticaux ou horizontaux, Camember…
Reporting :
La dernière étape dans la chaîne décisionnelle est la création des rapports qui vont être générés via
l'outil Pentaho Report Designer qui se base sur le moteur de Reporting Java jFree Report.
Pentaho Report Designer permet :
Le support de sources de données multiples dans les mêmes rapports,
Le support de sous rapports,
Le support multi langues,
Une possibilité de contrôler le formatage au moment de l‟exécution du rapport,
Une large gamme de graphiques à disposition,
La production de différents types de format de sortie (pdf, html,xml,…),
Une fois le rapport mis en place on le publie sur la plateforme du serveur Pentaho.
En résumé ce chapitre illustre le travail effectué et la solution obtenue. Il commence par la description de
StatEduc2.0 et ses fonctionnalités, ensuite la modélisation des processus métiers du système éducatif et une étude
d'intégration de ces processus dans StatEduc2.0 et enfin par la proposition d'une solution pour l'intégration des
processus énumérés et l'analyse de cette solution. Le chapitre qui suit donne une conclusion général du travail
éffectué et de la solution obtenue et les perspectives pour les études ulterieures.
D‟après les études faites par l‟Institut Statistique de l‟UNESCO (ISU) sur les problèmes spécifiques liés
aux aspects informatique dont sont confrontés plusieurs pays africains, les déficiences suivantes sont à mettre en
exergue :
- Le manque de ressources matérielles et des ressources humaines qualifiées dotées des compétences
requises en informatique;
- La faiblesse des applications informatiques déployées dans les ministères dans le cadre de la production
et la diffusion des statistiques.
- Le manque d‟une architecture orientée services souple des applications du système éducatif.
Dans le but donc de faire passer le pays à un niveau supérieur de son système d‟information grâce à
l‟amélioration de la qualité des données, l‟application informatique actuelle de saisie et de traitement des
données statistiques (StatEduc2.0) doit être amélioré afin de répondre aux exigences suivantes :
- Possibilité d‟accéder à l‟application à partir des établissements, des arrondissements, des départements et
des régions afin de partager les données ;
- Possibilité de disposer d'un outil décisionnel efficace permettant de générer l‟annuaire statistique, le
tableau de bord et le rapport d‟analyse selon le modèle voulu (XML, PDF, Word, Excel);
- Possibilité de déploiement des différents tiers de l‟application dans des serveurs différentes
(Vision d‟architecture trois-tiers) ;
- Possibilité de visualiser et d‟accéder aux données d‟un établissement sur une carte géographique ;
- Disposer d'une architecture souple du système éducatif Camerounais, en utilisant des outils appropriés
aux besoins du système;
De manière générale, la solution proposée est une architecture de Business Intelligence basée sur les
SOA. Cette architecture permet de construire/améliorer le système de recueil et d'analyse de données du système
éducatif Camerounais.
De manière détaillé et en décrivant les étapes utilisées pour atteindre cette solution, nous avons
commencé par recenser, décrire et modéliser en BPMN (Business Process Management Notation) une liste
exhaustive des processus métiers pour l'intégration du BI dans le système de collecte et traitement de
l'information sur l'éducation au Cameroun. Ensuite, une étude sur l'intégration de ces processus dans StatEduc2.0
a été faite afin de voir si cette intégration est possible sans trop de difficultés (processus après processus) compte
tenue d'une certaine rigueur imposé par le logiciel. Cette partie nous a permis de dégager des conclusions sur
l'adéquation de StatEduc2.0 avec les processus analysés. Enfin, sur la base de cette analyse, une proposition
(BI_EDUCAM 1.0) de solution pour l'amélioration du StatEduc2.0 a été faite. Cette proposition consiste en une
architecture basée sur les SOA pour l'implémentation du système. Plusieurs scénarios ont été analysés et
comparés et des éléments de la solution ont été décrit pour apporter plus de précision sur le modèle proposé.
L‟analyse de la proposition faite a consisté à décrire les constituants et le fonctionnement de la
plateforme BI_EDUCAM 1.0. Dans cette partie les rôles et l‟utilisation des outils suivants ont été donnée :
Talend Open Studio (Outil ETL) ;
GeoServer (Serveur géographique);
OpenLayers (Client SIG de GeoServer);
Pentaho BI (Outil décisionnel);
Mondrian (moteur OLAP);
Jpivot (Analyse OLAP);
Reporting (outil creation rapport).
L‟application BI_EDUCAM 1.0 n‟est pas encore mise en œuvre. Les services, les outils et les classes de
cette application sont modélisés. Il reste actuellement l‟implémentation de la solution en respectant l‟architecture
proposée c'est-à-dire basée sur SOA et utilisant éventuellement un Entreprise Services Bus (ESB). Nous
utiliserons la méthode Praxeme pour la conception des services et l‟implémentation à travers les Web Services.
Nous comptons dans l‟avenir rendre cette application internationale et paramétrable comme un Framework
composé des fonctionnalités réutilisables et paramétrables selon les besoins de chaque pays.
Un point qui nous semble important consiste à reconfigurer l‟architecture de l‟application StatEduc2.0
afin qu‟elle corresponde au modèle SOA; car notre solution améliore l‟application StatEduc2.0 en l‟associant à
des outils décisionnels externes pour construire une autre application basée sur le modèle souhaité et répondant
aux besoins du système éducatif camerounais.
Bibliographie
[ABS12]: ABOUBAKAR SIDDIKI, Rapport de stage professionnel à l’UNESCO, Juin 2012
[ALF13]: Alain Fernandez, "Business Intelligence, comprendre et conduire le projet", http://www.piloter.org/business-
intell+999999igence/index.htm, janvier 2013
[BAC02] : Bieber and Carpenter, « Architecture Orientée Services (SOA), de Didiez Donsez», Université Joseph
Fourier, Année 2002.
[CDA08]:Cyrille Devaux, , Livre Blanc : "URBANISATION & ARCHITECTURE ORIENTÉE SERVICE (SOA), Quelques
bonnes pratiques pour leur mise en œuvre", Aubay Management, Année 2008
[DSM08] : Didier MOUNIEN & Samantha MOINEAUX, Projet 15:"Outils informatiques et l'aide à la prise de décision en
Entreprise", Année académique 2007-2008
[GHE10] : GHELLAB Abdelkrim « Mémoire Magister sur la conception d’une base de données décisionnelle »,
Université*Mohamed Boudiaf* De M‟sila sous la présidence de Mr. BOUDERAH BRAHIM, Année Académique 2009-
2010.
[GSC10]:Groupe SCOrWare, "SOA (Service-Oriented Architecture) Concepts et points de vue, infrastructure service-
composants et outillage de développement Eclipse", - 2010
[GTN10]: Gurupratap Singh Dsor, Tata Consultancy Services Limited, Noida, India: A Business Intelligence Solution to
Improve Educational Standards and Performance for an Australian State Education Authority, Paper 129-2010
[LYW11]: Lee-Kwun Chan, Yee-WaiSim and William Yeoh, “A SOA-Driven Business Intelligence Architecture”,
1Faculty of Information and Communication Technology, University Tunku Abdul Rahman, Perak, Malaysia, School of
Information Systems, Deakin University, Victoria, Australia
[LWTM98]: Ricky, W.H. Yeung, Derek, T.W. Ngan, and Martin, C.Y. Cheung, “Application of Business Intelligence
Tools In Education Institutes: A Case Study Of Meem Laboratory“, Department of Manufacturing Engineering and
Engineering Management. City University of Hong Kong
[MBA10]: Mickaël BARON, "SOA – Services Web Introduction SOA " – 2010 (Rev. Janvier 2011).
[MGU08]: Muriel Guénon analyst CXP, Forum du CXP du 21 octoble 2008 « BPM : le défi de l’agilité ».
[OCM12]:Ocello Audrey : Mise en œuvre d’une SOA & meilleures pratiques de modélisation, Module Architecture SOA
– SI5/Master IFI, Publication 2011-2012
[OCA12]:Ocello Audrey : Méthodologies SOA, Module Architecture SOA – SI5/Master IFI, Publication 2011-2012
[OMG09]: OMG (Object Management Group): « Business Process Modeling Notation » du 03 Janvier2009
[PCV06]: P. Čechand V. Bureš:”Utilisation of Business Intelligence in an Education Environment “, University Of Hradec
Kralove, Faculty of informatics and management, Rokitanskeho 62, 500
03 Hradec Kralove, Czech Republic. Current Developments in Technology-Assisted Education (2006)
[PLW11]: Philip Wik, Lead Information Architect at Choice Hotels International, “Service-Oriented Architecture and
Business Intelligence”, SERVICE TECHNOLOGY MAGAZINE • Issue LIII • August 2011
[VAN01] : Jean Vanderdonckt et Stéphane Faulkner : Présentation des données dans les systèmes d‟information
opérationnels et décisionnels : « Environnement évolué et évolution de l’IHM », Année 2001
[XBI07]:Xebia Business Integration Architects, Livre Blanc : "Comprendre et savoir utiliser un ESB dans une SOA",
Copyright © Xebia 2007
[XGO09]: Xavier Godefroy, CNAM cours NFE107 : "Urbanisation et architecture des SI", Rapport sur le BPM, Mai 2009
[KMN09] : Kholladi Mohamed Naoufel, Mémoire de Magister en Informatique sur le thème « Une Approche de
transformation de la notation BPMN vers BPEL basée sur la transformation de graphe », Dans le cadre de l‟école doctorale
de l‟est, Algérie, Université Mentouri Constantine, N°358/MAG/2009, Série : 015/INF/2009
[ALI12] : ALIOUM, Rapport de Stage licence professionnel de l’IUT de Ngaoundéré, année 2012