Vous êtes sur la page 1sur 4

Sujet de stage 1 (sujet industriel) Entrept de Donnes pour la GRH : Modlisation et Analyse OLAP

Enseignant Responsable : Hajlaoui Jalel Eddine hajlaouijalel.ig@gmail.com Contexte : Lintrt croissant des entreprises pour le management de la performance se rencontre aujourdhui lopportunit technologique de mettre en place une architecture informatique, communment appel informatique dcisionnelle , appuye en rgle gnrale sur un Entrept de Donnes (ED) et/ou des Magasins de Donnes (MD). Larchitecture dun Systme dInformation Dcisionnel (SID) repose sur un modle trois couches o lED est plac dans la premire couche, les MD dans la seconde, et les outils danalyse OLAP ( On-Line Analytical Processing ) et de visualisation/reporting des rsultats dans la troisime couche. Les ED ou bases de donnes multidimensionnelles se sont naturellement imposes dans le monde industriel car elles pallient les limites des bases de donnes (BD) relationnelles. En effet, dans un contexte danalyse dcisionnelle, lutilisateur a besoin dinformations agrges, rsumes et observables sur plusieurs niveaux de prcision. La modlisation conceptuelle des ED/MD seffectue selon un modle conceptuel dit multidimensionnel (Schma en toile, Schma en constellation ou schma en flocons). Aprs la construction des cubes de donnes (i.e., les structures logiques des ED/MD), il est ncessaire de dfinir les procdures ETL (ExtractTransform-Load) qui assurent leurs chargements partir de la BD source. La production des rapports analytiques et des tableaux de bords est une opration importante pour la visualisation graphique des donnes stockes dans lED/MD. Ceci permet au dcideur d dfinir une politique de prise de dcision efficace pour la gestion des indicateurs de performance des activits de son entreprise. Le sujet propos consiste raliser un Entrept de Donnes pour la Gestion de Ressources Humaines (GRH). En effet, il sagit de concevoir et dimplmenter une base de donnes multidimensionnelle pour grer le personnel, les absences, les demandes des congs, les contrats de travail, les pointages des employes, les demande de congs). Activits essentielles : - Animer la base de donnes source et essayer le logiciel de GRH dj dvelopp avec le langage VB.NET sous lenvironnement Visaul Studio 2010 enrichi par loutil DevExpress sous une BD Sql Server 2008 ; - Concevoir la structure dun entrept de donnes ; - Contrler et assurer la cohrence du systme dinformations existant et le respect des standards utiliss ; - Exploiter les informations de la base de donnes source et de lentrept de donnes grce aux techniques de calcul statistiques;

- Rendre exploitables les donnes extraites destination des utilisateurs/dcideurs. Comptences utiles : - Systme Bases de donnes : Sql Server ; - Langage BDD : SQL, PL/SQL ; - Analyse OLAP : Sql Server Analysis Services - Outils de reporting : Sql Server Reporting Services Entreprise daccueil : SBS_Consulting ; une socit de service, de conseil et dassistance dans le domaine de la qualit Profil recherch : Etudiants-Ingnieurs en Gnie logiciel. Liens Utiles : http://www.sbs-tunisie.com (Site de lentreprise daccueil)

http://www.youtube.com/watch?v=yflAQ8DffrY (dmo du logiciel Qualitop


dvelopp par la socit daccueil. Ce logiciel comprend entre autre le module de GRH sur lequel se base le travail dcrit prcdemment

http://fr.scribd.com/doc/115433804 (Description du logiciel de GRH existant


qui fonctionne sous une base de donnes Sql Server)

Sujet de stage 2 (sujet de recherche) Entrept de Donnes Actif : Automatisation des scnarios danalyse complexes
Enseignant Responsable : Hajlaoui Jalel Eddine hajlaouijalel.ig@gmail.com Contexte : Les systmes dcisionnels (SD) visent transformer les donnes mtiers en informations pouvant tre interprtes par les dcideurs. Ils sont souvent constitus par des espaces de stockage ddis appels entrepts de donnes (ED). Un ED est une base de donnes centralise vocation analytique qui permet d'exprimer des contextes d'analyse sous la forme de cubes de donnes. La technologie entreptOLAP ( On-Line Analytical Processing ) est apparue donc comme une solution pour les entreprises dsirant une meilleure performance danalyse de leurs donnes et leur SD. LOLAP dispose doprateurs pour rsumer les donnes sous forme dagrgats (ou au contraire pour dtailler les lments agrgs) et doprateurs pour visualiser les informations contenues dans le cube. Ces oprateurs sont classiquement dcomposs en oprateurs de structuration (Rotate, Switch, Push, Pull) et de navigation (Slice, Roll-up, Drill-down, Aggregate). Afin d'acclrer la prise de dcision et fin de doter l'entrept d'un aspect actif, une solution possible pour ce problme consiste s'inspirer des techniques utilises dans les bases de donnes actives. La technologie des Entrepts de Donnes Actifs (EDAs) rpond de manire ractive la croissance constante des volumes de

donnes et aux besoins des utilisateurs. Un EDA est considr comme un systme permettant dintgrer dans une mme base cible des donnes et des traitements. Dun point de vue technique, les EDAs sinspirent des techniques utilises dans les bases de donnes actives savoir : les rgles "vnement- Condition-Action" (ECA). Grce ce mcanisme, il est possible alors de penser stocker des donnes et des traitements dans un entrept linstar de lapproche objet. Ce mcanisme dECA permet de construire des rgles danalyse, exprimes sous la forme de scripts, qui dnissent des tches danalyse par exemple ou dautomatiser toute autre tche du processus dentreposage. Les rgles actives ECA, gnralisent la notion de dclencheur, elles utilisent gnralement le formalisme Evnement-Condition-Action. La smantique la plus gnrale d'une rgle ECA est la suivante : lorsque survient un vnement E, si la condition C est satisfaite alors excuter l'action A. Les rgles ECA sont parfois affilies aux rgles de production des systmes dductifs, gnralement de la forme Evnement-Action. Motivation : Une des fonctionnalits de base dun EDA est de dtecter des vnements. Cest seulement aprs qu'un vnement d'intrt soit produit et soit dtect que les rgles soient dclenches et les actions appropries sont excutes. Ainsi, plus un EDA dtecte plusieurs types d'vnements, plus quil est capable de rpondre une plus grande varit de situations relles et y ragit en consquence. De ce fait, le besoin de disposer dun EDA plus puissant et expressif, tellement accentu par la capacit de dtection dune taxonomie de diffrentes catgories d'vnements, est souvent traduit en un besoin de supporter plus d'vnements complexes. Un vnement complexe est un vnement composite ou driv partir dun vnement atomique ou dautres vnements complexes selon des oprateurs dfinis par un algbre dvnement. Les vnements constitutifs dun vnement complexe sont nomms des composants alors que lvnement rsultat est dit un vnement parent. Le premier vnement qui contribue la dtection dun vnement complexe est un vnement initiateur. Le dernier vnement est un vnement de terminaison alors que les vnements composants sappellent des vnements intrieurs. Typiquement, un vnement peut dclencher plus quune rgle et avoir lieu dans diverses compositions. Cependant, notons que dans la littrature, la majorit des approches existantes se limitent des dfinitions fragmentaires en mettant l'accent sur quelques types d'vnements primitifs touchant des contextes particuliers dans le cycle de vie d'un EDA. Ce sujet vise proposer une architecture efficace de dtection dvnements complexes dans un EDA permettant doffrir une smantique non ambige des expressions dvnements formes par divers oprateurs dans diffrents contextes. Problmatique de recherche : Un EDA se base sur la transformation du mcanisme ECA en un mcanisme dECG (Evnements-Conditions-Graphes danalyses). Une problmatique se pose

lorsquun vnement composite se produit sur un intervalle, mais il est dtect au point lorsque le dernier vnement constitutif de l'vnement composite est dtect. La smantique de dtection et d'occurrence est nettement distingue. La dtection est dfinie en termes doccurrence alors que loccurrence d'vnement ne peut pas tre dfinie en termes de son dtection. Ceci a engendr des ambigits avec les approches prcoces qui traitent cette problmatique dans le contexte des bases de donnes actives. Il est aussi ncessaire de dfinir un mcanisme adquat pour la modlisation et la dtection des vnements composites permettant la reprsentation des expressions dvnements. Les rseaux de ptri et les graphes dvnements peuvent servir pour dfinir un cadre formel des vnements complexe. Travaux raliser 1) Etude de l'tat des entrepts de donnes actif afin de dgager leurs spcificits aux niveaux architecture, conception, implantation et manipulation. 2) Etude de lart des techniques de modlisation et de dtection des vnements complexes et des vnements composites. 3) Proposition d'une approche de modlisation des vnements complexes et des vnements composites et leur intgration dans un entrept de donnes actif. 4) Proposition des techniques OLAP permettant une analyse multidimensionnelle ractive au sein dun entrept de donnes actif. 5) Dveloppement d'un prototype logiciel afin de montrer la faisabilit des propositions et pour raliser des d'exprimentations/illustrations. Outils utiliser : - Systme Bases de donnes : Sql Server ; - Langage BDD : SQL, PL/SQL ; - Analyse OLAP : Sql Server Analysis Services - Langages de requtes OLAP : MDX (Multi Dimensional eXpression) - Langages de Programmation : JAVA et XML Lieu de stage : ISSAT sousse Profil recherch : Etudiants-Ingnieurs en Gnie logiciel.