Vous êtes sur la page 1sur 26

Université Moulay Ismail Année universitaire : 2022/2023

Faculté des Sciences et Techniques Prof Y.FARHAOUI


Errachidia

Système d’Information Décisionnel


Informatique décisionnelle
Définition

Selon Wikipédia, "L’informatique décisionnelle (en anglais : BI


pour Business Intelligence) est l’informatique à l’usage des
décideurs et des dirigeants des entreprises. Elle désigne les
moyens, les outils et les méthodes qui permettent de collecter,
modéliser et restituer les données, matérielles ou immatérielles,
d’une entreprise en vue d’offrir une aide à la décision et de
permettre à un décideur d’avoir une vue d’ensemble de l’activité
traitée."
Systèmes d’information
Le système d'information d'une organisation (Université, institution, club, groupe structuré
...) regroupe tout ce qui à quelque niveau que se soit traite ou stocke des informations
relatives à l'organisation concernée.

Exemple:
Le système d'information comprend des informations relatives: aux flux : liste des étudiants,
les notes, les éléments pédagogiques...
à l'univers extérieur: stage, relation extérieure...
à l'organisation de l'université;
aux contraintes légales: lois, règlements, paramètres financiers... etc.

Les inconvénients d’un système d'information pour un utilisateur final:

 Schéma très/trop complet:


Contient des tables inutiles pour l’analyse

 Pas d’interface graphique capable de rendre utilisable


le modèle E/A (Entité/Association).

 Inadapté pour l’analyse


Systèmes d’information décisionnel

Un (SID) est un système qui permet aux décideurs d’une institution de disposer
d’informations pertinentes et d’outils d’analyse puissants pour les aider à prendre les
bonnes décisions au bon moment. Le suivi d’une politique d’établissement peut se faire
par le partage de tableaux de bord et autres indicateurs.

Système d'Information Décisionnel. Désigne les moyens, les outils et les méthodes qui
permettent de collecter, consolider, modéliser et restituer les données d'une université en
vue d'offrir une aide à la décision.
Différences entre données du système de production et données décisionnelles

Données opérationnelles Données décisionnelles


Orientées application, détaillées, précises au moment de Orientée activité (thème, sujet), condensées, représentes
l’accès des données historiques

Mise à jour interactive possible de la part des utilisateurs Pas de mise à jour interactive de la part des utilisateurs

Accédées de façon unitaires par une personne à la fois Utilisées par l’ensemble des analystes, gérées par sous-
ensemble

Cohérence atomique Cohérence globale


Haute disponibilité en continu Exigence différente, haute disponibilité ponctuelle
Uniques (pas de redondance en théorie) Peuvent être redondantes
Structure statique, contenu variable Structure flexible
Petite quantité de données utilisées par un traitement Grande quantité de données utilisée par les traitements

Réalisation des opérations au jour le jour Cycle de vie différent


Utilisées de façon répétitive Utilisée de façon aléatoire
Architecture d'un système décisionnel
Architecture d'un système décisionnel
Alimentation des données

ETL (Extract, Transform, Load) qui permet de concevoir et exécuter des opérations de
manipulation et de transformation de données.
Un processus ETL se décompose en cinq phases :

1. Définition des métadonnées source : description des bases de données opérationnelles.


2. Définition des métadonnées cible : description des futures bases du Data Warehouse.
3. Validation de la qualité des données
4. Création du processus qui permet de charger la cible en utilisant les données sources.
5. Ordonnancement
Architecture d'un système décisionnel

Data Warehouse ou l'entrepôt de données

Le Data Warehouse est une collection de données orientées sujet, intégrées, non volatiles
et historisées, organisées pour le support d'un processus d'aide à la décision.

Différences entre le système de production et le data warehouse :

Critère Système de production Data Warehouse

Niveau de détail des informations Très détaillé Synthétique, parfois détaillé


utilisateurs

Utilisateurs Une ou quelques fonctions de l’entreprise Plusieurs fonctions de l’entreprise

Données figées Non – évolution en temps réel Oui – archivage


Historique Non Oui
Opérations sur les données Ajout/mise à jour/ consultation Consultation uniquement
Architecture d'un système décisionnel

Data warehouse - points de vue pour les utilisateurs


Architecture d'un système décisionnel

Data Mart

Un datamart est un magasin de données. Comme le datawarehouse c'est un entrepôt de


données, mais spécialisé pour un métier ou un sujet donné.

Le Data Mart est une base de données moins coûteuse que le Data Warehouse, et plus
légère puisque destinée à quelques utilisateurs d’un département. Il séduit plus que le
Data Warehouse les candidats au décisionnel.

Data Warehouse Data Mart


Cible utilisateur Toute l’entreprise Département
Implication du service Elevée Faible ou moyen
informatique
Base de données d’entreprise SQL type serveur SQL milieu de gamme, bases
multidimensionnelles
Modèles de données A l’échelle de l’entreprise Département
Champ applicatif Multi sujets, neutre Quelques sujets, spécifique
Sources de données Multiples Quelques unes
Stockage Base de données Plusieurs bases distribuées
Taille Centaine de GO et plus Une à 2 dizaines de GO
Temps de mise en place 9 à 18 mois pour les 3 étapes 6 à 12 mois (installation en plusieurs
étapes)
Architecture d'un système décisionnel

Base de Données multidimensionnelles (OLAP)

Les outils OLAP (On Line Analytical Process) reposent sur une base de données
multidimensionnelle, destinée à exploiter rapidement les dimensions d'une population de
données.

Online Analytical Processing (OLAP), désigne les bases de données multidimensionnelles


(aussi appelées cubes ou hypercubes) destinées à l'analyse. On parle ici de bases de
données multidimensionnelles car pour pouvoir analyser des données représentant
l'activité d'une université, il faut pouvoir les modéliser suivant des axes. Ainsi, pour
prendre un exemple, la régions par filières les donné se décline en trois axes au
minimum.
Architecture d'un système décisionnel

Hyper cube et OLAP

Online Analytical Processing (OLAP), désigne les bases de données multidimensionnelles


(aussi appelées cubes ou hypercubes) destinées à l'analyse. On parle ici de bases de
données multidimensionnelles car pour pouvoir analyser des données représentant
l'activité d'une entreprise, il faut pouvoir les modéliser suivant des axes. Ainsi, pour
prendre l'exemple le plus courant, la note par l'étudiant donné se décline en trois axes au
minimum : étudiant, module, et année.

2017
2016
2015
Architecture d'un système décisionnel

Hyper cube et OLAP


Filière Region

MIPC
Medalt
BCG

MIP Errachidia

Ouarzazate

Effectif réussi en
2015/16
MIP en
2013/14 Errachidia pour
2014/15 2015/16
Année
Architecture d'un système décisionnel
Reporting

Un éditeur de rapports traditionnel permet à un utilisateur de produire uniquement un


document statique, tandis que les applications de reporting qui supportent la technologie
OLAP produisent des rapports interactifs.

Data Mining

DATA MINING comme une démarche ayant pour objet de découvrir des relations et des
faits, à la fois nouveaux et significatifs, sur de grands ensembles de données.

Data Mining l'ensemble des techniques qui permettent de transformer les données en
connaissances.
L’outil Data Mining permet de rechercher les causes des résultats donnés par l ’analyse
multidimensionnelle, de vérifier des hypothèses, et de découvrir des corrélations entre les
données.
Modélisation
Annee_Uni Resultat_ELP

Cod_Anu Cod_ELP
Cod_Sem Not_ELP
Lib_Anu

Résultat_
Semestre Cod_ELP Académie
Cod_anu
Cod_Sem Cod_Acd
Cod_Ind
Sems Lib_Acd
Cod_Acd
Cod_Dip Lic_Acd
Effectif_réussi
Individu

Cod_Ind
Cod_ind_bac
Diplôme

Cod_Dip
Lib_Dip
Lic_Dip
Ind_Bac BAC
Cod_Ind_bac Cod_Bac
Cod_Bac Lib_Bac
Cod_Dep Daa_deb_vld_ba
Cod_Etb c
Modélisation
Nous pouvons maintenant dire que la mesure effective réussie est dimensionnée par Année,
filière, région, type du bac.
Filière Région
Compta
Medalt
Droit

Econ Errachidia

Ouarzazate

Filière
Annéeee Effectif réussi
Compta en Econ en
2015/2016
2013/14 2015/16 Errachidia
Droit
pour 2015/16
2014/15
Econ 2014/2015 Année

2013/14

Effectif réussi
en Econ en
bac Eco pour
Bac SE Bac Eco 2014/2015
Bac M
Bac
Modélisation

Le Cube
Analyse
L'effectif réussi en étude hispanique par type du BAC en 2003, 2004 et 2005

Type du BAC Année Effectif Réussi

Lettres 2003 1

Lettres Modernes 2003 126

Sciences Expérimentales 2003 2

Bac Technique 2004 3

Lettres 2004 63

Lettres Modernes 2004 35

Bac Technique 2005 1

Lettres 2005 91

Lettres Modernes 2005 36


Analyse
les moyennes générales des étudiants réussis par type du BAC

Moyenne
Type du BAC Année
générale
Lettres 2003 10.7
Lettres Modernes 2003 11.25
Sciences Expérimentales 2003 10.61
Moyenne
Bac Technique 2004 10.52 générale
Lettres 2004 11.61
Lettres Modernes 2004 11.47
Bac Technique 2005 11.7
Lettres 2005 10.98
Lettres Modernes 2005 11.33

Type du BAC
Outils de Business Intelligence

Suite Microsoft BI, Microsoft Power BI, Pentaho Data Integration, Qlik Sense & Qlik View,
Jasper Reports, Mondrian, Tableau software, jasperserver-pro

Les progiciels (ex : SAS, SPSS Clementinel, Pentaho, SpogoIB, JasperSoft, Xreporter
…) dans ce domaine ont aussi réalisé une percée importante et ajoutent des analyses.
Outils de Business Intelligence

Quelques solutions disponibles Open source

Pentaho est une solution d’informatique décisionnelle open source entièrement


développée en Java. Elle porte sur toute la chaîne décisionnelle et utilise différents outils
et composants :

Pour la collecte et l’intégration : les outils d’ETL Kettle ou Mondarian,


Pour la diffusion : un serveur d’application JBoss ou TOMCAT,
Pour la présentation : JFreeReport, BIRT ou encore JasperReport
Pour le Data Mining : weka
Outils de Business Intelligence

Spago BI
Spago BI permet la génération d’états, simples ou paramétrés en utilisant les générateurs Jasper
Reports et BIRT.
Il permet également l'analyse de données avec Jpivot/Mondrian.
SpagoBI intègre un composant d’aide à la création de requêtes SQL (Query By Example) qui
permet à l’utilisateur de sélectionner graphiquement les données à extraire de l’entrepôt de
données puis d’effectuer des tris, groupements, sélections et d’exporter le résultat.
L’interface graphique utilise un ensemble de portlets pour afficher graphiques, états et
indicateurs à l’intérieur du portail. Certains indicateurs et graphiques sont capables d’actualiser
leur données sans intervention de l’utilisateur.
Les données sont stockées dans un référentiel utilisant la norme JCR (Java Content Repository)
ce qui le rend librement interchangeable.
Outils de Business Intelligence
Outils de Business Intelligence

Logiciel Open source (Pentaho) :


Outils de Business Intelligence

Logiciel commercial (SAS)

Système SAS est sans doute le logiciel de traitement de données le plus complet et, sinon le
plus répandu, du moins celui qui traite quotidiennement le plus gros volume de données.

Architecture technique de la plateforme décisionnelle SAS

Vous aimerez peut-être aussi