Vous êtes sur la page 1sur 68

INF3186

2021-2022
Université de
Yaoundé I

INF3186: Business Intelligence


Concepts fondamentaux et
généralités
Avril 2022

Valéry MONTHE
valery.monthe@facsciences-uy1.cm
Bureau R114, Bloc pédagogique 1
Plan
1. Concepts de base de l’informatique décisionnelle
2. Des bases de données aux entrepôts de données
3. Introduction et définition d’un ED
4. Architecture fonctionnelle d’un entrepôt de données
5. Modélisation multidimensionnelle

INF3186 || 2021-2022 Notions de bases sur le BI 05/04/2022 2


L’informatique décisionnelle (ID)

INF3186 || 2021-2022 Notions de bases sur le BI 05/04/2022 3


Le Constat
• De plus en plus de données stockées dans l’entreprise
• Donnée comptables et financières
• Données clients (logiciels CRM)
• Données de production
• Donnés RH
• A différents niveaux
• Locales à une agence / une direction régionale
• Nationales(siège)
• Internationales(Filiales)
• L’information n’est pas consolidée/pas nettoyée
Plusieurs adresses clients : une seule est la bonne(la dernière?)
• Des outils d’analyses personnels : Excel
Tout le monde mesure, pas sur les mêmes bases
=> Les directions ne peuvent pas prendre de bonnes
décisions
INF3186 || 2021-2022 Notions de bases sur le BI 4
La prise de décision
• Le processus de décision humain
• J’ai chaud
• S’il fait chaud dehors => c’est normal, je vais me mettre au frais
• S’il ne fait pas chaud => j’ai de la fièvre => je vais chez le
médecin

• Une information isolée a peu de valeur. Elle n’a de sens que


comparée à d’autres informations
• On compare un chiffre à un objectif (référentiel)
• On suit l’évolution d’un indicateur dans le temps
• On fédère des données provenant de plusieurs systèmes pour
obtenir une information à valeur ajoutée
• CA/nb de colis expédiés

INF3186 || 2021-2022 Notions de bases sur le BI 5


La prise de décision
Pour prendre la bonne décision, il faut savoir.

Que faire pour rattraper la baisse du chiffre d’affaire?


• Comment a-t-il baissé?
• Dans quelle gamme de produit ?
• Dans quels pays, quelles régions?
• Dans le portefeuille de clientèle de quels commerciaux?
• N’avait-on pas une baisse semblable en Septembre
chaque année?

INF3186 || 2021-2022 Notions de bases sur le BI 6


Processus de prise de décision(1)

Sources : Lydie Soler, AgroTechParis


INF3186 || 2021-2022 Notions de bases sur le BI 7
Processus de prise de décision(2)

Sources : Lydie Soler, AgroTechParis


INF3186 || 2021-2022 Notions de bases sur le BI 8
Métriques d’aide à la décision(1)

Connaissances

Informations

Données

INF3186 || 2021-2022 Notions de bases sur le BI 9


Métriques d’aide à la décision(2)
Concepts clefs : Donnée
• Résultat direct d’une mesure
• Peut être collectée par un outil de mesure, ou être présente
dans une base de données
• Ne permet pas de prendre de décision sur une action à lancer
Exemple
• Le mois dernier, on a enregistré 127 incidents au centre de
services
• 10 nouveaux prestataires ont été employés à la direction
informatique
• 20 nouveaux cas de covid-19 ont été détectés en Mars

INF3186 || 2021-2022 Notions de bases sur le BI 10


Métriques d’aide à la décision(3)
Concepts clefs : Information
• Données à laquelle un sens et une interprétation ont été
données
• Permet au responsable de prendre une décision sur une action
Exemple
• Le mois dernier, on a enregistré 240% du nombre d’incidents
par rapport au moins précédent
• L’emploi des 10 prestataires est lié à une augmentation de la
charge de travail
• Il y a une augmentation de 10% des cas de contaminations

INF3186 || 2021-2022 Notions de bases sur le BI 11


Métriques d’aide à la décision(4)
Concepts clefs : Connaissance
• Résultat d’une réflexion sur les informations analysées
• Se base sur les expériences, les idées, valeurs, avis des
personnes consultées.
Exemple
• Le gestionnaire de changement peut établir une corrélation
entre l’arrivée des nouveaux prestataires et l’augmentation
du nombre d’incidents en ayant connaissance de certains
éléments.
• On peut établir un lien entre le taux de contamination et les
évènements des 2 derniers mois.

INF3186 || 2021-2022 Notions de bases sur le BI 12


Métriques d’aide à la décision(5)
Concepts clefs : Sagesse
• Etat d’esprit général de discernement final sur le contenu et de
jugement de bon sens
• Permet de lancer des actions d’adaptation de l’organisation, des
personnes, des processus et outils
Exemple
• Le responsable sénior de l’organisation prend des décisions à
long terme et des décisions stratégiques pour l’organisation
informatique.

INF3186 || 2021-2022 Notions de bases sur le BI 13


Quelques illustrations
Un Reporting imprécis

INF3186 || 2021-2022 Notions de bases sur le BI 14


Quelques illustrations
En fait, l’important est dans la variation

INF3186 || 2021-2022 Notions de bases sur le BI 15


Quelques illustrations
Mais une information peut en cacher une autre …

INF3186 || 2021-2022 Notions de bases sur le BI 16


Données, informations, connaissances(1)

Sources : F. Ravat, UT1


INF3186 || 2021-2022 Notions de bases sur le BI 17
Données, informations, connaissances(2)

Sources : F. Ravat, UT1


INF3186 || 2021-2022 Notions de bases sur le BI 18
Business Intelligence : Définition
• Terme générique qui englobe les applications, l’infrastructure,
les outils et les meilleurs pratiques permettant l’accès et
l’analyse de l’information afin d’améliorer et d’optimiser les
décisions et les performances. (source : Gartner)
• Un ensemble de solutions informatiques permettant
l’analyse des données de l’entreprise, afin d’en dégager les
informations qualitatives nouvelles qui vont fonder des
décisions, qu’elles soient tactiques ou stratégiques. (source :
smile)
• Moyens, outils et méthodes qui permettent à un décideur :
▪ d’avoir une vue d’ensemble de l’activité traitée
▪ de trouver l'information pertinente et complète pour
prendre rapidement la meilleure décision

INF3186 || 2021-2022 Notions de bases sur le BI 19


Business Intelligence (1)

Sources : F. Ravat, UT1; decizia.com


INF3186 || 2021-2022 Notions de bases sur le BI 20
Business Intelligence (2)

Sources : F. Ravat, UT1; decizia.com


INF3186 || 2021-2022 Notions de bases sur le BI 21
Système d’aide à la Décision
BI Traditionnelle

INF3186 || 2021-2022 Notions de bases sur le BI 05/04/2022 22


SAD/DSS : Définition
Applications informatiques permettant
de transformer les données
opérationnelles en indicateurs pertinents
dont la restitution guidera la prise de
décision

INF3186 || 2021-2022 Notions de bases sur le BI 23


Pourquoi construire un SD?
1. Servir une information considérée comme stratégique

• Un des actifs les plus importants des sociétés : leur


capital d’informations collectées au jour le jour
• Information généralement inaccessibles ou réparties
• Le SID résulte d’un processus consistant à extraire les
données (systèmes opérationnels et autres sources
externes à l’entreprise), les transformer en information
de pilotage et les rendre accessible aux utilisateurs
• La base décisionnel est aujourd’hui reconnue comme
un actif stratégique par beaucoup d’entreprises

INF3186 || 2021-2022 Notions de bases sur le BI 24


Pourquoi construire un SD?
2. Quelques constats
• Information existante souvent très riche, mais difficile
d’avoir une vision globale homogène et cohérente des
information manipulées par tous les départements.
• Pas facile d’accéder directement à l’information
nécessaire : plusieurs sources utilisant des support
différents (papier, BD, fichier Excel).
• Les données de gestion peuvent avoir des
significations différentes selon l’utilisation qui en est
faites. Exemple : la marge, le CA; mais le reporting de
direction générale n’accepte qu’un seul sens à une
valeur manipulée.
INF3186 || 2021-2022 Notions de bases sur le BI 25
Pourquoi construire un SD?
3. Les besoins justifiant un système décisionnel.
1. Meilleur accès aux données
2. Amélioration de la qualité des informations
3. Intégration des données provenant de systèmes différents
4. Définition commune des informations
5. Meilleur accès aux données historiques

INF3186 || 2021-2022 Notions de bases sur le BI 26


Pourquoi construire un SD?
4. Les principaux défis d’un système décisionnel.
1. Compréhension des besoins utilisateurs
2. Intégrité des données
3. Coût des alimentations en données
4. Définition du périmètre du projet
5. Performances du système
6. Règles de gestion commune

INF3186 || 2021-2022 Notions de bases sur le BI 27


La chaîne décisionnelle
5 grandes étapes :
• Planification
• ETL
• Stockage
• Analyses
• Restitution

Planification ETL Stockage Analyses Restitution

INF3186 || 2021-2022 Notions de bases sur le BI 28


Planification
Planification ETL Stockage Analyses Restitution

• Planifier le projet de mise en place de la plate-forme


décisionnelle d’entreprise
• Définir l’administration du projet
• Etc.
Exemple :
• Définir une stratégie de sécurité rigoureuse

INF3186 || 2021-2022 Notions de bases sur le BI 29


ETL
Planification ETL Stockage Analyses Restitution

• ETL : Extract, Trasform, Load


✓ Extraction des données à partir d’une ou plusieurs sources
de données : fichier texte, Excel, base de données, etc.
✓ Transformation des données agrégées
✓ Chargement des données dans la banque de données de
destination (datawarehouse)
• La phase d’ETL est ici incontournable, car conditionne et
influence la qualité du projet par la suite.

INF3186 || 2021-2022 Notions de bases sur le BI 30


Stockage
Planification ETL Stockage Analyses Restitution

• Les données extraites et transformées doivent être stockées


• Plusieurs manières de les stocker dans les data Warehouse
• Chacune ayant ses avantages et ses inconvénients
• L’administrateur des bases de données décisionnelles pourra
notamment choisir entre : les schémas en étoile, schéma en flocon,
etc.

INF3186 || 2021-2022 Notions de bases sur le BI 31


Analyse
Planification ETL Stockage Analyses Restitution

• Regroupe l’ensemble des techniques de statistique, d’économétrie,


de data mining, de recherche opérationnelle.
• Demande souvent des compétences statistiques avancées
• Néanmoins certaines solutions embarquent ces fonctionnalités pré-
paramétrées à des cas de figures bien définies

INF3186 || 2021-2022 Notions de bases sur le BI 32


Restitution
Planification ETL Stockage Analyses Restitution

• La génération de tableau de bord, est la partie émergée de l’iceberg


: l’ ID
• C’est la partie que voient la plupart des utilisateurs
• Ce sont généralement de jolies interfaces intuitives permettant à un
utilisateur lambda, en fonction de ses droits, de consulter des
rapports, des tableaux de bord, de les annoter, voire de les créer lui-
même.

INF3186 || 2021-2022 Notions de bases sur le BI 33


Architecture générale d’un système décisionnel

INF3186 || 2021-2022 Notions de bases sur le BI 05/04/2022 34


Architecture générale d’un SAD

Sources : F. Ravat, UT1


INF3186 || 2021-2022 Notions de bases sur le BI 35
Les sources

INF3186 || 2021-2022 Notions de bases sur le BI 05/04/2022 36


Les sources : données sources
❑ Caractéristiques
▪ Volumineuses
▪ Hétérogènes en contenu
▪ Détaillées
▪ Volatiles : pas d’historisation systématique ou
incomplète (pour les analyses)
▪ Peu ou pas adaptées à l’analyse

❑ Supports
▪ Une ou plusieurs sources
▪ Interne ou externe
▪ Hétérogènes en modèles et systèmes de stockage

INF3186 || 2021-2022 Notions de bases sur le BI 37


ETL:Extract Transform Load (1)

INF3186 || 2021-2022 Notions de bases sur le BI 38


ETL:Extract Transform Load (2)
▪ Modèle entité-relation (BD de production)
→ Modèle à base de dimensions et de faits

▪ Outil :
• Offrant un environnement de développement
• Offrant des outils de gestion des opérations et de
maintenance
• Permettant de découvrir, analyser, et extraire les
données à partir de sources hétérogènes
• Permettant de nettoyer et standardiser les données
• Permettant de charger les données dans un
entrepôt

INF3186 || 2021-2022 Notions de bases sur le BI 39


ETL:Extract Transform Load (3)
▪ But : Alimentation initiale et mise à jour périodique

▪ Outil pour automatiser ces différents chargements

INF3186 || 2021-2022 Notions de bases sur le BI 40


ETL:Extract Transform Load (4)
▪ ETL : Extraction, Transformation, Chragement
▪ ODS(Operational Data Store)/DSA(Data Staging Area)
• Zones de stockage non permanentes et optionnelles

Sources : F. Ravat, UT1


INF3186 || 2021-2022 Notions de bases sur le BI 41
ETL

INF3186 || 2021-2022 Notions de bases sur le BI 42


ETL

INF3186 || 2021-2022 Notions de bases sur le BI 43


ETL

Sources : E. Negre, Univ Paris Dauphine


INF3186 || 2021-2022 Notions de bases sur le BI 44
ETL
❑ Chargement : Insérer ou modifier les données
dans l’entrepôt
▪ Alimentation incrémentale ou totale?, offline
ou online?, fréquence des chargements?,
taille de l’historique?, …
▪ Si pas de MAJ :
• insertion de nouvelles données
• Archivage des données anciennes
▪ Sinon (attention en cas de gros volumes)
• Périodicité parfois longue
• MAJ des indexes et des résumés
INF3186 || 2021-2022 Notions de bases sur le BI 45
ETL

INF3186 || 2021-2022 Notions de bases sur le BI 46


Les stockage

INF3186 || 2021-2022 Notions de bases sur le BI 05/04/2022 47


Stockage données décisionnelles

Sources : F. Ravat, UT1


INF3186 || 2021-2022 Notions de bases sur le BI 48
Entrepôt de données :
définition et caractéristiques

INF3186 || 2021-2022 Notions de bases sur le BI 05/04/2022 49


Définition : ED (DW)
❑ L’entrepôt de données (ED) ou Data
Warehouse est une collection de données
orientées sujet(thématiques), intégrées, non
volatiles et historisées, organisées pour le
support d’un processus d’aide à la décision.
W.H. Inmon(1996)

❑C’est une BD à des fins d’analyse

INF3186 || 2021-2022 Notions de bases sur le BI 50


L’entrepôt
❑ Objectif : Préparation des données
décisionnelles

❑ Principe : Lieu de stockage centralisé d’un


extrait des sources pertinent pour les
décideurs, historisé, non volatile,
disponible pour l’interrogation
décisionnelle, organisé selon un modèle
informatique facilitant la gestion des
données
INF3186 || 2021-2022 Notions de bases sur le BI 51
DW : objectifs
• Intégrer différentes bases de données
opérationnelles;
• Permettre l’accès aux informations
historisées;
• Fournir des outils d’analyse sur ces
données;
• Résumer les données
• Réconcilier des données inconsistantes

INF3186 || 2021-2022 Notions de bases sur le BI 52


Caractéristiques d’un ED(1)
❑Orientées sujet : un ED rassemble et organise des données
associées aux différentes structures fonctionnelles de lʼentreprise,
pertinentes pour un sujet ou thème et nécessaire aux besoins
dʼanalyse
❑Intégrées : les données résultent de lʼintégration de données
provenant de différentes sources pouvant être hétérogènes
❑Historisées : les données dʼun ED représentent lʼactivité dʼune
entreprise durant une certaine période (plusieurs années)
permettant de dʼanalyser les variations dʼune donnée dans le Temps
❑Non-volatiles : les données de lʼED sont essentiellement utilisées
en interrogation (consultation) et ne peuvent pas être modifiées
(sauf certain cas de rafraîchissement).

INF3186 || 2021-2022 Notions de bases sur le BI 53


Caractéristiques d’un ED(2)
• Données orientées sujet
✓ Regroupe les informations des différents métiers
✓ Ne tient pas compte de l’organisation
fonctionnelle des données
✓ Données organisées par thèmes souvent
transverses par rapport aux systèmes
opérationnels

Sources : Lydie Soler, AgroTechParis


INF3186 || 2021-2022 Notions de bases sur le BI 54
Caractéristiques d’un ED(3)
• Données intégrées
✓ Les données proviennent de plusieurs sources
✓ Normalisation des données
✓ Définition d’un référentiel unique et cohérent
Cette phase est très complexe et représente une charge
importante

Sources : Lydie Soler, AgroTechParis


INF3186 || 2021-2022 Notions de bases sur le BI 55
Caractéristiques d’un ED(4)
• Données non volatiles
✓ Traçabilité des informations et des décisions prises
✓ Copie des données de production
✓ Les données ne sont ni modifiées ni supprimées

Sources : Lydie Soler, AgroTechParis


INF3186 || 2021-2022 Notions de bases sur le BI 56
Caractéristiques d’un ED(5)
• Données historisées / datées
✓ Les données persistent dans le temps (jamais mis à jour)
✓ Mise en place d’un référentiel temps
✓ Identification de chaque données dans le temps

Sources : Lydie Soler, AgroTechParis


INF3186 || 2021-2022 Notions de bases sur le BI 57
Caractéristiques d’un ED(6)
• Inconvénient :
✓ De par sa taille le DW est rarement
utilisé directement par les décideurs car
il contient plus que nécessaire pour une
classe de décideurs

INF3186 || 2021-2022 Notions de bases sur le BI 58


Le Datamart
• Sous-ensemble d’un entrepôt de données
• Destiné à répondre aux besoins d’un
secteur ou d’une fonction particulière de
l’entreprise
• Point de vue spécifique selon des critères
métiers

Sources : Lydie Soler, AgroTechParis


INF3186 || 2021-2022 Notions de bases sur le BI 59
Le Datamart
▪ Objectif : Présentation des données
décisionnelles
▪ Principe :
• Extrait de l’entrepôt de données
• Adapté aux besoins d’une classe de
décideurs
• Organisé selon un modèle informatique
adapté aux outils décisionnels

INF3186 || 2021-2022 Notions de bases sur le BI 60


Pourquoi pas un SGBD (1)
• Fonctions d’un SGBD :
✓ Systèmes transactionnels (OLTP)
✓ Permettre d’insérer, modifier, interroger
rapidement, efficacement et en sécurité les
données de la base
✓ Sélectionner, ajouter, mettre à jour, supprimer
des tuples
✓ Répondre à de nombreux utilisateurs
simultanément

INF3186 || 2021-2022 Notions de bases sur le BI 61


Pourquoi pas un SGBD(2)
• Fonctions d’un DW:
✓ Systèmes pour l’aide à la prise de décision
(OLAP)
✓ Regrouper, organiser des informations
provenant de sources diverses
✓ Intégrer et stocker les données pour une vue
orientée métier
✓ Retrouver et analyser l’information rapidement
et facilement

INF3186 || 2021-2022 Notions de bases sur le BI 62


Pourquoi pas un SGBD (3)

INF3186 || 2021-2022 Notions de bases sur le BI 63


Pourquoi pas un SGBD (4)

INF3186 || 2021-2022 Notions de bases sur le BI 64


Entrepôt de données VS Bases de données

INF3186 || 2021-2022 Notions de bases sur le BI 65


Les données du SI
Données opérationnelles Données décisionnelles
❑ Orientées applications ❑ Orientées activités
❑Données détaillées ❑Données globalisées
❑Données récentes ❑Données historiques
❑Structure compréhensible et optimisée ❑Structure compréhensible par les décideurs
pour l’informaticien
❑Données réparties et non homogènes ❑Données centralisées, intégrées
❑Utilisateurs : Agents opérationnels, ❑Utilisateurs : Décideurs, analystes, peu
nombreux, et concurrents nombreux et non concurrents
❑ Utilisées de façon répétitive ❑ Utilisée de façon aléatoire

❑ Petite quantité de données utilisées par un ❑ Grande quantité de données utilisée par les
traitement traitements

INF3186 || 2021-2022 Notions de bases sur le BI 66


OLTP vs. OLAP
• OLTP : On Line Transactional Processing
✓ Système destiner à offrir le moyen à une application
d’utiliser de façon transactionnelle un serveur de base de
données.
✓ Ensemble logiciel que l’utilisateur peut employer de façon
interactive pour accéder aux données de la manière la plus
rapide et simple possible
✓ Exemple : le 15/01/2012 à 13h12, le client X a retiré 500 du
compte Y
• OLAP : On Line Analytical Processing
✓ Technologie logicielle permettant aux analystes, managers et
décideurs d’accéder de manière rapide, consistant et
interactive à une large variété d’information.
✓ Exemple : Quel est le volume des ventes par produit et par
région durant le 2e trimestre de 2012?

INF3186 || 2021-2022 Notions de bases sur le BI 67


Bibliographie et ressources
Ouvrages recommandés
1. Golfarelli M., Rizzi S., « Data Warehouse Design:Modern Principles and
Methodologies », McGrawHill, 2009.
2. Kimball R., Ross, M., « Entrepôts de données:guide pratique de
modélisation dimensionnelle », 2°édition, Ed. Vuibert, 2003, ISBN:2-
7117-4811-1.
3. Franco J-M., « Le Data Warehouse ». Ed. Eyrolles, Paris, 1997. ISBN 2-212-
08956-2.
4. OLAP Solutions:Building Multidimensional Information Systems, E.
Thomsen
Notes de cours et autres références
1. Elsa NEGRE, Univ Paris-Duaphine, Entrepôts de données
2. F. Boufares, LIPN, Université Paris Nord
3. P. Marcel, LI, Universitéde Tours
4. Bernard Espinasse, Ecole Polytechnique Universitaire de Marseille
5. T. Hamon, Institut Galilée –Université Paris 13
INF3186 || 2021-2022 Notions de bases sur le BI 05/04/2022 68

Vous aimerez peut-être aussi