Vous êtes sur la page 1sur 16

Entrepôt de données

Introduction à l’informatique décisionnelle

▪ Enseignante : Leïla Bayoudhi


▪ Etablissement : Institut Supérieur d’Informatique de Mahdia
▪ Année universitaire : 2023-2024
Le contexte
• Besoin : prise de décisions stratégiques et tactiques

• Pourquoi : besoin de réactivité

• Qui : les décideurs (non informaticiens, non statisticiens)

• Comment : répondre aux demandes d’analyse des données, dégager de nouvelles informations
qualitatives

Qui sont mes Pourquoi et


meilleurs comment le chiffre
clients? d’affaire a baissé?

Quels clients A combien s’élèvent


consomment mes ventes
beaucoup de fruits journalières?
et légumes ? 2
L. Bayoudhi MM&ED 2
Les données utilisables par les décideurs

■ Données opérationnelles (de production)


■ Bases de données (Oracle, SQL Server)
■ Fichiers, …
■ Caractéristiques de ces données:
■ Distribuées : systèmes éparpillés
■ Hétérogènes : systèmes et structures de données différents
■ Détaillées : organisation des données selon les processus fonctionnels, données
surabondantes pour l’analyse
■ Peu/pas adaptées à l’analyse : les requêtes lourdes peuvent bloquer le système
transactionnel
■ Volatiles : pas d’historisation systématique
L. Bayoudhi MM&ED 3
Informatique de production

▪ Interrogations et modifications fréquentes des données par de nombreux utilisateurs.

▪ Nécessité de conserver la cohérence des données.

▪ Les systèmes transactionnels (OLTP) garantissent la cohérence des données.

▪ L’informatique de production est optimisée pour les tâches répétitives et planifiées.

L. Bayoudhi MM&ED 4
Problématique

• Comment répondre aux demandes des décideurs?

• En donnant un accès rapide et simple à l’information stratégique?

• En donnant du sens aux données?

=> Mettre en place un système d’information dédié aux applications décisionnelles :

un data warehouse

L. Bayoudhi MM&ED 5
Informatique décisionnelle

• Chargement périodique des données

• Pas de modifications des données

• Interrogations non régulières, planifiées, parfois longues des systèmes d’information


décisionnels

• Exemples de questions :

• Quelles sont les ventes du produit X pendant le trimestre A de l'année B dans la


région C ?

• Comment se comporte le produit X par rapport au produit Y?

• Quel type de client peut acheter le produit X?


L. Bayoudhi MM&ED 6
L’informatique décisionnelle

❑ L’informatique décisionnelle (DSS pour Decision Support System ou BI


pour Business Intelligence) : désigne les moyens, les outils et les
méthodes qui permettent de collecter, consolider, modéliser et restituer les
données d'une entreprise en vue d'offrir une aide à la décision et de
permettre aux responsables d’avoir une vue d’ensemble de l’activité.

L. Bayoudhi MM&ED 7
Chaîne décisionnelle

Collecte de
ETL Stockage Analyses Restitution
données

L. Bayoudhi MM&ED 8
Collecte

• La collecte s’effectue à partir de données appelées : données sources. Ces


données peuvent se présenter sous

• différents formats; Il peut s’agir de .

• fichiers "plats" (fichiers CSV avec séparateurs, fichiers XML, fichiers ASCII...),

• aussi de systèmes de bases de données (MySQL, PostgreSQL, DB2,


ORACLE...).

L. Bayoudhi MM&ED 9
ETL

• ETL : Extract, Transform, Load


• Extraction des données à partir d’une ou plusieurs sources de données :
fichier texte, Excel, base de données…
• Transformation Toutes les données ne sont pas utilisables telles qu'elles.
Elle méritent d'être vérifiées, reformatées, nettoyées afin d'éliminer les
valeurs aberrantes et les doublons, et consolidées.
• Chargement des données dans la banque de données de destination
(datawarehouse).
• La phase d’ETL est ici incontournable car elle conditionne et influence la
qualité du projet par la suite.
L. Bayoudhi MM&ED 10
Stockage

• Plusieurs manières de stocker la donnée dans un data warehouse.

• Chacune ayant ses avantages et ses inconvénients.

• L'administrateur des bases de données décisionnelles pourra notamment choisir


entre : les schémas en étoile, schéma en flocon…

L. Bayoudhi MM&ED 11
Analyse

• L'analyse multidimensionnelle consiste à modéliser des données selon plusieurs


axes.
• Le cube "OLAP" (pour Online analytical processing) désigne la technologie
analytique qui s'applique à ce modèle de représentation.

L. Bayoudhi MM&ED 12
Analyse

L. Bayoudhi MM&ED 13
Restitution

• Ce sont généralement de jolies interfaces intuitives permettant à un


utilisateur, en fonction de ses droits, de consulter des rapports, des
tableaux de bord, de les annoter, voire de les créer lui-même.

L. Bayoudhi MM&ED 14
Architecture d’un SID

L. Bayoudhi MM&ED 15
Concepts de SID et BI
• Data mining : utilisation de bases de données, de statistiques et de machine learning pour déceler
les tendances dans les ensembles de données volumineux.

• Reporting désigne l’ensemble des informations (rapports et bilans analytiques) relatives aux
réalisation d’une période..

✓ une belle photographie de ce qui vient de se passer (incluse dans document word/pdf/ppt)

✓ destiné aux directeurs de services et à la direction de l’entreprise

• Le tableau de bord… il présente les indicateurs de performance clés (ou KPI) d’une équipe ou d’une
entreprise, à travers une série de graphiques. Aussi appelé « dashboard »

✓ des indicateurs essentiels en temps réel pour piloter (tableaux diffusés sur un doc ou une
interface).

✓ Il s’adresse aux équipes métier et à leurs responsables, plutôt qu’à la direction.


L. Bayoudhi MM&ED 16

Vous aimerez peut-être aussi