Vous êtes sur la page 1sur 8

ENTREPOTS ET ANALYSE DE DONNNEES

I) Présentation

Le processus décisionnel ou les systèmes décisionnels au sens des entrepôts de données


sont nés d’un besoin exprimé par les entreprises qui n’était pas satisfait par les systèmes tra-
ditionnels de bases de données. En intégrant la technologie des entrepôts de données
(datawarehouses), le processus décisionnel apporte une réponse au problème de la
croissance continuelle des données pouvant être de formats différents. De plus, il supporte
efficacement les processus d’analyse en ligne (On-Line Analytical Processing- OLAP).

L’entreposage de données est donc né dans les entreprises. Nous pouvons citer les
secteurs de la grande distribution, des banques et des assurances, ainsi que ceux de
l’automobile et des institutions médicales. Mais bien au-delà, l’entreposage de données
suscite de plus en plus d’intérêt, avec une ouverture vers des entreprises plus petites mais
qui peuvent tirer parti aujourd’hui de ces outils.
Notons aussi que plusieurs domaines d’application ont vu le jour autour du Web, des
systèmes d’informations géographiques, des flux de données, etc. Le Web est par ailleurs
devenu une source de données à part entière.

2) Définitions
a) entrepôt de données
Le terme entrepôt de données(ou base de données décisionnelle ; en anglais, data
warehouse ou DWH) désigne une base de données utilisée pour collecter, ordonner,
journaliser et stocker des informations provenant de base de données opérationnelles et
fournir ainsi un socle à l'aide à la décision en entreprise.
b) Business Intelligent

La BI c'est la collecte, la consolidation, la modélisation et la restitution des données de


l'entreprise depuis des sources multiples (fichier plat, fichier Excel, ERP...) pour fournir des
informations et des analyses significatives aux employés, aux clients, aux fournisseurs et aux
partenaires. Ainsi, de leurs permettre d'avoir une vue d'ensemble de l'activité traitée en vue
d'aider à la prise de décision plus efficace pour les décideurs.

Le but de la BI est d’apporter une vision globale des données de l’entreprise, afin de
répondre aux problématiques de celle-ci ou, tout simplement, afin de l’évaluer

 L'intelligence: c'est le savoir et la compréhension. C'est de comprendre le sens et le


contexte des choses. C'est la capacité de la prédiction, la résolution des problèmes
compliqués pour prendre des meilleures décisions et toute personne peut prendre
les décisions.
o INTELLIGENCE = DECISIONS = PERSONNES = information: pour évoluer,
progresser et répondre aux questions.
o Prendre des meilleures décisions grâce aux réponses trouvées au travers
d'information.
 Business: les entreprises; accroître les ventes, les meilleurs produits vendus,
"comment mes employés se comportent...".
o La business intelligence (BI) est un outil d'aide à la décision qui permet d'avoir
une vue d'ensemble des différentes activités de l'entreprise et de son
environnement.
o La BI aide les dirigeants dans leurs prises de décisions et dans l'analyse de la
performance et de leur entreprise.
o Les outils décisionnels peuvent générer des rapports et analyser les données.

3) Domaines d’utilisations

Les domaines d’utilisation de la BI se trouvent dans la plupart des métiers de l’entreprise:

 Finance (les reportings financiers et budgétaires…).


 Vente et commerce (l’analyse de la profitabilité, des points de ventes…).
 Logistique (le suivi des livraisons, la gestion des stocks…).
 Marketing (les analyses comportementales, la segmentation client…).
 Ressources humaines (l’optimisation des ressources…).
 Etc.

4) Les avantages

Les avantages les plus intéressants dans la BI sont :

 Le gain de temps pour les analystes : ils n’analysent que les données.
 La fiabilisation des données.

5) Quelques termes à connaitre

Des termes à connaître:

 Data Warehouse: DWS est une base de données centrale dans laquelle les données
sont stockées et peuvent être restructurées pour répondre aux besoins de
l'entreprise. Les entrepôts de données stockent habituellement d'énormes volumes
de données.
 Datamart: c'est un compartiment d'un datawarehouse, qui contient des tables. On
peut ajouter une table d'agrégat pour un datamart.
 La chaîne décisionnelle

Collecter → Traiter (ETL) → Stocker dans un datawarehouse c'est de pouvoir s'agréger dans
un cube multidimensionnel afin de restituer sous forme de reporting, indicateurs (exemple,
un KPI), carte géographique, etc.

 ETL (Extract Transform Load)

ETL unifie des données provenant de sources de données différentes, les uniformise, les
consolide et les charge dans un entrepôt de données de destination unique.

ETL permettra d'effectuer les opérations suivantes:

 Sélectionner et extraire les données utiles des sources.


 Transformer les données en fonction de la sortie souhaitée dans la
destination DB.
 Charger les données dans la destination (par exemple, un datawarehouse).

Ces opérations peuvent être programmées et automatisées, ce qui réduit le coût de


propriété.

ETL repose sur:

 Des connecteurs (pour exporter ou importer les données).


 Des transformateurs (manipuler les données: agrégation, filtres, conversion).
 Mises en correspondance (mapping entre source et destination).

. 8) Les cubes OLAP


Les cubes OLAP:

OLAP = OnLine Analytical Processing

OLTP = On Line Transaction Processing.

OLAP: est un cube en 3 dimensions (multidimensionnel) avec 3 axes d'analyses (par


exemple: lieu, produit, temps). Le croisement de ces axes donne notre mesure ça
veut dire que la cellule obtenue contient la donnée.

Le cube est une façon schématique pour présenter le croisement de la dimension et


du fait.

OLAP = table de dimension + table de fait ➔ schéma en flocon ou schéma en étoile.

 La méthodologie OLAP

Un cube OLAP est une représentation abstraite d'informations multidimensionnelles


exclusivement numérique utilisé par l'approche OLAP (acronyme de On-line Analytical
Processing). Cette structure est prévue à des fins d'analyses interactives par une ou plusieurs
personnes (souvent ni informaticiens ni statisticiens) du métier que ces données sont
censées représenter.

Les cubes OLAP ont les caractéristiques suivantes :

1- obtenir des informations déjà agrégées selon les besoins de l’utilisateur.


2- simplicité et rapidité d’accès
3- capacité à manipuler les données agrégées selon différentes dimensions
4- un cube utilise les fonctions classiques d’agrégation : min, max, count, sum, avg, mais peut
utiliser des fonctions d’agrégations spécifiques.
 Exemple de cube OLAP :
Dans notre exemple, nous allons nous intéresser aux ventes de tous les magasins .

Vue n° 1 : On s'intéresse à toutes les ventes du magasin d'ANNECY (toutes catégories


confondues durant toute l'année)

Vue n° 2 : On s'intéresse aux ventes de la catégorie "vêtements pour enfants" (tous les
magasins durant toute l'année)
10) Analyse de données
L’analyse de données est au coeur même du système de Business Intelligence, si ce n'est
au coeur des préoccupations de l'entreprise. Il s'agit en effet de décoder l'environnement
toujours plus riche en signaux faibles afin d'assurer une prise de décision aux risques
mesurés.

Mieux comprendre les attentes des clients, identifier les tendances pour rester sur la vague,
évaluer les stratégies pour mieux anticiper l'évolution sont autant de voies incontournables
pour assurer une rentabilité durable.

a) Analyse statistiques
Les outils de statistique descriptive, toujours plus performants, notamment dans les
restitutions des résultats, graphiques et cartographies, Datavisualisation, ne sont pas d'un
usage aisé pour les managers non expérimentés. Il est ainsi préférable de profiter de
l'assistance d'un statisticien professionnel afin d'éviter les maniements incertains et les
interprétations hasardeuses. Les études de corrélations par exemple, même lorsque la
dispersion est bien évaluée, délivrent parfois des résultats suffisamment surprenants pour
satisfaire l'intellect du découvreur en herbe. Elles sont un véritable piège pour l'utilisateur
inexpérimenté.
b) Analyse OLAP
Pour réaliser les analyses multidimensionnelles .

11) Modes de stockage des cubes OLAP


Le mode de stockage d'une partition affecte les performances de traitement et des requêtes,
les besoins en espace de stockage, ainsi que les emplacements de stockage de la partition,
de son cube et de son groupe de mesures parents. Le mode de stockage a également une
incidence sur les options de traitement.

Une partition peut utiliser l'un des trois modes de stockage de base :

 OLAP multidimensionnel (MOLAP)


 OLAP relationnel (ROLAP)
 Hybrid OLAP (HOLAP)

o MLOAP (Multiple OLAP): les données agrégées et une copie de données


sources sont stockées dans une structure multidimensionnelle; les requêtes
ne sont pas vers les cubes mais vers la DWH.
o ROLAP (Relational OLAP): les données agrégées sont stockées dans des vues
indexées de la BDR, les données sources ne sont pas copiées.

Par exemple : un utilisateur peut accéder en temps réel aux données sources.

o HOLAP (Hybrid OLAP): les données agrégées sont stockées dans une structure
multidimensionnelle et les données sources restent dans la BD source.
 Action sur les cubes :
o Drill-up: augmenter la granularité.
o Drill-down: diminuer la granularité.
o Drill-through: ne dispose que les données agrégées. Drill through fournit des
informations détaillées relatives aux données cubes sur lesquelles l’action est
basée.

Vous aimerez peut-être aussi