Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
I) Présentation
L’entreposage de données est donc né dans les entreprises. Nous pouvons citer les
secteurs de la grande distribution, des banques et des assurances, ainsi que ceux de
l’automobile et des institutions médicales. Mais bien au-delà, l’entreposage de données
suscite de plus en plus d’intérêt, avec une ouverture vers des entreprises plus petites mais
qui peuvent tirer parti aujourd’hui de ces outils.
Notons aussi que plusieurs domaines d’application ont vu le jour autour du Web, des
systèmes d’informations géographiques, des flux de données, etc. Le Web est par ailleurs
devenu une source de données à part entière.
2) Définitions
a) entrepôt de données
Le terme entrepôt de données(ou base de données décisionnelle ; en anglais, data
warehouse ou DWH) désigne une base de données utilisée pour collecter, ordonner,
journaliser et stocker des informations provenant de base de données opérationnelles et
fournir ainsi un socle à l'aide à la décision en entreprise.
b) Business Intelligent
Le but de la BI est d’apporter une vision globale des données de l’entreprise, afin de
répondre aux problématiques de celle-ci ou, tout simplement, afin de l’évaluer
3) Domaines d’utilisations
4) Les avantages
Le gain de temps pour les analystes : ils n’analysent que les données.
La fiabilisation des données.
Data Warehouse: DWS est une base de données centrale dans laquelle les données
sont stockées et peuvent être restructurées pour répondre aux besoins de
l'entreprise. Les entrepôts de données stockent habituellement d'énormes volumes
de données.
Datamart: c'est un compartiment d'un datawarehouse, qui contient des tables. On
peut ajouter une table d'agrégat pour un datamart.
La chaîne décisionnelle
Collecter → Traiter (ETL) → Stocker dans un datawarehouse c'est de pouvoir s'agréger dans
un cube multidimensionnel afin de restituer sous forme de reporting, indicateurs (exemple,
un KPI), carte géographique, etc.
ETL unifie des données provenant de sources de données différentes, les uniformise, les
consolide et les charge dans un entrepôt de données de destination unique.
La méthodologie OLAP
Vue n° 2 : On s'intéresse aux ventes de la catégorie "vêtements pour enfants" (tous les
magasins durant toute l'année)
10) Analyse de données
L’analyse de données est au coeur même du système de Business Intelligence, si ce n'est
au coeur des préoccupations de l'entreprise. Il s'agit en effet de décoder l'environnement
toujours plus riche en signaux faibles afin d'assurer une prise de décision aux risques
mesurés.
Mieux comprendre les attentes des clients, identifier les tendances pour rester sur la vague,
évaluer les stratégies pour mieux anticiper l'évolution sont autant de voies incontournables
pour assurer une rentabilité durable.
a) Analyse statistiques
Les outils de statistique descriptive, toujours plus performants, notamment dans les
restitutions des résultats, graphiques et cartographies, Datavisualisation, ne sont pas d'un
usage aisé pour les managers non expérimentés. Il est ainsi préférable de profiter de
l'assistance d'un statisticien professionnel afin d'éviter les maniements incertains et les
interprétations hasardeuses. Les études de corrélations par exemple, même lorsque la
dispersion est bien évaluée, délivrent parfois des résultats suffisamment surprenants pour
satisfaire l'intellect du découvreur en herbe. Elles sont un véritable piège pour l'utilisateur
inexpérimenté.
b) Analyse OLAP
Pour réaliser les analyses multidimensionnelles .
Une partition peut utiliser l'un des trois modes de stockage de base :
Par exemple : un utilisateur peut accéder en temps réel aux données sources.
o HOLAP (Hybrid OLAP): les données agrégées sont stockées dans une structure
multidimensionnelle et les données sources restent dans la BD source.
Action sur les cubes :
o Drill-up: augmenter la granularité.
o Drill-down: diminuer la granularité.
o Drill-through: ne dispose que les données agrégées. Drill through fournit des
informations détaillées relatives aux données cubes sur lesquelles l’action est
basée.