Académique Documents
Professionnel Documents
Culture Documents
-------------------------------------
En BI nous avons 4 grandes parties: Data sources, Data storage, OLAP Engine, Front-
End Tools
Pour arriver � stocker les donn�es, nous nous servirons d'un outil qu'on appelle
ETL(Extract Transform Load) ou ETC (Extraction Transformation et chargement).
ETL est un ensemble de composants(logiciels, script, etc.) nous permettant
d'extraire, de nettoyer, de transformer les donn�es provenant des diverses sources
de donn�es et de les charger ou de les rafraichir dans l'entrep�t de donn�es.
Un entrep�t de donn�es ou data warehouse est une structure qui regroupe les
donn�es de l'entreprise pour des fins analytiques pour aider � la d�cision
strat�gique. Un data warehouse relate la vie de l'entreprise
c'est une partie de l'entrep�t de donn�es. Etant donn� que les Data
warehouses sont �normes, ces derniers sont divis�s en Data Mart ou magasin de
donn�es afin de faciliter � un certain niveau la gestion d'une quantit�
d'informations d�termin�e.
On peut faire des d�coupes par fonction(data mart pour les ventes, pour les
commandes, pour les ressources humaines) ou par sous-ensemble organisationnel(un
data mart par succursale).
c. Fait
C'est semblable � une table dans une BD classique. Une table de fait, c'est
ce qu'on d�sire analyser (ventes, achats, recettes) sur base des dimensions
d. Dimension
On entend par dimensions; les axes (crit�res) avec lesquels on veut faire
l'analyse (�valuer, quantifier, qualifier) des faits. Il peut y avoir une
dimension.
e. Mesure
f. Etoile
Une �toile c'est une fa�on de mettre les dimensions et les faits dans un
entrep�t de donn�es.
g. Flocon
C'est un autre mod�le de mise en relation des dimensions et des faits dans un
entrep�t de donn�es. Le principe �tant qu'il peut exister des hi�rarchies de
dimensions et qu'elles sont reli�es ce qui donne naissance � un flocon.
h. Constellation
une constellation est une s�rie d'�toiles et des flocons r�li�s entre eux par
des dimensions. Il s'agit donc d'�toiles avec des dimensions en commun. Dans une
constellation on doit avoir au moins deux �toiles (donc ayant au moins deux tables
des faits).
i. Approche de conception
Trois m�thodes s'offre ici:
1. Top-Down: c'est la m�thode la plus lourde, la plus contraignante et
la plus compl�te en m�me temps. Elle consiste en la conception de tout l'entrep�t
(ie: toutes les �toiles) puis en la r�alisation de ce dernier.
3. Middle-Out:
j. Meta donn�es
Une m�tadonn�e est une donn�e � partir de laquelle nous pouvons avoir
d'autres donn�es.
Ex: une image. Elle est porteuse des d�tails: date creation, taille,
format...
OLAP (on line analytical processing) consiste en l'exploitation (en lecture) d'un
enptrep�t de donn�es par analyse (navigation) multidimensionnelle et interactive.
Le mod�le de base, attribu� � Codd, se repose sur douze r�gles de base.
- La multidimensionnalit� : permet d'avoir une vision multidimensionnels des
donn�es (ce qui n'est pas le cas avec une table unidimensionnele)
- La transparence (transparency) : L'utilisateur ne doit pas se rendre compte
de la provenance des donn�es si celles-ci provienne des sources h�t�rog�nes
- Accessibilit�:
- Stabilit�
- Client serveur
- Dimensionnement
- Gestion compl�te
- Multi-utilisateur
- Inter Dimension
- Intuitif
- Flexibilit�
En r�sum�
---------
La technologie OLAP, selon The Olap Report doit �tre rapide (Fast), doit permettre
de faire
des analyses complexes (Analysis), r�pondre � une architecture Client/Serveur avec
tout
ce que cela implique en terme de s�curit� et de gestion d'acc�s concurrent
(Shared). Un
outil OLAP doit, comme dit plus haut, se baser sur une vue multidimensionnelle des
donn�es (Multidimensional) et finalement le volume d'information que peut prendre
en
charge ses outils (Information). Ces crit�res ont �t� simplifi�s par l'acronyme
FASMI (Fast
Analysis of Shared Multidimensional Information)
1. R-OLAP
Relational OLAP permet d'utiliser les SGBD courants afin de stocker les donn�es.
2. M-OLAP
cette technologie permet de calculer le des solutions
3. H-OLAP
Hybrid OLAP est une solution mi-chemin entre R-OLAP et M-OLAP. Donc une partie en
pr�calcule et l'autre partie en naturel
4. D-OLAP
Desktop OLAP. Permet � l'utilisateur de sauvegarder une partie des donn�es en local
m�me lorsque l'utilisateur est d�connect�. Il peut effectuer des requettes en
locale et synchronise lors du retablissement de la connexion.
C'est le fait de regrouper les donn�es par mois, semaine...(fait de passer les
enti)
c.1.2. Slice : C'est une op�ration de selection pr�cise du cube selon une
dimension(ann�e, mois...)
c.1.2. Dice :
Ici, nous traitons du probl�me de transformation des donn�es extraites dans une