Académique Documents
Professionnel Documents
Culture Documents
Dekkak Hind
Le Data warehouse
Un « Data Warehouse » (en français : entrepôt de données) est une plateforme utilisée
pour collecter et analyser des données en provenance de multiples sources
hétérogènes. Elle occupe une place centrale au sein d’un système de Business
Intelligence (Informatique décisionnelle : permet de transmettre des informations
pertinentes aux responsables et managers dans les sociétés)
Au fil du temps, les ordinateurs sont devenus plus complexes. Le volume de données à
disposition des entreprises a considérablement augmenté. Cette augmentation est à la
fois une aubaine et un défi pour les entreprises.
-Une aubaine, car les Données Clients permettent de connaître les besoins des clients et
d’y répondre au mieux avec des produits adaptés.
- Un défi, car les datas ont besoin d’être récoltées, unifiées et correctement traitées,
aussi bien pour des raisons marketing que pour des questions légales.
C’est la raison pour laquelle les Data Warehouses sont devenus indispensables.
En 1970, pour la première fois, Nielsen et IRI introduisent le concept de Data Marts
dimensionnels (une forme simple de Data Warehouse centré sur un seul sujet ou
fonction) pour les commerces de détail. En 1983, Teradata lance un système de gestion
de base de données spécifiquement conçu pour l’aide à la décision.
C’est IBM qui a créé le premier Data Warehouse d’entreprise à la fin des années 1980.
Cela dit, le concept d’entrepôt de données aurait été inventé par l’informaticien William
H. Inmon. Selon ce dernier, un Data Ware House doit présenter 4 caractéristiques :
Être orienté sujet : il peut analyser les données en fonction de leur typologie.
Être intégré : il rassemble et harmonise des données issues de différentes
sources.
Être non volatile : il ne doit pas modifier les données qu’il stocke.
Être « time-variant » : il permet des analyses par dates.
3- Comment ça fonctionne ?
- Le Warehouse Manager, quant à lui, effectue les opérations liées à la gestion des données
au sein de l’entrepôt. Il permet notamment d’assurer la consistance des données, la création
d’index et de visualisation, la transformation et la fusion de données de plusieurs sources et
l’archivage.
- Les outils d’accès permettent aux utilisateurs finaux d’interagir avec le Data Warehouse. Il
peut s’agir d’outils de reporting, de requête, de développement d’application ou encore
d’exploration de données.
Le Data mining
1- Définition :
Le Data Mining (exploration de données, forage de données) est une pratique qui permet
de répondre à des questions et de résoudre des problèmes qui prennent traditionnellement
trop de temps et sont bien trop complexes. Pour y parvenir, on analyse les données en
utilisant différentes techniques statistiques.
Ce processus permet d’identifier des tendances, des relations entre les données qui seraient
passées inaperçues de prime abord. Les découvertes ainsi réalisées peuvent être utilisées
pour prédire les événements les plus probables et agir en fonction.
Par la suite, les données sont triées selon leurs catégories. On procède ensuite à l’analyse
afin de découvrir des tendances ou des corrélations.
Réseaux neuronaux
C’est un paradigme d’apprentissage et de traitement automatisé qui s’inspire du
fonctionnement du système nerveux humain. Ce système permet aux neurones d’être
interconnectés dans un réseau (réseau neuronal) qui collabore pour produire des stimuli de
sortie.
Arbres de décision
C’est un modèle de prédiction qui est utilisé dans le domaine de l’Intelligence artificielle à
partir d’une base de données où sont construits des diagrammes de constructions logiques.
Il s’agit d’un système similaire à la prédiction basée sur des règles. Celles-ci servent à la
représentation d’une série de conditions qui se présentent successivement dans la
résolution des problèmes.
Techniques statistiques
C’est une expression symbolique sous forme d’égalité qui est utilisée dans les plans
expérimentaux et la régression. Elle permet d’identifier les facteurs qui modifient la variable.
Regroupement (clustering)
Il s’agit du regroupement d’une série de vecteurs selon certains critères, dont le plus
considéré est la distance. Il s’agit d’agencer les vecteurs d’entrée de manière à ce qu’ils
soient plus proches de ceux ayant des caractéristiques communes.
4- Le rôle du Data mining dans la Gestion de la Relation Client :
Les techniques d'exploration de données dans le CRM aident votre entreprise à trouver et à
sélectionner les informations pertinentes. Cela peut ensuite être utilisé pour obtenir une
vision claire du cycle de vie du client.