Vous êtes sur la page 1sur 15

12/27/19

MTI820 − Entrepôts de données et intelligence d’affaires

Introduction à l’intelligence d’affaires


et aux entrepôts de données

C. Desrosiers

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 1

Questions
• Quelles sont vos expériences avec l’intelligence
d’affaires?
• Quelle est selon vous la définition de ce concept?

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 2

Avant de commencer…
1. Quel est le lien entre les couches et la bière ?

2. Pourquoi les services de Google (Gmail, Calendar,


Groups) sont-ils gratuits ?

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 3

1
12/27/19

Le lien entre les couches et la bière


• Observations:
– Les ventes de bières sont particulièrement importantes les
vendredis en début de soirée;
– Les clients qui achètent de la bière durant cette période
ont tendance à acheter également des … couches !
• Marketing:
– En plaçant ces deux produits près l’un de l’autre, les
épiceries augmentent leurs ventes et leurs profits
(stratégie de vente croisée).

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 4

Le principe Google:
• Toute information a un prix;
• Google utilise ses services pour acquérir gratuitement de
l’information sur ses usagers:
– Analyse du texte des courriels (Gmail);
– Profil et liste des contacts (Google Groups);
– Emploi du temps (Google Calendar);
– etc.
• Cette information est utilisée pour envoyer de la
publicité ciblée aux usagers.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 5

Exploitation de l’information
« Les entreprises qui gèrent leurs données comme une
ressource stratégique et investissent dans la qualité de
celles-ci sont en avance sur leurs compétiteurs, au niveau
de la réputation et de profitabilité »
− Sondage PricewaterhouseCoopers Global Data Management (2001)

• Métro / Loblaws / Super C:


– Entreprises qui vendent de la nourriture OU;
– Entreprises qui exploitent des connaissances sur:
• Les préférences des clients;
• Les biais géographiques;
• La chaîne logistique;
• Le cycle de vie des produits;
• Les informations sur les ventes des compétiteurs.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 6

2
12/27/19

Question
• En quoi l’information diffère-t-elle des ressources
matérielles et humaines?

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 7

Caractéristiques de l’information
• Temporelle:
– La valeur diminue avec le temps;
– Ex: actions en bourse, achats des clients, etc.
• Partageable:
– Peut être copiée et distribuée facilement;
– Ex: réseaux sociaux, le Web, les médias, etc.
• Valeur augmente avec l’usage:
– Ne se dégrade pas comme d’autres ressources (ex: une
voiture);
– Ex: algorithme PageRank de Google.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 8

Caractéristiques de l’information
• Valeur augmente avec la qualité:
– Une information erronée ou imprécise peut nuire;
– Ex: opérations militaires.
• Valeur augmente avec la fusion:
– Une information peut avoir de la valeur que si elle est combinée
avec d’autres informations;
– Ex: ventes + inventaire = planification.
• Valeur mesurable:
– Historique: combien a couté l’acquisition de cette information ?
– Marché: combien une personne serait-elle prête à payer pour
obtenir cette information;
– Utilité: quelle valeur peut-on espérer obtenir de cette
information ?
Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 9

3
12/27/19

Question
• Est-ce que stocker beaucoup de données est suffisant
pour aider la prise de décision d’une entreprise?

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 10

10

Données vs informations vs connaissances


• Données:
– Collection d’éléments de valeur brute ou de faits servant à
calculer, raisonner et mesurer;
– Peuvent être collectées, stockées ou traitées;
– Ne possèdent pas de contexte ni de sens.
• Informations:
– Proviennent de l’organisation des données, mettant en valeur
les relations entre les différents éléments de ces données;
– Fournissent un contexte et un sens aux données.
• Connaissances:
– Viennent de la compréhension de l’information dans son
contexte;
– Sont utiles au processus de décision.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 11

11

Question
• Exemples de données, informations et connaissances
dans le domaine de la vente (ex: Amazon) ?

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 12

12

4
12/27/19

De données à stratégies
• Pyramide d’abstraction:
Intelligence d’affaires:
Ensemble de processus, de technologies
et d’outils servant à transformer:
Connaissances • Les données en informations;
Va ts $

et intelligence • Les informations en connaissances;


Niveau d’abstraction

r
le u
û
Co

• Les connaissances en stratégies


menant à des actions profitables à
Informations l’entreprise.

Données

Taille des données

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 13

13

Questions
• Comment le marché d’aujourd’hui diffère-t-il d’il y a 10,
20 ou 30 ans?
• Pourquoi avons-nous besoin de l’intelligence d’affaires?

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 14

14

L’environnement d’affaires
• L’environnement d’affaires est en constante évolution et
devient de plus en plus complexe;
• Les entreprises sont sous pression: elles doivent répondre
rapidement aux changements et innover dans leurs manières
d’opérer;
• La prise de décisions stratégiques et opérationnelles
complexes requiert une quantité considérable de données et
de connaissances;
• Les données nécessaires à la prise de décision proviennent de
sources diverses et hétérogènes;
• L’information de ces données doit être traitée très
rapidement.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 15

15

5
12/27/19

Échecs dans les projets


• Taux d’échec de projets:
Catégorie Taux approx.
Film (Hollywood) 60 %
Acquisition / fusion 60 %
TI 70 %
Produit alimentaire 80 %
Produit pharmaceutique 90 %
Source: Slywotzky et Weber (2007). The Upside: The 7 Strategies for Turning Big
Threats into Growth Breakthroughs

• Causes fréquentes d’échecs:


– Considérer trop peu de scénarios / scénarios peu réalistes;
– Être incapable d’anticiper les actions d’un compétiteur;
– Ignorer les changements économiques ou sociaux;
– Prévoir incorrectement la demande.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 16

16

Question
• Qu’est-ce que l’intelligence d’affaire?

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 17

17

Intelligence d’affaires
• Business intelligence (BI):
– Un ensemble de concepts, de méthodologies et
d’applications pour rassembler, stocker, analyser, et
permettre d’accéder des données, dans le but d’aider les
utilisateurs (et des systèmes) d’entreprises dans leur
processus de décision.
• Inclut:
– L’entreposage de données;
– Les requêtes et le reporting;
– L’analyse multidimensionnelle (OLAP);
– L’analyse statistique;
– La prédiction (forecasting);
– Le forage de données (data mining).

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 18

18

6
12/27/19

Pourquoi l’intelligence d’affaires ?


• Augmenter les revenus,
• Diminution des coûts;
• Profitabilité accrue de l’entreprise;
• Meilleure gestion des relations avec le client (CRM);
• Amélioration de l’expérience;
• Diminution des risques;
• etc.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 19

19

Question
• Qu’est-ce qu’un entreprôt de données et en quoi cette
technologie diffère-t-elle des bases de données
transactionnelles?

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 20

20

OLTP vs OLAP
• OnLine Transaction Processing (OLTP):
– Traitement rapide d’un grand nombre de courtes
transactions faites en-ligne (ex: INSERT, UPDATE, DELETE)
– Intégrité des données dans un environnement
concurrentiel (c.-à-d. plusieurs requêtes simultanées).
• OnLine Analytical Processing (OLAP):
– Traitement rapide de requêtes complexes (multiples
tables, agrégation de données, etc.)
– Objectif: assister dans la prise de décision.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 21

21

7
12/27/19

Question
• Système OLTP ou OLAP?:
a) Sert à contrôler et exécuter les tâches quotidiennes et
fondamentales de l’entreprise;
b) Renferme des données historiques consolidées;
c) Donne un portrait instantané des processus d’affaires de
l’entreprise;
d) Fait des requêtes complexes impliquant souvent plusieurs
tables et faisant l’agrégation de valeurs;
e) Données modélisées à l’aide d’un grand nombre de
tables hautement normalisées.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 22

22

OLTP vs OLAP
Critère OLTP OLAP
But Contrôler et exécuter les tâches Assister dans la planification, la
quotidiennes et fondamentales de résolution de problème et la prise
l’entreprise de décision
Types de données Données opérationnelles Données historiques consolidées
(transactions)
Sources de données BD transactionnelles Entrepôts de données ou
magasins de données
Ce que montre les Portrait instantané des processus Vue multidimensionnelle de
données d’affaires de l’entreprise plusieurs activités d’affaires de
l’entreprise
Insertions et mises-à-jour Courtes requêtes d’insertion et de Longs traitements en lot servant à
mise-à-jour lancées par les rafraichir les données
usagers finaux
Requêtes Simples requêtes retournant Requêtes complexes impliquant
quelques enregistrements (lignes) souvent plusieurs tables et faisant
de la BD l’agrégation de valeurs
Temps de réponses Instantané Quelques secondes à 1 minute
max.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 23

23

OLTP vs OLAP
Critère OLTP OLAP
Espace requis Relativement petit si les Grand due aux données
données historiques sont historiques et aux données
archivées d’agrégation
Modélisation de la BD Un grand nombre de tables Moins de tables, tables
hautement normalisées typiquement dénormalisées,
schémas en étoile ou flocon
Sauvegarde et récupération Fait de façon régulière, critique Fait de façon irrégulière, peut
pour l’entreprise récupérer des données OLTP
Reporting Routinier et très ciblé Ad hoc, multidimensionnel, à
plus large portée
Ressources requises Simple DBMS relationnel DBMS spécialisé multi-
processeurs et à grande
capacité
Nombre d’utilisateurs Grand Petit
simultanés

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 24

24

8
12/27/19

Quelques définitions
• Entreposage de données (data warehousing):
– « La copie périodique et coordonnée de données
provenant de diverses sources, internes et externes à
l’entreprise, dans un environnement optimisé pour
l’analyse »

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 25

25

Quelques définitions
• Les entrepôts de données (data warehouse):
– Centralisent les données de l’entreprise;
– Sont contenus dans un environnement bien géré;
– Possèdent un processus cohérent et répétable pour
charger les données provenant des applications de
l’entreprise;
– Reposent sur une architecture ouverte et extensible
pouvant accommoder la croissance des données;
– Fournissent des outils permettant aux usagers de
transformer les données en information utile à la prise
de décision.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 26

26

Historique des entrepôts de données


1910 1920 … 1970 1980 1990 2000 2010

GIS, réseaux sociaux,


Web sémantique, etc.

Oracle, IBM, Microsoft, SAP, etc.

Naissance de l’entreposage de données;

Dispersion des données causée par les PC;


Première solution Teradata (RDBMS). Bill Inmon
Production de rapports automatisés sur Ralph Kimball
micro-ordinateurs (pas d’intégration).

Mesures de la performance d’une entreprise et de Arthur Nielsen


l’impact d’une stratégie de marketing.

Naissance de la recherche en marketing. Charles Coolidge Parlin

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 27

27

9
12/27/19

Caractéristiques des entrepôts de données


• Orientés sujet:
– Les données sont organisées par sujet (ex: clients,
produits, ventes, etc.).
• Intégrés:
– Les données, qui proviennent de diverses sources
hétérogènes, sont consolidées et intégrées dans l’entrepôt.
• Historiques:
– Les données ont très souvent une composante temporelle
(ex: date et heure d’une transaction).
• Non-volatiles:
– Une fois insérées dans l’entrepôt, les données ne sont
jamais modifiées ou effacées; elle sont conservées pour
des analyses futures.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 28

28

Question
• Quels sont les avantages d’utiliser les entrepôts de
données?

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 29

29

Bénéfices des entrepôts de données


• Bénéfices directs:
– Permettent de mener des analyses poussées sur
différents sujets d’affaires;
– Fournissent une vue consolidée des données de
l’entreprise (une seule vérité);
– Procurent de l’information de qualité, plus
rapidement;
– Libèrent les ressources (ex: serveurs) dédiées au
traitement des transactions des tâches d’analyse;
– Simplifient l’accès aux données.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 30

30

10
12/27/19

Bénéfices des entrepôts de données


• Bénéfices indirects:
– Augmentent le savoir de l’entreprise;
– Procurent un avantage concurrentiel à
l’entreprise;
– Améliorent la satisfaction des clients;
– Permettent de mieux gérer les ressources;
– etc.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 31

31

Bénéfices des entrepôts de données


• Autres bénéfices:
– Meilleure communication/coopération entre les différents
intervenants/branches d’une entreprise:
• Rapprochent les intervenants du domaine des TI et ceux du
domaine des affaires en leur donnant un objectif commun;
• Permettent d’intégrer et de consolider les données des
différentes branches;
• Fournit une plateforme et des outils d’analyse communs.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 32

32

Architecture d’un entrepôt de données


Sources de Option sans datamart
données

Accès Applications
ERP / Processus ETL
(visualisations)
CRM
Datamart
Sélection Rapports
(marketing)
Méta- de routine
Legacy
données
Extraction
Forage de
API / Intergiciels

Datamart
Entrepôt de (finances) données /
POS données textes
Transformation
OLAP,
Datamart
OLT tableaux
Intégration (clients) de bord
/Web
Copie
Chargement Datamart Autres
Externes
(ventes)

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 33

33

11
12/27/19

Sources de données
• Enterprise resource planning (ERP):
– Gèrent les processus opérationnels d'une entreprise (ex: ressources
humaines, finances, distribution, approvisionnement, etc.).
• Customer relationship management (CRM):
– Gèrent les interactions d’une entreprise avec ses clients (ex:
marketing, ventes, après-vente, assistance technique, etc.).
• Systèmes legacy:
– Matériels et logiciels obsolètes mais difficilement remplaçables.
• Point of sale (POS):
– Matériels et logiciels utilisés dans les caisses de sorties d’un magasin.
• Externes:
– Ex: données concurrentielles achetées, données démographiques.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 34

34

Questions
• À quoi correspond le processus ETL?
• Pourquoi ce processus est-il essentiel à l’entreposage de
données?

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 35

35

Intégration des données


• Processus Extract, Tranform, Load (ETL):
1. Extraire les données des sources hétérogènes:
• Identifier les sources utiles;
• Comprendre les schémas.
2. Consolider les données:
• Données redondantes / manquantes;
• Différents noms / types;
3. Charger les données intégrées dans l’entrepôt:
• Mode différé (batch);
• Quasi temps-réel.
• Représente la partie la plus complexe de l’entreposage.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 36

36

12
12/27/19

Les outils d’analyse de données


• Rapports et requêtes simples
– « Dis moi ce qui s’est passé ».
• Analyse OLAP
– « Dis moi ce qui s’est passé et pourquoi ».
• Tableaux de bord et scorecards
– « Donne moi l’information mais ne me fait pas travailler
pour obtenir les réponses ».
• Forage de données
– « Dis moi quelque chose de nouveau et d’intéressant sans
que j’aille à le demander ».

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 37

37

Exemple de tableau de bord (MS Powerpivot)

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 38

38

Cas d’étude: Police de Richmond


• Objectif:
– Réduire le crime en anticipant les activités criminelles.
• Données:
– Données actuelles et historiques d’appels au 911;
– Informations relatives aux événements de la ville et des
régions limitrophes;
– Conditions météorologiques;
– etc.
• Méthode:
– Analyser les interactions entre les données actuelles et
historiques.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 39

39

13
12/27/19

Cas d’étude: Police de Richmond


• Composantes technologiques:
Technologie Composante

Webfocus
(Information Builders) Intégration des données

SPSS (IBM) Analyse prédictive


Correspondance dynamique des informations
ESRI géographiques

• Outil de visualisation:
– Représentation des indicateurs sur la carte graphique de la
ville.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 40

40

Cas d’étude: Police de Richmond

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 41

41

Cas d’étude: Police de Richmond


• Résultats:
– Affectation optimale des ressources policières;
– Meilleure anticipation des activités criminelles;
– Le crime a été réduit de 49 %;
– Moins d’appels au 911.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 42

42

14
12/27/19

Business Intelligence, Analytics, Data Science

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 43

43

Prochaine scéance

Séance #2

Le cycle de vie d'un projet en intelligence d'affaires

Lecture Chapitre 1 & 2


Ralph Kimball, Laura Reeves, Margy Ross, Warren Thornthwaite
(2013). The Data Warehouse Lifecycle Toolkit, 3rd Edition, Wiley.

Département de génie logiciel et des TI MTI820 – © S. Chafki, C. Desrosiers 44

44

15

Vous aimerez peut-être aussi