Académique Documents
Professionnel Documents
Culture Documents
Présentation
Sommaire
3. Le Data Mining
4. L’offre BI de Microsoft
Proactif
Data Mining
OLAP
Interactif
Reporting Adhoc
Reporting de masse
Passif
Rendu
Présentation Exploration Découverte
Définitions – Vocabulaire
• Infocentre = Base de données dédiée à l’analyse d’une application
A l’origine des “copies” de base de production
• Staging Area : Espace de stockage temporaire des données provenant des différentes sources. C’est un lieu
où l’on va pouvoir stocker des données qui arrivent à des moments différents. C’est une zone d’attente, une
“salle d’embarquement”.
• Data Mart : Entrepôt de données dédié à un métier particulier. Il est situé en aval du Datawarehouse
Architecture cible
Staging Area
Stockage
ODS Multidimensionnel
DataWarehouse
• Un projet décisionnel est réussi quand l’utilisateur dit : « J’ai l’information, elle est sûre, je la
comprends, donc je l’utilise »
Modélisation BI
KIMBALL :
• Tables de fait , Tables de Dimensions
• Stockage dénormalisé des données
Inmon’s:
• S ’appuie sur une modélisation en BD relationnelle complexe
• Les données sont stockées dans la 3éme Forme Normale (3NF)
Lequel Choisir?
• Traditionnellement la modélisation Kimbal est utilisée
• Kimball permet un Feedback rapide / demandes métier
La pierre angulaire d’un système décisionnel
Le modèle de donnée
Performance
d’interrogations affectées
Schéma en flocon
Schéma en étoile
Economie de jointures à
l'interrogation
Perte en espace
de stockage
Les technologies Multidimensionnelles
Le Data Mining
Statut
Basé sur des méthodes mathématiques +/-
complexes :
• Méthodes de tri : Les algorithmes de Data Mining
• Technique: Statistique Crédit Accordé
(Oui/Non)
• Résultat: Prédiction, estimation, classification
Les Algorithmes de Data Mining
Marketing
• Quel profil de client cibler lors d’une campagne marketing ?
• Quels clients sont susceptibles de réagir à une promotion
déterminée ? (CRM)
• Quels produits offrir à quels clients ? (Eg: Amazone)
Finances
• Quels produits financiers proposer à quels clients ?
• Comment détecter une faillite prochaine ? (Crise Boursière)
Télécommunications
• Quels clients sont susceptibles de nous quitter ?
• Quel est le profil des clients très rentables,
et des clients pas ou peu rentables ?
L’offre BI de Microsoft
• Base de • OLAP
Données
SQL
Server SSAS
2008 R2
SSIS
SSAS,
SSRS XLs
2010
• Reporting • Data
Mining
Architecture fonctionnelle avec Microsoft BI
Data Mining
SQL Server Management Studio
SQL Server Management Studio est un environnement intégré qui permet d'avoir accès, de configurer,
de gérer, d'administrer et de développer tous les composants de SQL Server.
SQL Server Management Studio associe un groupe d'outils graphiques à des éditeurs de script T-SQL,
MDX, …
SQL Server Integration Services
• Au-delà du simple transfert des données d’une source vers une destination,
l’ETL sert à :
– Ordonnancer des taches
– Nettoyer les données transférées
– Augmenter la puissance de traitement pour faire face à l’accroissement
constant des volumes de données
– Prendre en charge la totalité de la chaîne de traitement, c’est-à-dire d’être
à même de mettre à jour les cubes OLAP construits à partir des entrepôts
de données mis à jour
Application Contained
Contained Database LocalDB In-memory
In-memory BI
BI SSIS
Application Fast
Fast FileStream
FileStream Database LocalDB for SSIS Server
Server
Centric
Centric Failover
Failover
Authentication
Authentication for corporate
corporate
Multiple
Multiple Readable Win32 Alerting
Readable Win32 access
access to
to Database Alerting Data
Data Quality
Secondaries database Database Replay
Replay UTF-16
UTF-16 Quality
Secondaries database files
files
Sysprep
Sysprep for
for AS Enhanced
Online Audit Paging
Paging for
for
AS Enhanced MDS
MDS
Online Operations
Operations Fast
Fast Full
Full Text
Text Audit
Enhancements
Enhancements result
result sets
sets
PowerPivot
PowerPivot
HA
HA for
for Management
FileTable Management Pack
Pack Full Enhancements
Enhancements
StreamInsight
StreamInsight FileTable for
for High
High Full Globe
Globe
Availability Spatial
Spatial Support
Support
Availability
AlwaysOn
AlwaysOn Reporting
Reporting as
as
Backup
Backup DAC
DAC Enhancements
Enhancements SharePoint
SharePoint
Secondaries Shared
Secondaries Shared Service
Service
ODBC
ODBC for
for Linux
Linux
SSMS
SSMS
Enhancements
Enhancements
JDBC
JDBC 4.0
4.0 driver
driver
Merci …
Unified Semantic Model
Projet Crescent : Power View
Projet Crescent : Power View