Vous êtes sur la page 1sur 16

SYSTÈME DECISIONNEL (SID)

• Gouvernance de données
• Entrepôt des données
• Fouille de données
Facilite :
La définition du SI
La Mise en œuvre de stratégie d’extraction gagnante
L’Analyse données (énormes)
Le Traitement des résultats
Knowlegde Management
Knowlegde Management
• Faciliter la prise de décision, les échanges en abolissant
les contraintes spatio-temporelles,
• Améliorer la réactivité aux signes du marché (anticiper)
• Eviter la répétition d'erreurs / redondance des tâches
• Favoriser l'innovation et la créativité,
• Devenir une organisation apprenante
BIG DATA (Megadonnées)
 Technique pour collecter, maintenir et traiter l’énorme info, expliquer la
relation entre les Data caractérisée par 3V (Volume, Vélocité, variété)
 C’est un super ensemble de Data Mining.

Les données doivent être :


• bien gouvernées
• Mesurables et traçables
• Disponibles, réutilisations, Exploitations
• Sécurisées, classifiées, historisables
BIG DATA (Megadonnées)

Caractéristiques :
• Volume: pas d'échantillonnage, on observe et mesure tout
• Vélocité: les données et les résultats sont souvent disponibles
en temps réel
• Variété: puise dans les données textuelles, les photos, audio /
vidéo et complète généralement les pièces manquantes en
fusionnant plusieurs sources
Explosion de la disponibilité des données
Augmentation de la capacité de stockage
Augmentation de la capacité d’analyse
Data Warehouse

Collection des data non volatiles et historisées, organisées


supportant une aide à la Décision.
OLAP (Online Analytical Process) qui est une méthode de
fragmentation Verticale
Data Warehouse
OLTP OLAP
Utilisateur Employé et Professionnel Analyse connaissance
Fonction Opérations au jour le jour Aide à la décision
Conception de BD Orientée application Orientée sujet

Données Courante, détaillée, simple relationnel Historique, multidimensionnelle,


intégrée, consolidée résumée
Usage Répétitif Ad-hoc
Accès Read/Write index/hash sur PK Multiples

Unité de travail Court, transaction simple Requête complexe


Enregistrement accès Dizaines Millions

Nombre Centaines utilisateur Milliers utilisateur


Taille de la BD 100Mo-1Go 100Go-1To
Métrique Transaction Requête
TYPE
Traitement de l’information : requêtes, analyse statistique, tableaux
croisés, graphiques.

Traitement analytique : Analyse multidimensionnelle des données

DataMining : pour l’analyse, l’extraction de données et la


découverte de connaissance
Data Science et Data Engineering
Data Science :
1. Domaine ou outils utilisés dans le Big Data.

2. consiste à obtenir des infos significatives à partir de donnée


brutes et non structurées en appliquant des compétences
analytiques, de programmation et commerciales.

3. Ex : SPSS, R, Python, SAS, Stata et Julia, Scala, Java et C#,


Neo4j, Cassandra, SqlServer, Oracle, …
Cycle de vie Data Science :
1. Data Discovery : Recherche de sources de Data et capture de
Data structurées et non structurées.

2. Préparation des données : conversion dans un format commun.

3. Modèle math : variables et équations établissant une relation.

4. Mettre les choses en action : recueillir des infos et obtenir des


résultats en fonction des besoins de l’entreprise.

5. Communication : Communiquer les résultats aux décideurs.


Data Engineering et/ou DataMining
concentre les applications pratiques de la collecte et de l’analyse de
données volumineuses.
Outil de collecte automatique des Data et BD stockées dans le DW
Algo/méthode d’extraction, d’exploration et d’analyse des Big Data

Ex : Python, R, C#, Java, Neo4j,


Cassandra, SPSS, Rapid Miner, SAS,
Excel, R, MatLab, KNIME, SQLServer,
Oracle DM, STATISTICA
SAP,, Redis, Riak, PostgreSQL, Hiven,
Sqoop,, MongoDB, Scala, …
Data Mining

Outil de collecte automatique des Data et BD stockées dans le DW


Algo/méthode d’extraction, d’exploration et d’analyse des Big Data

SPSS, Rapid Miner, SAS, Excel, R, MatLab,


KNIME, Ms SQL Server, Oracle DM,
STATISTICA, etc

Vous aimerez peut-être aussi