Une transformation
impressionnante !!!
1,5 milliards de dollars
1 milliards de dollars
77
L’exploitation du pétrole
88
JEMS-Datafactory
Présent à
PARIS
LONDRES
NEW YORK
Fondé 30 M€
en 2002 de CA
*prévisions 2017
1212
1414
DONNÉES
RÉFÉRENTIELLES
BESOINS
------------------------- DATALAKE EXPOSITION UTILISATEURS
SOURCES DES
EXTERNES DATATABL DONNÉES
------------------------- RAWDATA
E Requêtage
ALGORITHME Requêtage
API
ad’hoc
PORTAIL SÉCURISÉ
& CALCUL Rest
INTÉGRATION
VUES
MÉTIE
RS
------------------------- NETTOYAGE /
SOURCES CONSOLIDATION / REQUETAGE Reporting
INTERNES SÉMANTISATION / REJETS / DE DONNEES API
------------------------- ENRICHISSEMENT META Rest
DONNÉES AGRÉGATS +
STOCKAGE CALCULS
HISTORISATION ENRICHISSEMENT ODBC
RÉFÉRENTIELS CROISEMEN
TS
Data Discovery
ALIMENTATION EN BATCH ET/OU EN TEMPS RÉEL
DATAMANAGEMENT (QUALITÉ, TRAÇABILITÉ, GOUVERNANCE)
L’ARCHITECTURE DATALAKE 1717
DONNÉES
RÉFÉRENTIELLES
BESOINS
------------------------- DATALAKE EXPOSITION UTILISATEURS
SOURCES DES
EXTERNES DATATABL DONNÉES
------------------------- RAWDATA
E Requêtage
ALGORITHME Requêtage
API
ad’hoc
PORTAIL SÉCURISÉ
& CALCUL Rest
INTÉGRATION
VUES
MÉTIE
RS
------------------------- NETTOYAGE /
SOURCES CONSOLIDATION / REQUETAGE Reporting
INTERNES SÉMANTISATION / REJETS / DE DONNEES API
------------------------- ENRICHISSEMENT META Rest
DONNÉES AGRÉGATS +
STOCKAGE CALCULS
HISTORISATION ENRICHISSEMENT ODBC
RÉFÉRENTIELS CROISEMEN
TS
Data Discovery
ALIMENTATION EN BATCH ET/OU EN TEMPS RÉEL
DATAMANAGEMENT (QUALITÉ, TRAÇABILITÉ, GOUVERNANCE)
1818
HUB OMNICHANNEL
1 PRODUCER INIT
Dépôt manuel
INIT
(JSON)
3 Consumer MAPR-stream
CONSUMER
Sources en mode batch (TXT)
DM CRM
Real Time
Big Data Platform
(TXT)
Autres sources Data Lake récurrent
…
Enterprise Storage Database Event Streaming
INIT MapR-FS MapR-DB JSON MapR-Streams
(JSON)
INCR (JSON)
(TXT)
Zone de (JSON)
6 noeuds
Vision des flux entrants dans le Data Transfert
4 2
Lake
STREAM
- Vision INIT batch RAWDATA
Les
Les 55 facteurs
facteurs clés
clés pour
pour réussir
réussir un
un projet
projet BIGDATA
BIGDATA
• Construire et définir le périmètre de responsabilité des acteurs en fonction Penser à l’exploitation de vos
2 de leurs compétences projets en production
Projet :
Lutte anti-Fraude ciblée.
Description :
Notre client ferroviaire souhaite optimiser son système anti-Fraude aux resquilleurs
CONFIDENTIEL (248 millions d’euros de perte annuelle), en mettant en œuvre une architecture
permettant de collecter l’ensemble des indicateurs (Capteurs machine + les Flux des
passages par station + Les paiements effectués) en temps réel et obtenir une
puissance de calcul afin de cibler les stations victimes.
Mise à jour des systèmes sources en instaurant le temps réel, mise en place du
datalake, implémentation des algorithmes développés par les datascientists, mise en
œuvre d’une console de monitoring et système d’alerte pour les agents dédies au
contrôle afin d’intervenir à la minute qui suit.
Projet :
Mise en place d’un DataLake Marketing – Vision 360°
Hicham BOUR-RHA
hbour-rha@jems-group.com
RDV AU STAND 76