Remarques

Remarques concernant la prépa intégrée
1. IDL et IA
S7 : Concernant la matière DATA WAREHOUSE : ces outils sont un peu

dépassés avec les data lake (peuvent stocker des données non
structurées aussi) et les big data (qui traite les entrepôts de données et
les données en streaming structurées ou non). En plus, les data
warehouse et les data lake sont entrain de migrer vers le cloud. Vu que
les étudiants ont déjà vu les deux matières big data et cloud computing
en S6 je crois c’est comme si on revient en arrière.
Ce que je propose peut-être d’enseigner ce que les entreprises sont
entrain d’utiliser « cloud DATA Ware house et cloud data lake »
2. Data science et IA
Mes remarques concernent les modules intro BIG DATA et BIG DATA
avancée
Il faut signaler qu’il y a eu une matière enseignée en S6 pour les deux

spécialités « BIG DATA » . Ce que je propose c’est que cette matière donne
un aperçu sur toutes les notions big data (stockage distribués, traitements
de données ( en batch et en streaming) ainsi qu’aux principaux
frameworks).
S6 : BIG DATA ( Notions de BIG DATA, écosystème hadoop : HDFS,

MAPREDUCE, YARN, SPARK (batch et micro batch) et kafka (streaming))
S 7 : Data science et IA – Intro BIG DATA
Cloud computing et big data ( qui peut contenir la virtualisation nécessaire

pour le déploiement des framewoks et aussi les sources des données big
data des dataware house et lake house sur cloud)
BIG DATA Frameworks ( continuer à présenter les frameworks big data
commence en S6)
Modélisation des systèmes BIG DATA ( modélisation des données (SQL et

non SQL ou bien streaming(brokers)) et les prétraitements sur les
données( je crois qu’on ne peut pas consacrer une matière à cette partie)
S 8 : Data science et IA –BIG DATA avancés
BIG DATA et architectures associées ( architectures composées par les

framewors déja vus gamma, lambda …)
Analyse avancées de données/ Machine learning pour BIG DATA (utilisation

du machine learning pour le traitements de données : ML spark, pandas
tensorflow…)
Visualisation des données et dashboarding ( GRAPHX spark…)
En fait en big data : on acquière les données ( structurées ou pas) (en batch
ou en streaming) puis on les traite (frameworks) et enfin on prend des
décisions ( Machine learning) et on affiche (monotoring /dashboarding) : c
est la logique que j ai suivi pour ce que je propose

Remarques

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Remarques

Transféré par

Droits d'auteur :

Formats disponibles

Remarques concernant la prépa intégrée

S7 : Concernant la matière DATA WAREHOUSE : ces outils sont un peu

Il faut signaler qu’il y a eu une matière enseignée en S6 pour les deux

S6 : BIG DATA ( Notions de BIG DATA, écosystème hadoop : HDFS,

S 7 : Data science et IA – Intro BIG DATA

Cloud computing et big data ( qui peut contenir la virtualisation nécessaire

Modélisation des systèmes BIG DATA ( modélisation des données (SQL et

S 8 : Data science et IA –BIG DATA avancés

BIG DATA et architectures associées ( architectures composées par les

Analyse avancées de données/ Machine learning pour BIG DATA (utilisation

Visualisation des données et dashboarding ( GRAPHX spark…)

Vous aimerez peut-être aussi