Vous êtes sur la page 1sur 2

Remarques concernant la prépa intégrée

1. IDL et IA

S7 : Concernant la matière DATA WAREHOUSE : ces outils sont un peu


dépassés avec les data lake (peuvent stocker des données non
structurées aussi) et les big data (qui traite les entrepôts de données et
les données en streaming structurées ou non). En plus, les data
warehouse et les data lake sont entrain de migrer vers le cloud. Vu que
les étudiants ont déjà vu les deux matières big data et cloud computing
en S6 je crois c’est comme si on revient en arrière.
Ce que je propose peut-être d’enseigner ce que les entreprises sont
entrain d’utiliser « cloud DATA Ware house et cloud data lake »

2. Data science et IA

Mes remarques concernent les modules intro BIG DATA et BIG DATA
avancée

Il faut signaler qu’il y a eu une matière enseignée en S6 pour les deux


spécialités « BIG DATA » . Ce que je propose c’est que cette matière donne
un aperçu sur toutes les notions big data (stockage distribués, traitements
de données ( en batch et en streaming) ainsi qu’aux principaux
frameworks).

S6 : BIG DATA ( Notions de BIG DATA, écosystème hadoop : HDFS,


MAPREDUCE, YARN, SPARK (batch et micro batch) et kafka (streaming))

S 7 : Data science et IA – Intro BIG DATA

Cloud computing et big data ( qui peut contenir la virtualisation nécessaire


pour le déploiement des framewoks et aussi les sources des données big
data des dataware house et lake house sur cloud)
BIG DATA Frameworks ( continuer à présenter les frameworks big data
commence en S6)

Modélisation des systèmes BIG DATA ( modélisation des données (SQL et


non SQL ou bien streaming(brokers)) et les prétraitements sur les
données( je crois qu’on ne peut pas consacrer une matière à cette partie)

S 8 : Data science et IA –BIG DATA avancés

BIG DATA et architectures associées ( architectures composées par les


framewors déja vus gamma, lambda …)

Analyse avancées de données/ Machine learning pour BIG DATA (utilisation


du machine learning pour le traitements de données  : ML spark, pandas
tensorflow…)

Visualisation des données et dashboarding ( GRAPHX spark…)

En fait en big data : on acquière les données ( structurées ou pas) (en batch
ou en streaming) puis on les traite (frameworks) et enfin on prend des
décisions ( Machine learning) et on affiche (monotoring /dashboarding) : c
est la logique que j ai suivi pour ce que je propose

Vous aimerez peut-être aussi