Parcours IA
ENS Paris Saclay 4. Plan du cours
Master 1
2020-2021
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 1 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 2 / 37
1. Présentation du cours
◮ Quatre séances de cours (10h)
2. Signaux et séries temporelles
◮ Projet tutoré en Matlab ou Python sur données réelles (20h)
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 3 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 4 / 37
Signaux et séries temporelles Signaux et séries temporelles
4. Plan du cours
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 5 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 6 / 37
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 7 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 8 / 37
Signaux et séries temporelles Signaux et séries temporelles
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 9 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 10 / 37
0.8 0.8
signal (en l’occurrence discret)
0.7 0.7 ◮ En pratique, les signaux numériques ou séries temporelles sont représentés
0.6 0.6 sous la forme de tableaux de valeurs (ou vecteurs) de longueur N.
x[n]
x(t)
0.5 0.5
◮ Chaque valeur stockée est appelée échantillon (attention : définition
0.4 0.4
différente de celle du ML !). N correspond au nombre d’échantillons.
0.3 0.3
0.2
◮ On définit alors :
0.2
0.1 0.1
◮ L’échantillon n
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0
0 1 2 3 4 5 6 7 8 9 10
n 0 1 2 3 4 5 6
t (secondes) n (echantillons)
◮ La série temporelle x[n], correspondant aux valeurs enregistrées
Signal continu x(t) Signal discret x[n]
t ∈ [0, 1] n ∈ J0, 10K x[n] 0.7 0.2 0.8 0.9 0.3 0.2 0.7
Dans le cours, les signaux discrets seront représentés par des segments terminés par ◮ Le vecteur temps t[n], correspondant aux instants où le signal a été enregistré
des cercles (cf figure ci-dessus) t[n] 16 :30 :01 16 :30 :23 16 :31 :43 16 :32 :38 16 :33 :06 16 :33 :16 16 :33 :56
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 11 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 12 / 37
Signaux et séries temporelles Signaux et séries temporelles
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 13 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 14 / 37
Trajectoires 2D/3D,
Séries temporelles
multivariées, ◮ Données potentiellement massives (ex : son HD : 44100 échantillons par
Données multimodales seconde)
sur des réseaux de
capteurs… ◮ Données multivariées, multimodales, hétérogènes
◮ Données bruitées, données manquantes
◮ Souvent liées à un contexte applicatif : le data scientist n’est pas formé pour
comprendre les données
◮ Manque d’annotations et de vérités terrain
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 15 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 16 / 37
Signaux et séries temporelles Signaux et séries temporelles
6 6
Thousands
5.5 5.5
5 5
4.5 4.5
4 4
◮ Chaque échantillon corresponds à la mesure d’un phénomène à un instant
3.5 3.5
donné 3 3
01/00 07/02 01/05 07/07 01/10 07/12 01/15 07/17 0 50 100 150 200 250
◮ La prise en compte du temps est cruciale pour la compréhension de l’évolution Time ??
du phénomène
La même série temporelle… mais où les temps ont été mélangés
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 17 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 18 / 37
0.1
0.4
Male
1.1 Young
ML
0.9 British accent
« Hello »
◮ Il existe plusieurs façons de voir une série temporelle x[n]
0.3
0.5
◮ Vision physique. La série temporelle correspond à une version discrétisée d’un
0.2 phénomène physique x(t) : on cherchera alors à retrouver les propriétés de x(t) à
partir de x[n]. Il s’agit d’une approche déterministe correspondant classiquement
à ce qui se fait en traitement du signal.
43
◮ Vision statistique. La série temporelle correspond à une réalisation d’un
28
21 ML
New user phénomène aléatoire X [n] : on cherchera alors à retrouver les propriétés
Likely to buy a car
08 statistiques de X [n] à partir de x[n]. Il s’agit d’une approche probabiliste
53
correspondant à ce qui se fait en traitement statistique du signal.
◮ Bien entendu ces deux visions sont liées, et afin de bien explorer les données il
est utile d’adopter les deux points de vue
◮ La plupart des algorithmes de ML ne prennent pas en compte le temps de
façon native
◮ Comment utiliser cette information temporelle pour extraire des
caractéristiques et des motifs qui peuvent être utilisés au sein d’un algorithme
de ML ?
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 19 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 20 / 37
Signaux et séries temporelles Signaux et séries temporelles
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 21 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 22 / 37
Prédiction de la valeur d’une action grâce à un réseau LSTM : utilisation des 250
premiers jours comme données d’entraı̂nement. La prédiction semble excellente ! Excellentes performances également ! Prédiction et RMSE de bonne qualité !
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 23 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 24 / 37
Signaux et séries temporelles Signaux et séries temporelles
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 25 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 26 / 37
Machine Learning pour les séries temporelles Machine Learning pour les séries temporelles
1. Présentation du cours ◮ Le Machine Learning ne consiste pas (uniquement) à obtenir les meilleures
performances possibles en lançant des packages de Machine Learning en
2. Signaux et séries temporelles Python
◮ Le Machine Learning a également pour but de comprendre les données,
3. Machine Learning pour les séries temporelles d’interagir avec des experts métier, et d’améliorer la connaissance
◮ Il n’y a pas d’intelligence artificielle sans intelligence humaine
4. Plan du cours ◮ Appliquer des méthodes perfectionnées de Machine Learning ne dispense pas
d’une phase d’exploration préliminaire… et le Machine Learning peut
également aider à cela !
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 27 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 28 / 37
Machine Learning pour les séries temporelles Machine Learning pour les séries temporelles
Machine Learning pour les séries temporelles Machine Learning pour les séries temporelles
0 0 0.02
-5 -5 0
0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 -50 0 50
5 5 0.04
0 0 0.02
-5 -5 0
0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 -50 0 50
5 5 0.04
0 0 0.02
-5 -5 0
0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 -50 0 50
5 5 0.04
0 0 0.02
-5 -5 0
0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 -50 0 50
5 5 0.04
0 0 0.02
-5 -5 0
0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 -50 0 50
5 5 0.04
0 0 0.02
-5 -5 0
0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 -50 0 50
Time (s) Time (s) Frequency (Hz)
Deux classes de signaux ? Tâche triviale si on travaille dans le bon domaine de représentation
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 31 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 32 / 37
Machine Learning pour les séries temporelles Machine Learning pour les séries temporelles
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 33 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 34 / 37
3. Machine Learning pour les séries temporelles ◮ Focus sur les tâches cachées : comprendre, modéliser, améliorer et extraire
◮ Algorithmes de ML interprétables et reproductibles : boı̂tes blanches
4. Plan du cours ◮ Méthodes permettant de créer des ponts entre les data scientists et les experts
métier
◮ Toutes ces méthodes permettent ensuite de résoudre facilement toutes les
tâches classiques en ML : prédiction, classification, partitionnement…
Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 35 / 37 Laurent Oudre IA&ML pour la modélisation de séries temporelles et de signaux 2020-2021 36 / 37
Plan du cours
Plan du cours