Académique Documents
Professionnel Documents
Culture Documents
Sous le thème :
Réalisé par :
M. FAQIHI Mohammed
Encadrant :
M. Laurent Barthès
1
Liste des figures
2
Introduction générale
Dans le cadre d’une stratégie énergétique bien réfléchie, et pour le souci d’un
développement durable, on accorde de plus en plus une importance à la connaissance de l’état
de l’atmosphère. Ce dernier peut s’exprimer par diverses grandeurs physiques, telles que la
température, l’humidité de l’air, le vent, la pression, le rayonnement solaire et les précipitations.
Ces grandeurs sont mesurées à l’aide d’instruments météorologiques dont on cherche
constamment à améliorer les performances.
Aujourd’hui les systèmes de mesures très sophistiqués sont mis au point. Ils peuvent
assurer l’acquisition et l’archivage de ces grandeurs météorologiques. Toutefois, il est
important de noter qu’une bonne connaissance du phénomène dépend à la fois d’une
observation de qualité et aussi du traitement effectué sur les données acquises.
En effet, beaucoup de méthodes de traitement peuvent être utilisées, pour répondre aux
besoins exigés. Le recours à l’utilisation des réseaux de neurones pour la modélisation et la
prévision des données météorologiques s’avère intéressant. A cet effet, on s’intéressera en guise
d’application, à l’estimation quantitative des précipitations via un radar météorologique en
utilisant les réseaux de neurones. L’idée est donc de construire un modèle neuronal de prévision
des précipitations contribuant ainsi à la connaissance du climat.
L’idée des méthodes d’apprentissage profond (deep learning) comme étant une
technique de traitement de l’information, se traduit par des réseaux de neurones constitué de
plusieurs couches cachées ce qui se traduit par un grand nombre de paramètres d’apprentissage,
permettant ainsi de résoudre des problèmes complexes dans la nature. Diverses applications
portant sur ces méthodes d’apprentissage profond, furent développées au cours de ces dernières
années : Les voitures autonome, la reconnaissance faciale, la traduction automatique, ainsi que
plusieurs autres applications.
C’est dans cette optique que s’inscrit la présente étude, il s’agit en effet de faire la
prédiction des taux de précipitation à partir d’observations issues de données radars
météorologiques, en utilisant des méthodes d’apprentissage profond.
Pour mieux illustrer ces aspects, le présent rapport, est subdivisé selon le plan suivant
3
Chapitre 1. Présentation du laboratoire
Le laboratoire est basé sur deux sites : Paris, Guyancourt. Ce stage a été
effectué sur le site de Guyancourt.
4
1.2 Organisation du laboratoire :
5
Les études portent sur ce qui se passe depuis la goutte ou le cristal de glace
(microphysique) jusqu’aux très grandes structures synoptiques.
Dans ce cadre très vaste, l’une des spécificités de l’équipe SPACE repose sur
l’interaction multidisciplinaire qui favorise la synergie entre développement
instrumental, développement de modèles statistiques, modélisation numérique et
études de processus
Les axes de recherche principaux de l’équipe SPACE sont, de façon
interdépendante, relatifs aux processus associés au Cycle de l'Eau (précipitations,
nuages, vapeur d’eau, interactions entre dynamique et microphysique,
météorologie) et à la variabilité des Climats Régionaux .
Ce stage se situe dans le cadre des activités de recherche lié au cycle de l’eau
au sein du département SPACE. Ce projet, parmi d’autres, est lié au thème de la
modélisation statistique et traitement d’images. Parmi les sujets entrepris lié au
thème, on retrouve :
• Classification non supervisée d’évènements précipitants,
• Inversion des données de télédétection par réseaux de neurones
artificielle ;
• Caractérisation de la neige en plaine à partir d'images géolocalisées,
par des méthodes d’apprentissage profond.
Ce stage a pour objectif d’améliorer la prédiction des taux de précipitation
au sol à partir des données radars.
6
Chapitre 2. Présentation du contexte d’étude
Figure 2.1.1 : Schéma illustrant le principe de fonctionnement d’un radar météorologique [2]
7
valeurs caractérisant la cible tel que le taux de pluie et le type d’hydrométéore
(pluie, neige, glace).
𝑃𝑟 𝑑 2
𝑍 =
𝐶𝐿²
Tableau 2.1.1 : valeurs typiques de réflectivité radar (dBZ) observées pour différentes cibles. [3]
𝑍 = 𝑎𝑅 𝑏
8
2.1.1.1 Les radars polarimétriques :
Tableau 2.1.1 : Schéma illustrant le principe du radar polarimétrique, Source : NOAA (National Weather
Service)
9
2.1.1.2 Les erreurs liées aux radars
Si les données radars sont très utiles pour de nombreuses applications, elles
peuvent néanmoins être contaminées par différentes sources d’erreurs, qui doivent
être prises en compte. Par exemple, la réflectivité radar peut être affectée par :
2.1.2 Le pluviomètre
10
Le pluviomètre à auget basculeur (Figure 2.1.4) contient un collecteur, en
forme d’entonnoir, qui draine l’eau captée vers un réceptacle. Il est constitué
principalement de trois parties :
● 1 - la réflectivité Z à l’instant t ;
● 2 - la réflectivité différentielle 𝑍𝐷𝑅 à l’instant t ;
● 3 - le coefficient de corrélation 𝜌ℎ𝑣 à l’instant t ;
● 4 - La réflectivité Z à l’instant t+5 min ;
● 5 - Les données de pluviomètres.
Une série de traitement a été appliquée sur les données avant de les
exploiter. Principalement :
11
Nous nous retrouvons finalement avec une base de 72885 images de 128x128
pixels, et 5 canaux. Ceci correspond à des mesures effectuées entre le 1-11-2016 et
le 30-10-2017 avec un pas de temps de 5 minutes. La figure 2.2.1 fournit un
exemple de cartes radars en présence de précipitations.
(a) (b)
(c)
Figure 2.2.1 : Observations polarimétriques par le radar de Trappes le 27/02/2017 ; (a) mesure de la réflectivité en dBZ ; (b)
mesure du coefficient de corrélation ; (c) mesure de la réflectivité différentielle en dBZ
Un problème qu’on retrouve dans notre base : c’est la faible représentativité des données
des pluviomètres sur la carte. Les pluviomètres sont des équipements qui réalise des mesures
sur le terrain. Vu l’impossibilité d’installer ces équipements partout dans le terrain, sur chaque
point de la carte. Contrairement aux mesures radars, qui balaye la totalité d’une zone de
l’espace.
12
pluviomètres installés sur le terrain. Un taux correspondant à 0.02%. Ce manque de données
compliquera alors, la tache de prédiction pour l’algorithme.
Figure 2.2.2 : Illustration du faible nombre de pluviomètres existant en comparaison avec les mesures radar
13
les informations de caractéristiques géographiques et spatiales à travers une
séquence de convolutions et concaténations ascendantes avec des fonctionnalités
haute résolution issues de la voie contractante. La figure 2.3.1 présente
l’architecture typique d’un U-net.
Dans notre étude nous allons employer un modèle U-net avec 4 couches
d’entrées de taille 64x64 et une sortie de 64x64 (figure 2.3.2). La taille des images
a été réduite à l’entrée en faisant un découpage aléatoire correspondant.
14
Chapitre 3. Apprentissage et résultats
Un problème qu’on retrouve dans nos données, est que les mesures des
pluviomètres n’existent pas sur toute la carte. Afin que notre modèle n’apprenne
pas les emplacements des pluviomètres, nous avons effectué des modifications
sur les données :
Comme décrit précédemment, nous avons utilisé le modèle Unet pour cet
apprentissage, avec un optimiseur Adam. La fonction de cout utilisé sera l’erreur
quadratique moyenne (RMSE) :
𝑚 𝑛
1
RMSE = √ ∑ ∑( 𝑌𝑖𝑗 − Ŷ 𝑖𝑗 )²
𝑚𝑛
𝑖=1 𝑗=1
15
Avec m et n la hauteur et la largeur de l’image.
𝑥 − min (𝑋)
𝑦=
max(𝑋) − min (𝑋)
Les valeurs minimales et maximale ont été fixé pour chaque variables :
Nous avons utilisé pour notre apprentissage une carte graphique Nvidia
Geforce RTX 2080 Ti, avec une mémoire de 11 GB. Avec un batch de taille 256 pour
l’apprentissage et la validation, nous avons fait notre apprentissage sur 500
epochs.
16
Figure 3.1.1 : courbe d'apprentissage et de validation su modèle de base
(a) (b)
B
Figure 3.1.2 : la réflectivité d’un élément de test(a) et son image à la sortie du modèle de base (b)
17
on ne peut pas de faire une évaluation du modèle sur tous les pixels. Ce qu’on peut
faire alors est de comparer les valeurs calculées par le model sur les pixels des
pluviomètres, et les valeurs leur valeurs réels.
Figure 3.1.3 : Tracé des valeurs de taux de pluie prédites par le modèle en fonction de celle mesurés par les pluviomètres
En conclusion de cette partie, malgré que notre modèle donne en sortie des
distributions de précipitations qui semble suivre l’allure de la réflectivité, mais le
tracé des valeurs du taux de pluie prédit en fonction des valeurs réels sur le terrain
nous permet de dire que le modèle calcule des valeurs qui sont loin des mesures
sur le terrain.
18
Chapitre 4. Compréhension du comportement
du système
4.1 Introduction :
Pour mieux comprendre le comportement du système, et afin de développer
les performances de notre modèle, nous allons essayer de simuler notre système et
y appliquer des modifications pour qu’il soit le plus proche du système réel. Pour
ce faire, nous allons effectuer les étapes suivantes :
Dans cette partie nous allons entrainer notre modèle sur les mesures de taux
de pluies simulés par la relation Z-R de Marshall Palmer. Rappelons qu’à partir de
cette relation, on peut calculer le taux de pluie en connaissant les mesures de la
réflectivité.
𝑍 = 200𝑅1.6
19
Les mesures des pluviomètres sont recueillies tous les 5min (unité de R des
pluviomètres est mm/5min), et la valeur de R calculé à partir de la loi Z-R est
exprimé par mm/h. Ceci implique une normalisation des valeurs simulées par la
loi Z-R de Marshall Palmer, en faisant une division par une constante C égale à
12.
1ℎ 60 𝑚𝑖𝑛
𝐶= = = 12
5𝑚𝑖𝑛 5 𝑚𝑖𝑛
Le modèle utilisé pour cette tache reste inchangé : un Unet avec la RMSE
comme fonction de cout. Pour la normalisation, en plus de celle cités dans le
paragraphe précédent, nous appliquerons une normalisation min/max sur les
données à l’entrée, les valeurs minimales et maximales sont celles décrite dans la
section 3.1.1.
20
Figure 4.2.2 : méthode de constitution de la cible MP_where_pl
Sur le même système de calcul, nous avons effectué les deux apprentissages
sur 500 epochs, avec le même jeu de données : 72885 images (58308 images pour
entrainement, et 14577 images pour validation)
21
La figure 4.2.4 montre l’évolution de l’erreur quadratique moyenne sur les
données d’apprentissage et de validation, pour le modèle « MP_where_pl ». On
remarque que la courbe d’entrainement n’a pas encore convergé au bout de 500
epochs. Mais l’erreur à ce niveau a atteint une valeur de l’ordre de 0.11mm/h, ce
qui reste faible en comparaison avec l’erreur atteinte au niveau de l’apprentissage
de base. En plus de ça on a des contraintes dans le temps d’apprentissage qui
atteint 24h pour un seul apprentissage de 400 epochs, on s’est alors contenté de ce
modèle et on a observé ses résultats.
22
(a) (b)
(c) (d)
23
(a) (b)
24
Pour évaluer notre modèle, nous allons générer aléatoirement les
emplacements des pluviomètres, le nombre d’emplacements à générer sera fixe
pour chaque apprentissage :
Le modèle utilisé pour cette tache reste inchangé pour tous les
apprentissages : un Unet avec la RMSE comme fonction de cout. Pour la
normalisation, nous appliquerons une normalisation min/max sur les données à
l’entrée, les valeurs minimales et maximales sont celles décrite dans la section
3.1.1.
25
4.3.2 Résultats d’apprentissage
La figure 4.3.2 montre l’évolution de l’erreur quadratique moyenne sur les données
d’apprentissage et de validation, durant l’apprentissage. On note sur le tracé qu’il
y a une superposition des courbes de l’erreur d’apprentissage en fonction du
pourcentage des pluviomètres sur la carte : moins on met de pluviomètres dans la
cible, plus l’erreur est plus importante. L’erreur entre les courbes est claire pour
les apprentissages correspondants à un taux de pluviomètres égal à 0.07% de la
carte ou celui de 0.24% de la carte. Mais à partir d’un taux de pluviomètres
supérieur à 1.44% de la carte, la différence entre les courbes devient moins
voyante. Cette superposition des courbes est observable aussi sur le tracé de
l’erreur de validation, même si la différence est réduite cette fois ci.
Figure 4.3.2 : courbes d'entrainement des réseaux correspondant à différents nombres de pluviomètres
générés sur tous les epochs
26
Figure 4.3.3 : courbes d'entrainement des réseaux correspondant à différents nombres de pluviomètres
générés à partir de la 40ème epoch
Figure 4.3.4 : courbes de validation des réseaux correspondant à différents nombres de pluviomètres
générés à partir de la 4ème epoch
27
d’atteindre une certaine valeur de l’erreur quadratique, et ceci pour plusieurs
valeurs de l’erreur.
Figure 4.3.5 : évolution du nombre d'epoch nécessaire pour atteindre une certaine valeur de l'erreur
Afin de tester notre modèle, nous avons introduit un élément de notre base
de test dans les différents modèles présentés, et nous avons observé sa sortie. Sur
la figure 4.3.6 on retrouve : (a)(1) la réflectivité de l’image test, (a)(2) le taux de
pluie calculé par Marshall Palmer, (b)(1) la sortie calculée par le modèle_0.07,
(b)(2) la différence en valeur absolue en la sortie du modèle_0.07 et la sortie
désiré((a)(2)), (c)(1) la sortie calculée par le modèle_0.24, (c)(2) la différence en
valeur absolue en la sortie du modèle_0.24 et la sortie désiré((a)(2)), (d)(1) la sortie
calculée par le modèle_24.4, (d)(2) la différence en valeur absolue entre la sortie du
modèle_24.4 et la sortie désiré((a)(2)).
28
(a)(1) (a)(2)
(b)(1) (b)(2)
(c)(1) (c)(2)
29
(d)(1) (d)(2)
Figure 4.3.6 : tracé de la sortie de nos modèles ainsi que la différence entre la sortie désiré et la sortie réelle
30
Conclusion générale
On s’est appuyé dans notre étude sur les données de précipitations dans la
région parisienne. Notre base de données est construite des mesures recueillies par
la station météorologique de Trappes (mesures radar).
Malgré les études effectuées durant le stage, nous ne sommes pas pour
l’instant arrivé à bien comprendre le système. Il reste encore plusieurs aspects à
étudier :
31
• Etude du bruit des échos fixes : les échos relevant des montagnes et des
bâtiment fixes.
32
Bibliographie
[1] https://www.latmos.ipsl.fr/
[2] https://en.wikipedia.org/wiki/Weather_radar#/media/File:Radar-hauteur-en.svg)
[4] Marshall, J. S. and W. M. K. Palmer, 1948: The distribution of raindrops with size.
Journal of Meteorology, 5 (4), 165–166
[5] Kamra N. Preiss J. Predicting Rainfall with Polarimetric Radar Data (URL :
http://www-scf.usc.edu/~nkamra/pdf/rain.pdf)
[6] Ronneberger O., Fischer P., Brox T. (2015) U-Net: Convolutional Networks for
Biomedical Image Segmentation. arXiv:1505.04597v1 [cs.CV]
33