Vous êtes sur la page 1sur 35

Université de Versailles saint Quentin en yvelines

Master : Traitement de l’information et exploitation des données

Rapport de stage de fin d’études

Sous le thème :

Utilisation des méthodes d’apprentissage profond pour


l’estimation quantitative des précipitations
météorologiques

Réalisé par :

M. FAQIHI Mohammed

Encadrant :

M. Laurent Barthès

Stage réalisé du 01/09/2020 à 18/12/2020

Année universitaire : 2019-2020


Table des matières

INTRODUCTION GENERALE ......................................................................................................... 3


CHAPITRE 1. PRESENTATION DU LABORATOIRE .............................................................. 4
1.1 INTRODUCTION AU LABORATOIRE ............................................................................................ 4
1.2 ORGANISATION DU LABORATOIRE : .......................................................................................... 5
1.3 DEPARTEMENT SPACE : ........................................................................................................... 5
1.3.1 Présentation du département : ........................................................................................... 5
1.3.2 Présentation du projet : ...................................................................................................... 6
CHAPITRE 2. PRESENTATION DU CONTEXTE D’ETUDE ................................................... 7
2.1 SYSTEME DE MESURES : ........................................................................................................... 7
2.1.1 Le radar météorologique .................................................................................................... 7
2.1.2 Le pluviomètre .................................................................................................................. 10
2.2 CONSTITUTION DE LA BASE DE DONNEES :............................................................................. 11
2.3 PRESENTATION DU MODELE D’APPRENTISSAGE : ................................................................... 13
CHAPITRE 3. APPRENTISSAGE ET RESULTATS ................................................................. 15
3.1 L’APPRENTISSAGE DE BASE : .................................................................................................. 15
3.1.1 Description de la méthode : .............................................................................................. 15
3.1.2 Résultats de l’apprentissage ............................................................................................. 16
3.1.3 Résultats du test du modèle ............................................................................................. 17

CHAPITRE 4. COMPREHENSION DU COMPORTEMENT DU SYSTEME ....................... 19


4.1 INTRODUCTION : .................................................................................................................... 19
4.2 APPRENTISSAGE MARSHALL PALMER .................................................................................... 19
4.2.1 Description des méthodes : ............................................................................................... 19
4.2.2 Résultats de l’apprentissage ............................................................................................. 21
4.2.3 Test du modèle .................................................................................................................. 22
4.3 APPRENTISSAGE MARSHALL PALMER AVEC DES PLUVIOMETRES GENERES ALEATOIREMENT 24
4.3.1 Description des méthodes ................................................................................................. 24
4.3.2 Résultats d’apprentissage ................................................................................................ 26
4.3.3 Résultats du test : ............................................................................................................. 28
CONCLUSION GENERALE ............................................................................................................ 31

1
Liste des figures

FIGURE 1.2.1 : ORGANISATION DU LABORATOIRE ............................................................................................ 5


FIGURE 2.1.1 : SCHEMA ILLUSTRANT LE PRINCIPE DE FONCTIONNEMENT D’UN RADAR
METEOROLOGIQUE [2] ................................................................................................................................. 7
FIGURE 2.2.1 : OBSERVATIONS POLARIMETRIQUES PAR LE RADAR DE TRAPPES LE 27/02/2017 ; (A) MESURE DE LA
REFLECTIVITE EN DBZ ; (B) MESURE DU COEFFICIENT DE CORRELATION ; (C) MESURE DE LA REFLECTIVITE
DIFFERENTIELLE EN DBZ............................................................................................................................... 12
FIGURE 2.2.2 : ILLUSTRATION DU FAIBLE NOMBRE DE PLUVIOMETRES EXISTANT EN COMPARAISON AVEC
LES MESURES RADAR ................................................................................................................................. 13
FIGURE 2.3.1 : ARCHITECTURE U-NET ............................................................................................................ 14
FIGURE 2.3.2 : ILLUSTRATION DU MODELE D'APPRENTISSAGE ..................................................................... 14
FIGURE 3.1.1 : COURBE D'APPRENTISSAGE ET DE VALIDATION SU MODELE DE BASE ................................ 17
FIGURE 3.1.2 : LA REFLECTIVITE D’UN ELEMENT DE TEST(A) ET SON IMAGE A LA SORTIE DU MODELE DE
BASE (B) ....................................................................................................................................................... 17
FIGURE 3.1.3 : TRACE DES VALEURS DE TAUX DE PLUIE PREDITES PAR LE MODELE EN FONCTION DE CELLE
MESURES PAR LES PLUVIOMETRES ................................................................................................................. 18
FIGURE 4.2.1 : METHODE DE LA CONSTITUTION DE LA CIBLE MP_ALL_MAP ............................................. 20
FIGURE 4.2.2 : METHODE DE CONSTITUTION DE LA CIBLE MP_WHERE_PL ................................................ 21
FIGURE 4.2.3 : ERREUR D'APPRENTISSAGE ET DE VALIDATION DU MODELE « MP_ALL_MAP » ................. 21
FIGURE 4.2.4 : ERREUR D'APPRENTISSAGE ET DE VALIDATION DU MODELE « MP_WHERE_PL ».............. 22
FIGURE 4.2.5 : EVALUATION DU MODEL « MP_ALL_MAP » SUR UNE IMAGE ................................................ 23
FIGURE 4.2.6 : IMAGE TEST SUR LE MODELE MP_WHERE_PL ....................................................................... 24
FIGURE 4.3.1 : ILLUSTATION DU PROCESSUS DE CONSTRUCTION DE LA CIBLE........................................... 25
FIGURE 4.3.2 : COURBES D'ENTRAINEMENT DES RESEAUX CORRESPONDANT A DIFFERENTS NOMBRES DE
PLUVIOMETRES GENERES SUR TOUS LES EPOCHS .................................................................................. 26
FIGURE 4.3.3 : COURBES D'ENTRAINEMENT DES RESEAUX CORRESPONDANT A DIFFERENTS NOMBRES DE
PLUVIOMETRES GENERES A PARTIR DE LA 40EME EPOCH ..................................................................... 27
FIGURE 4.3.4 : COURBES DE VALIDATION DES RESEAUX CORRESPONDANT A DIFFERENTS NOMBRES DE
PLUVIOMETRES GENERES A PARTIR DE LA 4EME EPOCH ....................................................................... 27
FIGURE 4.3.5 : EVOLUTION DU NOMBRE D'EPOCH NECESSAIRE POUR ATTEINDRE UNE CERTAINE VALEUR
DE L'ERREUR ............................................................................................................................................... 28
FIGURE 4.3.6 : TRACE DE LA SORTIE DE NOS MODELES AINSI QUE LA DIFFERENCE ENTRE LA SORTIE
DESIRE ET LA SORTIE REELLE ................................................................................................................... 30

2
Introduction générale

Dans le cadre d’une stratégie énergétique bien réfléchie, et pour le souci d’un
développement durable, on accorde de plus en plus une importance à la connaissance de l’état
de l’atmosphère. Ce dernier peut s’exprimer par diverses grandeurs physiques, telles que la
température, l’humidité de l’air, le vent, la pression, le rayonnement solaire et les précipitations.
Ces grandeurs sont mesurées à l’aide d’instruments météorologiques dont on cherche
constamment à améliorer les performances.

Aujourd’hui les systèmes de mesures très sophistiqués sont mis au point. Ils peuvent
assurer l’acquisition et l’archivage de ces grandeurs météorologiques. Toutefois, il est
important de noter qu’une bonne connaissance du phénomène dépend à la fois d’une
observation de qualité et aussi du traitement effectué sur les données acquises.

En effet, beaucoup de méthodes de traitement peuvent être utilisées, pour répondre aux
besoins exigés. Le recours à l’utilisation des réseaux de neurones pour la modélisation et la
prévision des données météorologiques s’avère intéressant. A cet effet, on s’intéressera en guise
d’application, à l’estimation quantitative des précipitations via un radar météorologique en
utilisant les réseaux de neurones. L’idée est donc de construire un modèle neuronal de prévision
des précipitations contribuant ainsi à la connaissance du climat.

L’idée des méthodes d’apprentissage profond (deep learning) comme étant une
technique de traitement de l’information, se traduit par des réseaux de neurones constitué de
plusieurs couches cachées ce qui se traduit par un grand nombre de paramètres d’apprentissage,
permettant ainsi de résoudre des problèmes complexes dans la nature. Diverses applications
portant sur ces méthodes d’apprentissage profond, furent développées au cours de ces dernières
années : Les voitures autonome, la reconnaissance faciale, la traduction automatique, ainsi que
plusieurs autres applications.

C’est dans cette optique que s’inscrit la présente étude, il s’agit en effet de faire la
prédiction des taux de précipitation à partir d’observations issues de données radars
météorologiques, en utilisant des méthodes d’apprentissage profond.

Pour mieux illustrer ces aspects, le présent rapport, est subdivisé selon le plan suivant

• Le premier chapitre, présentera le contexte général du projet à savoir l’organisme


d’accueil, et la mise en situation du sujet.
• Le deuxième chapitre, présentera des généralités sur les systèmes de mesures, ainsi que
la constitution de la base de données
• Au chapitre trois, on présentera les résultats du modèle entrainé sur les données réelles
• En quatrième partie on essayera de pousser notre étude afin de mieux comprendre le
système en globalité, et pouvoir améliorer les résultats

3
Chapitre 1. Présentation du laboratoire

1.1 Introduction au laboratoire

Le Laboratoire Atmosphères, Observations Spatiales (LATMOS) est une


unité de recherche mixte spécialisée dans l'étude des processus physico-chimiques
fondamentaux qui régissent les atmosphères terrestre et planétaires et leurs
interfaces avec la surface, l’océan, et le milieu interplanétaire. Cette unité de
recherche relève de :

• Le centre national de recherche scientifique (CNRS)


• L’Université de Versailles Saint Quentin en Yvelines (UVSQ)
• La Sorbonne université à paris

Le laboratoire a été créé en 2009 suite à une fusion entre le service


d’Aéronomie et d’une partie du CETP. Il fait partie de l’institut Pierre Simon
Laplace (IPSL) regroupant 9 laboratoires qui se spécialise dans la recherche
concernant l’environnement global domaine qui s'étend de la surface au Soleil sur
Terre et les autres planètes du système solaire.

Le laboratoire est basé sur deux sites : Paris, Guyancourt. Ce stage a été
effectué sur le site de Guyancourt.

Les principaux thèmes de recherche du laboratoire sont :

• Les processus physiques et chimiques dans l'atmosphère Terrestre (depuis


la basse atmosphère, jusqu'à la stratosphère et la mésosphère) et les
échanges entre l'atmosphère et la surface terrestre (océan/continents);
• L'étude des planètes et petits corps du système solaire (atmosphères,
surfaces, sub-surfaces) ;
• La physique de l'héliosphère, de l'exosphère des planètes, et des plasmas du
système solaire.

4
1.2 Organisation du laboratoire :

L’organisation du laboratoire est faite comme suit :

Figure 1.2.1 : Organisation du laboratoire

Les départements scientifiques du laboratoire sont :

• HEPPI : Héliosphère, Exosphères Planétaires, Plasmas et Interfaces


• IMPEC : Instrumentation ; Modélisation en Planétologie, Exobiologie
et Comètes
• STARTO : Stratosphère, Haute Troposphère et Interfaces
• SPACE : Statistique, Processus, Aérosols, Cycle de l'eau. Ce stage se
situe dans le cadre d’un projet porté par l’équipe du département SPACE.
• TROPO : Troposphère : pollution et climat

1.3 Département Space :

1.3.1 Présentation du département :


L’équipe SPACE a pour objectifs principaux : la compréhension et la
modélisation du cycle de l’eau dans l’atmosphère à différentes échelles spatiales et
temporelles.

5
Les études portent sur ce qui se passe depuis la goutte ou le cristal de glace
(microphysique) jusqu’aux très grandes structures synoptiques.
Dans ce cadre très vaste, l’une des spécificités de l’équipe SPACE repose sur
l’interaction multidisciplinaire qui favorise la synergie entre développement
instrumental, développement de modèles statistiques, modélisation numérique et
études de processus
Les axes de recherche principaux de l’équipe SPACE sont, de façon
interdépendante, relatifs aux processus associés au Cycle de l'Eau (précipitations,
nuages, vapeur d’eau, interactions entre dynamique et microphysique,
météorologie) et à la variabilité des Climats Régionaux .

1.3.2 Présentation du projet :

Ce stage se situe dans le cadre des activités de recherche lié au cycle de l’eau
au sein du département SPACE. Ce projet, parmi d’autres, est lié au thème de la
modélisation statistique et traitement d’images. Parmi les sujets entrepris lié au
thème, on retrouve :
• Classification non supervisée d’évènements précipitants,
• Inversion des données de télédétection par réseaux de neurones
artificielle ;
• Caractérisation de la neige en plaine à partir d'images géolocalisées,
par des méthodes d’apprentissage profond.
Ce stage a pour objectif d’améliorer la prédiction des taux de précipitation
au sol à partir des données radars.

6
Chapitre 2. Présentation du contexte d’étude

2.1 Système de mesures :

2.1.1 Le radar météorologique

Le radar météorologique est un instrument de détection et de mesure des


précipitations, dont le principe est d’émettre des ondes électromagnétiques dans
une direction donnée par son antenne, et de recevoir les échos dus à la réflexion
sur les gouttes de pluie de l’onde électromagnétique. L’essentiel de la puissance
émise est concentré dans un angle solide d’environ un degré, qui constitue
l’ouverture du faisceau (Figure 1). Lorsque le rayonnement émis atteint une cible
(hydrométéore), une partie du signal est absorbée, une autre est rétrodiffusée dans
la direction du radar, une autre est transmise dans la direction initiale (et donc
atténuée), et le reste est diffusé dans les autres directions.

Figure 2.1.1 : Schéma illustrant le principe de fonctionnement d’un radar météorologique [2]

Les intensités de ces rayonnements, en particulier l’intensité du signal


rétrodiffusé, permettent, dans les applications météorologiques, de déduire des

7
valeurs caractérisant la cible tel que le taux de pluie et le type d’hydrométéore
(pluie, neige, glace).

Pour une cible constituée de gouttes de pluie, à partir de la puissance reçue


Pr des ondes rétrodiffusées on estime un facteur de réflectivité radar Z (en
𝑚𝑚6 𝑚−3), qui caractérise la capacité de la cible à renvoyer une partie du
rayonnement incident. Cette estimation est réalisée à partir d'une expression
simplifiée découlant de l'équation du radar :

𝑃𝑟 𝑑 2
𝑍 =
𝐶𝐿²

Où d est la distance au radar, L² est un facteur d’atténuation fonction de la


distance au radar, et C est une constante qui dépend des caractéristiques du
radar : longueur d’onde, gain de l’antenne, largeur d’impulsion, ouverture du
faisceau, puissance émise.

Comme la réflectivité prend des valeurs sur plusieurs ordres de grandeur,


on l’exprime en 𝑍𝑑𝑏 = 10𝑙𝑜𝑔 (𝑍), avec Z en 𝑚𝑚6 𝑚−3. Le tableau 1 fournie les
grandeurs de la réflectivité en fonction du type de précipitation.

Tableau 2.1.1 : valeurs typiques de réflectivité radar (dBZ) observées pour différentes cibles. [3]

Les intensités de précipitation sont déduites du facteur de réflectivité par


une relation semi-empiriques de type :

𝑍 = 𝑎𝑅 𝑏

Où a et b dépendent de la distribution des hydrométéores présents dans le


volume observé. Généralement on prend a = 200 et b = 1.6 (Marshall and Palmer
,1948)[4].

8
2.1.1.1 Les radars polarimétriques :

Les radars polarimétriques émettent en particulier un rayonnement


électromagnétique de polarisation horizontale et verticale (Figure 2.1.3). Cela
permet d’estimer, à travers différentes mesures sur l’intensité en polarisation
verticale et horizontal, des informations sur la taille, la forme, et la densité de la
cible. Les principales variables, en plus de la réflectivité, mesurées par les radars
polarimétriques sont [5]:

● Réflectivité différentielle (𝑍𝐷𝑅 en dBZ) : Rapport des puissances


horizontale et verticale réfléchies. C'est un bon indicateur de la forme
de la goutte et donc de la taille moyenne des gouttes.
● Coefficient de corrélation (𝜌ℎ𝑣 sans unité) : Corrélation entre les
puissances horizontales et verticaux réfléchies. C'est un bon
indicateur des régions où il y a un mélange de types de précipitations,
par ex. pluie et neige
● La phase différentielle (𝜑𝑑𝑝 en °) : la différence de rotation de phase sur la
totalité du trajet aller-retour, des ondes émises sur les voies horizontale et
verticale.
La phase différentielle spécifique (𝐾𝑑𝑝 en °/km) : C’est la dérivée radiale de 𝜑𝑑𝑝 .
C'est un bon estimateur du taux de pluie.

Tableau 2.1.1 : Schéma illustrant le principe du radar polarimétrique, Source : NOAA (National Weather
Service)

9
2.1.1.2 Les erreurs liées aux radars

Si les données radars sont très utiles pour de nombreuses applications, elles
peuvent néanmoins être contaminées par différentes sources d’erreurs, qui doivent
être prises en compte. Par exemple, la réflectivité radar peut être affectée par :

● Des erreurs de calibrage : un radar est un instrument de mesure complexe.


Afin d’obtenir une mesure de réflectivité fiable, il est nécessaire de bien le
calibrer. Différentes techniques de calibrage peuvent être utilisées, telles
que l’étalonnage électronique, les comparaisons radar-radar, ou les
comparaisons de long terme avec les pluviomètres.
● Les échos fixes : liés à l’interception par le faisceau radar de cibles non
météorologiques fixes, de nature topographique (montagnes) ou
anthropique (pylône électrique, une tour, …).
● Les échos non météorologiques : avions, oiseaux, insectes, ou échos de mer
par exemple. Les variables polarimétriques et en particulier le coefficient
de corrélation sont très utiles pour identifier ces variables.
● Les masques : lorsque que le faisceau radar intercepte une montagne ou
un immeuble, une partie de l’énergie transmise est arrêtée par l’obstacle et
engendre une sous-estimation de la réflectivité radar derrière cet obstacle.
● L’atténuation par les précipitations : l’atténuation par les fortes pluies
dépend de la longueur de l’onde du radar. Plus la longueur d’onde est
petite, plus le signal est atténué.

2.1.2 Le pluviomètre

Le pluviomètre est un instrument météorologique destiné à mesurer la


quantité de précipitations (surtout la pluie) tombée pendant un intervalle de
temps donné en un endroit donné. Il existe plusieurs types de pluviomètres, celui
utilisé dans notre cas est un pluviomètre à auget basculeurs.

Tableau 2.1.2 : schéma illustrant le principe du pluviomètre à auget basculeur

10
Le pluviomètre à auget basculeur (Figure 2.1.4) contient un collecteur, en
forme d’entonnoir, qui draine l’eau captée vers un réceptacle. Il est constitué
principalement de trois parties :

● Un collecteur en forme d’entonnoir, qui draine l’eau captée vers un


réceptacle.
● Un compteur qui possède deux petits récipients (les augets) identiques
accolés pouvant tourner autour d’un axe horizontal. L’eau provenant du
cône de réception s’écoule dans l’un d’eux. Lorsqu’il est plein, le système
bascule par suite du déplacement de son centre de gravité, assurant la
vidange du premier auget et le positionnement du second sous l’orifice du
cône.

Sachant le volume des augets, le nombre de basculement permet de calculer


le taux de pluie. Ce type de mesure entraine toutefois une erreur de quantification
liée au volume des augets. Cette erreur est d’autant plus faible que le volume des
augets est petit et/ l’intensité de pluie forte.

2.2 Constitution de la base de données :


Notre base de données est constituée des mesures radar de la station
météorologique de Trappes à la résolution de 1x1 km2, et des données des
pluviomètres situés dans la région pour l’année 2017. Nous disposons alors des
mesures de :

● 1 - la réflectivité Z à l’instant t ;
● 2 - la réflectivité différentielle 𝑍𝐷𝑅 à l’instant t ;
● 3 - le coefficient de corrélation 𝜌ℎ𝑣 à l’instant t ;
● 4 - La réflectivité Z à l’instant t+5 min ;
● 5 - Les données de pluviomètres.

Une série de traitement a été appliquée sur les données avant de les
exploiter. Principalement :

● Projection sur le plan cartésien : vu que les mesures radars sont


représentées initialement en coordonnées polaires, nous avons fait alors une
projection sur le plan cartésien selon une grille régulière.
● Sélection de la zone d’étude : pour chaque élément de la base, nous avons
sélectionné une zone de taille 128x128 pixels de telle façon qu’on remplit
deux conditions :
o Cette zone devra contenir au moins 3 pluviomètres ;
o Au moins un des pluviomètres de cette zone a une mesure non nulle.

11
Nous nous retrouvons finalement avec une base de 72885 images de 128x128
pixels, et 5 canaux. Ceci correspond à des mesures effectuées entre le 1-11-2016 et
le 30-10-2017 avec un pas de temps de 5 minutes. La figure 2.2.1 fournit un
exemple de cartes radars en présence de précipitations.

(a) (b)

(c)

Figure 2.2.1 : Observations polarimétriques par le radar de Trappes le 27/02/2017 ; (a) mesure de la réflectivité en dBZ ; (b)
mesure du coefficient de corrélation ; (c) mesure de la réflectivité différentielle en dBZ

Un problème qu’on retrouve dans notre base : c’est la faible représentativité des données
des pluviomètres sur la carte. Les pluviomètres sont des équipements qui réalise des mesures
sur le terrain. Vu l’impossibilité d’installer ces équipements partout dans le terrain, sur chaque
point de la carte. Contrairement aux mesures radars, qui balaye la totalité d’une zone de
l’espace.

Pour illustrer ce déficit du nombre de pluviomètres en comparaison avec les mesures


radars, nous avons afficher sur la figure 2.2.2, pour une carte de réflectivité d’une zone,
d’espace, le nombre pluviomètres existant sur le terrain. On remarque que pour une image radar
de 128x128 pixels, ce qui correspond à un total de 16384 mesures de réflectivité, on n’a que 4

12
pluviomètres installés sur le terrain. Un taux correspondant à 0.02%. Ce manque de données
compliquera alors, la tache de prédiction pour l’algorithme.

Figure 2.2.2 : Illustration du faible nombre de pluviomètres existant en comparaison avec les mesures radar

2.3 Présentation du modèle d’apprentissage :


Pour réaliser la tache de prédiction des taux de pluie à partir des données
radars polarimétriques nous avons choisi d’utiliser une architecture de type U-Net
[6]. U-Net est un réseau de neurones convolutionnel développé pour la
segmentation d'images biomédicales au département d'informatique de
l'université de Fribourg en Allemagne. Il a été décrit pour la première fois par Olaf
Ronneberger, Philipp Fischer et Thomas Brox dans le document "U-Net : Réseaux
convolutifs pour la segmentation d'image biomédicale". Le réseau est basé sur une
architecture entièrement convolutionnelle modifiée par ajout de connexion
supplémentaires (skip connexions). Les auteurs ont montré qu’une telle
architecture nécessitait un nombre réduit d’images pour entrainer le réseau et qu’il
permettait un rendu plus fidèle.

Le réseau se compose d'une partie contractante et une voie expansive, ce qui


lui confère une architecture en forme de « U » identique à une architecture du type
réseau autoencodeur. La partie contractante est un réseau de convolution typique
qui consiste en une application répétée de convolutions, chacune suivie d'une unité
linéaire rectifiée (ReLU) et d'une opération de « pooling » maximum. Durant la
phase de contraction, les informations spatiales sont réduites tandis que les
informations sur les caractéristiques sont augmentées. La voie expansive combine

13
les informations de caractéristiques géographiques et spatiales à travers une
séquence de convolutions et concaténations ascendantes avec des fonctionnalités
haute résolution issues de la voie contractante. La figure 2.3.1 présente
l’architecture typique d’un U-net.

Figure 2.3.1 : Architecture U-net

Dans notre étude nous allons employer un modèle U-net avec 4 couches
d’entrées de taille 64x64 et une sortie de 64x64 (figure 2.3.2). La taille des images
a été réduite à l’entrée en faisant un découpage aléatoire correspondant.

Figure 2.3.2 : illustration du modèle d'apprentissage

14
Chapitre 3. Apprentissage et résultats

3.1 L’apprentissage de base :

3.1.1 Description de la méthode :

Le but ultime de cette étude est de faire la prédiction des taux de


précipitation à partir des données radars. Pour ce faire, nous avons effectué un
apprentissage en prenant comme données d’entrée celles du radar, et en sortie les
mesures des pluviomètres.

Rappelons que notre base de données se compose de 72885 éléments,


chaque élément est composé de 4 images radar de taille 128x128, représentant
les mesures polarimétriques, et une carte de 128x128 pixels qui correspond aux
mesures des pluviomètres.

Un problème qu’on retrouve dans nos données, est que les mesures des
pluviomètres n’existent pas sur toute la carte. Afin que notre modèle n’apprenne
pas les emplacements des pluviomètres, nous avons effectué des modifications
sur les données :

• Découpage aléatoire : à partir des images initiales ; de taille


128x128, nous avons effectué un découpage aléatoire de taille
64x64.
• Rotation aléatoire : nous avons effectué des rotations aléatoires sur
les images après découpage.

Ces deux étapes permettront de changer les emplacements des


pluviomètres dans l’image, et ainsi on augmentera les chances d’avoir des
mesures pluviomètres qui balaye toute l’image.

Comme décrit précédemment, nous avons utilisé le modèle Unet pour cet
apprentissage, avec un optimiseur Adam. La fonction de cout utilisé sera l’erreur
quadratique moyenne (RMSE) :

𝑚 𝑛
1
RMSE = √ ∑ ∑( 𝑌𝑖𝑗 − Ŷ 𝑖𝑗 )²
𝑚𝑛
𝑖=1 𝑗=1

15
Avec m et n la hauteur et la largeur de l’image.

Pour la normalisation nous avons utilisé une normalisation min/max a été


utilisé :

𝑥 − min (𝑋)
𝑦=
max(𝑋) − min (𝑋)

Les valeurs minimales et maximale ont été fixé pour chaque variables :

• Pour la réflectivité : min(𝑋) = −9 et max(𝑋) = 70


• Pour la réflectivité différentielle : min(𝑋) = −2 et max(𝑋) = 4
• Pour le coefficient de corrélation : min(𝑋) = 0 et max(𝑋) = 1

Quant à la cible on a pris les mesures des pluviomètres sans effectuer de


normalisation.

Les données d’apprentissage de validation et de test sont prises comme suit :

• Données d’apprentissage : 80% de la base ce qui correspond à 58308


éléments ;
• Données de validation : 20% de la base ce qui correspond à 14577
éléments ;
• Données de test : on a pris les données de validation comme données
de tests.

Le partage des données d’apprentissage et de validation a été fait de manière


aléatoire.

Nous avons utilisé pour notre apprentissage une carte graphique Nvidia
Geforce RTX 2080 Ti, avec une mémoire de 11 GB. Avec un batch de taille 256 pour
l’apprentissage et la validation, nous avons fait notre apprentissage sur 500
epochs.

3.1.2 Résultats de l’apprentissage

La figure 3.1.1 montre l’évolution de l’erreur quadratique moyenne sur les


données d’apprentissage et de validation, durant l’apprentissage.

16
Figure 3.1.1 : courbe d'apprentissage et de validation su modèle de base

On remarque sur la figure qu’au bout de 250 epochs, la courbe


d’apprentissage commence à se stabiliser. L’erreur quadratique atteint une valeur
de 1.3 mm/h pour l’entrainement, et 1.1 mm/h pour la validation.

3.1.3 Résultats du test du modèle

(a) (b)
B

Figure 3.1.2 : la réflectivité d’un élément de test(a) et son image à la sortie du modèle de base (b)

Sur la figure 3.1.2, on affiche l’image radar de la réflectivité, et son image


correspondante en résultat du modèle appris. L’allure de l’image en sortie suit celle
de la réflectivité, mais ceci ne veut encore rien dire. Les mesures existant des
pluviomètres sur le terrain n’existent que sur quelques pixels de la carte, dès lors

17
on ne peut pas de faire une évaluation du modèle sur tous les pixels. Ce qu’on peut
faire alors est de comparer les valeurs calculées par le model sur les pixels des
pluviomètres, et les valeurs leur valeurs réels.

L’allure de l’image de sortie semble suivre celle de la réflectivité. Pour mieux


évaluer notre modèle nous allons comparer les valeurs des pluviomètres estimé par
le modèle et les valeurs réels des pluviomètres. Une première remarque sur la
figure 3.1.3 est que pour des petites valeurs de taux de pluie sur le terrain (0 et 2.5
mm/h), le modèle donne en sortie, à plusieurs reprises, des valeurs négatives. On
remarque aussi que le modèle a un problème de surestimation ainsi que de sous-
estimation.

Figure 3.1.3 : Tracé des valeurs de taux de pluie prédites par le modèle en fonction de celle mesurés par les pluviomètres

En conclusion de cette partie, malgré que notre modèle donne en sortie des
distributions de précipitations qui semble suivre l’allure de la réflectivité, mais le
tracé des valeurs du taux de pluie prédit en fonction des valeurs réels sur le terrain
nous permet de dire que le modèle calcule des valeurs qui sont loin des mesures
sur le terrain.

Pour mieux comprendre notre système, nous pousserons notre étude, en


faisant des simulations pour évaluer l’influence des paramètres du système
(radar+atmosphère+pluviomètre) qui nous semblent important, dans le but
d’améliorer les résultats. Les parties suivantes décrivent en détail les points
abordés.

18
Chapitre 4. Compréhension du comportement
du système

4.1 Introduction :
Pour mieux comprendre le comportement du système, et afin de développer
les performances de notre modèle, nous allons essayer de simuler notre système et
y appliquer des modifications pour qu’il soit le plus proche du système réel. Pour
ce faire, nous allons effectuer les étapes suivantes :

• Simuler les valeurs des pluviomètres, en calculant le taux de pluie


par la loi Z-R de Marshall Palmer pour les pluies stratiformes ;
• Effectuer un apprentissage en prenant comme cible les mesures des
pluviomètres simulés (par la relation Z-R) sur tous les pixels de la
carte. Les données à l’entrée restent les mesures polarimétriques du
radar ;
• Effectuer un apprentissage en prenant comme cible les mesures des
pluviomètres simulés par la loi Z-R sur les pixels correspondant aux
endroits des pluviomètres réels dans la carte ;
• Générer aléatoirement des emplacements de pluviomètres et faire des
apprentissages dont la cible représente les taux de pluie de pluies
simulé par la loi Z-R sur les pixels générés.

4.2 Apprentissage Marshall Palmer

4.2.1 Description des méthodes :

Dans cette partie nous allons entrainer notre modèle sur les mesures de taux
de pluies simulés par la relation Z-R de Marshall Palmer. Rappelons qu’à partir de
cette relation, on peut calculer le taux de pluie en connaissant les mesures de la
réflectivité.

𝑍 = 200𝑅1.6

Avec Z en 𝑚𝑚6 𝑚−3 et R en mm/h.

19
Les mesures des pluviomètres sont recueillies tous les 5min (unité de R des
pluviomètres est mm/5min), et la valeur de R calculé à partir de la loi Z-R est
exprimé par mm/h. Ceci implique une normalisation des valeurs simulées par la
loi Z-R de Marshall Palmer, en faisant une division par une constante C égale à
12.

1ℎ 60 𝑚𝑖𝑛
𝐶= = = 12
5𝑚𝑖𝑛 5 𝑚𝑖𝑛

Le modèle utilisé pour cette tache reste inchangé : un Unet avec la RMSE
comme fonction de cout. Pour la normalisation, en plus de celle cités dans le
paragraphe précédent, nous appliquerons une normalisation min/max sur les
données à l’entrée, les valeurs minimales et maximales sont celles décrite dans la
section 3.1.1.

Les données d’apprentissage et de validation sont issues de la même base,


et l’apprentissage a été effectué sur la même machine de calcul.

Nous allons alors effectuer deux apprentissages :

• « M_P all map » : un apprentissage ou la cible ici correspond aux


mesures de taux de pluies calculés par la relation Z-R, sur tous les
pixels de la carte ;
• « M_P where pluvios » : un apprentissage ou la cible ici représente
les taux de pluies calculés par la loi Z-R, sur les pixels ou sont posés
les pluviomètres.
Les figures 4.2.1 et la figure 4.2.2 illustrent la différence entre les deux
apprentissages, dans la construction de la cible.

Figure 4.2.1 : Méthode de la constitution de la cible MP_all_map

20
Figure 4.2.2 : méthode de constitution de la cible MP_where_pl

Sur le même système de calcul, nous avons effectué les deux apprentissages
sur 500 epochs, avec le même jeu de données : 72885 images (58308 images pour
entrainement, et 14577 images pour validation)

4.2.2 Résultats de l’apprentissage

La figure 4.2.3 montre l’évolution de l’erreur quadratique moyenne sur les


données d’apprentissage et de validation, durant l’apprentissage pour le modèle
« MP_all_map ». au niveau de l’epoch 500 on constate que l’erreur quadratique
moyenne atteint des valeur de l’ordre de 0.05mm/h pour l’entrainement et pour la
validation.

Figure 4.2.3 : erreur d'apprentissage et de validation du modèle « MP_all_map »

21
La figure 4.2.4 montre l’évolution de l’erreur quadratique moyenne sur les
données d’apprentissage et de validation, pour le modèle « MP_where_pl ». On
remarque que la courbe d’entrainement n’a pas encore convergé au bout de 500
epochs. Mais l’erreur à ce niveau a atteint une valeur de l’ordre de 0.11mm/h, ce
qui reste faible en comparaison avec l’erreur atteinte au niveau de l’apprentissage
de base. En plus de ça on a des contraintes dans le temps d’apprentissage qui
atteint 24h pour un seul apprentissage de 400 epochs, on s’est alors contenté de ce
modèle et on a observé ses résultats.

Figure 4.2.4 : Erreur d'apprentissage et de validation du modèle « MP_where_pl »

4.2.3 Test du modèle

La figure 4.2.5 montre les résultats du modèle « MP_all_map » sur un


élément de la base test dont, la réflectivité est représentée dans l’image (a) de la
figure. L’image (b) représente notre cible, calculé par la loi Z-R associé. L’image(c)
est la sortie du modèle « MP_all_map ». L’image (d) est la différence en valeur
absolue entre la cible et la sortie du modèle. On constate que l’erreur entre la cible
et la sortie du modèle est faible, elle atteint des valeurs de l’ordre de 0.1 mm/h sur
certaines régions qui correspondent à des valeurs élevées de la réflectivité.

22
(a) (b)

(c) (d)

Figure 4.2.5 : évaluation du model « MP_all_map » sur une image

Sur la figure 4.2.6 on a la sortie calculée par le modèle « MP_where_pluvios »


de l’élément affiché dans l’image (a) de la figure 4.2.5. L’image (b) représente la
valeur absolue de la différence entre la cible et la sortie du modèle. On remarque
que l’erreur ici est plus importante en global, en comparaison avec celle du modèle
« MP_all_map ». En particulier, elle atteint des valeurs de l’ordre de 0.3 sur les
zones de forte réflectivité, ses valeurs restent toutefois acceptables, en
comparaison avec le système idéale (apprentissage « MP_all_map »).

23
(a) (b)

Figure 4.2.6 : image test sur le modèle MP_where_pl

En conclusion, après avoir comparé les courbes d’entrainement et de


validation, ainsi qu’avoir vu les résultats des deux modèles sur une image test, on
constate que le modèle « MP_where_pl » fournit globalement de bons résultats,
malgré le nombre de pluviomètres qui reste très petit par rapport aux nombres
de pixels de l’image. Les résultats sont toutefois susceptibles de s’améliorer, vu
qu’on n’a pas encore atteint un plancher dans l’erreur quadratique lors de
l’apprentissage.

4.3 Apprentissage Marshall Palmer avec des pluviomètres


générés aléatoirement

Un aspect à étudier, est l’impact du nombre de pluviomètres installés dans


le terrain, sur le modèle. C’est ce qu’on verra dans la partie suivante.

4.3.1 Description des méthodes

Dans cette partie on verra l’impact du nombre des pluviomètres installés


dans le terrain sur les résultats du modèle. Pour ce faire, nous allons construire la
cible par la loi Z-R de Marshall Palmer, sur des pixels de la carte qui seront générés
aléatoirement.

La génération aléatoire des pixels sera faite par le processus ponctuel de


Poisson (PPP), C’est un processus mathématique qui permet de générer
aléatoirement des points dans l’espace, en se basant sur la loi de poisson.

24
Pour évaluer notre modèle, nous allons générer aléatoirement les
emplacements des pluviomètres, le nombre d’emplacements à générer sera fixe
pour chaque apprentissage :

• 3 pluviomètres généré = 0.07% des pixels de la


carte (Modèle_0.07)
• 10 pluviomètres générés = 0.24% des pixels de la carte
(Modèle_0.24)
• 50 pluviomètres générés = 1.22% des pixels de la carte
(Modèle_1.22)
• 100 pluviomètres générés = 2.44% des pixels de la carte
(Modèle_2.44)
• 1000 pluviomètres générés = 24.4% des pixels de la carte
(Modèle_24.4)
• 4096 pluviomètres générés = 100% des pixels de la carte
(Modèle_100)

Figure 4.3.1 : illustation du processus de construction de la cible

Le modèle utilisé pour cette tache reste inchangé pour tous les
apprentissages : un Unet avec la RMSE comme fonction de cout. Pour la
normalisation, nous appliquerons une normalisation min/max sur les données à
l’entrée, les valeurs minimales et maximales sont celles décrite dans la section
3.1.1.

Les données d’apprentissage et de validation sont issues de la même base,


et l’apprentissage a été effectué sur la même machine de calcul.

25
4.3.2 Résultats d’apprentissage

La figure 4.3.2 montre l’évolution de l’erreur quadratique moyenne sur les données
d’apprentissage et de validation, durant l’apprentissage. On note sur le tracé qu’il
y a une superposition des courbes de l’erreur d’apprentissage en fonction du
pourcentage des pluviomètres sur la carte : moins on met de pluviomètres dans la
cible, plus l’erreur est plus importante. L’erreur entre les courbes est claire pour
les apprentissages correspondants à un taux de pluviomètres égal à 0.07% de la
carte ou celui de 0.24% de la carte. Mais à partir d’un taux de pluviomètres
supérieur à 1.44% de la carte, la différence entre les courbes devient moins
voyante. Cette superposition des courbes est observable aussi sur le tracé de
l’erreur de validation, même si la différence est réduite cette fois ci.

Figure 4.3.2 : courbes d'entrainement des réseaux correspondant à différents nombres de pluviomètres
générés sur tous les epochs

26
Figure 4.3.3 : courbes d'entrainement des réseaux correspondant à différents nombres de pluviomètres
générés à partir de la 40ème epoch

Figure 4.3.4 : courbes de validation des réseaux correspondant à différents nombres de pluviomètres
générés à partir de la 4ème epoch

Vu les temps d’apprentissage importante des modèles, pour 400 epochs on


entraine pendant 24h en moyenne, on n’arriva pas toujours à lancer des
entrainements qui dure sur plusieurs epochs, surtout qu’on a besoin de lancer
plusieurs apprentissages. Donc pour avoir une estimation du temps nécessaire
pour un modèle d’atteindre une valeur de l’erreur, on a tracé (figure 4.3.5) en
échelle logarithmique le nombre d’epochs nécessaire pour chaque modèle

27
d’atteindre une certaine valeur de l’erreur quadratique, et ceci pour plusieurs
valeurs de l’erreur.

Figure 4.3.5 : évolution du nombre d'epoch nécessaire pour atteindre une certaine valeur de l'erreur

4.3.3 Résultats du test :

Afin de tester notre modèle, nous avons introduit un élément de notre base
de test dans les différents modèles présentés, et nous avons observé sa sortie. Sur
la figure 4.3.6 on retrouve : (a)(1) la réflectivité de l’image test, (a)(2) le taux de
pluie calculé par Marshall Palmer, (b)(1) la sortie calculée par le modèle_0.07,
(b)(2) la différence en valeur absolue en la sortie du modèle_0.07 et la sortie
désiré((a)(2)), (c)(1) la sortie calculée par le modèle_0.24, (c)(2) la différence en
valeur absolue en la sortie du modèle_0.24 et la sortie désiré((a)(2)), (d)(1) la sortie
calculée par le modèle_24.4, (d)(2) la différence en valeur absolue entre la sortie du
modèle_24.4 et la sortie désiré((a)(2)).

28
(a)(1) (a)(2)

(b)(1) (b)(2)

(c)(1) (c)(2)

29
(d)(1) (d)(2)

Figure 4.3.6 : tracé de la sortie de nos modèles ainsi que la différence entre la sortie désiré et la sortie réelle

Sur la figure 4.3.6 on visualise comment l’erreur augmente, en diminuant le


nombre de pluviomètres mis sur terrain. Cette erreur est d’autant plus importante
sur les régions de forte refléctivité.

La différence entre la sortie désirée et la sortie obtenue est moins apparente


pour le modèle_0.24 en comparaison avec le modèle_0.07 : on a l’impression que,
dans le cas idéal, avec des pluviomètres installés aléatoirement sur 0.24% de la
carte, le modèle arrive à donner des résulats très proches au cas idéal
(Modèle_100).

Pour conclure cette partie, on a constaté que plus le nombre de pluviomètre


placé sur la carte est petit, plus les résultats de prédiction se deteriorent. D’autre
part, quand on dépasse un certain nombre de pluviomètres, les résultats des
modèles se rapprochent.

30
Conclusion générale

L’estimation quantitative des précipitations (QPE) à l’aide de mesures radar


est un sujet complexe qui fait l’objet de nombreux travaux en météorologie radar.
En effet, ces estimations sont perturbées par de nombreuses sources d’erreurs
comme l’étalonnage du radar, l’atténuation, la variabilité des précipitations.
L’objectif de ce stage est de mieux comprendre le système en globalité, afin de
pouvoir améliorer les résultats de prédiction, élaborés par les méthodes
d’apprentissage profond.

On s’est appuyé dans notre étude sur les données de précipitations dans la
région parisienne. Notre base de données est construite des mesures recueillies par
la station météorologique de Trappes (mesures radar).

Le déroulé du stage s’est passé comme suit :

• Effectuer un premier apprentissage sur les données réelles recueillies par le


radar et les pluviomètres. Les résultats obtenus lors de cette partie étant
insuffisants, nous avons étudié quelques sources d’erreurs possibles
• La deuxième partie consiste à simuler les mesures du taux de pluie des
pluviomètres est de le mettre comme cible pour notre apprentissage, et
d’observer les résultats. On constate dans cette partie que le modèle arrive
à estimer les taux de pluie simulés.
• Dans la troisième partie, nous avons vu comment le nombre de pluviomètres
installés dans le terrain impactait les performances des modèles.

Malgré les études effectuées durant le stage, nous ne sommes pas pour
l’instant arrivé à bien comprendre le système. Il reste encore plusieurs aspects à
étudier :

• Étude de l’impact du bruit de quantification : C’est le bruit provenant de la


mesure des pluviomètres.
• Etude de l’impact du pas spatial : dans la constitution de nos images de la
base de données les pixels correspondent à une région de la surface terrestre,
et les pluviomètres ne sont pas placés sur toute cette région. Pourtant dans
notre étude nous avons estimé que pour chaque pluviomètre dans une région
tout le pixel correspondant prend sa valeur mesurée.

31
• Etude du bruit des échos fixes : les échos relevant des montagnes et des
bâtiment fixes.

Ces points seront sujet à étudier lors de la suite de mon stage, à


commencer par l’étude du bruit de quantification.

Enfin, j’aimerais noter que ce stage m’a permis de découvrir le domaine


des précipitations météorologiques, ainsi que de consolider mes connaissances
dans le domaine du traitement des données, en particulier celles liés à
l’apprentissage profond.

32
Bibliographie

[1] https://www.latmos.ipsl.fr/

[2] https://en.wikipedia.org/wiki/Weather_radar#/media/File:Radar-hauteur-en.svg)

[3] Radar Meteorology. Cambridge University Press (CUP),

[4] Marshall, J. S. and W. M. K. Palmer, 1948: The distribution of raindrops with size.
Journal of Meteorology, 5 (4), 165–166

[5] Kamra N. Preiss J. Predicting Rainfall with Polarimetric Radar Data (URL :
http://www-scf.usc.edu/~nkamra/pdf/rain.pdf)

[6] Ronneberger O., Fischer P., Brox T. (2015) U-Net: Convolutional Networks for
Biomedical Image Segmentation. arXiv:1505.04597v1 [cs.CV]

33

Vous aimerez peut-être aussi