Vous êtes sur la page 1sur 53

Eléments de modélisation en hydrologie

Par : Pr. Zian Ahmed


Professeur à L’école Nationale Des Sciences Appliquées
d’Al-Hoceima
Année universitaire : 2018-2019

1
Table des matières
Chapitre.1. Introduction à la Modélisation hydrologique. ............................... 4

Généralité. .............................................................................................. 4

Typologie des modèles. ...................................................................... 5

Généralités. ..................................................................................... 5

Classification des modèles hydrologiques. ..................................... 5

Modèle Pluie – Débit. ......................................................................... 8

Généralités. ..................................................................................... 8

Modèles Pluie – débit. .................................................................. 10

Etapes et critères d’élaboration d’un modèle hydrologique. .......... 14

Les bases d’un modèle hydrologique. .......................................... 14

Principales étapes de la modélisation hydrologique. ................... 15

Critères de performance d’un modèle. ........................................ 16

Typologie des modèles Pluie-Débit. ................................................. 20

Critères de typologie. .................................................................... 20

Système de Barré saint venant. .................................................... 23

Système de Holtan. ....................................................................... 26

Model SCS. .................................................................................... 26

Modèle hydrologique globale. (GR) .............................................. 27

Modélisation hydrologique semi-distribuée : TOPMODEL ........... 29

Modèles à réservoirs. ....................................................................... 31

Principe. ........................................................................................ 31

Modèle à réservoir linéaire ........................................................... 32

Modèles à réservoir non linéaire. ................................................. 33

Chapitre 2 : Modélisation statistique. ............................................................ 34

Introduction à la modélisation statistique. .......................................... 34

2
Généralités. ................................................................................... 34

Rappels : ........................................................................................ 34

Critères d’estimation des paramètres, intervalles de confiance et test


d‘hypothèse. 35

Critères d’estimation des paramètres. ......................................... 35

Intervalles de confiances. ............................................................. 38

Test d’hypothèse........................................................................... 39

Régression linéaire simple, régression linéaire multiple. ................. 40

Régression linéaire simple. ........................................................... 40

Régression linéaire multiple. ........................................................ 41

Analyse fréquentielle. ....................................................................... 42

Généralités. ................................................................................... 42

Constitution et contrôle de la série de valeur (Tests d’hypothèse).


43

Choix du modèle fréquentiel. ....................................................... 44

Ajustement du modèle fréquentiel. ............................................. 45

Contrôle de l'ajustement. ............................................................. 48

Analyse des incertitudes. .............................................................. 49

Modèlisation stochastique. .............................................................. 50

Généralités. ................................................................................... 50

Construction d’un modèle stochastique....................................... 51

Typologie des modèles stochastiques. ......................................... 53

3
Chapitre.1. Introduction à la Modélisation hydrologique.
Généralité.
L'étude de certains phénomènes physiques, chimiques, hydrodynamiques
et biologiques amène souvent à l'étude des relations qui existent entre plusieurs
variables caractérisant ce même phénomène. Ces relations se matérialisent soit
par des dépendances fonctionnelles strictes (Modèle déterministe), soit par des
dépendances fonctionnelles approchées (Modèle probabiliste). Au phénomène
étudié est ainsi associé un modèle mathématique exprimé par une équation
différentielle (Bertrandias, 1994). Il faudra revenir au phénomène lui-même pour
évaluer l'adéquation physique entre la réalité et l'approximation de la réalité à
travers le modèle.
Un modèle est donc un outil désigné pour représenter une version
simplifiée de la réalité (Dassargues, 1995), basé sur des approximations de la
réalité, il ne représente pas donc la réalité. L'interprétation se fait en prenant en
considération ces approximations. Le métier du modélisateur est de simplifier
cette réalité, représenter les processus en forme simple, simplifier la répartition
spatiale et permettre l'analyse en intervalles de temps (pas de temps horaire,
journalier, mensuel, semestriel, annuel).
La modélisation hydrologique est une représentation, partielle ou totale,
du cycle de l’eau. Elle définit les relations quantitatives entre les caractéristiques
de l’écoulement (sorties) et les facteurs influant sur ces valeurs (entrées). C’est
une définition très générale qui englobe un large éventail de méthodes. Dans ce
module, on se limite à l’étude des modèles pluie-débit, qui représentent la
transformation de la pluie en écoulement. Les applications de ces modèles sont
multiples, et permettent la :
• Prévisions (crues, sécheresse, gestion de l’irrigation, d’ouvrages
hydroélectriques, recharge d’aquifères). Le tableau.1 récapitule les éléments à
prévoir dans la gestion des ressources en eau :

4
Tableau 1. Eléments à prévoir dans la gestion des ressources en eau
(Christin, 2008)
• Simulations : Soit du comportement des bassins versants afin d'établir
des prévisions sur les effets probables d'évènements climatiques exceptionnels
ou non (changement climatique ; aménagements de bassins d’un point de vue
qualité ou quantité d’eau). Soit de l’impact d’aménagements anthropiques sur
l’hydrologie d’un bassin versant (construction d’un barrage, imperméabilisation
d’une zone par construction), ou encore de reconstituer des chroniques de débits
sur des bassins sur lesquels on ne dispose que de chroniques de pluies.
Typologie des modèles.
Généralités.
On distingue plusieurs méthodes de modélisation. A un extrême se
trouvent les techniques purement empiriques, dites de la « boite noire », dont le
but n’est pas de modéliser la structure interne et la réponse physique du bassin
versant mais uniquement de rapprocher les entrées et les sorties du système que
constitue un bassin versant. A l’autre extrême, des techniques font intervenir des
ensembles complexes d’équations, fondées sur les lois physiques et les concepts
théoriques régissant les processus hydrologiques : ce sont les modèles
hydrodynamiques. Entre les deux extrêmes se situent divers modèles
conceptuels, représentations logiques d’éléments conceptuels simples, par
exemple des réservoirs et des chenaux linéaires ou non linéaires, qui simulent les
processus en jeu dans le bassin versant. Qu’ils soient purement empiriques,
conceptuels ou hydrodynamiques, ces modèles sont qualifiés souvent de
déterministes.
Classification des modèles hydrologiques.

5
Depuis l’apparition de la modélisation hydrologique, de nombreux
modèles ont été développés en fonction des objectifs recherchés, sur base de
différents choix d’élaboration, menant à une multitude de modèles exploitables
dont chacun est doté de champs d’application et de validité restreints. Les
différences portent notamment sur les options de simulation en termes de
discrétisation spatiale, sur l’expression des phénomènes hydrologiques, liés soit
à des équations empiriques, soit à des équations physiques, soit à une
simplification plus ou moins poussée de ces équations physiques (approche
conceptuelle). Bref, les critères de classification des modèles reposent
principalement sur la représentation de l’espace, du temps et des processus
décrits (Singh, 1995 Payraudeau, 2002)
Actuellement, différents types de modèles hydrologiques existent :
Modèles déterministes.
Ces modèles donnent des résultats mathématiques qui ne sont pas
assortis d’indice de probabilité. C’est pourquoi on les qualifie souvent de
déterministes.
Modèles à base physique
Le modèle physique est une maquette qui reproduit d’une manière plus
au moins adéquate la réalité. Ils font intervenir des ensembles complexes
d’équations, fondées sur les lois physiques et les concepts théoriques régissant
les processus hydrologiques : ce sont les modèles hydrodynamiques. Les
équations utilisées dans ces modèles sont nombreuses en fonction des objectifs
tracés. Ils font intervenir de nombreuses données du milieu, généralement peu
accessibles (propriétés texturales, structurales, hydrodynamiques du sol,
caractéristiques de la végétation, état de l'atmosphère…), et doivent en outre
être appliquées à des échelles très fines, pour des raisons aussi bien physiques
que numériques. Malgré que ces modèles soient difficilement applicables dans la
pratique, ils sont des outils adaptés aux études d'impact (changement du climat,
modifications du bassin) ou au test d’hypothèses. On distingue parmi les modèles
à base physique :
➢ Modèles conceptuels :

6
Les modèles conceptuels dites aussi « à réservoirs », cherchent à
modéliser des observations, représenter logiquement d’éléments conceptuels
simples, par exemple des réservoirs et des chenaux linéaires ou non linéaires, qui
simulent les processus en jeu dans le bassin versant. On peut distinguer deux
types de modèles conceptuels selon que les paramètres sont supposés constants
dans l'espace (Modèles globaux), ou qu'ils prennent des valeurs différentes dans
l'espace (modèles distribués). En fait, c’est le but de notre cours
➢ Modèles empiriques
Les modèles empiriques dites de la « boite noire », cherchent seulement
à reproduire une sortie (débit), dont le but n’est pas de modéliser la structure
interne et la réponse physique du bassin versant mais uniquement de rapprocher
les entrées et les sorties du système que constitue un bassin versant (régression ;
réseaux de neurones). Ces modèles font intervenir un nombre réduit de
paramètres, et sont de ce fait plus faciles à mettre en œuvre et à caler. En
revanche, leur extrapolation hors du domaine d'observation n'est pas garantie.
➢ Modèles analytiques.
Ce sont des modèles pour lesquels les relations entre variables de sortie
et les variables d’entrée ont été établies par analyse de séries de données
mesurées. L’exemple type est celui des modèles linéaires : les paramètres de ces
modèles sont liés aux coefficients de corrélation entre les variables. Notons que
l’analyse des données peut conduire au choix de relations non linéaires entre les
variables.
Modèles paramétriques.
Les modèles paramétriques sont les modèles incluant des paramètres
dont la valeur doit être estimée par calage.
Modèles stochastiques.
Ils utilisent une densité de probabilité et découlent de l’analyse statistique
des données (voir paragraphe IV). Il sert à décrire, généralement, le phénomène
naturel et en particulier le phénomène hydrologique à l’aide d’un processus
aléatoire.
• La figure ci-après (Fig.1) donne une classification des modèles hydrologiques
en se basant sur les critères proprement dits.

7
Fig.1. Classification des modèles hydrologiques
Modèle Pluie – Débit.
Généralités.
Modèles conceptuels.
La modélisation en hydrologie a émergé comme un outil acceptable pour
soutenir le processus de "decisions-making" dans la gestion durable de la
ressource en eau (Sinha, 2005). Il y’a de nombreuses manières de caractériser les
modèles hydrologiques. Pour notre propos, nous retenons deux types de
modélisation Pluit-Débit représentant un système hydrologique (bassin versant,
réseau hydrographique, lac, estuaire, ...etc.) : Modélisations de type
« empirique » aussi simple et la modélisation conceptuelle dont l‘étude du milieu
conduit à la connaissance d'un certain nombre de processus actifs dans la zone
étudiée, éventuellement la formalisation mathématique de ces processus des
paramètres caractérisant le milieu.
Les modèles de translation déterministes conceptuels se basent
généralement sur un modèle de drainage et un modèle de vitesse appliqués tous
deux à une discrétisation spatialisée du bassin versant (fig.2).
Le modèle de drainage permet d’estimer la direction des ruissellements
en tout point de la discrétisation du bassin. Il peut être simplement dérivé d’un
modèle numérique d’Altitude (MNA). Dans le cas d’un MNA produit pour un
maillage carré régulier, la direction de drainage retenue en chaque maille est par
exemple fréquemment choisie parmi 8 les directions élémentaires possibles et
celle donnant la plus grande pente. Le réseau de grainage correspondant au

8
modèle de drainage permet de connaitre le chemin parcouru par n’importe quelle
particule d’eau de pluie tombant sur le bassin (Fig.2.b).
Le modèle de vitesse est utilisé pour estimer le temps nécessaire à une
particule d’eau de pluie, tombée en un endroit quelconque du bassin, pour
traverser chaque maille trouvée sur son parcourt jusqu’à l’exutoire. Chaque
particule est supposée généralement se déplacer de son lieu de production à
l’exutoire du bassin versant indépendamment des autres particules. Les modèles
de vitesse distinguent souvent les mailles « réseau » au sein desquelles la vitesse
est plus grande (Zech & al, 1993). La vitesse de ruissellement peut aussi dépendre
du débit transité (Lhomme & al, 2004).

Le temps de parcours Tm de la particule d’eau de pluie tombée en un point


m donné du bassin versant pour rejoindre (Fig.2.c), est finalement obtenu comme
la somme des temps nécessaires à la traversée des différentes mailles
rencontrées sur son parcours :
𝑝

𝑇𝑚 = ∑ 𝐼𝑘/𝑣𝑘
𝑘=1

Avec : lk la distance à parcourir sur la kième maille du parcours et avec vk la


vitesse de transfert sur cette maille. Cette approche nécessite aussi le calage de
différents paramètres dont ceux appliqués dans le modèle de vitesse.

9
Modèle hydrologique Pluie-débit.
Un modèle hydrologique posséde trois approches complémentaires :
l'approche débit - débit, l'approche pluie-débit et l'approche mixte, comme
illustré dans la figure 2. L'approche pluie-débit est la plus étudiée, ses modèles
ont pour objectif de procéder à la transformation de la pluie en débit à l'échelle
d'un bassin versant en essayant de trouver un lien entre les débits et les
phénomènes qui en sont la cause directe, en l'occurrence les pluies. Il permet de
comprendre le fonctionnement du bassin, la nature et le rôle des processus mis
en jeu, leur importance relative par rapport au phénomène étudié ou encore les
liens spatiaux ou temporels entre ces processus (Perrin, 2000). Mais un modèle
hydrologique a pour composante spatiale le système "Bassin versant", ce dernier
est appréhendé selon deux principales approches (Mathevet, 2005):
➢ Une approche structuraliste (holistique, non réductionniste,
systémique, phénoménologique, etc.) : elle vise à étudier le bassin versant dans
son ensemble, de manière systémique à partir du développement de relations
entre les entrées et les sorties du système.
➢ Une approche réductionniste (physique, représentationnelle, etc.).
Elle vise à décrire et étudier le bassin versant en établissant une chaine causale,
basée sur les théories de la physique des écoulements, capable d'expliquer le
comportement du bassin versant.
Modèles Pluie – débit.
a. Définition.
Le modèle Pluie – Débit est un modèle mathématique qui rend compte les
différents processus d’un bassin versant et permettent d’en décrire les caractères
et d’en prévoir les évolutions. Ce modèle mathématique, formé par un ensemble
d’équations, relie les variables d’entrée (Précipitations) aux variables de sortie
(débits) en tenant compte des variables d’états (topographie, couvert végétal,
humidité des sols…) (Fig.3)

10
Fig2. Différentes approches de modèles hydrologiques (Perrin, 2000)

Fig 3. Principales variables d’un modèle pluie - Débit


Un modèle pluie-débit est généralement constitué d'une fonction de
production (transformation de la précipitation en pluie efficace, disponible au
ruissellement) et d'une fonction de transfert (achemine la pluie efficace à
l'exutoire, et reconstitue la dynamique de la crue). (Fig.4).

11
Fig 4. Fonction de production et fonction de transfert d’un modèle Pluie-
débit
Utilité des modèles Pluie – Débit.
Les débits des rivières sont des données relativement rares et difficiles à
mesurer. Les pluies sont plus facilement mesurables et d'accès plus simple, en
temps réel ou différé. Les modèles pluie-débit ont donc pour première fonction
de simuler des débits à l'aide des valeurs de pluie disponibles ou vraisemblables.
Par extension, un modèle pluie-débit à pour fonction de simuler et prévisionner
les débits des rivières dans toute situation qui échappe (le plus souvent) à
l'observation :
➢ Simulation de débits, pour le comblement de lacunes dans des séries
de données,
➢ Prévision des crues et des étiages : évaluer les débits de crues à haut
risque (inondation) ou les débits d'étiages nécessitant la mise en place d'un plan
actif de gestion de la ressource en eau pour maintenir un approvisionnement
régulier,
➢ Influence d'aménagements sur l'hydrologie : prédire les changements
de la réponse du bassin suite des modifications des caractéristiques du bassin
d'origine humaine ou à des changements environnementaux.
Un modèle pluie-débit a également une vocation à tester des hypothèses sur
les processus hydrologiques. On peut par exemple imaginer un fonctionnement
hydrologique, le formaliser par un modèle, et confronter ce schéma aux observations
disponibles de pluie et de débit. En cas d’échec, on rejettera les hypothèses choisies
12
(en supposant que les observations sont fiables). En cas de succès, on conclura que
les hypothèses choisies sont un scénario possible.
Caractéristiques des modèles Pluie – Débit.
Un modèle hydrologique pluie-débit est généralement défini par (Mathevet,
2005) : (fig.5).
➢ Ses variables d'entrée (variables indépendantes) : il s'agit des entrées
du modèle, qui sont les chroniques de pluie, d'ETP et/ou de température (X1 (t),
X2(t),…) ;
➢ Ses variables de sortie (variables dépendantes) : il s'agit des sorties du
modéle, qui sont les débits simulés à l'exutoire du bassin versant, mais qui peuvent
être aussi l'ETR, des niveaux piézométriques, etc., (Z1(t), Z2(t),…) ;
➢ Ses variables d'état : il s'agit des variables internes du système, qui
évoluent en fonction du temps et rendent compte de l'état du système à un
moment donnée. Typiquement, ces variables sont les niveaux de remplissage des
différents réservoirs (neige/production/routage), ou le taux de saturation moyen
du sol,… (Y1(t), Y2(t),…) ;
➢ Ses paramètres : les paramètres des modèles hydrologiques sont des
constantes du bassin (grandeurs abstraites, caractéristiques du milieu…) qui
servent à adapter la paramétrisation des lois régissant le fonctionnement du
modèle, au bassin versant étudié, (ɸ1, ɸ2,…) ;
➢ Conditions initiales et conditions limites : les conditions initiales sont
les valeurs affectées aux valeurs d’états Y(t0), alors que les conditions limites sont
les valeurs des variables d’état du modèle aux frontières du bassin versant pour
chaque pas de temps de la période couverte par la simulation,
➢ Ses performances : il s'agit d'estimer l'amplitude des erreurs de
modélisation, calculées généralement sur la base d'une mesure de l'écart entre les
valeurs simulées et les valeurs mesurées (Hingray et al, EPFL 2009) (Fig. 6).
On pourra écrire l’expression de la structure d’un modèle hydrologique de la
manière suivante :

13
Fig.5. Structure et variables d’un modèle hydrologique

Fig6. Variables d’entrée, variables de sorties et erreurs d’un modèle


Etapes et critères d’élaboration d’un modèle hydrologique.
Les bases d’un modèle hydrologique.
Le développement du modèle repose généralement sur trois éléments :
❖ Le système observé et sa discrétisation spatiale et temporelle, qui en
définissent l’objet et ses limites (spatiales ou temporelles). La connaissance du
système est conditionnée par la mesure de ses caractéristiques et l’acquisition de
données sur les flux, les stocks et les transformations de phase. Dans notre cas, le
système est typiquement le bassin versant ;
❖ L’objectif de modélisation, pour lequel le modèle est développé. Le
modèle est construit pour répondre à des questions et peut ainsi, au-delà d’un
outil de représentation, être également un instrument de connaissance. L’étude
du cycle de l’eau est l’objectif général de l’hydrologie. Nous nous intéresserons

14
plus particulièrement dans ce travail de recherche à la représentation de la
transformation de la pluie en débit;
❖ Le choix d’une formulation de la réalité. Après la définition des deux
points précédents, l’essentiel de la démarche de modélisation consiste à trouver
la formulation de la réalité la plus satisfaisante relativement aux objectifs fixés. En
fait, le modèle est la plupart du temps le résultat d’un compromis entre généralité,
réalisme et précision (Kauark-Leite et Nascimento, 1993). La formulation d’un
modèle est conditionnée par la connaissance antérieure des processus ou des
systèmes considérés, par les idées et l’imagination du modélisateur et par les
hypothèses qui sont formulées.
Principales étapes de la modélisation hydrologique.
On peut classer les différentes étapes d’une modélisation hydrologique de la
manière suivante :
Définition.
Il s’agit de définir l’objectif ou les objectifs principal(s) et d’en choisir le
modèle convenable à ces objectifs en therme de précision.
Identification.
Collecter et analyser les données disponibles sur l'hydrosystème et construire
sa base de données (définir l'événement, le choix des échelles de temps et
d’espace…) ;
Développement de la base de données du système.
Développer une représentation de la réalité qui décrit ses caractéristiques
importantes, sous forme systémique, afin d’aboutir au modèle conceptuel.
Sélection / développement d’un code.
Traduire le fonctionnement obtenu en code informatique au travers
d’équation mathématique.
Calage.
Calage de modèle par estimation des paramètres du modèle non mesurables
en ajustant les paramètres et coefficients sur une partie de la série de données.
Evaluation – validation.

15
Il s’agit d’analyser des sensibilités du modèle et sa validation sur le reste de la
série de données, en vérifiant si le comportement de notre modèle se rapproche de
la réalité.
Exploitation.
Activer un dispositif d’exploitation par scénario en vue d’une gestion
rationnelle de ressources en eau suivant l’objectif principal tracé en première étape.
La figure ci-dessous (Fig.7) regroupe les différentes étapes de la modélisation
hydrologique du type Pluie-Débit.

Fig.7. Démarche pour le développement d’un modèle hydrologique


Critères de performance d’un modèle.
Choix du modèle.
Le choix d'un modèle doit être fondé sur de réels besoins en termes
d'écoulement superficiel et de gestion de la ressource en eau à l'échelle
temporelle et spatiale. Selon Bertrandias en 1994, l'emploi des modèles
mathématiques répond à des interrogations formulées par le modélisateur en
deux étapes successives :
- L’étape de l’identification : ou l’on s’interroge sur : Comment choisir
entre plusieurs modèles possibles ? Comment identifier les paramètres qui y
interviennent ?
- L’étape de validation : ou l’on cherche à comprendre : Les fonctions
calculées sont-elles suffisamment proches de celles observées ? le modèle est-il

16
bien adapté à la situation étudiée et à quelle précision, à quel pas de temps
(horaire, journalier, mensuel, semestriel, annuel...etc.) et avec quelle habilité ?
Néanmoins, le modèle reste sujet à des facteurs d'application, parfois
contraignants, tels que la disponibilité de diverses données relatives aux
précipitations, aux ETP, aux débits, à la topographie, à la végétation, aux sols
dominants, à leur humidité...etc. Certaines bassins versants marocains sont mal
instrumentés, la performance de ces modèles peut être, de ce fait, altérée par le
manque de données et l'inadéquation de l'expérimentation numérique par
rapport aux caractéristiques générales du bassin versant. Le choix du pas de
temps est tout aussi important mais l'état de certaines stations hydrométriques
au Maroc (Station Dar El Arsa en amont de Fès par exemple), souvent emportées
et endommagées par les crues, ne laisse pas présager une application à pas de
temps journalier.
Importance de paramétrisation.
Pour construire un modèle hydrologique et/ou hydrogéologique, diverse
donnée sont nécessaires, cette procédure est appelée paramétrisation. Il s'agit
de collecter, classer, géoréférencer, traiter, analyser et injecter dans un Système
d'Information Géographique (SIG), les différents paramètres du milieu superficiel
et souterrain, qui permettent de caractériser le système dans son ensemble
(Kessasra, 2015). La collecte de données peut intervenir à tout moment, mais est
souvent exigée après la conceptualisation du modèle initial, quand une
compréhension préliminaire du système est achevée. L'analyse d'incertitude sur
des modèles prévisionels peut indiquer des zones ou des gammes de données qui
sont exigés pour diminuer l'incertitude ou l'erreur (Wels, 2012). L'utilisation de
modèles facilite et accélére la compréhension de certaines notions abstraites. Il
s'agit des paramètres et données en rapport avec (Bear, 1993, Perrin, 2000, Wels,
2012, Kessasra,2015) :
❖ la structure du milieu physique : morphologie, forme, structure,
topographie, occupation des sols, couvert végétal du bassin versant, cartes
topographiques montrant le niveau de la nappe par rapport à la surface,
localisation des forages, cartes et coupes géologiques montrant une
section verticale afin de déterminer les épaisseurs des formations

17
aquifères, limites et frontières du systéme, cartes isocontours montrant le
nivellement de l'aquifère, niveau du substratum et niveaux connés, cartes
isopaches montrant les épaisseurs de l'aquifère et des niveaux connés et
cartes montrant la relation aquifère-rivière, relation aquifère-lac et les
dépôts dans les lacs et les rivières
❖ Les chroniques de pluie, de température, d'ETP, d'ETR, de débits, du taux
d’infiltration,…etc. et leur distribution spatiale et temporelle ;
❖ La structure du milieu hydrogéologique : cartes piézométriques de chaque
horizon aquifère, distribution spatiale des variations saisonnières des
niveaux piézométriques (cartes des battements), caractéristiques des
écoulements (directions d'écoulement, lignes de partage des eaux),
distribution spatiale des champs de perméabilité (figure 2.2) et de
transmissivité, zones et taux de recharge de la nappe, zones et taux de
décharge (sources), cartes et sections de croisements montrant les zones
de stockage et les niveaux connés, interaction eau souterraine-eau de
surface, taux de pompage et données sur l'exploitation de la nappe
(Prélèvements AEP, AEI et irrigation) ;
❖ Paramètres de transports et cartes de vulnérabilité.
b. Types de critères de performance.
Il n’existe pas d’unique critère permettant d’apprécier les performances
des modèles, ces derniers étant souvent dépendants des objectifs fixés. Klemeš
(1986b) a voulu systématiser l’évaluation des modèles en proposant une
procédure hiérarchique, comprenant quatre types de tests :
1. split-sample test (test d’échantillon fractionné) : séparation de la
période disponible en deux sous-périodes indépendantes ; calage du modèle sur
la première période et test en simulation sur la deuxième ; puis échange des rôles
des deux sous-périodes,
2. ‘proxy-basin test’ : calage du modèle sur un bassin A et application à un
bassin B; on échange ensuite le rôle des bassins A et B. Si les résultats sont
satisfaisants dans les deux cas, le modèle est applicable en transposition sur un
bassin C non-jaugé,

18
3. differential split-sample test’: application du test n°1 mais avec non
stationnarité des conditions (caractéristiques climatiques différentes d’une
période à l’autre),
4. proxy-basin differential split-sample test’: application du test n°2 mais
avec non-stationnarité des conditions climatiques.
Cette procédure hiérarchique de Klemes (1986b) est très exigeante. Si elle
paraît souhaitable et capable de mettre en évidence les qualités des modèles en
les mettant à rude épreuve, elle est assez lourde à mettre en place sur un grand
nombre de bassins versants.
La plupart des études comparatives existantes ont adopté le seul ‘split-
sample test’ (avec dans certains cas le test en conditions non stationnaires, c’est-
à-dire le test n°3).
Exemple de critères de performance :
- Critère de Nash : étant la fonction objective la plus utilisée en
hydrologie, il est défini par la relation suivante :

Où Qobs, Qcalc, Qm sont respectivement les débits observés et simulés


sur un pas de temps et la moyenne des débits observés. Notons bien que plus le
Nash est proche de 1, plus la simulation est proche de l’observation.
- Les critères EAM, EQM, C2M et Crec : plus ils sont proche de zéro, plus
le modèle simulé est proche de l’observé.
- Critère de biais : définit par la relation suivante :

Exemple de performance d’un modèle.


Les performances en contrôle des différents modèles (tableau.2),
montrent l'amélioration des simulations à mesure que l'on utilise un modèle
ayant un nombre plus grand de paramètres. Il existe un écart de 20 points de C2M

19
entre les performances minimale et maximale en calage. Mais, l'écart entre les
performances en contrôle des modèles ayant, respectivement, la performance
minimale (GR1J) et la performance maximale (GR4J et TOPMOD8) n'est plus que
de 16 points. Il convient donc d'observer la similarité des résultats des modèles
GR4J et TOPMOD8 (Rojas-Serna, 2005).

Typologie des modèles Pluie-Débit.


Critères de typologie.
Il y a autant de modèles conceptuels que de simplifications des processus du
cycle de l’eau, mais peuvent être regroupés selon certaines grandes familles, au sein
desquelles les propriétés des modèles sont relativement semblables :
Nature des équations.
Ce critère de classification prend en compte les équations intervenant dans le
modèle mais aussi le degré du lien avec le physique des processus. On en distingue :
- Modèles empiriques : qui ne font intervenir aucune information sur la
physique du bassin Ils se contentent d'établir une relation fonctionnelle
entre l’évènement pluvieux et le débit mesure à l'exutoire. Les
algorithmes s'inspirent de la théorie des signaux : la pluie est un signal
d'entrée transforme par le bassin versant en signal de sortie, en débit à
l'exutoire. Leur mise en œuvre requiert des séries chronologiques, c'est-
ä-dire un catalogue représentatif d'évènement pluie-débits permettant
l'extraction de la fonction de transfert. Ils ignorent de ce fait la dimension
spatiale.
- Modèles conceptuels : dites aussi modèle à réservoirs qui tâchent de
reproduire les mécanismes physiques du Système étudié et s'expriment,
dans la mesure du possible par des équations de l'hydraulique. Le sens
physique donné aux paramètres est un avantage décisif lorsqu'il s'agit de
comprendre les changements de comportement d'un bassin lorsque les
modifications y sont apportées telles que l'imperméabilisation du sol ou

20
les corrections de cours d'eau. le système conceptuel le Plus connue est
celui de Barré saint venant. (pour les écoulements à surface libre)
- Modèle à base physique : Les modèles à base physique utilisent par
exemple les équations de Richards (pour le transfert dans la zone non
saturée), de Darcy (pour le transfert dans la zone saturée), de Penman-
Monteith (pour évapotranspiration). Ces équations font intervenir de
nombreuses données du milieu, généralement peu accessibles (propriétés
texturales, structurales, hydrodynamiques du sol, caractéristiques de la
végétation, état de l'atmosphère…), et doivent en outre être appliquées à
des échelles très fines, pour des raisons aussi bien physiques que
numériques. Ces modèles sont donc difficilement applicables dans la
pratique, mais sont des outils adaptés aux études d'impact (changement
du climat, modifications du bassin) ou au test d’hypothèses.
La gamme des débits simulés.
On distingue le modèle continu (fig.8) qui décrit l’épisode de crue mais aussi
l’état du bassin au début de chaque épisode (phase inter-événementielle) ou
le modèle événementiel (Fig.9) qui, au contraire, ne décrit que l’épisode de
crue.

Fig.8. Exemple d’un modèle continu

Fig.9. Exemple de modèle événementiel

21
Topologie élémentaire.
La relation pluie-débit est représentée par différents degrés de complexité
des fonctions de production et de transfert selon les modèles (fig. 4). La méthode du
Soil Conservative Service est utilisée dans huit modèles (SCS). Les autres fonctions
de production, représentant la relation pluie précipitée-pluie efficace durant un
événement, sont les approches de Horton (1933), SmithParlange (1978), Barré saint
venant (1871) et la fonction tangente hyperbolique de Boughton (1966).
De nombreux modèles intègrent le processus de l’évapotranspiration qui joue
un rôle entre les épisodes de pluie, selon les équations de Penman-Monteith (1948),
Priestley-Taylor (1972), Thorntwaite (1948) et Morton-Granger (1995). D’autres
intègre le processus d’infiltration
Nous abordons dans ce cours les modèles conceptuels les plus utilisés. Il s’agit
des modèles globaux dont les variables sont exprimées par des valeurs moyennes sur
le bassin (Pluie moyenne, pente moyenne, etc), et les modèles distribués qui
s’intéresse à l’organisation spatiale.

Fig.4. Degré de complexité des fonctions utilisées dans les modèles


hydrologiques

22
Système de Barré saint venant.
L'écoulement d'une rivière en crue, c'est-à-dire, en régime transitoire, a été
décrit pour la première fois par Barré de Saint-Venant, en 1871. Pour ce faire, il a
proposé un système d'équations aux dérivées partielles, non linéaires, qui s'écrit sous
la forme suivante (Pochât, 1980), en absence d'apports intermédiaires :

Ou :
S : section mouillée ;
Q : débit ;
V : vitesse moyenne dans la section ;
t : temps ;
X : abscisse en long ;
Y : tirant d'eau ;
g : accélération de la pesanteur ;
i : pente du fond ;
j : pente de la ligne d'énergie.
La première équation est l'équation de la continuité, traduisant la
conservation des volumes ; la deuxième est l'équation dynamique, qui traduit la
conservation de la quantité de mouvement.

23
Dans l'équation dynamique, (a) et (b) sont les termes d'inertie ; (c) correspond
au terme de pression ; (d) est le terme de gravité et (e) est le terme englobant les
pertes de charge par frottement.
Ces équations, dites de Saint-Venant, sont basées sur quelques hypothèses
simplificatrices de la réalité physique. En effet, les hypothèses fondamentales sont
celles des écoulements filaires, graduellement variés. Elles sont essentiellement les
suivantes :
- Fluide incompressible et homogène ;
- Distribution des pressions hydrostatisque sur une verticale ;
- Pente du fond faible ;
- Variation graduelle de la section transversale ;
- Pertes de charge équivalentes aux pertes dans les écoulements permanents.
Malgré ces hypothèses assez draconiennes, il semble que le phénomène de
propagation dans des cours d'eau naturels est bien décrit par le système de Saint
Venant.
Cette dernière hypothèse suppose que le paramètre J a la même forme qu'en
régime permanent et qu'il peut être déterminé par une loi de comportement
empirique, faisant intervenir la vitesse moyenne v et le tirant d'eau y (Kovacs, 1988).
Dans ces conditions, le système de Saint-Venant est complété par une troisième
équation :

On utilise habituellement ici la formule de Chézy, combinée avec les


expressions de Bazin ou de Manning-Strickler (Chow, 1959).
Pour la résolution du système de Saint-Venant, il faut connaître les conditions
aux limites, amont et aval, liant les variables Q ou y dans le temps. Il faut encore
connaître les conditions initiales, c'est-à-dire v(x,0) et y(x,0) pour tout x, dans les cas
des écoulements fluviaux, les plus fréquents en hydrologie.
Enfin, le système d'équations de Saint-Venant n'ayant pas de solution
analytique connue, il est nécessaire d'utiliser des méthodes numériques pour sa
résolution, avec des besoins, en temps de calcul, importants. De ce fait, plusieurs
essais de simplification ont été effectués.
❖ Les simplifications du système complet
24
Comme l'équation de la continuité (1.1) n'est pas passible de
simplification et que sa modification serait lourde de conséquences, les
simplifications ont donc porté sur l'équation dynamique (1.2). Celle-ci avec ses
cinq termes, peut conduire à de nombreuses simplifications, souvent acceptables
et réalistes pour les besoins de l'hydrologie (Miller et Cunge, 1975). Une première
simplification, en négligeant les termes d'inertie et en groupant les termes de
pression et de frottement, nous conduit à l'expression suivante (1.4), pour
l'équation dynamique simplifiée :

Cette simplification revient à dire, en plus des hypothèses de Saint-


Venant, que les forces de frottement, gravité et pression sont dominantes, ce qui
se vérifie pour les crues lentes naturelles, en rivières avec une pente du fond pas
trop faible (Cunge, 1976).
L'avantage essentiel de négliger les termes d'inertie est que l'on peut
éliminer une des variables et obtenir une seule équation, en hauteur ou en débit.
En général, on conserve la variable débit, et l'on obtient l'expression (1.5)
(Weinmann et Laurenson,1979) :


C = C (x, t, y, Q) ;
D = D (x, t, y, Q).
Cette équation est appelée onde de crue diffusante lorsque l'on élimine la
variable y (ou Q) dans les expressions analytiques de C et de D.
Dans ce modèle, l'écoulement est décrit comme une onde qui se propage
de l'amont vers l'aval avec une célérité C et qui s'atténue, d'une façon analogue à
la diffusion de chaleur, selon un coefficient de diffusion D. Ces coefficients C et D,
dans le modèle de l'onde de crue diffusante sont variables en fonction du débit
et des caractéristiques du cours d'eau, comme l'on verra pour la suite.

25
Cette formulation, radicalement différente de celle du système Saint-
Venant, permet une prise en compte plus globale de la géométrie, sans une
référence explicite à la rugosité. Tout cela conduit à une mise en œuvre plus aisée,
soit au niveau du calcul, soit au niveau des besoins de la connaissance physique
du cours d'eau.
Système de Holtan.
La fonction de production utilisant le schéma d’infiltration proposé par
Holtan est représentée par trois types de pertes de ruissèlement :
- les pertes dues à l’interception par la végétation et à l’évaporation;
- les pertes dues à la ré-humidification du sol;
- l’infiltration profonde qui contribue à reconstituer le niveau de la nappe.
Le taux d’infiltration est calculé selon la loi d’Holtan qui peut s’écrire de la
façon suivante :
Equation [1] f = fc + a.Un
Avec: f = vitesse d'infiltration; fc = vitesse d'infiltration finale; U = hauteur
correspondant au stockage potentiel. « a » et « n « = constantes fonction du sol
et des conditions de surface et de culture. Le modélisateur utilise ces paramètres
pour discriminer les surfaces perméables et imperméables.
Pour la fonction de transfert, le modèle utilise la méthode du réservoir
linéaire avec un ou deux réservoirs (selon la taille du bassin versant).
Model SCS.
C’est un modèle qui a été proposé aux Etats Unis en 1954 par le Soil
Conservation Service, (SCS). Il utilise une procédure permettant d'estimer
l’écoulement superficiel. Le concept essentiel du modèle est de résumer les
propriétés hydrodynamiques de la couverture du sol à l’aide de courbes
auxquelles sont attribués des numéros selon les sols. On parle de « Curve Number
(CN)”. Le paramètre CN est déterminé à partir d'un tableau à triple entrée : le
groupe hydrologique (A, B, C, ou D) du sol (par ordre de diminution de
perméabilité); les modes d'occupation du sol et les conditions d'humidité
antérieure du sol (sec, moyen, ou mouillé) [ARON et al., 1977].
Il s'agit d'un modèle du type analytique-statistique [Sempere Torres,
1990] qui est utilisé pour la prévision des crues. Le calcul direct du volume ruisselé

26
en utilisant la méthode du Curve Number est une technique internationale
[HAWKINS, 1978]. Ce modèle a été adapté pour les bassins versants urbains en
1975 [HJELMFELT, 1987]. Utilisable à la fois sur des bassins ruraux et sur des
bassins urbains, ce modèle peut donc être également mis en œuvre sur des
bassins mixtes.
L'hypothèse principale de cette méthode est que le rapport de la rétention
cumulée instantanée F, à la rétention maximum S, est égal au rapport du
ruissellement Q à la pluie P moins la perte initiale, Ia. La relation se met donc sous
la forme mathématique suivante:

L'équation principale du modèle SCS pour estimer le ruissellement est


[CERNESSON, 1993, HJELMFELT, 1980, MUZIK, 1993, WILLIAMS et al., 1976]:

Avec:
- Q = Ruissellement cumulé (millimètres);
- P = Précipitation cumulée (millimètres);
- Ia = Pertes Initiales (millimètres);( quantité de la pluie qui est absorbée
avant le début du ruissellement)
- S = Rétention maximale du sol (millimètres).
Modèle hydrologique globale. (GR)
Définition.
Les modèles globaux reposent sur l'hypothèse simplificatrice que « le
bassin réagit dans son ensemble » à événement climatologique (röche 1986). Les
paramètres introduits caractérisent l'ensemble du bassin sans tenir compte de la
répartition spatiale et de la Position respective des différentes zones constituant
le bassin versant. On classe dans cette catégorie les modèles à réservoirs en
cascade ou celui de l'hydrogramme unitaire. La mise en œuvre de ce type de
modèles recours à des séries chronologiques. On suppose que le bassin n'a pas
subi de transformation si importantes (par exemple, une extension très notable
des surfaces imperméables) que son comportement probable s'en trouverait

27
fortement influencé. De ce fait, ils ne sont guère utiles pour simuler les effets
éventuels d'aménagements projetés sur le bassin versant (remaniements
parcellaires, urbanisation, etc..)
Typologie du modèle hydrologique globale.
Ce modèle diffère selon l’objectif de la modélisation :
❖ En contexte de simulation : En premier lieu, une phase de calage
(optimisation) des paramètres qui correspond à la détermination de la valeur
optimale des paramètres du modèle, en optimisant une fonction objective qui
peut être de différentes formes. En second lieu, une phase dite de contrôle qui
consiste à faire tourner et évaluer le modèle sur une autre période de temps que
celle où a été calé le modèle. Afin d'évaluer le modèle, différents critères peuvent
être utilisés tels que :
• Le critère de Nash ;
• Le critère "bilan" qui correspond au rapport du volume total écoulé estimé
sur le volume total écoulé observé ; et enfin et non finalement
• Le critère "volume en crues" qui correspond au volume d'eau en crue observé
sur ce même volume calculé. Il faut auparavant devenir un seuil de débit (C)
à partir duquel on considère qu'il y a un épisode de crue.
❖ En contexte de prévision, La phase de calage permet de déterminer les
paramètres du modèle. On peut donc maintenant utiliser ces modèles afin de
prévoir les crues, c'est-à-dire de prévoir le débit à l'instant t+Δt à partir de l'instant
t. Pour cela, à chaque pas de temps, il faudra remettre à jour le modèle à l'instant
t par rapport aux valeurs de débit observées. Il est possible d'agir à différents
niveaux :
• Corriger les données pluviométriques ;
• Modifier l'état du modèle en jouant sur le niveau des réservoirs (états du
modèle) ;
• Modifier les paramètres du modèle ; et enfin
• Corriger les données de sortie du modèle en prévoyant l'erreur du modèle.
Exemple : GR4J (Fig 5) : le modèle pluie-débit journalier du "Génie Rural"
a été développé au Cemagref (Edijatno et Michel, 1989 ; Edijatno, 1991 ; Perrin,

28
2000). Ce modèle se caractérise par son faible nombre de paramètres qui est de
quatre (figure 4) :
X1 : Capacité du réservoir de routage ;
X2 : Capacité du réservoir de production ;
X3 : Paramètre d'échanges en eau ;
X4 : Temps de base des hydrogrammes.

Figure 5. Architecture du modèle global : GR4J (Mouelhi, 2003, Moeulhi


et al. 2006)
Modélisation hydrologique semi-distribuée : TOPMODEL
Ce modèle (Beven et Kirkby, 1979) est basé sur le principe des zones
contributives à l'écoulement, qui sont fixées à partir de la topographie : des zones
à faibles pentes atteignent plus facilement la saturation et contribuent donc au
ruissellement plus rapidement par rapport aux zones de crêtes. TOPMODEL
(Topography-based hydrological MODEL) est un modèle hydrologique semi-
distribué car certains paramètres sont distribués dans l'espace comme la pente
topographique et la surface amont drainée, d'autres sont considérés globalement
notamment les propriétés hydrauliques des sols (transmissivité, réserve hydrique
du sol, ETP) et les précipitations. Les paramètres spatialement distribués servent
à calculer des classes de similarité hydrologique. Ces classes de similarité
correspondent à des zones géographiques présentant un comportement
hydrologique identique : leur état de saturation est similaire et dépend
uniquement de la situation météorologique. Cette version comporte huit

29
paramètres dont deux utilisés afin de remplacer l'indice de topographie calculé
ordinairement à partir du modèle numérique de terrain (figure 6) :
X1 : Capacité du réservoir de routage ;
X2 : Paramètres de vidange ;
X3 : Capacité du réservoir d'interception ;
X4 : Délai ;
X5 et X6 : Paramètres d'indice topographique ;
X7 et X8 : Paramètres d'évaporation.

Figure 6. Architecture du modèle semi-distribué : Topmodel (Beven et al., 1979)


Il s'agit d'un modèle non-linéaire pour simuler les réponses lentes et rapides
sur un bassin versant et le transfert dans le réseau hydrographique (Beven et al.,
1995) et qui prend en compte deux principales composantes d'écoulement :
• L’écoulement en nappe souterraine qui alimente les cours d'eau par
drainage latéral,
• L’écoulement superficiel par saturation du sol sur les zones oú la nappe
atteint la surface du sol.
Si ce modèle apparaît comme très séduisant sur le plan intellectuel dans la
mesure où il utilise une information a priori pertinente sur la topographie du bassin
versant, il pose, comme tous les modèles distribués, des problèmes d'utilisation liés
au grand nombre de données nécessaires.
De plus :
- il est très sensible à la qualité des données ;
- il utilise des séries temporelles continues;
30
- il utilise les données d’évapotranspiration ;
- il a besoin de nombreux paramètres pour la fonction de production (il utilise
le modèle de Green&Ampte), et au moins quatre paramètres pour la fonction de
transfert.
Modèles à réservoirs.
Principe.
Contrairement aux modèles de translation, pour un modèle à réservoirs,
le bassin versant n’est pas forcément discrétisé ; Il peut être considéré
globalement. Dans ce cas, la simulation du transfert est obtenue par le seul
stockage temporaire au sein d’un ou plusieurs réservoirs conceptuels, de la pluie
nette tombée sur les pas de temps précédents. Les modèles à réservoirs ne
cherchent pas à représenter les chemins parcourus par les écoulements au sein
du bassin versant. Ils ne relèvent donc pas de l’approche géomorphologiques, en
revanche, leurs paramètres peuvent parfois être dérivés de certaines
caractéristiques géomorphologiques du milieu.
La variété des modèles à réservoirs, encore appelés modèles capacitifs,
est quasi infini comme l’illustre l’inventaire de perrin (2000). Ils ont de degré de
complexité variés, fonction du nombre de réservoirs utilisés, de leurs types
respectifs ainsi que de leur organisation.
Cependant, quelque soit le réservoir impliqué dans la structure d’un
modèle à réservoirs, son comportement est régi par un système de trois
équations :
- L’équation de continuité qui exprime la conservation de la masse d’eau
pour le réservoir,
- Une équation de stockage, reliant le volume stocké dans le réservoir à la
hauteur du stock dans le réservoir,
- Diverses équations de débits, exprimant le débit en provenance ou à
destination d’autres compartiments du système modélisé en fonction de
la hauteur du stock dans le réservoir.
Différents types de réservoirs fréquemment utilisés, parfois de façon
combinée, pour modéliser la fonction de transfert, sont présentés dans la figure
7. La simulation du transfert avec un modèle à réservoirs est dans un cas général

31
assez aisée. Elle nécessite le développement d’un schéma numérique approprié
(ex. diférences finies) qui permet d’estimer l’évolution temporelle des volumes
stockés dans chacun des réservoirs et l’évolution temporelle des différents flux
associés.

Modèle à réservoir linéaire


Ce modèle est de loin le plus utilisé pour modéliser la fonction de
transfert. Le comportement du réservoir est régi par seulement deux équations :
l’équation de continuité et l’équation de vidange. La linéarité réside dans
l’équation de vidange, le débit sortant étant supposés une fonction linéaire de la
hauteur d’eau (ou de volume d’eau) stocké dans le réservoir,
Equation de continuité :

32
Equation de vidange :

Ou S(t) est le volume stocké au temps t dans le réservoir


i(t) et q(t) sot respectivement les flux entrant et les flux sortant du
réservoir, exprimé dans la même unité. K est la constante de temps du modèle,
le seul paramètre du modèle à estimer
En combinant les deux équations, une équation différentielle linéaire du
premier ordre est obtenue. Elle consiste l’équation d’un réservoir linéaire :

Cette équation à une solution explicite qui s’obtient par séparation des
variables. L’expression des flux sortant q(t) (débit spécifique à l’exutoire)
résultant d’un flux entrant i(t) (Pluie nette) est :

Avec q(t0) = q(t=t0).


Modèles à réservoir non linéaire.
Ce sont des modèles fréquemment utilisés pour modéliser le transfert, en
particulier en milieu urbain, car ils permettent en principe de reproduire la
réactivité plus importante des bassins versant lorsque la sollicitation
pluviométrique augmente. La non-linéarité réside la majeure partie du temps
dans l’équation de vidange. Elle est souvent de type :

Avec a et b deux constantes à estimer. Le paramètre b détermine le degré


de la non linéarité, a étant la réactivité du bassin. La valeur de (5/ 3) est
fréquemment retenue pour le paramètre b ; en particulier dans le cas des bassins
urbain. L’équation du comportement du réservoir est alors :

33
Contrairement à l’équation du réservoir linéaire, cette équation n’a pas de
solution explicite et sa résolution nécessite l’utilisation de techniques numériques
telles que les différences finies. En l’absence d’apport récents (i(t) = 0 pour t > t0),
il est possible de déterminer l’expression analytique de la courbe de récession
produite par ce réservoir. Son expression varie suivant la valeur de b.

Chapitre 2 : Modélisation statistique.


Introduction à la modélisation statistique.
Généralités.
Ce cours s’intéresse au thème de la modélisation et plus particulièrement aux
méthodes linéaires et à celles qui se ramènent au cas linéaire. Il se limite donc à
l’exposé des méthodes dites paramétriques dans lesquelles interviennent des
combinaisons linéaires des variables dites explicatives. Celles-ci visent donc à
l’estimation d’un nombre généralement restreint de paramètres intervenant dans
cette combinaison mais sans aborder les techniques spécifiques à l’étude des séries
chronologiques.
Le cadre général de ce cours considère donc les observations d’une variable
aléatoire Y dite réponse, exogène, dépendante qui doit être expliquée (modélisée)
par les mesures effectuées sur « p » variables dites explicatives, de contrôle,
endogènes, dépendantes, régresseurs. Ces variables peuvent être quantitatives ou
qualitatives, ce critère déterminant le type de méthode ou de modèle à mettre en
œuvre : régression linéaire (simple et multiple), analyse fréquentielle.
Rappels :
Un modèle statistique est un couple (ℋ n,P), où ℋ est l’espace supposé
topologique de chaque observation, et P est une famille de lois de probabilités Sur ℋ
n muni de sa tribu borélienne. Le modèle statistique (ℋ n,P) est paramétré par Θ si P
= {Pθ } θ ϵ Θ.
L’expérience aléatoire sous-jacente fournit n observations (x1, ···,xn) ϵ ℋ n du
même phénomène aléatoire, qui est régit par la loi inconnue P 0. Le principe de base
de la statistique est de considérer que (x1, ···,xn) est régit par l’une des lois d’un
modèle P, avec P0 ϵ P. Cette étape de modélisation étant achevée, il s’agira de
chercher quelle loi de ce modèle s’ajuste le mieux aux observations.

34
Par exemple, lorsque les expériences ont été menées indépendamment les
unes des autres, l’observation (x1, ···,xn) est régie par la loi P0 =Qn0 , et le modèle
statistique est un ensemble de probabilités sur ℋ n contenant Qn 0 .
A noter, donc : à l’inverse du probabiliste, le statisticien travaille plutôt sur
l’espace des observations, qui constitue un cadre d’étude plus naturel. Par ailleurs, le
statisticien ne suppose pas que la loi des observations est connue, à l’inverse du
probabiliste.
Exemple En utilisant des chroniques des débits des différents stations
indépendantes x1, ···,xn de la même durée d’observations ayant les mêmes
instruments de mesure, on veut connaître la loi suivie par le comportement des
débits en fonction du temps. La 1ère étape consiste à définir le modèle statistique
associé, dont l’espace des observations est ℝn +. Du point de vue de la modélisation,
il est raisonnable d’affirmer qu’une v.a (Variables aléatoires). X sur (",F,P) qui
représente le comportement des débits en fonction du temps est sans mémoire, i.e.

Cette propriété signifie que les débits "ne se souvient" pas d’avoir des valeurs
récurrentes. Par ailleurs, on peut aussi supposer que la loi de X est à densité par
rapport à la mesure de Lebesgue. On sait alors qu’il existe ( > 0 tel que X - E ((). Comme
les observations des débits en fonction du temps sont indépendantes, (x1, ··· ,xn) est
une réalisation d’une loi E ((0)#n, pour un certain (0 > 0 qu’il s’agira de trouver. Le
modèle statistique associé à cette expérience aléatoire est donc (ℝn +,{E (()#n}(>0.
Critères d’estimation des paramètres, intervalles de confiance et test
d‘hypothèse.
Critères d’estimation des paramètres.
Définition.
Un paramètre est une valeur numérique qui n’est pas calculé par le
modèle et qui n’est pas une variable d’entrée mesurée ou observée

35
L’estimation des paramètres consiste à approcher les valeurs des
paramètres à partir des données expérimentales et/ou d’informations issues de
l’expertise. Cette estimation semble très importante quand au choix du modèle
convenable, encore plus les performances d’un modèle vont dépendre de la
méthode d’estimation des paramètres utilisé.
Etapes d’estimation des paramètres.
La méthode optimale d’estimation des paramètres consiste à répondre
aux questions suivantes :
Quels paramètres à estimer ?
Selon qu’on considère un modèle linéaire ou un modèle non linéaire, le
choix du paramètre à estimer devient très important.
• En modèle linéaire : La relation analytique entre estimateurs et
données est connue. En plus, il y’a suffisamment de données par rapport aux
paramètres que l’on veut estimer. La tache devient ainsi facile car il y’a des
logiciels pour l’accomplir (SAS, S+, Matlab, ModelMaker…) ;
• En modèle non-linéaire : La relation analytique entre estimateurs et
données est inconnue. En plus, il y’a peu de données par rapport au nombre de
paramètres. La tache devient difficile et nécessite l’intervention des logiciels
statistiques plus délicate. Donc, La complexité d’estimation augmente, alors
lorsque le modèle est non linéaire. La figure suivante (fig.1) montre la complexité
d’estimation en fonction de la nature du modèle choisit et des paramètres à
estimer.

fig.1. complexité d’estimation


Quelle information disponible ?

36
Estimer un ou plusieurs paramètres revient toujours à poser la question
sur l’information disponible qui va être utilisé à chaque paramètre. En effet,
lorsque la structure des données est complexe (plusieurs types de mesure,
mesures corrélées), il faut faire très attention quand au choix des données qui
vont être attribués aux paramètres à estimer même si on possède un logiciel
statistique délicat.
Quelle méthode d’estimation utilisée ?
Un estimateur est une fonction qui relie les paramètres à des
observations. En changeant les observations, on change la valeur du paramètre
en utilisant l’estimateur.
La solution naturelle consiste faire simplement la moyenne des
observations. Dans le cas d’un modèle linéaire, on utilise une méthode assez
simple qui est la méthode des moindres carrés ordinaires.
Dans le cas d’un modèle non-linéaire, là ou on ne peut pas trouver
l’expression analytique des estimateurs, différentes solutions peuvent être
envisageables :
- Méthode des moindre carrés pondérés (MCP) : sont utiles pour
estimer les paramètres sans utiliser l’information a priori.
- Méthodes bayésiennes : sont utiles pour estimer les paramètres à la
fois à partir des données et de l’information a priori.
Quelle est la précision des estimateurs ?
La dernière question consiste à se demander si l’estimateur est précis.
Pour étudier la précision d’un estimateur, il est utile de considérer l’erreur
quadratique moyenne.
Θ est la vraie valeur du paramètre (inconnue), Ô est la valeur estimée pour un
échantillon de donnée, l’espérance est prise sur l’ensemble des échantillons de
données possibles.
L’EQM est égale à la somme de deux termes. Le premier est le biais, c’est
l’erreur systématique. Le biais indique si l’estimateur surestime ou sous-estime
systématiquement la vraie valeur du paramètre. Le deuxième terme est la
variance de l’estimateur. La variance donne une information sur la variabilité de
THETA^ lorsqu’on change d’échantillon.

37
En pratique, on ne connait pas la vrai valeur theta, ni la vraie valeur du
biais et de la variance de l’estimateur. Par contre, on peut approcher ces valeurs
de différentes façons.
Intervalles de confiances.
On appelle intervalle de confiance à α % sur l'estimation pˆ d'un
paramètre p, l'intervalle limité par deux bornes p1 et p2 telles que l'on ait α/2 %
de chance d'avoir p < p1 ou p > p2 du seul fait des erreurs d'échantillonnage.
On a donc α % de chance pour que la véritable valeur p (du paramètre que
l'on estime par pˆ) soit comprise entre p1 et p2. Compte tenu des réflexions sur
les distributions des estimations, on obtient :
Intervalle de confiance à α % sur la moyenne :
Les bornes de l'intervalle sont :

- Si n < 30, est la valeur du t de Student de fréquence au non-


1−𝛼
dépassement 𝐹= pour v = n - 1 ;
2

- Si n > 30, la variable réduite de Gauss de fréquence au non-


1−𝛼
dépassement 𝐹 =1− pour 𝑣 = n − 1
2
Intervalle de confiance à α % sur l'écart-type :
- Si n < 50, les bornes de l'intervalle de confiance à a % sont :

1−𝛼
c1 : valeur ayant pour fréquence au non-dépassement 𝐹 =
2

c : valeur ayant pour fréquence au non-dépassement 𝐹 =1−


1−𝛼
2
- si n > 50, les bornes sont :

38
Avec : variable réduite de Gauss de fréquence au non-
1−𝛼
dépassement : 𝐹 =
2
Intervalle de confiance à α % sur le quantile xF :
Les bornes de l'intervalle de confiance sont alors :

(2 fois plus pour la borne supérieure et 2 fois moins pour la borne


inférieure)
tF : variable réduite de Gauss ayant la fréquence au non-dépassement
F
tα : variable réduite de Gauss ayant la fréquence au non-
1−𝛼
dépassement : 𝐹 =1−
2
Test d’hypothèse.
En hydrologie, on utilise souvent des chroniques (échantillon) qui,
d’ailleurs, ne représente pas la variation des observations pris en compte en
fonction de tout le temps (population mère). D’après cet échantillon, nous
choisirons la formulation mathématique de la loi de probabilité et nous
calculerons les paramètres numériques de cette loi. On peut alors se demander
quelle est la probabilité pour que la loi retenue représente effectivement la
population mère dont l’échantillon est à priori représentatif.
En testant cette hypothèse, on court deux risques :
- un risque de première espèce qui consiste à rejeter à tort l'hypothèse
alors qu'elle est vraie. La probabilité de ce risque est appelée niveau de
signification à α %. Elle est définie par la valeur numérique du test, α étant
toujours exprimé en probabilité au dépassement de cette valeur numérique ;
- un risque de deuxième espèce qui est d'accepter à tort l'hypothèse alors
qu'elle est fausse. La probabilité de ce risque étant β, on appelle puissance du test
la valeur (1 - β).

39
Deux test connus et bien utilisés en hydrologie : le test khi deux et le test
Wn2 d’Anderson

Régression linéaire simple, régression linéaire multiple.


La régression considère les observations d’une variable aléatoire « Y » dite
réponse, exogène (Débits), dépendante qui doit être expliquée (modélisée) par
les mesures effectuées sur « p » variables dites explicatives, de contrôle,
endogènes, dépendantes, régresseurs. Ces variables peuvent être quantitatives
ou qualitatives, ce critère déterminant le type de méthode ou de modèle à mettre
en œuvre : régression linéaire, régression multiple analyse de variance et
covariance, régression logistique, modèle log-linéaire. On s’intéressera dans ce
cours à la régression linéaire et la régression multiple.
Régression linéaire simple.
Soit deux séries d'observation X et Y telles qu'à chaque valeur xi, on puisse
associer une valeur de yi. Les couples (x,y) peuvent être représentés dans un
graphique comme ci-dessous. Cependant, en l'absence d'hypothèse sur les
distributions de X et de Y, il n'est pas possible de prévoir la forme des courbes de
régression. Rien n'empêche cependant de chercher l'équation d'une droite y = ax
+ b telle que la somme des carrés des écarts εi = yi - a xi - b, soit minimale.
Les coefficients a et b que l'on cherche à déterminer seront obtenus en
annulant les dérivées partielles ∑𝑛𝑖=1 𝜀 2 par rapport à a et b :

40
Soit le système suivant qui s'interprète ainsi :
∑𝑛𝑖=1 𝜀𝑖 2 = 0 : les écarts sont nuls en moyenne
∑𝑛𝑖=1 𝑥𝑖 𝜀𝑖 2 = 0 : il y a orthogonalité entre ε et x (les écarts sont indépendants
de x)
Le système à résoudre en a et b est le suivant :

Tout calcul fait et en posant...

... on trouve :

Régression linéaire multiple.


Le modèle de régression linéaire multiple est l’outil statistique le plus
habituellement mis en œuvre pour l’étude de données multidimensionnelles.
Supposons que l'on cherche à expliquer une variable y à partir de k variables x. Si y et
les x sont tirés d'une loi de Gauss à k+1 dimensions, les paramètres de cette loi de
distribution sont :
Les moyennes marginales : y, x1, x2, .... xi, ... xk
Les écarts-types marginaux : σy,σ x1 ,σx2 , ... σxi, ..., σxk
Les coefficients de corrélation totale, soit la matrice [r] :

On peut montrer alors que la distribution conditionnelle des y liés par les k xi
est gaussienne de moyenne y҃xi et d'écart-type σyxi avec :
y҃xi = a0 + a1x1 + a2x2 + ... + aixi + ... + akxk et :

41
Il reste alors à évaluer les k+1 coefficients de régression ai, le coefficient de
corrélation multiple R, et les k coefficients de corrélation partielle ryxix1,x2,...xk .
On pourrait également montrer que y҃xi correspond à l'hyper plan des
moindres carrés : y҃xi= a0 + a1 x1 + a2 x2 ... + ai xi ... + ak xk
On détermine alors les ai de façon à minimiser la somme des carrés des écarts
entre y et ses estimations yˆ :
Les dérivées partielles par rapport aux k+1 paramètres devront donc être
nulles :
1 équation :

(erreur nulle en moyenne et par conséquent a0 = 0)


k équations du type :

Analyse fréquentielle.
Généralités.
L'analyse fréquentielle est une méthode statistique de prédiction
consistant à étudier les événements passés, caractéristiques d'un processus
donné (hydrologique ou autres), afin d'en définir les probabilités d'apparition
future.
Cette prédiction repose sur la définition et la mise en œuvre d'un modèle
fréquentiel, qui est une équation décrivant le comportement statistique d'un
processus. Ces modèles décrivent la probabilité d'apparition d'un événement de
valeur donnée.
L'analyse fréquentielle fait appel à diverses techniques statistiques et
constitue une filière complexe qu'il convient de traiter avec beaucoup de rigueur.
Ses diverses étapes peuvent être schématisées très simplement selon le
diagramme suivant (Fig.2) :

42
Fig.2. Principales étapes de l’analyse fréquentielle
Avant de commencer tout travail, il est primordial de formuler clairement
les buts de l'analyse et d'adapter la démarche en conséquence. A cet égard, en
hydrologie, l'un des critères essentiels est certainement l'échelle spatio-
temporelle : étudier le comportement des crues dans un micro-bassin urbain (à
très faible temps de concentration) avec des données de pluie au pas de temps
mensuel n'aurait pas de sens ! L'inverse est tout aussi vrai : il est probablement
inutile de disposer de pluies au pas de temps de la minute pour l'étude d’un bassin
versant.
Constitution et contrôle de la série de valeur (Tests d’hypothèse).
Il s’agit de collecter les données des débits moyens annuels qui sont
généralement issue d’une station de jaugeage située à l’exutoire sous forme des
débits journaliers. Ensuite, ces données doivent être contrôlées leur fiabilité du
fait que les mesures de débits ou des précipitations disponibles peuvent être
entachées d’un certain nombre d’erreurs d’observation qui ont pour différentes
origines (Chachi, 1986).

43
Ce contrôle se base, généralement, sur le test d’homogénéité ainsi que le
test d’indépendance et de stationnarité. Différentes méthodes s’appliquent, ceux
fréquemment utilisées en hydrologie sont :
- Test d’homogénéité de Man-Whitney à 5%.
- Test de stationnarité et d’indépendance de Wald Wolfowitz à 5%
Choix du modèle fréquentiel.
La validité des résultats d'une analyse fréquentielle dépend du choix du
modèle fréquentiel et plus particulièrement de son type. Diverses pistes peuvent
contribuer à faciliter ce choix, mais il n'existe malheureusement pas de méthode
universelle et infaillible.
Considérations théoriques.
❖ Loi normale :
La loi normale se justifie, théoriquement par le théorème central-limite,
comme la loi d'une variable aléatoire formée de la somme d'un grand nombre de
variables aléatoires. En hydrologie fréquentielle des valeurs extrêmes, les
distributions ne sont cependant pas symétriques, ce qui constitue un obstacle à son
utilisation. Cette loi s'applique toutefois généralement bien à l'étude des modules
annuels des variables hydro-météorologiques en climat tempéré.
❖ Loi log-normale :
La loi log-normale est préconisée par certains hydrologues dont V.-T. Chow
qui la justifient en argumentant que l'apparition d'un événement hydrologique
résulte de l'action combinée d'un grand nombre de facteurs qui se multiplient. Dès
lors la variable aléatoire suit une loi log-normale. En effet le produit de variables se
ramène à la somme de logarithmes de celles-ci et le théorème central-limite permet
d'affirmer la log-normalité de la variable aléatoire.
❖ Loi de Gumbel :
E.-J. Gumbel postule que la loi double exponentielle, ou loi de Gumbel, est la
forme limite de la distribution de la valeur maximale d'un échantillon de valeurs. Le
maximum annuel d'une variable étant considéré comme le maximum de 365 valeurs
journalières, cette loi doit ainsi être capable de décrire les séries de maxima annuels.

44
Il est à remarquer que plus le nombre de paramètres d'une loi est grand, plus
l'incertitude dans l'estimation est importante. Pratiquement il est par conséquent
préférable d'éviter l'utilisation de lois à trois paramètres ou plus.
Comportement asymptotique.
Une comparaison du comportement de différentes lois pour de grandes
valeurs de 𝐹(𝑥), c'est-à-dire pour la queue de la distribution, peut être tentée. Si,
par convention, la distribution 𝐹(𝑥) est transformée en une variable 𝑢 de Gumbel
(𝑢 = −ln(𝐹(𝑥))), les 4 types de comportement asymptotique suivants peuvent
être distingués (Fig.3) :

1 𝑥 ≈ 𝑢1∕𝑛 , avec n > 1, loi normale


2 𝑥 ≈ 𝑢, croissance asymptotiquement
exponentielle: loi de Gumbel, Pearson III, loi
des fuites;
3 𝑥 = 𝑢𝑛 , avec n > 1: loi de Goodrich;
4 𝑥 ≈ exp( 𝑢𝑛 ) avec n > 0 (lois de type
logarithme): loi log-normale (Galton),
Pearson V, Fréchet, log-gamma.

Fig3. Les 4 types de comportement asymptotique


Cette approche suggère la plus grande prudence avec des lois de type
logarithmique qui peuvent largement surestimer les valeurs correspondant à des
fréquences rares.
Utilisation des tests d'adéquation.
Beaucoup d'auteurs utilisent les tests d'adéquation (voir paragraphe
contrôle de l'ajustement) comme technique permettant de choisir le modèle
fréquentiel approprié. Cependant il est à remarquer qu'un test statistique ne
permet que de conclure au rejet, ou à l'acceptation, de l'hypothèse nulle H0. Il
n'est pas en mesure de comparer plusieurs modèles fréquentiels et de choisir le
meilleur.
Ajustement du modèle fréquentiel.

45
Il s’agit d’étudier les techniques de l'ajustement ou du calage d'un modèle
fréquentiel à une série de données : il s'agit de définir les paramètres de la loi
retenue. Nous utiliserons comme support pédagogique la loi de Gumbel,
fréquemment utilisée en hydrologie, pour modéliser les événements extrêmes,
les pluies notamment.
Présentation de la loi de Gumbel.
La distribution des valeurs extrêmes provenant de n'importe quelle
distribution converge vers la loi des extrêmes généralisées (GEV). La distribution
de cette loi s'exprime de la manière suivante :

Où a est le paramètre de position, b le paramètre d'échelle et c le


paramètre de forme. 3 lois peuvent être distinguées en fonction des valeurs de c.
Leurs caractéristiques sont résumées dans le tableau suivant :

La fonction de répartition de la loi de Gumbel s'exprime de la manière suivante :

Techniques d'ajustement.
❖ Méthode graphique (Fig.4):
Dans le cas d'un ajustement selon la loi de Gumbel, la méthode graphique
repose sur le fait que l'expression d'un quantile correspond à l'équation d'une droite.
En conséquence, les points de la série à ajuster peuvent être reportés dans un
système d'axes x - u ; il est alors possible de tracer la droite qui passe le mieux par ces
points et d'en déduire les deux paramètres a et b définissant la loi. Le graphique ci-
dessous montre un ajustement à l'œil (voir figure ci-dessous). Dans la mesure où les

46
points xi sont connus (ils font partie de la donnée du problème), il suffit de définir les
coordonnées ui correspondant à chaque point pour pouvoir le positionner dans le
graphique. Ces coordonnées se déterminent à partir de la relation inverse de la
fonction de répartition qui donne u en fonction de la distribution 𝐹(𝑥) . Il s'agit donc
essentiellement d'estimer la probabilité de non-dépassement 𝐹(𝑥𝑖) qu'il convient
d'attribuer à chaque valeur.

Fig4. Méthode graphique d’ajustement


❖ Méthodes des moments.
La méthode des moments consiste à égaler les moments échantillonnaux
et les moments théoriques de la loi choisie x1, x2, …xn. Soit l'échantillon de

données à disposition. Posons et les


estimateurs standard de la moyenne et de la variance. Les deux premiers
moments théoriques de la loi de Gumbel s'expriment à partir des paramètres de
position et d'échelle de la manière suivante :

(constante d'Euler).
On obtient donc les formules suivantes pour l'estimation par la méthode
des moments :

❖ Méthode de maximum de vraisemblance.

47
La vraisemblance offre une approche générale à l'estimation de paramètres
inconnus à l'aide de données. Soit x1, x2, …xn un échantillon provenant d'une loi
𝐹𝜃 (𝑥), où θ est un paramètre inconnu qui peut être réel ou multivarié. La fonction
de vraisemblance, qu'il s'agit de maximiser, s'écrit :

où f est la densité de probabilité.


Souvent pour se simplifier le calcul, en remplaçant le produit par une somme,
il est judicieux de maximiser le logarithme de la fonction de vraisemblance. On
obtient dans le cas de la loi de Gumbel les estimateurs suivants :

La première équation doit être résolue de façon itérative. Dans ce cas la


solution de la méthode des moments peut par exemple être utilisée comme
première approximation.
Lorsque la taille de l'échantillon est faible, la méthode du maximum de
vraisemblance fournit une estimation biaisée des paramètres. Il s'agit, dans ce cas,
d'utiliser la correction proposée par Fiorentino et Gabriele.
Contrôle de l'ajustement.
Examen visuel de l'ajustement.
L'examen visuel du graphique représentatif de l'ajustement réalisé, même
s'il peut paraître rudimentaire, reste un des bons moyens pour juger de la qualité
d'un ajustement et devrait toujours constituer un préambule à tout test
statistique. La figure ci-dessous (fig.5) en présente un exemple.

48
Fig.5. Ajustement de la série tronquée des débits de pointe [m3/s] du
Nozon à Orny (1923-1931) à une loi exponentielle

Le test chi-carré de K. Pearson.


Ce test est appliqué dans une situation où l'on observe la répartition de
objets dans classes. Il est utilisé pour tester l'hypothèse que la répartition des
données s'effectue selon une distribution théorique. On se pose donc la question
de l'adéquation d'une distribution théorique à des données.
Le test de Kolmogorov-Smirnov.
Le test de Kolmogorov-Smirnov consiste à mesurer, pour une variable
aléatoire continue, la plus grande distance entre la distribution théorique 𝐹0 (𝑥)

et la distribution expérimentale 𝐹(𝑥) . Nous avons donc

et pour au moins une valeur de x. La distribution empirique,


ou observée, se calcule, dans la théorie de Kolmogorov-Smirnov, par la relation
classique :

Analyse des incertitudes.


A ce stade de l'analyse nous disposons d'un modèle fréquentiel 𝐹(𝑥),
obtenu après plusieurs étapes. On est donc en droit de se poser la question de sa
fiabilité ou degré de confiance que l'on peut y accorder.
L'incertitude liée au phénomène de la fluctuation d'échantillonnage peut
être évaluée par la procédure classique de l'intervalle de confiance. La

49
construction d'un tel intervalle peut être effectuée par la méthode dite de
l'erreur-type.
Dans ce cas, la construction de l'intervalle de confiance nécessite la
connaissance de trois grandeurs :

1. L'estimation du quantile, qui est donnée par l'équation .

2. L'erreur-type ,
3. La forme de la distribution d'échantillonnage, considérée dans la
plupart des cas comme "normale ".
Modèlisation stochastique.
Généralités.
Les phénomènes hydrologiques, comme tous phénomène naturel est pourvu
des aléas, en partant d’un état initial (précipitations), il y’a plusieurs état finaux
(plusieurs comportements des débits en fonction du temps). On parle de
stochasticité pour tous ce qui échappe de déterminisme dans lequel on parte d’un
état initial parfaitement connu en aboutissant à un état final dépourvu des
phénomènes aléatoires.
Les modèles déterministes prédisent des résultats par un jeu de variable
explicatives donné. La connaissance des distributions des prédictions du modèle est
pourtant précieuse pour connaitre la variabilité de ces résultats et pour calculer par
exemple des intervalles de confiance des prédictions. Un modèle déterministe n’est
pas suffisant et l’introduction d’aléatoire dans le modèle est nécessaire, d’où la
construction d’un modèle que l’on appel modèle stochastique. Un tel modèle donne
à la fois la prédiction et la variabilité de ses variables de sortie.
Le modèle stochastique sert, donc, à calculer ou estimer les risques qui
peuvent se produire au cours d’un phénomène hydrologique. Il est conçu lorsqu’on
s’intéresse, dans nos études, à la variabilité ce qui est raisonnable pour les modèles
locaux, et non à la tendance des phénomènes hydrologiques ajustée aux modèles
globaux, Ces variabilités « hydrologiques » constituent les aléas qui peuvent être
soit :
- Erreurs de mesures
- Interactions au sein d'un système complexe ; état initial inexact ;

50
- Fluctuation environnement ;
- Variations individuelles (génétique, ...) ;
- Fluctuation climatique.
Construction d’un modèle stochastique.
Introduction.
Partant des données réels (précipitations) qui seront « bruitées », en les

ajustant à une loi déterministe suivant une équation y i = f (x i), en tenant

comptes des différentes paramètres et variables du bassin versant, en fonction


du temps. Les paramètres seront bruités (on attribut à chaque paramètre l’aléa
qui lui convient), puis on ajout ce qu’on appelle un bruit ou encore résidu « εi »
comme étant une variable aléatoire qui suit, par exemple, une loi Normale. εi
représente les aléas qui sera mise en valeur par l’introduction des lois de
probabilité de la façon suivante :

Lors de la construction de modèle linéaire, on construit directement le


modèle stochastique. Par contre, lorsqu’on construit un modèle hydrologique, le
modèle est déterministe. En effet, les modèles hydrologiques sont souvent des
modèles très complexes qui sont itératifs et qui utilisent de très nombreuses
équations. Des variables prédictrices, telles que des variables météorologiques,
des variables décrivant l’état du sol ou encore la nature géologique des terrains.
Le modèle permet ensuite de prédire des variables de sorties qui sont,
généralement, des risques tels que les crues ou les étiages.
Etude des résidus (εi ).
Afin de choisir la méthode la lus adapté pour construire un modèle
stochastique, on étudie le comportement du modèle déterministe et ses résidus :
Le modèle est il biaisé, les résidus pour la chronique considérée sont-ils
indépendants ou auto-corrélés, les résidus suivent-ils une loi multi-normale, les
erreurs d’échantillonnage sont elle relativement importante et expliquent-elles,
à elle seules, les résidus du modèle déterministe.

51
❖ Etude du biais du modèle.
Cette étude est simple. Il suffit de tester, variable par variable, si la
moyenne des résidus est égale à 0. Pour cela, on utilise des tests de conformités
(test t). Si toutes les variables sont sans biais, alors le modèle sera dit sans biais.
Sinon, on peut toujours à un modèle sans biais par translation.
❖ Etude de l’indépendance.
L’indépendance des résidus est une hypothèse plus intéressante car c’est
une condition indispensable dans de nombreux tests. En hydrologie, les séries
chronologiques doivent être tester s’il s’agit d’un bruit blanc ou non. Les tests
d’hypothèses abordés au paragraphe d’analyse fréquentielle (III.2) et plus
particulièrement le test de Wald-Wolfiwitz qui sert à centrer les résidus et qui
permet de tester que, dans un échantillon de mesure « A » et « B », les données
pluviométriques, par exemple, sont distribués au hazard.
❖ Etude de la multi-normalité des résidus.
Pour déterminer si la distribution des résidus du modèle déterministe est
multi-normale, on peut utiliser de multi-normalité proposé par Mardia (1974). Ce
test est fondé sur les statistiques du coefficient d’asymétrie et du coefficient
d’aplatissement multivarié ? Ce test de multi-normalité est disponible dans le
logiciel HYFRAN.
❖ Distinction des erreurs d’échantillonnage et des erreurs de
prédiction du modèle
Si des répétitions des mesures sont disponible pour une même station, il
est intéressant de distinguer les erreurs de prédiction du modèle et les erreurs
d’échantillonnage dans le calcul des résidus du modèle. En effet, la variabilité des
résidus peut se décomposer en deux thermes : la variance des erreurs
d’échantillonnage et la variance de prédiction du modèle. Si cette dernière est
faible comparée à la variance des erreurs d’échantillonnage, alors le modèle
déterministe est bon et le modèle stochastique peut étre construit avec
l’équation suivante :

52
La présence des répétitions permet également de tester si une
combinaison des variables explicatives (ce qu’on appelle traitement) aucun effet
significatif sur les résidus. Des résultats de ce test dépend de la modélisation
stochastique que l’on choisira de mettre en place.
Typologie des modèles stochastiques.
Les modèles stochastiques peuvent être classer de la manière suivante :
Modèles à variabilité additives
Les modèles stochastiques additifs se construisent en ajoutant aux
prédictions du modèle déterministes un terme d’erreur. C’est ce terme d’erreur
qui rend le modèle stochastique. Plusieurs modélisations de la variabilité et des
corrélations des résidus des variables de sortie du modèle sont envisageables.
Modèle autorégressif d’ordre 1.
Afin de rendre aléatoire toutes les variables (intermédiaires et de sortie)
du modèle, le terme de variabilité peut être inséré directement dans les
équations du modèle plutôt qu’ajouté aux résultats déterministes de celui-ci.

53