Vous êtes sur la page 1sur 17

Hydrological Sciences Journal

ISSN: 0262-6667 (Print) 2150-3435 (Online) Journal homepage: https://www.tandfonline.com/loi/thsj20

Développement du modèle log-normal non-


stationnaire et comparaison avec le modèle GEV
non-stationnaire

I. AISSAOUI-FQAYEH , S. EL-ADLOUNI , T. B. M. J. OUARDA & A. ST-HILAIRE

To cite this article: I. AISSAOUI-FQAYEH , S. EL-ADLOUNI , T. B. M. J. OUARDA & A. ST-


HILAIRE (2009) Développement du modèle log-normal non-stationnaire et comparaison avec le
modèle GEV non-stationnaire, Hydrological Sciences Journal, 54:6, 1141-1156, DOI: 10.1623/
hysj.54.6.1141

To link to this article: https://doi.org/10.1623/hysj.54.6.1141

Published online: 19 Jan 2010.

Submit your article to this journal

Article views: 2202

View related articles

Citing articles: 2 View citing articles

Full Terms & Conditions of access and use can be found at


https://www.tandfonline.com/action/journalInformation?journalCode=thsj20
Hydrological Sciences–Journal–des Sciences Hydrologiques, 54(6) Décembre 2009 1141

Développement du modèle log-normal non-stationnaire et


comparaison avec le modèle GEV non-stationnaire

I. AISSAOUI-FQAYEH1, S. EL-ADLOUNI2, T. B. M. J. OUARDA1 &


A. ST-HILAIRE1
1 Chaire en hydrologie statistique (Hydro-Québec / CRSNG), Chaire du Canada en estimation des variables
hydrologiques, INRS-ETE, Universite du Québec, 490 rue de la Couronne, Québec G1K 9A9, Canada
2 Institut National de Statistique et d’Économie Appliquée, INSEA, Avenue Allal El Fassi, Madinat Al Irfane,
BP 62 – 10100 Rabat Instituts, Maroc
el_adlouni@yahoo.com

Résumé Dans le présent travail on présente le modèle log-normal (LN) non-stationnaire pour l’ajustement
des séries dont les paramètres sont fonctions de covariables. Les modèles non-stationnaires, d’une manière
générale, permettent de tenir compte des tendances ou de la variabilité temporelle observée dans un
échantillon. Ils permettent également de considérer l’effet d’une covariable sur une variable donnée. Le
modèle LN non-stationnaire est comparé au modèle GEV non-stationnaire par simulation de Monte Carlo.
Les résultats montrent que même dans le cas de séries générées à partir d’un modèle GEV non-stationnaire,
le modèle LN non-stationnaire conduit à une estimation des quantiles plus adéquate que celle qui est obtenue
par le modèle GEV non-stationnaire. L’utilité de ces modèles est illustrée par l’étude de l’effet d’un indice
climatique (Indice d’Oscillation Australe, SOI) sur des données hydro-climatiques de la Californie, USA.
L’effet de l’indice SOI sur les précipitations maximales annuelles, enregistrées à la station Tehachapi de la
Californie, est étudié.
Mots clefs distribution log-normale; estimateur du maximum de vraisemblance; modèles non-stationnaires;
quantiles; précipitations maximales annuelles

Non-stationary lognormal model development and comparison with the non-stationary GEV
model
Abstract Classical flood frequency analysis (FFA) requires stationarity of the observed data set. This
hypothesis is not always verified for observed data. This restriction can be lifted if classical distributions
used in FFA integrate non-stationarity by considering time dependent parameters. It is also possible to
consider other covariates instead of the time. The conditional distribution can then be obtained with respect
to given values of the covariates. In the present study the non-stationary lognormal (LN) model with linear
and quadratic dependence is presented, and corresponding maximum likelihood equations are developed.
These models are compared to the non-stationary generalized extreme value (GEV) models by Monte Carlo
simulation. The non-stationary LN model is also applied to a case study to illustrate its potential. The case
study deals with the analysis of the annual maximum precipitation at the Tehachapi Station in California,
USA, with the Southern Oscillation Index (SOI) as a covariate.
Key words lognormal model; maximum likelihood estimator; non-stationary model; quantiles;
annual maximum precipitation

1 INTRODUCTION
L’étude des processus et événements hydrologiques extrêmes aux échelles locale et régionale
passe par la mesure et l’analyse de différentes variables hydro-climatiques (précipitations,
températures, débits, etc.). Cela nécessite des outils statistiques adaptés qui tiennent compte de
l’interaction entre les différentes variables. Les approches classiques d’analyse fréquentielle
supposent la stationnarité des séries d’observations, ainsi que l’indépendance et l’homogénéité.
Autrement dit, les observations doivent être indépendantes et identiquement distribuées (iid). En
hydrologie, la loi de probabilité des crues peut changer avec le temps (existence de non-
stationnarité) comme conséquence des activités humaines ou à cause des changements climatiques
(Zhang et al., 2001; El Adlouni et al., 2007). Il est donc nécessaire de développer des approches
d’analyse fréquentielle qui tiennent compte de la non-stationnarité des séries des données hydro-
climatiques. Ce genre de modèles permet d’inclure l’effet de différentes covariables sur la
variabilité et l’évolution de la série observée.

La discussion concernant cet article est ouverte jusqu’au 1er Juin 2010 Copyright © 2009 IAHS Press
1142 I. Aissaoui-Fqayeh et al.

Avant de procéder à une analyse fréquentielle, il faut vérifier les hypothèses d’homogénéité et
de stationnarité des séries observées. Plusieurs tests permettent de vérifier ces hypothèses. Dans ce
travail on s’intéresse au problème de non-stationnarité. Pour tester cette dernière on utilise les tests
de Mann, Kruskal-Wallis (Faucher et al., 1997) et Mann-Kendall (Önöz & Bayazit, 2003).
Récemment de nouveaux tests ont été développés tels que le test de segmentation (Chen & Rao,
2002) et le test de Kwiatkowski-Phillips-Schmidt-Shin (le test KPSS) (Hobijn, 2004).
En analyse fréquentielle, plusieurs méthodes ont été développées pour l’estimation des
paramètres des distributions d’intérêt. La méthode des moments de probabilités pondérées (PWM)
et la méthode des L-moments (LM) (Hosking, 1990) sont parmi les méthodes les plus utilisées, en
raison de leur simplicité pour la majorité des distributions. Dans le cas non-stationnaire (existence
d’une non-stationnarité temporelle ou de dépendance de covariables) les estimateurs des
L-moments sont compliqués à implémenter d’une manière explicite. Dans ce cas, on considère
souvent l’estimation par la méthode du maximum de vraisemblance (ML) qui permet, par le biais
de la résolution numérique du système d’équations, d’estimer les paramètres même dans des cas
très complexes (Coles, 2001). El Adlouni et al. (2007) ont donné une extension de la méthode du
maximum de vraisemblance généralisée (GML) introduite par Martin & Stedinger (2000), au cas
de la présence de covariables pour le modèle GEV non-stationnaire. La méthode GML permet
d’intégrer une loi a priori sur le paramètre de forme de la loi GEV et de réduire l’espace des
solutions de la méthode du ML à des valeurs admissibles dans le cas des séries hydro-
météorologiques.
La majorité des travaux sur les modèles non-stationnaires est liée au modèle généralisé des
valeurs extrêmes (GEV) (Coles, 2001; Clarke, 2002a,b). Katz et al. (2002) ont utilisé ce modèle
pour traiter le cadre local ainsi que le cadre régional. En effet, la loi GEV est très utilisée en
hydrologie et a été jugée dans plusieurs études comme adéquate pour l’ajustement des séries des
maximums (Faucher et al., 1997). Cependant dans certaines régions, d’autres distributions ont été
suggérées pour l’étude des séries hydrométéorologiques: log-normale (LN) en Chine, log-Pearson
Type III (LPIII) aux États-Unis d’Amérique (USWRC, 1982), ou log-normale à deux paramètres
(LN) au Québec (Kouider et al., 2002). Notons que la loi LN a un comportement au niveau des
extrêmes qui est très semblable à celui des distributions à queues lourdes (Ouarda et al., 1994). En
considérant ce résultat et les derniers travaux de la théorie des valeurs extrêmes, El Adlouni et al.
(2008) ont présenté une classification des distributions les plus utilisées en analyse fréquentielle
par rapport à leur queue droite. On remarque à partir de cette classification que la loi log-normale a
une queue plus lourde que celles des lois sub-exponentielles (exemple: Gumbel, gamma, Halphen
Type A) et plus légère que celles des distributions à variations régulières (Fréchet, log-Pearson,
inverse gamma). Il est souvent très difficile de discriminer entre la loi LN et les distributions à
variations régulières, ou connues aussi sous le nom de distributions de type puissance.
Dans cette étude, on présente le modèle log-normal non-stationnaire à deux paramètres. Ce
modèle, comme il a été déjà mentionné, s’ajuste bien à plusieurs séries de données hydrologiques
et respecte le principe de parcimonie. En effet, le nombre de paramètres augmente avec le nombre
de covariables d’où l’avantage de considérer une distribution avec le moins de paramètres
possible, surtout en hydrologie où la taille des séries d’observations est souvent faible. Le
deuxième objectif est de comparer, sur la base de simulations de Monte Carlo, les propriétés des
estimateurs de quantiles par la méthode du maximum de vraisemblance obtenus pour les modèles
LN non-stationnaire et GEV non-stationnaire.
Après avoir rappelé certaines propriétés statistiques de la loi log-normale, on présente le
modèle log-normal non-stationnaire et certains des cas particuliers avec la méthode du maximum
de vraisemblance pour l’estimation des paramètres. Nous présentons ensuite dans la Section 3 une
comparaison par simulation de Monte Carlo entre le modèle LN non-stationnaire et le modèle
GEV non-stationnaire. Une application qui illustre la flexibilité et l’efficacité du modèle proposé
est présentée dans la Section 4. Les conclusions et la discussion générale sont présentées dans la
Section 5.

Copyright © 2009 IAHS Press


Développement du modèle log-normal non-stationnaire 1143

2 MODELE LOG-NORMAL NON-STATIONNAIRE


2.1 Caractéristiques statistiques
2.1.1 Distribution log-normale On présente ci-dessous quelques propriétés statistiques de la
loi log-normale (Leurent, 1998). Une variable X est distribuée suivant une loi log-normale si son
logarithme suit une loi normale. Soient μ et σ la moyenne et l’écart-type de la transformée
logarithmique, log(X). La variable Z = [log(X) – μ]/σ est distribuée suivant une loi normale centrée
réduite. Soit Φ la fonction de répartition de la loi normale centrée réduite et F celle de la loi log-
normale, on a alors les égalités suivantes:
F ( x 0 ) = Pr( X ≤ x0 ) = Pr (Z ≤ z 0 ) = Φ(z 0 ) = Φ[(ln( x0 ) − μ ) / σ ] = p (1)

(
F −1 ( p) = exp μ + σ ⋅ Φ −1 ( p) ) (2)
La fonction de répartition peut être écrite sous la forme:
x0
1 ⎛ 1 ⎛ log( x) − μ ⎞ 2 ⎞
F ( x0 ) = ∫ σx 2π ⎜⎜ − 2 ⎜⎝ σ ⎟⎠ ⎟⎟dx
exp (3)
0 ⎝ ⎠
La fonction de densité de probabilité f(x) est donnée par:
1 ⎛ 1 ⎛ log( x) − μ ⎞ 2 ⎞
f ( x) = exp⎜ − ⎜ ⎟ ⎟ (4)
σx 2π ⎜ 2 ⎝ σ ⎠ ⎟⎠

où x > 0, σ > 0 et μ ∈ Ρ.
Les moments d’ordre 1 et d’ordre 2 sont donnés par:
E [X ] = exp(μ + σ 2 / 2) (5)

[ ]
E X 2 = exp(2 μ + 2σ 2 )
(6)
= (E[ X ]) × exp(σ 2 )
2

La variance s’écrit donc de la façon suivante:


( )( )
var( X ) = exp 2 μ + σ 2 exp(σ 2 ) − 1 = E[ X ] 2 exp(σ 2 ) − 1 ( ) (7)
Le coefficient de variation (Cv) et le coefficient d’asymétrie (Cs) sont donnés par:

( ) ( )( )
1 1
σ2 σ2 2
Cv = e − 1 et CS = e
2 − 1 eσ + 2 .
2

Après une transformation logarithmique, on obtient des variables aléatoires normalement


distribuées de moyenne μ et de variance σ2 données par les formules:
1 ⎛ var[ X ] ⎞ ⎛ var[ X ] ⎞
μ = log(E[ X ]) − log⎜⎜1 + ⎟, σ 2 = log⎜⎜1 + ⎟ (8)
2 (E[ X ])2 ⎟ ⎝ ⎠ ⎝ (E[ X ])2 ⎟⎠
2.1.2 Modèle log-normal non-stationnaire Les modèles fréquentiels classiques peuvent être
généralisés pour intégrer la notion de non-stationnarité dans le processus de modélisation en
intégrant le temps ou d’autres covariables au niveau des paramètres. De telles covariables
pourraient incorporer des tendances, des cycles, ou des indices climatiques tels que les indices
d’oscillations climatiques de basse fréquence (Coles 2001; Katz et al., 2002). Par conséquent ces
modèles peuvent être appliqués pour étudier l’effet des changements climatiques, ainsi que l’effet
de la variabilité climatique sur la fréquence et l’amplitude des événements extrêmes.
Le modèle log-normal non-stationnaire correspond au processus Xt, tel que les paramètres sont
fonctions du temps ou d’autres covariables. Ainsi, pour des valeurs fixes du temps ou/et de

Copyright © 2009 IAHS Press


1144 I. Aissaoui-Fqayeh et al.

covariables, Xt est distribué selon une loi log-normale. Différents types de dépendance peuvent
être considérés en représentant des paramètres comme fonctions des covariables. Cependant,
quand deux modèles donnent un bon ajustement, le modèle avec le nombre de paramètres le plus
faible sera préféré.
L’introduction des covariables peut être effectuée au niveau de n’importe quel paramètre, ou
même à deux ou trois paramètres à la fois. Sankarasubramanian & Lall (2003) ont comparé trois
méthodes pour l’estimation des quantiles conditionnels. La première méthode est paramétrique et
est basée sur une transformation d’une loi normale dont les paramètres dépendent de covariables.
Les deux autres méthodes correspondent à une approche non paramétrique (régression des
quantiles; Koenkar & Bassett, 1978) et une approche semi-paramétrique (modèle de vraisemblance
locale; Davison & Ramesh, 2000).
L’introduction de covariables au niveau des paramètres implique des changements des
caractéristiques statistiques de la distribution ajustée. Plusieurs scientifiques suggèrent d’associer
un changement dans la variance à celui de la moyenne pour que le coefficient de variation (Cv)
reste constant. Cependant, dans le cas d’une variable distribuée suivant une loi log-normale, le
coefficient Cv est fonction seulement du paramètre σ. Ainsi, garder le coefficient Cv constant
implique que le paramètre σ est constant. Par conséquent, dans le présent travail, seul le paramètre
μ est fonction des covariables.
Pour étudier les propriétés des estimateurs des paramètres, trois modèles sont considérés dans
le présent travail:
– LN(0) (μ, σ) qui est un modèle classique où tous les paramètres sont constants μt = μ, σt = σ.
– LN(1) (μt = β1 + β2Yt, σ): le paramètre μ est fonction linéaire d’une covariable Yt.
– LN(2) (μt = β1 + β2Yt + β3Yt2, σ): le paramètre μ est une fonction quadratique d’une covariable
temporelle Yt et l’autre paramètre est constant.
Notons que pour la distribution log-normale, le changement du paramètre μ mène à un
changement de la moyenne et de la variance de la variable, ce qui correspond souvent aux
changements observés dans des séries hydrométéorologiques.

2.2 Estimation des paramètres par la méthode du maximum de vraisemblance


Les paramètres du modèle log-normal non-stationnaire peuvent être estimés par la méthode du
maximum de vraisemblance, par maximisation du logarithme de la fonction de vraisemblance. La
fonction de vraisemblance s’écrit:
n
Ln ( x | μt , σ t ) = ∏ f ( xt ; μt , σ t )
t =1

n
1 ⎛ 1 ⎛ log x − μ ⎞ 2 ⎞ (9)
=∏ exp ⎜ − ⎜ t t
⎟ ⎟⎟
t =1 σ t xt 2π ⎜ 2 ⎝ σ ⎠ ⎠
⎝ t

1 n ⎛ 1 ⎛ log x − μ ⎞ 2 ⎞
= n n ∏ exp ⎜ − ⎜
⎜ 2⎝
t

σt
t
⎟ ⎟⎟
⎠ ⎠
∏ σ t ∏ xt (2π )
t =1 t =1
n / 2 t =1

où n est la taille de la série à ajuster.


Posons σt = σ, puisque la non-stationnarité considérée dans le présent travail est liée seule-
ment au paramètre μ. Dans ce cas, la fonction de log-vraisemblance ln est donnée par:
n ⎛
1 ⎛ log xt − μt ⎞ ⎞
n 2
n
ln ( x; μt , σ ) = (−n log(σ ) − ∑ log( xt ) − log(2π )) + ∑ ⎜ − ⎜ ⎟ ⎟ (10)
t= 2 ⎜ 2⎝
t =1 ⎝ σ ⎠ ⎟⎠
Par définition, les estimateurs du maximum de vraisemblance sont les solutions du système
d’équations des dérivées partielles de ln par rapport à chacun des paramètres.

Copyright © 2009 IAHS Press


Développement du modèle log-normal non-stationnaire 1145

Pour le modèle LN(1), où (μt = β1 + β2Yt) et Yt est le vecteur des covariables, les estimateurs du
maximum de vraisemblance des paramètres β1, β2 et σ sont solutions du système d’équations
suivant:

⎪1 n
⎪ 2 ∑ ( log x t − β 1 − β 2 y t ) = 0
⎪σ t =1
⎪⎪ 1 n
⎨ 2 ∑ yt ( log x t − β 1 − β 2 y t ) = 0
(11)
⎪σ t =1

⎪ n ⎜ ( log x t − β 1 − β 2 y t ) ⎟
⎛ n 2

⎪ σ ⎜∑
− +
t =1 σ3 ⎟
=0
⎪⎩ ⎝ ⎠
Ce système peut être résolu par une méthode numérique comme par exemple l’algorithme de
Newton-Raphson. D’une manière analogue on obtient un système équivalent au système précédent
pour le modèle LN(2), avec une quatrième équation pour le paramètre β3.

2.3 Estimation des quantiles


Le quantile de probabilité au non-dépassement p conditionnellement à une valeur observée y0 de la
covariable Y est obtenu à partir d’une loi log-normale de paramètres (μy0, σ). Ce quantile peut être
présenté sous forme explicite:
(
x p , y0 = exp μ y0 + σ Φ −1 ( p ) ) (12)

où μy0 est le premier paramètre du modèle log-normal non-stationnaire conditionnellement à la


valeur particulière y0 de la covariable. Ce paramètre change selon les différents modèles: pour le
modèle LN(0), μy0 = μ; pour le modèle LN(1) il est fonction linéaire de la covariable, μy0 = β1 + β2y0;
et pour le modèle LN(2) il s’écrit sous la forme μy0 = β1 + β2y0 + β3y02.
En remplaçant ces paramètres par leurs estimateurs dans l’équation (12), on obtient les
estimateurs des quantiles.

3 COMPARAISON DES MODELES LN ET GEV NON-STATIONNAIRES


L’objectif de cette section est de comparer le modèle LN non-stationnaire au modèle GEV non-
stationnaire. Les modèles GEV non-stationnaires considérés dans ce travail ont été décrits en détail
par El Adlouni et al. (2007) et sont présentés dans l’Annexe A. Pour étudier la différence entre les
deux modèles, nous avons considéré la même méthode d’estimation: la méthode du maximum de
vraisemblance. Nous avons considéré plusieurs types de non-stationnarité qui peuvent être
observés dans des séries hydrométéorologiques. Pour tous les cas, la covariable est distribuée
suivant une loi normale centrée réduite.

3.1 Plan de simulation


Dans cette partie on compare par simulations les modèles LN et GEV non-stationnaires (Annexe)
pour l’estimation des extrêmes conditionnellement aux valeurs de covariables. Le choix des
paramètres des modèles simulés est effectué sur la base de la moyenne et du coefficient de
variation de 40 séries de débit maximum annuel du Québec, étudiées par Kouider et al. (2002). Les
résultats obtenus à partir de cette étude nous ont permis de déterminer les intervalles de variation
des deux paramètres de la loi LN. Les coefficients de variation les plus observés pour ces 40 séries
appartiennent à l’intervalle [0.15, 0.35]. Nous avons considéré pour cette étude deux coefficients
de variation: Cv = 0.2 et Cv = 0.3. La moyenne a été fixée E[x] = 200. Les valeurs de l’asymétrie,
pour une variable distribuée suivant une loi LN, peuvent être déduites de celles du coefficient de

Copyright © 2009 IAHS Press


1146 I. Aissaoui-Fqayeh et al.

variation à partir de la formule suivante:


Cs = Cv (Cv2 + 3) (13)
Les coefficients d’asymétrie correspondant aux deux coefficients de variation Cv = 0.2 et Cv = 0.3
sont Cs = 0.6 et Cs = 0.9, respectivement. Comme conséquence au choix de ces deux cas, les
valeurs du paramètre σ pour la loi LN et du paramètre de forme κ pour la loi GEV sont fixées pour
chaque asymétrie (Tableau 1).
Comme nous l’avons déjà mentionné, le modèle LN(1) peut représenter: (a) le cas où la
moyenne dépend d’une covariable, et (b) la moyenne et la variance sont fonctions de la covariable.
Nous avons considéré les trois cas suivants:
– Cas 1: on compare M1 = LN(1) et M2 = GEV(10) (le paramètre de position est fonction linéaire
de la covariable).
– Cas 2: on compare M1 = LN(1) et M2 = GEV(11) (les paramètres de position et d’échelle sont
fonctions linéaires de la covariable).
– Cas 3: comparaison des modèles M1 = LN(2) et M2 = GEV(21) (le paramètre de position est
une fonction quadratique et le paramètre d’échelle est fonction linéaire de la covariable).
Pour les trois cas, la covariable Yt est distribuée selon une loi normale centrée réduite (de
moyenne 0 et de variance 1). Les paramètres de dépendance de la covariable, pour les deux
modèles, ont été choisis convenablement pour que les échantillons générés à partir des deux
modèles aient les mêmes caractéristiques de dépendance des covariables. Nous avons considéré
des dépendances semblables à celles observées en pratique. Les paramètres de la loi GEV ont été
fixés à l’avance et ceux du modèle log-normal ont été calculés par estimation sur la base d’un
échantillon de taille 10 000 simulé à partir du modèle GEV avec covariable.
Le Tableau 1 présente les paramètres des modèles pour les trois cas considérés et pour les
deux coefficients de variation. Pour comparer ces modèles (deux à deux), on génère N = 5000
échantillons de taille n = 50 à partir du modèle Mi (i = 1, 2) et on estime les quantiles de
probabilité au non-dépassement 50, 90 et 99% à partir des deux modèles M1 et M2. Les quantiles
sont estimés conditionnellement à des valeurs particulières de la covariable—les valeurs: minimale
(min), moyenne (moy) et maximale (max). On calcule ensuite le biais relatif (BR) et la racine de
l’erreur quadratique moyenne relative (REQMR). Le BR et la REQMR sont donnés par les
formules suivantes:
N Q ˆ −Q
BR = 1 ∑
i, p p
(14)
N i =1 Qp
1/ 2
⎡ N ⎛ Qˆ − Q ⎞2 ⎤
REQMR = ⎢ 1 ∑ ⎜ i , p p
⎟ ⎥ (15)
⎢ N i =1 ⎝ Q p ⎟⎠ ⎥

⎣ ⎦
ˆ
où Qi , p et Qp sont respectivement les estimateurs des quantiles, pour l’itération i, et les quantiles
théoriques de probabilité au non-dépassement p, et où N est le nombre de simulations.

Tableau 1 Paramètres des lois LN et GEV correspondant aux deux coefficients de variation considérés.
Cv Cv = 0.2 Cv = 0.3
σ = 0.193 pour LN σ = 0.283 pour LN
κ = –0.01 pour GEV κ = –0.04 pour GEV
Cas 1 LN(1) (μt = 6.2 – 0.1Yt, σ) LN(1) (μt = 7.28 – 0.1Yt, σ)
GEV(10) (μt = 1060 – 200Yt, 200, κ) GEV(10) (μt = 1360 – 200Yt, 250, κ)
Cas 2 LN(1) (μt = 6.2 – 0.1Yt, σ) LN(1) (μt = 7.28 – 0.1Yt, σ)
GEV(11) (μt = 1060 – 200Yt, exp(log(200) – 0.2Yt), κ) GEV(11) (μt = 1360 – 200Yt, exp(log(250) – 0.2Yt), κ)
Cas 3 LN(2) (μt = 6.2 – 0.2Yt + 0.1Yt2, σ) LN(2) (μt = 7.28 – 0.1Yt + 0.1Yt2, σ)
GEV(21) (μt = 1060 – 250Yt + 3Yt2, exp(log(200) – 0.2Yt), κ) GEV(21) (μt = 1360 – 250Yt + 3Yt2, exp(log(250) – 0.2Yt), κ)

Copyright © 2009 IAHS Press


Développement du modèle log-normal non-stationnaire 1147

Cette comparaison permettra d’évaluer: (a) les erreurs reliées à la méthode d’estimation des
paramètres pour une faible taille de l’échantillon (n = 50) dans le cas où on effectue un bon choix
du modèle, ainsi que (b) les erreurs reliées au mauvais choix du modèle (choisir un modèle LN au
lieu de GEV et vice versa).

3.2 Résultats
Les résultats de la comparaison entre les modèles LN et GEV avec covariables, pour les six cas
considérés sont présentés dans les Tableaux 2–7. Pour chaque cas on présente le BR et le REQMR
des quantiles conditionnellement aux valeurs minimale, moyenne et maximale de la covariable
(distribuée suivant une loi normale). Notons que la différence entre les deux modèles est
relativement importante dans le cas des quantiles extrêmes (probabilité au non-dépassement 99%)
conditionnellement à la valeur minimale ou maximale de la covariable. Tous les résultats sont
présentés dans les tableaux ci-dessous. Cependant, l’analyse des résultats va être faite
principalement pour le quantile de probabilité au non-dépassement 99% conditionnellement à la
valeur maximale de la covariable.
3.2.1 Les modèles LN(1) et GEV(10) Pour le premier cas, on compare les modèles LN(1) et
GEV(10) avec une faible asymétrie (le coefficient de variation Cv = 0.2). Les résultats sont
présentés dans le Tableau 2.
On remarque que lorsque l’on génère à partir du modèle GEV(10) (bloc de ligne correspondant
au modèle GEV(10)), le BR du quantile (de probabilité au non-dépassement 99%
conditionnellement à la valeur maximale de la covariable) estimé à partir du modèle LN(1) est de
l’ordre de −9% alors qu’il est très faible pour GEV(10) (−0.75%). Cependant, la différence en
termes de la REQMR des quantiles estimés à partir de ces deux modèles n’est pas aussi importante
que celle qui est obtenue pour le biais. La REQMR est de l’ordre de 12% pour le modèle GEV(10)
et de 14% pour le modèle LN(1) (pour le même quantile, 99%, et la même valeur de la covariable
qui est le maximum).
Dans le cas où les échantillons sont générés à partir d’un modèle LN(1), (bloc de ligne
correspondant au modèle LN(1)), le BR maximum est de –0.17% pour le modèle LN(1) et 21% pour
le modèle GEV(10). On remarque que cette différence est très importante pour le biais et qu’elle
l’est aussi pour l’erreur quadratique moyenne (REQMR est de l’ordre de 10% pour LN(1) et 32%
pour GEV(10)). Le Tableau 3 présente les résultats de la comparaison de ces deux modèles, LN(1)et
GEV(10), pour le coefficient de variation Cv = 0.3.

Tableau 2 BR et REQMR des quantiles estimés, conditionnellement à la covariable, par le modèle GEV(10)
et LN(1) pour Cv = 0.2.
Distribution à générer Valeurs de la BR % (GEV(10)): BR % (LN(1)):
covariable 50% 90% 99% 50% 90% 99%
GEV(10) Min 0.11 –0.60 –0.59 2.34 4.90 7.17
Moy 0.17 –0.65 –0.63 –0.02 –0.81 –0.78
Max 0.33 –0.75 –0.70 3.50 –5.08 –9.35
LN(1) Min –7.05 –12.20 –15.31 –0.28 –0.96 –1.47
Moy 1.19 1.16 1.48 –0.04 –0.72 –1.23
Max –14.93 6.82 21.63 1.02 0.33 –0.17
REQMR % (GEV(10)): REQMR % (LN(1)):
GEV(10) Min 5.70 5.22 8.14 7.22 9.01 11.34
Moy 3.26 3.86 8.19 2.93 3.92 5.42
Max 13.92 10.66 12.28 12.3 12.22 14.54
LN(1) Min 8.99 13.01 16.75 6.34 6.84 7.88
Moy 3.37 4.15 10.03 2.69 3.76 5.44
Max 22.76 17.23 32.11 9.69 9.97 10.68

Copyright © 2009 IAHS Press


1148 I. Aissaoui-Fqayeh et al.

Tableau 3 BR et REQMR des quantiles estimés, conditionnellement à la covariable, par le modèle GEV(10)
et LN(1) pour Cv = 0.3.
Distribution à générer Valeurs de la BR % (GEV(10)): BR % (LN(1)):
covariable 50% 90% 99% 50% 90% 99%
GEV(10) Min –0.11 –0.82 –0.24 3.61 6.45 6.59
Moy 0.01 –0.83 –0.18 0.36 –1.34 –4.19
Max 0.38 –0.87 –0.05 7.05 –6.54 –15.55
LN(1) Min –8.82 –15.28 –17.06 0.59 –0.17 –0.69
Moy 1.00 1.23 4.26 0.04 –0.70 –1.22
Max –8.31 20.28 42.32 0.73 –0.01 –0.52
REQMR % (GEV(10)): REQMR % (LN(1)):
GEV(10) Min 5.94 5.67 10.68 8.49 10.91 12.17
Moy 3.29 4.43 11.44 3.03 4.49 7.33
Max 16.24 11.84 16.18 15.53 13.8 19.39
LN(1) Min 11.90 16.40 20.30 9.63 10.18 11.60
Moy 4.82 6.05 16.96 4.11 5.52 7.92
Max 25.75 29.30 55.36 14.70 15.08 16.10

Les mêmes conclusions sont valables pour le deuxième cas (Cv = 0.3), avec des valeurs du
BR et de la REQMR relativement plus élevées que celles qui sont obtenues dans le cas de faible
asymétrie (Tableau 3). Notons que les REQMR des quantiles estimés à partir du modèle LN(1) sont
presque les mêmes quelle que soit la population mère (générée à partir du modèle GEV(10) ou
LN(1)); alors que, lorsque l’ajustement est effectué avec le modèle GEV(10), la différence est très
grande dépendamment de la population mère (12% quand on génère à partir de GEV(10) et 32%
dans le cas de valeurs simulées à partir de LN(1)).
3.2.2 Les modèles LN(1) et GEV(11) Pour le deuxième cas, on considère des échantillons
générés à partir des modèles LN(1) et GEV(11) pour tenir compte de l’effet d’une dépendance
linéaire du paramètre d’échelle de la loi GEV en fonction de la covariable. Les résultats dans le cas
de Cv = 0.2 sont présentés dans le Tableau 4.
On remarque que dans ce cas les BR des quantiles estimés à partir du modèle GEV(11), pour
des échantillons générés à partir du modèle LN(1), sont relativement faibles par rapport aux
résultats de comparaison des modèles GEV(10) et LN(1). Les BR obtenus sont du même ordre que

Tableau 4 BR et REQMR des quantiles estimés, conditionnellement à la covariable, par le modèle GEV(11)
et LN(1) pour Cv = 0.2.
Distribution à générer Valeurs de la BR % (GEV(11)): BR % (LN(1)):
covariable 50% 90% 99% 50% 90% 99%
GEV(11) Min 0.53 2.09 3.97 1.53 –3.8 –6.50
Moy –0.11 –1.26 –1.30 –0.26 –1.01 –0.90
Max 0.59 –0.04 0.12 4.46 5.03 7.80
LN(1) Min –5.98 –3.97 –4.02 0.76 0.00 –0.56
Moy 1.33 0.04 –1.81 0.27 –0.47 –1.03
Max –6.69 –6.67 –7.03 0.25 –0.47 –1.02
REQMR % (GEV(11)): REQMR % (LN(1)):
GEV(11) Min 6.63 13.0 22.58 7.32 8.14 10.17
Moy 3.19 4.03 8.79 2.75 3.92 5.53
Max 12.29 15.18 21.38 11.29 14.50 18.02
LN(1) Min 7.89 9.93 15.21 6.59 6.85 7.73
Moy 3.42 3.91 8.90 2.75 3.75 5.39
Max 21.56 17.49 22.59 10.37 10.74 11.47

Copyright © 2009 IAHS Press


Développement du modèle log-normal non-stationnaire 1149

Tableau 5 BR et REQMR des quantiles estimés, conditionnellement à la covariable, par le modèle GEV(11)
et LN(1) pour Cv = 0.3.
Distribution à générer Valeurs de la BR % (GEV(11)): BR % (LN(1)):
covariable 50% 90% 99% 50% 90% 99%
GEV(11) Min 0.4383 0.9757 2.4842 3.9459 7.1784 7.57
Moy 0.13 –1.00 –0.57 0.48 –1.22 –4.08
Max 1.02 1.01 2.67 6.57 –7.76 –17.05
LN(1) Min –6.14 –4.22 –7.85 0.89 0.26 –0.14
Moy 1.00 –1.38 –3.46 0.09 –0.52 –0.93
Max –11.71 –6.70 –15.84 0.45 –0.15 –0.54
REQMR % (GEV(11)): REQMR % (LN(1)):
GEV(11) Min 6.51 10.37 18.24 8.43 11.12 12.41
Moy 3.33 4.54 11.82 3.05 4.47 7.21
Max 17.73 24.00 34.81 14.72 14.03 20.34
LN(1) Min 9.63 13.49 22.65 10.03 10.53 11.81
Moy 4.72 5.54 13.04 4.05 5.42 7.69
Max 25.34 23.08 31.18 14.87 15.32 16.24

ceux qui sont obtenus avec le modèle LN(1) lorsque les échantillons sont générés à partir du modèle
GEV(11). Notons que ces deux modèles se ressemblent plus que ceux qui sont considérés dans la
première comparaison GEV(10) et LN(1). On remarque également que:
– les REQMR des quantiles estimés par le modèle GEV(11) sont les mêmes quelle que soit la
population à partir de laquelle on génère; et
– les REQMR des quantiles obtenus à partir du modèle LN(1) sont faibles par rapport à celles du
modèle GEV(11) quel que soit le modèle à partir duquel on génère. Ceci est dû principalement
au nombre de paramètres considérés dans chaque modèle (trois paramètres pour LN(1) et cinq
paramètres pour GEV(11)).
Les résultats correspondants à la comparaison de ces deux modèles dans le cas de Cv = 0.3
sont donnés dans le Tableau 5.
Les conclusions tirées pour le premier cas, faible asymétrie, restent valables pour Cv = 0.3
avec une légère augmentation de la REQMR pour les deux modèles (Tableau 5). Cependant, les
REQMR des quantiles sont presque les mêmes si on considère le même modèle d’ajustement
(c’est-à-dire indépendamment du modèle de génération). Les REQMR des quantiles obtenus par le
modèle LN(1) restent toujours inférieures à celles du modèle GEV(11) quelle que soit la population
mère (le modèle considéré pour générer les données, GEV(11) ou LN(1)).

3.2.3 Les modèles LN(2) et GEV(21) Pour ce troisième cas on compare les modèles LN(2) et
GEV(21) où les paramètres de position et d’échelle sont, respectivement, des fonctions quadratiques
et linéaire de la covariable. Ces modèles permettent de modéliser la dépendance des covariables
avec plus de flexibilité. Les résultats de cette comparaison sont présentés dans le Tableau 6 (cas où
Cv = 0.2) et le Tableau 7 (cas où Cv = 0.3).
On remarque que les REQMR des deux modèles restent les mêmes quelle que soit la
distribution de la population mère. Ceci peut être expliqué par la flexibilité de ces deux modèles
pour représenter les deux populations considérées dans cette étude (générées à partir du modèle
GEV(21) et du modèle LN(2)).
Quand on génère à partir du modèle GEV(21), le modèle LN(2) performe mieux que le modèle
GEV(21) en termes de REQMR, pour les deux asymétries. Ceci est dû principalement à la variance
élevée causée par le nombre de paramètres qui est égal à 6 dans le cas du modèle GEV(21). Alors
que pour le biais, le bon choix du modèle mène automatiquement à un faible biais.

Copyright © 2009 IAHS Press


1150 I. Aissaoui-Fqayeh et al.

Tableau 6 BR et REQMR des quantiles estimés, conditionnellement à la covariable, par le modèle GEV(21)
et LN(2) pour Cv = 0.2.
Distribution à générer Valeurs de la BR % (GEV(21)): BR % (LN(2)):
covariable 50% 90% 99% 50% 90% 99%
GEV(21) Min 1.55 3.02 4.98 –0.40 –4.37 –6.27
Moy –0.17 –1.63 –1.81 0.33 –0.91 –1.19
Max 4.92 2.09 0.91 2.65 2.96 3.68
LN(2) Min –6.58 –7.08 –7.17 1.19 0.24 –0.47
Moy 0.50 0.80 1.09 0.11 –0.81 –1.51
Max 3.46 –11.60 –9.46 1.29 0.35 –0.36
REQMR % (GEV(21)): REQMR % (LN(2)):
GEV(21) Min 10.08 14.13 22.29 10.48 11.20 12.40
Moy 3.54 4.22 9.11 3.20 4.16 5.70
Max 20.75 19.78 24.85 17.51 17.86 18.60
LN(2) Min 10.36 12.35 17.38 10.02 10.10 10.67
Moy 3.62 4.29 9.734 3.10 4.04 5.64
Max 19.52 19.91 26.38 18.00 17.94 18.20

Tableau 7 BR et REQMR des quantiles estimés, conditionnellement à la covariable, par le modèle GEV(21)
et LN(2) pour Cv = 0.3.
Distribution à générer Valeurs de la BR % (GEV(21)): BR % (LN(2)):
covariable 50% 90% 99% 50% 90% 99%
GEV(21) Min 2.22 3.46 5.57 1.53 4.08 3.89
Moy –0.33 –1.65 –1.49 1.03 –1.31 –4.79
Max 6.75 3.28 2.48 2.58 –8.8 –17.16
LN(2) Min –6.35 –8.03 –7.50 0.79 –0.41 –1.29
Moy 0.22 0.42 2.03 0.05 –1.12 –1.98
Max 4.59 –15.90 –27.44 2.24 1.01 0.12
REQMR % (GEV(21)): REQMR % (LN(2)):
GEV(21) Min 9.19 13.33 21.89 9.42 10.82 11.6
Moy 3.72 4.80 10.95 3.61 4.83 7.79
Max 29.87 29.27 37.55 26.36 24.99 27.47
LN(2) Min 13.11 16.19 24.40 13.89 14.09 14.96
Moy 5.35 6.09 14.69 4.55 5.88 8.10
Max 27.39 26.80 34.20 25.36 25.20 25.52

4 APPLICATION: PRECIPITATIONS A LA STATION TEHACHAPI


Nous avons appliqué les modèles GEV et LN non-stationnaires à une série X = ( x1, …, xn) de
précipitations maximales annuelles instantanées en mm, enregistrées à la station Tehachapi de la
Californie (Station USGS #048826; latitude: 35.13; longitude: –118.45; période 1952–2000 et le
nombre d’années d’enregistrement n = 49). La Fig. 1 montre la localisation géographique de la
station d’étude. Située au sud de la Californie, les précipitations de cette région sont fortement
modulées par le phénomène El Niño.
L’objectif de cette application est d’illustrer la possibilité de tenir compte dans la distribution
des précipitations maximales annuelles, des dépendances de certains indices climatiques. Pour la
présente étude on considère l’indice SOI (Indice d’oscillation australe). On ajuste le modèle log-
normal non-stationnaire sous ses deux formes LN(1) et LN(2) pour analyser la dépendance des
paramètres de l’indice SOI. Le modèle GEV non-stationnaire sera également considéré pour
montrer la différence entre les deux familles de modèles. Le coefficient de corrélation entre la
variable X et la covariable SOI est –0.57. Le coefficient de corrélation de Pearson est une mesure

Copyright © 2009 IAHS Press


Développement du modèle log-normal non-stationnaire 1151

42.5 ° N

40.0 ° N

37.5 ° N
California

35.0 ° N Tehac hapi

32.5 ° N

125.0 ° W 122.5 ° W 120.0 ° W 117.5 ° W 115.0 ° W 112.5 ° W


Fig. 1 Situation géographique de la station Tehachapi de la Californie, USA.

Précipitation
100 3 SOI
90
2
80
Précipitation (mm)

70 1
60 0
SOI

50
40 -1
30 -2
20
-3
10
0 -4
1952
1955
1958
1961
1964
1967
1970
1973
1976
1979
1982
1985
1988
1991
1994
1997
2000

Année

Fig. 2 Précipitations maximales annuelles observées et valeurs de SOI correspondantes.

de la corrélation linéaire entre les deux variables. Il est considéré à titre indicatif pour vérifier
l’existence d’une dépendance significative. La Fig. 2 illustre la relation entre ces deux variables.
La Fig. 3 montre qu’il y a une corrélation négative significative (coefficient de corrélation.
ρ = –0.57) entre les précipitations et l’indice climatique SOI. On remarque également que les plus
grandes valeurs enregistrées pour les précipitations maximales annuelles correspondent aux faibles
valeurs de l’indice climatique SOI.
Tous les modèles, LN et GEV, ont été ajustés à la série des précipitations maximales
annuelles en considérant comme covariable SOI. On s’intéresse principalement à l’estimation de la
médiane (quantile correspondant à la probabilité au non-dépassement 50%) par les trois modèles
dans le cas de LN (LN(0), LN(1) et LN(2)) et quatre modèles dans le cas de GEV (GEV(0), GEV(10),
GEV(11) et GEV(21)).

Copyright © 2009 IAHS Press


1152 I. Aissaoui-Fqayeh et al.

90

80

70
Précipitation (mm)

60

50

40

30

20

10
-4 -3 -2 -1 0 1 2 3
SOI
Fig. 3 Nuage de points des précipitations maximales annuelles observées et valeurs de SOI
correspondantes.

Le choix du modèle est fait à l’aide de la déviance statistique. Le test basé sur la déviance est
simple et très utilisé pour comparer deux modèles comme lorsque l’un est un cas particulier de
l’autre (Coles, 2001). Ce test est utilisé, séparément, pour choisir un modèle parmi les modèles LN
non-stationnaires et un parmi les modèles GEV non-stationnaires. Quand la différence entre les
deux modèles n’est pas évidente, il est préférable d’utiliser le modèle le plus simple afin de
respecter le principe de parcimonie.
Pour deux modèles M1 et M0 tels que M0 ⊂ M1, la statistique de déviance est définie par: D =
2{ln*(M1) − ln*(M0)}, où ln*(M) est la fonction du log-vraisemblance du modèle M. Une grande
valeur de D indique que le modèle M1 est le plus adéquat pour ajuster les variations des données
que le modèle M0. La statistique D est distribuée selon une loi de chi-deux (χv2). Le paramètre v est
égal à la différence entre la dimension (le nombre de paramètres) du modèle M1 et la dimension du
modèle M0. Des valeurs de D qui sont plus grandes que les quantiles de la loi de χv2 pour un niveau
de signification particulier α = 5%, signifie que le modèle M1 est meilleur que le modèle M0.
Les résultats montrent que pour les modèles LN non-stationnaires, il y a une différence
significative entre les modèles LN(1) et LN(0) puisque D = 15.49. Cette valeur est plus grande que le
quantile (95%) de la loi χ12 (Pr (χ12 ≤ 15.49) = 0.9999). D’autre part, pour les modèles LN(1) et
LN(2), le test statistique montre qu’il n’y a pas de différence significative entre ces deux modèles,
car D = 1.20 et Pr (χ12 ≤ 1.20) = 0.7273. Ainsi, pour le niveau de signification α = 5%, le modèle
LN(1) est le plus adéquat pour représenter la dépendance entre les précipitations maximales
annuelles et la covariable SOI. Les estimations des paramètres ainsi que la valeur de la fonction
log-vraisemblance correspondant à chacun des modèles LN, sont données dans le Tableau 8.
Le test basé sur la statistique de déviance a également été appliqué pour les modèles GEV
non-stationnaires. Les résultats montrent que le modèle GEV(21) est le plus adéquat pour
représenter la dépendance entre les précipitations maximales annuelles et l’indice SOI. Le
Tableau 9 présente les estimations des paramètres pour chaque modèle ainsi que les valeurs de la
fonction de log-vraisemblance considérées pour le test de la déviance.
Les médianes sont calculées conditionnellement à plusieurs valeurs de la covariable pour
l’estimation de la courbe médiane. Les résultats correspondant à certaines valeurs particulières (la
valeur minimale, la moyenne et la valeur maximale) sont donnés dans le Tableau 10. Les
estimateurs de la médiane obtenus par les deux modèles retenus, GEV(21) et LN(1), sont représentés
dans la Fig. 4. Les intervalles de confiance sont calculés en générant N = 5000 échantillons par
bootstrap. On remarque qu’il y a une légère différence entre les médianes conditionnelles obtenues
à partir des deux modèles, surtout au niveau des valeurs minimale et maximale.

Copyright © 2009 IAHS Press


Développement du modèle log-normal non-stationnaire 1153

Tableau 8 Estimateurs des paramètres et valeurs de la fonction log-vraisemblance des modèles LN non-
stationnaires.
ln* μ1 μ2 μ3 σ
LN(0) –195.69 3.301 - - 0.484
LN(1) –187.94 3.256 –0.287 - 0.413
LN(2) –187.34 3.226 –0.259 0.043 0.408

Tableau 9 Estimateurs des paramètres et valeurs de la fonction log-vraisemblance des modèles GEV non-
stationnaires.
ln* μ1 μ2 μ3 α1 α2 κ
GEV(0) –194.620 21.503 - - 2.169 - –0.308
GEV(10) –193.288 22.530 –3.364 - 2.247 - –0.208
GEV(11) –187.791 22.482 –3.747 - 2.126 –0.480 –0.075
GEV(21) –185.744 20.469 –6.599 3.192 1.982 –0.672 –0.194

Tableau 10 Estimateurs des quantiles de probabilité au non-dépassement 50% conditionnellement aux


valeurs minimale, moyenne et maximale de SOI.
SOI = –3.1600 SOI = –0.1553 SOI = 2.0720
LN(1) 64.2678 27.1290 14.3147
GEV(21) 76.3131 24.6317 21.1874

100
Données
90 Q2(0.5) LN(1)
CI Q2(0.5) LN(1)
80
Q2(0.5) GEV (21)

70 CI Q2(0.5) GEV (21)


precipitation (mm)

60

50

40

30

20

10
-4 -3 -2 -1 0 1 2 3
SOI
Fig. 4 Médiane conditionnelle et intervalles de confiance estimés par les modèles GEV(21) et LN(1).

Dans le cas stationnaire pour les modèles LN(0) et GEV(0), les estimations de la médiane sont
respectivement égales à 27.12 et 24.96. Ces valeurs correspondent à la médiane estimée par les
modèles non-stationnaires conditionnellement à la valeur moyenne de la covariable. La différence
entre les modèles stationnaires et non-stationnaires est très grande au niveau des valeurs extrêmes
de la covariable (surtout pour la valeur minimale). Quel que soit le modèle non-stationnaire choisi,
LN ou GEV, l’estimation de la médiane peut passer du simple au double (même plus que le double
pour quelques valeurs de la covariable) dépendamment du fait qu’on tienne compte de la

Copyright © 2009 IAHS Press


1154 I. Aissaoui-Fqayeh et al.

110
Données
100 Q2(0.5) LN(2)
CI Q2(0.5) LN(2)
90
Q2(0.5) GEV (21)

80 CI Q2(0.5) GEV (21)


precipitation (mm)

70

60

50

40

30

20

10
-4 -3 -2 -1 0 1 2 3
SOI
Fig. 5 Médiane conditionnelle et intervalles de confiance estimés par les modèles LN(2) et GEV(21).

dépendance de la covariable ou non. Pour les grandes valeurs de la covariable SOI, les estimations
conditionnelles de la médiane sont inférieures à celles obtenues dans le cas stationnaire.
Notons que le modèle GEV(21) est tel que le paramètre de position est une fonction
quadratique de la covariable. Le modèle LN non-stationnaire qui ressemble le plus au modèle
GEV(21) est le modèle LN(2). Ce modèle n’a pas été retenu par le test basé sur la statistique de la
déviance, puisque la différence avec le modèle LN(1) n’est pas significative. La Fig. 5 présente les
médianes conditionnelles obtenues à partir des modèles GEV(21) et LN(2). On remarque que ces
deux modèles donnent des résultats très semblables.

5 CONCLUSIONS
L’objectif principal de cette étude était de présenter le modèle log-normal non-stationnaire pour
l’ajustement des séries avec tendances ou qui dépendent de covariables. Cette dépendance est
introduite au niveau des paramètres pas le biais de fonctions usuelles et des hyper-paramètres. Le
modèle GEV est le modèle le plus étudié pour représenter ces dépendances. L’introduction du
modèle log-normal non-stationnaire et sa comparaison avec le modèle GEV non-stationnaire nous
a permis d’étudier la flexibilité du modèle LN pour représenter ces dépendances et d’évaluer les
erreurs liées à la méthode d’estimation ou celles qui sont générées par un mauvais choix du
modèle. La loi GEV est une loi à trois paramètres et est, par conséquent, une des lois les plus
flexibles pour l’ajustement des extrêmes. La loi LN est également très utilisée pour l’analyse des
extrêmes vu qu’elle possède des propriétés similaires aux distributions des extrêmes (au niveau des
queues des distributions).
Les résultats de simulation montrent que les modèles LN non-stationnaires performent bien
même dans le cas de séries générées à partir d’un modèle GEV non-stationnaire, en termes
d’erreur moyenne quadratique relative. En effet, dans tous les cas considérés, les REQMR des
quantiles estimés par les modèles LN non-stationnaires, sont plus petites que celles qui sont
obtenues à partir des modèles GEV non-stationnaires. Le biais est souvent lié au bon choix de la

Copyright © 2009 IAHS Press


Développement du modèle log-normal non-stationnaire 1155

distribution. On en déduit: (a) la flexibilité des modèles LN non-stationnaires pour représenter ce


type de dépendance, et (b) la nécessité de développer de nouveaux critères, autres que la statistique
de déviance, pour le choix de l’ajustement le plus adéquat dans le cas des modèles non-
stationnaires.
L’application des deux familles de modèles à des données de précipitations maximales
annuelles conditionnellement à l’indice climatique SOI illustre la flexibilité de ces modèles pour
l’ajustement des séries hydrométéorologiques. Le cas étudié montre également l’avantage des
modèles non-stationnaires pour incorporer l’information additionnelle. En fait, pour les petites
valeurs de la covariable SOI, le modèle classique sous-estime la médiane, ce qui peut avoir des
conséquences très dramatiques. L’utilisation des estimations conditionnelles a permis de déduire
les valeurs des quantiles correspondant aux événements particuliers représentés par la covariable.

REFERENCES
Chen, H. & Rao, A. (2002) Testing hydrologic time series for stationarity. J. Hydrol. Engng 7(2), 129–136.
Clarke, R. T. (2002a) Estimating time trends in Gumbel-distributed data by means of generalized linear models. Water Resour.
Res. 38(7), 1111, doi:10.1029/2001WR000917.
Clarke, R. T. (2002b) Estimating trends in data from the Weibull and a generalized extreme value distribution. Water Resour.
Res. 38(6), 1089, doi:10.1029/2001WR000575.
Coles, G. S. (2001) An Introduction to Statistical Modeling of Extreme Value. Springer-Verlag, Heidelberg, Germany.
Davison, A. C. & Ramesh, N. I. (2000) Local likelihood smoothing of sample extremes. J. Roy. Statist. Soc. Ser. B, Statistics in
Society 62(1), 191–208.
El Adlouni, S., Ouarda, T. B. M. J., Zhang, X., Roy, R. & Bobée, B. (2007) Generalized maximum likelihood estimators of the
non-stationary GEV model parameters. Water Resour. Res. 43, W03410, doi:10.1029/2005WR004545.
El Adlouni, S., Bobée, B. & Ouarda, T. B. M. J. (2008) On the tails of extreme event distributions. J. Hydrol. 355, 16–33.
Faucher, D., Ouarda, T. B. M. J. & Bobée, B. (1997) Revue bibliographique des tests de stationnarité. INRS-Eau Rapport de
Recherche no. R-499. INRS, Québec, Canada.
Hobijn, B. (2004) Generalizations of the KPSS-test for stationarity. Statistica Neerlandica 58(4), 483–502.
Hosking, J. R. M. (1990) L-moments: analysis and estimation of distributions using linear combinations of order statistics.
J. Roy Statist. Soc. 52, 105–124.
Katz, R. W., Parlange, M. B. & Naveau, P. (2002) Statistics of extremes in hydrology. Adv. Water Resour. 25, 1287–1304.
Kim, K.-D. & Heo, J.-H. (2002) Comparative study of flood quantiles estimation by non parametric models. J. Hydrol. 260,
176–193.
Koenkar, R. & Bassett, G. S. (1978) Regression quantiles. Econometrica 46, 33–50.
Kouider, A. Gingras, H., Ouarda, T. B. M. J., Ristic-Rudolf, Z. & Bobée, B. (2002) Analyse fréquentielle locale et régionale et
cartographie des crues au Québec. Raport no. R-627-el, INRS-ETE, Ste-Foy, Canada.
Leurent, F. (1998) Les valeurs du temps des automobilistes à Marseille en 1995. Recherche – Transports – Sécurité 60, 19–38.
Martin, E. S. & Stedinger, J. R. (2000) Generalized maximum likelihood GEV quantile estimators for hydrologic data. Water
Resour. Res. 36(3), 737–744.
Önöz, B. & Bayazit, M. (2003) The power of statistical tests for trend detection. Turkish J. Engng Environ. Sci. 27, 247–251.
Ouarda, T. B. M. J., Ashkar, F., Bensaid, E. & Hourani, I. (1994) Distributions statistiques utilisées en hydrologie: trans-
formations et propriétés asymptotiques. Département de Mathématique, Université de Moncton, Canada.
Sankarasubramanian, A. & Lall, U. (2003) Flood quantiles and changing climate: seasonal forecasts and causal relations. Water
Resour. Res. 39(5), 1134.
USWRC (US Water Resources Council) (1982) Guidelines for Determining Flood Flow Frequency. Bulletin 17B, Hydrology
Committee, USWRC, Washington, DC, USA.
Zhang, X., Harvey, K. D., Hogg, W. D. & Yuzyk, T. R. (2001) Trends in Canadian streamflow. Water Resour. Res. 37(4),
987–999.

ANNEXE
Quelques exemples du modèle GEV non-stationnaire
1. GEV(0) (μ, α, κ): correspond au modèle stationnaire où les paramètres sont constants:
μt = μ ; αt = α et κt = κ.
2. GEV(10) (μt = μ1 + μ2 Yt, α, κ): le paramètre de position est une fonction linéaire de la
covariable.
3. GEV(10) (μt = μ1 + μ2Yt, α = exp(α1 + α2Yt), κ): le paramètre de position et le logarithme du
paramètre d’échelle sont des fonctions linéaires de la covariable.
4. GEV(10) (μt = μ1 + μ2Yt + μ3Yt2, α = exp(α1 + α2Yt), κ): le paramètre de position est une

Copyright © 2009 IAHS Press


1156 I. Aissaoui-Fqayeh et al.

fonction quadratique de la covariable et le logarithme du paramètre d’échelle est une fonction


linéaire de la covariable.

Reçu le 12 Avril 2007; accepté le 30 Mars 2009

Copyright © 2009 IAHS Press

Vous aimerez peut-être aussi