Académique Documents
Professionnel Documents
Culture Documents
Résumé Dans le présent travail on présente le modèle log-normal (LN) non-stationnaire pour l’ajustement
des séries dont les paramètres sont fonctions de covariables. Les modèles non-stationnaires, d’une manière
générale, permettent de tenir compte des tendances ou de la variabilité temporelle observée dans un
échantillon. Ils permettent également de considérer l’effet d’une covariable sur une variable donnée. Le
modèle LN non-stationnaire est comparé au modèle GEV non-stationnaire par simulation de Monte Carlo.
Les résultats montrent que même dans le cas de séries générées à partir d’un modèle GEV non-stationnaire,
le modèle LN non-stationnaire conduit à une estimation des quantiles plus adéquate que celle qui est obtenue
par le modèle GEV non-stationnaire. L’utilité de ces modèles est illustrée par l’étude de l’effet d’un indice
climatique (Indice d’Oscillation Australe, SOI) sur des données hydro-climatiques de la Californie, USA.
L’effet de l’indice SOI sur les précipitations maximales annuelles, enregistrées à la station Tehachapi de la
Californie, est étudié.
Mots clefs distribution log-normale; estimateur du maximum de vraisemblance; modèles non-stationnaires;
quantiles; précipitations maximales annuelles
Non-stationary lognormal model development and comparison with the non-stationary GEV
model
Abstract Classical flood frequency analysis (FFA) requires stationarity of the observed data set. This
hypothesis is not always verified for observed data. This restriction can be lifted if classical distributions
used in FFA integrate non-stationarity by considering time dependent parameters. It is also possible to
consider other covariates instead of the time. The conditional distribution can then be obtained with respect
to given values of the covariates. In the present study the non-stationary lognormal (LN) model with linear
and quadratic dependence is presented, and corresponding maximum likelihood equations are developed.
These models are compared to the non-stationary generalized extreme value (GEV) models by Monte Carlo
simulation. The non-stationary LN model is also applied to a case study to illustrate its potential. The case
study deals with the analysis of the annual maximum precipitation at the Tehachapi Station in California,
USA, with the Southern Oscillation Index (SOI) as a covariate.
Key words lognormal model; maximum likelihood estimator; non-stationary model; quantiles;
annual maximum precipitation
1 INTRODUCTION
L’étude des processus et événements hydrologiques extrêmes aux échelles locale et régionale
passe par la mesure et l’analyse de différentes variables hydro-climatiques (précipitations,
températures, débits, etc.). Cela nécessite des outils statistiques adaptés qui tiennent compte de
l’interaction entre les différentes variables. Les approches classiques d’analyse fréquentielle
supposent la stationnarité des séries d’observations, ainsi que l’indépendance et l’homogénéité.
Autrement dit, les observations doivent être indépendantes et identiquement distribuées (iid). En
hydrologie, la loi de probabilité des crues peut changer avec le temps (existence de non-
stationnarité) comme conséquence des activités humaines ou à cause des changements climatiques
(Zhang et al., 2001; El Adlouni et al., 2007). Il est donc nécessaire de développer des approches
d’analyse fréquentielle qui tiennent compte de la non-stationnarité des séries des données hydro-
climatiques. Ce genre de modèles permet d’inclure l’effet de différentes covariables sur la
variabilité et l’évolution de la série observée.
La discussion concernant cet article est ouverte jusqu’au 1er Juin 2010 Copyright © 2009 IAHS Press
1142 I. Aissaoui-Fqayeh et al.
Avant de procéder à une analyse fréquentielle, il faut vérifier les hypothèses d’homogénéité et
de stationnarité des séries observées. Plusieurs tests permettent de vérifier ces hypothèses. Dans ce
travail on s’intéresse au problème de non-stationnarité. Pour tester cette dernière on utilise les tests
de Mann, Kruskal-Wallis (Faucher et al., 1997) et Mann-Kendall (Önöz & Bayazit, 2003).
Récemment de nouveaux tests ont été développés tels que le test de segmentation (Chen & Rao,
2002) et le test de Kwiatkowski-Phillips-Schmidt-Shin (le test KPSS) (Hobijn, 2004).
En analyse fréquentielle, plusieurs méthodes ont été développées pour l’estimation des
paramètres des distributions d’intérêt. La méthode des moments de probabilités pondérées (PWM)
et la méthode des L-moments (LM) (Hosking, 1990) sont parmi les méthodes les plus utilisées, en
raison de leur simplicité pour la majorité des distributions. Dans le cas non-stationnaire (existence
d’une non-stationnarité temporelle ou de dépendance de covariables) les estimateurs des
L-moments sont compliqués à implémenter d’une manière explicite. Dans ce cas, on considère
souvent l’estimation par la méthode du maximum de vraisemblance (ML) qui permet, par le biais
de la résolution numérique du système d’équations, d’estimer les paramètres même dans des cas
très complexes (Coles, 2001). El Adlouni et al. (2007) ont donné une extension de la méthode du
maximum de vraisemblance généralisée (GML) introduite par Martin & Stedinger (2000), au cas
de la présence de covariables pour le modèle GEV non-stationnaire. La méthode GML permet
d’intégrer une loi a priori sur le paramètre de forme de la loi GEV et de réduire l’espace des
solutions de la méthode du ML à des valeurs admissibles dans le cas des séries hydro-
météorologiques.
La majorité des travaux sur les modèles non-stationnaires est liée au modèle généralisé des
valeurs extrêmes (GEV) (Coles, 2001; Clarke, 2002a,b). Katz et al. (2002) ont utilisé ce modèle
pour traiter le cadre local ainsi que le cadre régional. En effet, la loi GEV est très utilisée en
hydrologie et a été jugée dans plusieurs études comme adéquate pour l’ajustement des séries des
maximums (Faucher et al., 1997). Cependant dans certaines régions, d’autres distributions ont été
suggérées pour l’étude des séries hydrométéorologiques: log-normale (LN) en Chine, log-Pearson
Type III (LPIII) aux États-Unis d’Amérique (USWRC, 1982), ou log-normale à deux paramètres
(LN) au Québec (Kouider et al., 2002). Notons que la loi LN a un comportement au niveau des
extrêmes qui est très semblable à celui des distributions à queues lourdes (Ouarda et al., 1994). En
considérant ce résultat et les derniers travaux de la théorie des valeurs extrêmes, El Adlouni et al.
(2008) ont présenté une classification des distributions les plus utilisées en analyse fréquentielle
par rapport à leur queue droite. On remarque à partir de cette classification que la loi log-normale a
une queue plus lourde que celles des lois sub-exponentielles (exemple: Gumbel, gamma, Halphen
Type A) et plus légère que celles des distributions à variations régulières (Fréchet, log-Pearson,
inverse gamma). Il est souvent très difficile de discriminer entre la loi LN et les distributions à
variations régulières, ou connues aussi sous le nom de distributions de type puissance.
Dans cette étude, on présente le modèle log-normal non-stationnaire à deux paramètres. Ce
modèle, comme il a été déjà mentionné, s’ajuste bien à plusieurs séries de données hydrologiques
et respecte le principe de parcimonie. En effet, le nombre de paramètres augmente avec le nombre
de covariables d’où l’avantage de considérer une distribution avec le moins de paramètres
possible, surtout en hydrologie où la taille des séries d’observations est souvent faible. Le
deuxième objectif est de comparer, sur la base de simulations de Monte Carlo, les propriétés des
estimateurs de quantiles par la méthode du maximum de vraisemblance obtenus pour les modèles
LN non-stationnaire et GEV non-stationnaire.
Après avoir rappelé certaines propriétés statistiques de la loi log-normale, on présente le
modèle log-normal non-stationnaire et certains des cas particuliers avec la méthode du maximum
de vraisemblance pour l’estimation des paramètres. Nous présentons ensuite dans la Section 3 une
comparaison par simulation de Monte Carlo entre le modèle LN non-stationnaire et le modèle
GEV non-stationnaire. Une application qui illustre la flexibilité et l’efficacité du modèle proposé
est présentée dans la Section 4. Les conclusions et la discussion générale sont présentées dans la
Section 5.
(
F −1 ( p) = exp μ + σ ⋅ Φ −1 ( p) ) (2)
La fonction de répartition peut être écrite sous la forme:
x0
1 ⎛ 1 ⎛ log( x) − μ ⎞ 2 ⎞
F ( x0 ) = ∫ σx 2π ⎜⎜ − 2 ⎜⎝ σ ⎟⎠ ⎟⎟dx
exp (3)
0 ⎝ ⎠
La fonction de densité de probabilité f(x) est donnée par:
1 ⎛ 1 ⎛ log( x) − μ ⎞ 2 ⎞
f ( x) = exp⎜ − ⎜ ⎟ ⎟ (4)
σx 2π ⎜ 2 ⎝ σ ⎠ ⎟⎠
⎝
où x > 0, σ > 0 et μ ∈ Ρ.
Les moments d’ordre 1 et d’ordre 2 sont donnés par:
E [X ] = exp(μ + σ 2 / 2) (5)
[ ]
E X 2 = exp(2 μ + 2σ 2 )
(6)
= (E[ X ]) × exp(σ 2 )
2
( ) ( )( )
1 1
σ2 σ2 2
Cv = e − 1 et CS = e
2 − 1 eσ + 2 .
2
covariables, Xt est distribué selon une loi log-normale. Différents types de dépendance peuvent
être considérés en représentant des paramètres comme fonctions des covariables. Cependant,
quand deux modèles donnent un bon ajustement, le modèle avec le nombre de paramètres le plus
faible sera préféré.
L’introduction des covariables peut être effectuée au niveau de n’importe quel paramètre, ou
même à deux ou trois paramètres à la fois. Sankarasubramanian & Lall (2003) ont comparé trois
méthodes pour l’estimation des quantiles conditionnels. La première méthode est paramétrique et
est basée sur une transformation d’une loi normale dont les paramètres dépendent de covariables.
Les deux autres méthodes correspondent à une approche non paramétrique (régression des
quantiles; Koenkar & Bassett, 1978) et une approche semi-paramétrique (modèle de vraisemblance
locale; Davison & Ramesh, 2000).
L’introduction de covariables au niveau des paramètres implique des changements des
caractéristiques statistiques de la distribution ajustée. Plusieurs scientifiques suggèrent d’associer
un changement dans la variance à celui de la moyenne pour que le coefficient de variation (Cv)
reste constant. Cependant, dans le cas d’une variable distribuée suivant une loi log-normale, le
coefficient Cv est fonction seulement du paramètre σ. Ainsi, garder le coefficient Cv constant
implique que le paramètre σ est constant. Par conséquent, dans le présent travail, seul le paramètre
μ est fonction des covariables.
Pour étudier les propriétés des estimateurs des paramètres, trois modèles sont considérés dans
le présent travail:
– LN(0) (μ, σ) qui est un modèle classique où tous les paramètres sont constants μt = μ, σt = σ.
– LN(1) (μt = β1 + β2Yt, σ): le paramètre μ est fonction linéaire d’une covariable Yt.
– LN(2) (μt = β1 + β2Yt + β3Yt2, σ): le paramètre μ est une fonction quadratique d’une covariable
temporelle Yt et l’autre paramètre est constant.
Notons que pour la distribution log-normale, le changement du paramètre μ mène à un
changement de la moyenne et de la variance de la variable, ce qui correspond souvent aux
changements observés dans des séries hydrométéorologiques.
n
1 ⎛ 1 ⎛ log x − μ ⎞ 2 ⎞ (9)
=∏ exp ⎜ − ⎜ t t
⎟ ⎟⎟
t =1 σ t xt 2π ⎜ 2 ⎝ σ ⎠ ⎠
⎝ t
1 n ⎛ 1 ⎛ log x − μ ⎞ 2 ⎞
= n n ∏ exp ⎜ − ⎜
⎜ 2⎝
t
σt
t
⎟ ⎟⎟
⎠ ⎠
∏ σ t ∏ xt (2π )
t =1 t =1
n / 2 t =1
⎝
Pour le modèle LN(1), où (μt = β1 + β2Yt) et Yt est le vecteur des covariables, les estimateurs du
maximum de vraisemblance des paramètres β1, β2 et σ sont solutions du système d’équations
suivant:
⎧
⎪1 n
⎪ 2 ∑ ( log x t − β 1 − β 2 y t ) = 0
⎪σ t =1
⎪⎪ 1 n
⎨ 2 ∑ yt ( log x t − β 1 − β 2 y t ) = 0
(11)
⎪σ t =1
⎪
⎪ n ⎜ ( log x t − β 1 − β 2 y t ) ⎟
⎛ n 2
⎞
⎪ σ ⎜∑
− +
t =1 σ3 ⎟
=0
⎪⎩ ⎝ ⎠
Ce système peut être résolu par une méthode numérique comme par exemple l’algorithme de
Newton-Raphson. D’une manière analogue on obtient un système équivalent au système précédent
pour le modèle LN(2), avec une quatrième équation pour le paramètre β3.
Tableau 1 Paramètres des lois LN et GEV correspondant aux deux coefficients de variation considérés.
Cv Cv = 0.2 Cv = 0.3
σ = 0.193 pour LN σ = 0.283 pour LN
κ = –0.01 pour GEV κ = –0.04 pour GEV
Cas 1 LN(1) (μt = 6.2 – 0.1Yt, σ) LN(1) (μt = 7.28 – 0.1Yt, σ)
GEV(10) (μt = 1060 – 200Yt, 200, κ) GEV(10) (μt = 1360 – 200Yt, 250, κ)
Cas 2 LN(1) (μt = 6.2 – 0.1Yt, σ) LN(1) (μt = 7.28 – 0.1Yt, σ)
GEV(11) (μt = 1060 – 200Yt, exp(log(200) – 0.2Yt), κ) GEV(11) (μt = 1360 – 200Yt, exp(log(250) – 0.2Yt), κ)
Cas 3 LN(2) (μt = 6.2 – 0.2Yt + 0.1Yt2, σ) LN(2) (μt = 7.28 – 0.1Yt + 0.1Yt2, σ)
GEV(21) (μt = 1060 – 250Yt + 3Yt2, exp(log(200) – 0.2Yt), κ) GEV(21) (μt = 1360 – 250Yt + 3Yt2, exp(log(250) – 0.2Yt), κ)
Cette comparaison permettra d’évaluer: (a) les erreurs reliées à la méthode d’estimation des
paramètres pour une faible taille de l’échantillon (n = 50) dans le cas où on effectue un bon choix
du modèle, ainsi que (b) les erreurs reliées au mauvais choix du modèle (choisir un modèle LN au
lieu de GEV et vice versa).
3.2 Résultats
Les résultats de la comparaison entre les modèles LN et GEV avec covariables, pour les six cas
considérés sont présentés dans les Tableaux 2–7. Pour chaque cas on présente le BR et le REQMR
des quantiles conditionnellement aux valeurs minimale, moyenne et maximale de la covariable
(distribuée suivant une loi normale). Notons que la différence entre les deux modèles est
relativement importante dans le cas des quantiles extrêmes (probabilité au non-dépassement 99%)
conditionnellement à la valeur minimale ou maximale de la covariable. Tous les résultats sont
présentés dans les tableaux ci-dessous. Cependant, l’analyse des résultats va être faite
principalement pour le quantile de probabilité au non-dépassement 99% conditionnellement à la
valeur maximale de la covariable.
3.2.1 Les modèles LN(1) et GEV(10) Pour le premier cas, on compare les modèles LN(1) et
GEV(10) avec une faible asymétrie (le coefficient de variation Cv = 0.2). Les résultats sont
présentés dans le Tableau 2.
On remarque que lorsque l’on génère à partir du modèle GEV(10) (bloc de ligne correspondant
au modèle GEV(10)), le BR du quantile (de probabilité au non-dépassement 99%
conditionnellement à la valeur maximale de la covariable) estimé à partir du modèle LN(1) est de
l’ordre de −9% alors qu’il est très faible pour GEV(10) (−0.75%). Cependant, la différence en
termes de la REQMR des quantiles estimés à partir de ces deux modèles n’est pas aussi importante
que celle qui est obtenue pour le biais. La REQMR est de l’ordre de 12% pour le modèle GEV(10)
et de 14% pour le modèle LN(1) (pour le même quantile, 99%, et la même valeur de la covariable
qui est le maximum).
Dans le cas où les échantillons sont générés à partir d’un modèle LN(1), (bloc de ligne
correspondant au modèle LN(1)), le BR maximum est de –0.17% pour le modèle LN(1) et 21% pour
le modèle GEV(10). On remarque que cette différence est très importante pour le biais et qu’elle
l’est aussi pour l’erreur quadratique moyenne (REQMR est de l’ordre de 10% pour LN(1) et 32%
pour GEV(10)). Le Tableau 3 présente les résultats de la comparaison de ces deux modèles, LN(1)et
GEV(10), pour le coefficient de variation Cv = 0.3.
Tableau 2 BR et REQMR des quantiles estimés, conditionnellement à la covariable, par le modèle GEV(10)
et LN(1) pour Cv = 0.2.
Distribution à générer Valeurs de la BR % (GEV(10)): BR % (LN(1)):
covariable 50% 90% 99% 50% 90% 99%
GEV(10) Min 0.11 –0.60 –0.59 2.34 4.90 7.17
Moy 0.17 –0.65 –0.63 –0.02 –0.81 –0.78
Max 0.33 –0.75 –0.70 3.50 –5.08 –9.35
LN(1) Min –7.05 –12.20 –15.31 –0.28 –0.96 –1.47
Moy 1.19 1.16 1.48 –0.04 –0.72 –1.23
Max –14.93 6.82 21.63 1.02 0.33 –0.17
REQMR % (GEV(10)): REQMR % (LN(1)):
GEV(10) Min 5.70 5.22 8.14 7.22 9.01 11.34
Moy 3.26 3.86 8.19 2.93 3.92 5.42
Max 13.92 10.66 12.28 12.3 12.22 14.54
LN(1) Min 8.99 13.01 16.75 6.34 6.84 7.88
Moy 3.37 4.15 10.03 2.69 3.76 5.44
Max 22.76 17.23 32.11 9.69 9.97 10.68
Tableau 3 BR et REQMR des quantiles estimés, conditionnellement à la covariable, par le modèle GEV(10)
et LN(1) pour Cv = 0.3.
Distribution à générer Valeurs de la BR % (GEV(10)): BR % (LN(1)):
covariable 50% 90% 99% 50% 90% 99%
GEV(10) Min –0.11 –0.82 –0.24 3.61 6.45 6.59
Moy 0.01 –0.83 –0.18 0.36 –1.34 –4.19
Max 0.38 –0.87 –0.05 7.05 –6.54 –15.55
LN(1) Min –8.82 –15.28 –17.06 0.59 –0.17 –0.69
Moy 1.00 1.23 4.26 0.04 –0.70 –1.22
Max –8.31 20.28 42.32 0.73 –0.01 –0.52
REQMR % (GEV(10)): REQMR % (LN(1)):
GEV(10) Min 5.94 5.67 10.68 8.49 10.91 12.17
Moy 3.29 4.43 11.44 3.03 4.49 7.33
Max 16.24 11.84 16.18 15.53 13.8 19.39
LN(1) Min 11.90 16.40 20.30 9.63 10.18 11.60
Moy 4.82 6.05 16.96 4.11 5.52 7.92
Max 25.75 29.30 55.36 14.70 15.08 16.10
Les mêmes conclusions sont valables pour le deuxième cas (Cv = 0.3), avec des valeurs du
BR et de la REQMR relativement plus élevées que celles qui sont obtenues dans le cas de faible
asymétrie (Tableau 3). Notons que les REQMR des quantiles estimés à partir du modèle LN(1) sont
presque les mêmes quelle que soit la population mère (générée à partir du modèle GEV(10) ou
LN(1)); alors que, lorsque l’ajustement est effectué avec le modèle GEV(10), la différence est très
grande dépendamment de la population mère (12% quand on génère à partir de GEV(10) et 32%
dans le cas de valeurs simulées à partir de LN(1)).
3.2.2 Les modèles LN(1) et GEV(11) Pour le deuxième cas, on considère des échantillons
générés à partir des modèles LN(1) et GEV(11) pour tenir compte de l’effet d’une dépendance
linéaire du paramètre d’échelle de la loi GEV en fonction de la covariable. Les résultats dans le cas
de Cv = 0.2 sont présentés dans le Tableau 4.
On remarque que dans ce cas les BR des quantiles estimés à partir du modèle GEV(11), pour
des échantillons générés à partir du modèle LN(1), sont relativement faibles par rapport aux
résultats de comparaison des modèles GEV(10) et LN(1). Les BR obtenus sont du même ordre que
Tableau 4 BR et REQMR des quantiles estimés, conditionnellement à la covariable, par le modèle GEV(11)
et LN(1) pour Cv = 0.2.
Distribution à générer Valeurs de la BR % (GEV(11)): BR % (LN(1)):
covariable 50% 90% 99% 50% 90% 99%
GEV(11) Min 0.53 2.09 3.97 1.53 –3.8 –6.50
Moy –0.11 –1.26 –1.30 –0.26 –1.01 –0.90
Max 0.59 –0.04 0.12 4.46 5.03 7.80
LN(1) Min –5.98 –3.97 –4.02 0.76 0.00 –0.56
Moy 1.33 0.04 –1.81 0.27 –0.47 –1.03
Max –6.69 –6.67 –7.03 0.25 –0.47 –1.02
REQMR % (GEV(11)): REQMR % (LN(1)):
GEV(11) Min 6.63 13.0 22.58 7.32 8.14 10.17
Moy 3.19 4.03 8.79 2.75 3.92 5.53
Max 12.29 15.18 21.38 11.29 14.50 18.02
LN(1) Min 7.89 9.93 15.21 6.59 6.85 7.73
Moy 3.42 3.91 8.90 2.75 3.75 5.39
Max 21.56 17.49 22.59 10.37 10.74 11.47
Tableau 5 BR et REQMR des quantiles estimés, conditionnellement à la covariable, par le modèle GEV(11)
et LN(1) pour Cv = 0.3.
Distribution à générer Valeurs de la BR % (GEV(11)): BR % (LN(1)):
covariable 50% 90% 99% 50% 90% 99%
GEV(11) Min 0.4383 0.9757 2.4842 3.9459 7.1784 7.57
Moy 0.13 –1.00 –0.57 0.48 –1.22 –4.08
Max 1.02 1.01 2.67 6.57 –7.76 –17.05
LN(1) Min –6.14 –4.22 –7.85 0.89 0.26 –0.14
Moy 1.00 –1.38 –3.46 0.09 –0.52 –0.93
Max –11.71 –6.70 –15.84 0.45 –0.15 –0.54
REQMR % (GEV(11)): REQMR % (LN(1)):
GEV(11) Min 6.51 10.37 18.24 8.43 11.12 12.41
Moy 3.33 4.54 11.82 3.05 4.47 7.21
Max 17.73 24.00 34.81 14.72 14.03 20.34
LN(1) Min 9.63 13.49 22.65 10.03 10.53 11.81
Moy 4.72 5.54 13.04 4.05 5.42 7.69
Max 25.34 23.08 31.18 14.87 15.32 16.24
ceux qui sont obtenus avec le modèle LN(1) lorsque les échantillons sont générés à partir du modèle
GEV(11). Notons que ces deux modèles se ressemblent plus que ceux qui sont considérés dans la
première comparaison GEV(10) et LN(1). On remarque également que:
– les REQMR des quantiles estimés par le modèle GEV(11) sont les mêmes quelle que soit la
population à partir de laquelle on génère; et
– les REQMR des quantiles obtenus à partir du modèle LN(1) sont faibles par rapport à celles du
modèle GEV(11) quel que soit le modèle à partir duquel on génère. Ceci est dû principalement
au nombre de paramètres considérés dans chaque modèle (trois paramètres pour LN(1) et cinq
paramètres pour GEV(11)).
Les résultats correspondants à la comparaison de ces deux modèles dans le cas de Cv = 0.3
sont donnés dans le Tableau 5.
Les conclusions tirées pour le premier cas, faible asymétrie, restent valables pour Cv = 0.3
avec une légère augmentation de la REQMR pour les deux modèles (Tableau 5). Cependant, les
REQMR des quantiles sont presque les mêmes si on considère le même modèle d’ajustement
(c’est-à-dire indépendamment du modèle de génération). Les REQMR des quantiles obtenus par le
modèle LN(1) restent toujours inférieures à celles du modèle GEV(11) quelle que soit la population
mère (le modèle considéré pour générer les données, GEV(11) ou LN(1)).
3.2.3 Les modèles LN(2) et GEV(21) Pour ce troisième cas on compare les modèles LN(2) et
GEV(21) où les paramètres de position et d’échelle sont, respectivement, des fonctions quadratiques
et linéaire de la covariable. Ces modèles permettent de modéliser la dépendance des covariables
avec plus de flexibilité. Les résultats de cette comparaison sont présentés dans le Tableau 6 (cas où
Cv = 0.2) et le Tableau 7 (cas où Cv = 0.3).
On remarque que les REQMR des deux modèles restent les mêmes quelle que soit la
distribution de la population mère. Ceci peut être expliqué par la flexibilité de ces deux modèles
pour représenter les deux populations considérées dans cette étude (générées à partir du modèle
GEV(21) et du modèle LN(2)).
Quand on génère à partir du modèle GEV(21), le modèle LN(2) performe mieux que le modèle
GEV(21) en termes de REQMR, pour les deux asymétries. Ceci est dû principalement à la variance
élevée causée par le nombre de paramètres qui est égal à 6 dans le cas du modèle GEV(21). Alors
que pour le biais, le bon choix du modèle mène automatiquement à un faible biais.
Tableau 6 BR et REQMR des quantiles estimés, conditionnellement à la covariable, par le modèle GEV(21)
et LN(2) pour Cv = 0.2.
Distribution à générer Valeurs de la BR % (GEV(21)): BR % (LN(2)):
covariable 50% 90% 99% 50% 90% 99%
GEV(21) Min 1.55 3.02 4.98 –0.40 –4.37 –6.27
Moy –0.17 –1.63 –1.81 0.33 –0.91 –1.19
Max 4.92 2.09 0.91 2.65 2.96 3.68
LN(2) Min –6.58 –7.08 –7.17 1.19 0.24 –0.47
Moy 0.50 0.80 1.09 0.11 –0.81 –1.51
Max 3.46 –11.60 –9.46 1.29 0.35 –0.36
REQMR % (GEV(21)): REQMR % (LN(2)):
GEV(21) Min 10.08 14.13 22.29 10.48 11.20 12.40
Moy 3.54 4.22 9.11 3.20 4.16 5.70
Max 20.75 19.78 24.85 17.51 17.86 18.60
LN(2) Min 10.36 12.35 17.38 10.02 10.10 10.67
Moy 3.62 4.29 9.734 3.10 4.04 5.64
Max 19.52 19.91 26.38 18.00 17.94 18.20
Tableau 7 BR et REQMR des quantiles estimés, conditionnellement à la covariable, par le modèle GEV(21)
et LN(2) pour Cv = 0.3.
Distribution à générer Valeurs de la BR % (GEV(21)): BR % (LN(2)):
covariable 50% 90% 99% 50% 90% 99%
GEV(21) Min 2.22 3.46 5.57 1.53 4.08 3.89
Moy –0.33 –1.65 –1.49 1.03 –1.31 –4.79
Max 6.75 3.28 2.48 2.58 –8.8 –17.16
LN(2) Min –6.35 –8.03 –7.50 0.79 –0.41 –1.29
Moy 0.22 0.42 2.03 0.05 –1.12 –1.98
Max 4.59 –15.90 –27.44 2.24 1.01 0.12
REQMR % (GEV(21)): REQMR % (LN(2)):
GEV(21) Min 9.19 13.33 21.89 9.42 10.82 11.6
Moy 3.72 4.80 10.95 3.61 4.83 7.79
Max 29.87 29.27 37.55 26.36 24.99 27.47
LN(2) Min 13.11 16.19 24.40 13.89 14.09 14.96
Moy 5.35 6.09 14.69 4.55 5.88 8.10
Max 27.39 26.80 34.20 25.36 25.20 25.52
42.5 ° N
40.0 ° N
37.5 ° N
California
32.5 ° N
Précipitation
100 3 SOI
90
2
80
Précipitation (mm)
70 1
60 0
SOI
50
40 -1
30 -2
20
-3
10
0 -4
1952
1955
1958
1961
1964
1967
1970
1973
1976
1979
1982
1985
1988
1991
1994
1997
2000
Année
de la corrélation linéaire entre les deux variables. Il est considéré à titre indicatif pour vérifier
l’existence d’une dépendance significative. La Fig. 2 illustre la relation entre ces deux variables.
La Fig. 3 montre qu’il y a une corrélation négative significative (coefficient de corrélation.
ρ = –0.57) entre les précipitations et l’indice climatique SOI. On remarque également que les plus
grandes valeurs enregistrées pour les précipitations maximales annuelles correspondent aux faibles
valeurs de l’indice climatique SOI.
Tous les modèles, LN et GEV, ont été ajustés à la série des précipitations maximales
annuelles en considérant comme covariable SOI. On s’intéresse principalement à l’estimation de la
médiane (quantile correspondant à la probabilité au non-dépassement 50%) par les trois modèles
dans le cas de LN (LN(0), LN(1) et LN(2)) et quatre modèles dans le cas de GEV (GEV(0), GEV(10),
GEV(11) et GEV(21)).
90
80
70
Précipitation (mm)
60
50
40
30
20
10
-4 -3 -2 -1 0 1 2 3
SOI
Fig. 3 Nuage de points des précipitations maximales annuelles observées et valeurs de SOI
correspondantes.
Le choix du modèle est fait à l’aide de la déviance statistique. Le test basé sur la déviance est
simple et très utilisé pour comparer deux modèles comme lorsque l’un est un cas particulier de
l’autre (Coles, 2001). Ce test est utilisé, séparément, pour choisir un modèle parmi les modèles LN
non-stationnaires et un parmi les modèles GEV non-stationnaires. Quand la différence entre les
deux modèles n’est pas évidente, il est préférable d’utiliser le modèle le plus simple afin de
respecter le principe de parcimonie.
Pour deux modèles M1 et M0 tels que M0 ⊂ M1, la statistique de déviance est définie par: D =
2{ln*(M1) − ln*(M0)}, où ln*(M) est la fonction du log-vraisemblance du modèle M. Une grande
valeur de D indique que le modèle M1 est le plus adéquat pour ajuster les variations des données
que le modèle M0. La statistique D est distribuée selon une loi de chi-deux (χv2). Le paramètre v est
égal à la différence entre la dimension (le nombre de paramètres) du modèle M1 et la dimension du
modèle M0. Des valeurs de D qui sont plus grandes que les quantiles de la loi de χv2 pour un niveau
de signification particulier α = 5%, signifie que le modèle M1 est meilleur que le modèle M0.
Les résultats montrent que pour les modèles LN non-stationnaires, il y a une différence
significative entre les modèles LN(1) et LN(0) puisque D = 15.49. Cette valeur est plus grande que le
quantile (95%) de la loi χ12 (Pr (χ12 ≤ 15.49) = 0.9999). D’autre part, pour les modèles LN(1) et
LN(2), le test statistique montre qu’il n’y a pas de différence significative entre ces deux modèles,
car D = 1.20 et Pr (χ12 ≤ 1.20) = 0.7273. Ainsi, pour le niveau de signification α = 5%, le modèle
LN(1) est le plus adéquat pour représenter la dépendance entre les précipitations maximales
annuelles et la covariable SOI. Les estimations des paramètres ainsi que la valeur de la fonction
log-vraisemblance correspondant à chacun des modèles LN, sont données dans le Tableau 8.
Le test basé sur la statistique de déviance a également été appliqué pour les modèles GEV
non-stationnaires. Les résultats montrent que le modèle GEV(21) est le plus adéquat pour
représenter la dépendance entre les précipitations maximales annuelles et l’indice SOI. Le
Tableau 9 présente les estimations des paramètres pour chaque modèle ainsi que les valeurs de la
fonction de log-vraisemblance considérées pour le test de la déviance.
Les médianes sont calculées conditionnellement à plusieurs valeurs de la covariable pour
l’estimation de la courbe médiane. Les résultats correspondant à certaines valeurs particulières (la
valeur minimale, la moyenne et la valeur maximale) sont donnés dans le Tableau 10. Les
estimateurs de la médiane obtenus par les deux modèles retenus, GEV(21) et LN(1), sont représentés
dans la Fig. 4. Les intervalles de confiance sont calculés en générant N = 5000 échantillons par
bootstrap. On remarque qu’il y a une légère différence entre les médianes conditionnelles obtenues
à partir des deux modèles, surtout au niveau des valeurs minimale et maximale.
Tableau 8 Estimateurs des paramètres et valeurs de la fonction log-vraisemblance des modèles LN non-
stationnaires.
ln* μ1 μ2 μ3 σ
LN(0) –195.69 3.301 - - 0.484
LN(1) –187.94 3.256 –0.287 - 0.413
LN(2) –187.34 3.226 –0.259 0.043 0.408
Tableau 9 Estimateurs des paramètres et valeurs de la fonction log-vraisemblance des modèles GEV non-
stationnaires.
ln* μ1 μ2 μ3 α1 α2 κ
GEV(0) –194.620 21.503 - - 2.169 - –0.308
GEV(10) –193.288 22.530 –3.364 - 2.247 - –0.208
GEV(11) –187.791 22.482 –3.747 - 2.126 –0.480 –0.075
GEV(21) –185.744 20.469 –6.599 3.192 1.982 –0.672 –0.194
100
Données
90 Q2(0.5) LN(1)
CI Q2(0.5) LN(1)
80
Q2(0.5) GEV (21)
60
50
40
30
20
10
-4 -3 -2 -1 0 1 2 3
SOI
Fig. 4 Médiane conditionnelle et intervalles de confiance estimés par les modèles GEV(21) et LN(1).
Dans le cas stationnaire pour les modèles LN(0) et GEV(0), les estimations de la médiane sont
respectivement égales à 27.12 et 24.96. Ces valeurs correspondent à la médiane estimée par les
modèles non-stationnaires conditionnellement à la valeur moyenne de la covariable. La différence
entre les modèles stationnaires et non-stationnaires est très grande au niveau des valeurs extrêmes
de la covariable (surtout pour la valeur minimale). Quel que soit le modèle non-stationnaire choisi,
LN ou GEV, l’estimation de la médiane peut passer du simple au double (même plus que le double
pour quelques valeurs de la covariable) dépendamment du fait qu’on tienne compte de la
110
Données
100 Q2(0.5) LN(2)
CI Q2(0.5) LN(2)
90
Q2(0.5) GEV (21)
70
60
50
40
30
20
10
-4 -3 -2 -1 0 1 2 3
SOI
Fig. 5 Médiane conditionnelle et intervalles de confiance estimés par les modèles LN(2) et GEV(21).
dépendance de la covariable ou non. Pour les grandes valeurs de la covariable SOI, les estimations
conditionnelles de la médiane sont inférieures à celles obtenues dans le cas stationnaire.
Notons que le modèle GEV(21) est tel que le paramètre de position est une fonction
quadratique de la covariable. Le modèle LN non-stationnaire qui ressemble le plus au modèle
GEV(21) est le modèle LN(2). Ce modèle n’a pas été retenu par le test basé sur la statistique de la
déviance, puisque la différence avec le modèle LN(1) n’est pas significative. La Fig. 5 présente les
médianes conditionnelles obtenues à partir des modèles GEV(21) et LN(2). On remarque que ces
deux modèles donnent des résultats très semblables.
5 CONCLUSIONS
L’objectif principal de cette étude était de présenter le modèle log-normal non-stationnaire pour
l’ajustement des séries avec tendances ou qui dépendent de covariables. Cette dépendance est
introduite au niveau des paramètres pas le biais de fonctions usuelles et des hyper-paramètres. Le
modèle GEV est le modèle le plus étudié pour représenter ces dépendances. L’introduction du
modèle log-normal non-stationnaire et sa comparaison avec le modèle GEV non-stationnaire nous
a permis d’étudier la flexibilité du modèle LN pour représenter ces dépendances et d’évaluer les
erreurs liées à la méthode d’estimation ou celles qui sont générées par un mauvais choix du
modèle. La loi GEV est une loi à trois paramètres et est, par conséquent, une des lois les plus
flexibles pour l’ajustement des extrêmes. La loi LN est également très utilisée pour l’analyse des
extrêmes vu qu’elle possède des propriétés similaires aux distributions des extrêmes (au niveau des
queues des distributions).
Les résultats de simulation montrent que les modèles LN non-stationnaires performent bien
même dans le cas de séries générées à partir d’un modèle GEV non-stationnaire, en termes
d’erreur moyenne quadratique relative. En effet, dans tous les cas considérés, les REQMR des
quantiles estimés par les modèles LN non-stationnaires, sont plus petites que celles qui sont
obtenues à partir des modèles GEV non-stationnaires. Le biais est souvent lié au bon choix de la
REFERENCES
Chen, H. & Rao, A. (2002) Testing hydrologic time series for stationarity. J. Hydrol. Engng 7(2), 129–136.
Clarke, R. T. (2002a) Estimating time trends in Gumbel-distributed data by means of generalized linear models. Water Resour.
Res. 38(7), 1111, doi:10.1029/2001WR000917.
Clarke, R. T. (2002b) Estimating trends in data from the Weibull and a generalized extreme value distribution. Water Resour.
Res. 38(6), 1089, doi:10.1029/2001WR000575.
Coles, G. S. (2001) An Introduction to Statistical Modeling of Extreme Value. Springer-Verlag, Heidelberg, Germany.
Davison, A. C. & Ramesh, N. I. (2000) Local likelihood smoothing of sample extremes. J. Roy. Statist. Soc. Ser. B, Statistics in
Society 62(1), 191–208.
El Adlouni, S., Ouarda, T. B. M. J., Zhang, X., Roy, R. & Bobée, B. (2007) Generalized maximum likelihood estimators of the
non-stationary GEV model parameters. Water Resour. Res. 43, W03410, doi:10.1029/2005WR004545.
El Adlouni, S., Bobée, B. & Ouarda, T. B. M. J. (2008) On the tails of extreme event distributions. J. Hydrol. 355, 16–33.
Faucher, D., Ouarda, T. B. M. J. & Bobée, B. (1997) Revue bibliographique des tests de stationnarité. INRS-Eau Rapport de
Recherche no. R-499. INRS, Québec, Canada.
Hobijn, B. (2004) Generalizations of the KPSS-test for stationarity. Statistica Neerlandica 58(4), 483–502.
Hosking, J. R. M. (1990) L-moments: analysis and estimation of distributions using linear combinations of order statistics.
J. Roy Statist. Soc. 52, 105–124.
Katz, R. W., Parlange, M. B. & Naveau, P. (2002) Statistics of extremes in hydrology. Adv. Water Resour. 25, 1287–1304.
Kim, K.-D. & Heo, J.-H. (2002) Comparative study of flood quantiles estimation by non parametric models. J. Hydrol. 260,
176–193.
Koenkar, R. & Bassett, G. S. (1978) Regression quantiles. Econometrica 46, 33–50.
Kouider, A. Gingras, H., Ouarda, T. B. M. J., Ristic-Rudolf, Z. & Bobée, B. (2002) Analyse fréquentielle locale et régionale et
cartographie des crues au Québec. Raport no. R-627-el, INRS-ETE, Ste-Foy, Canada.
Leurent, F. (1998) Les valeurs du temps des automobilistes à Marseille en 1995. Recherche – Transports – Sécurité 60, 19–38.
Martin, E. S. & Stedinger, J. R. (2000) Generalized maximum likelihood GEV quantile estimators for hydrologic data. Water
Resour. Res. 36(3), 737–744.
Önöz, B. & Bayazit, M. (2003) The power of statistical tests for trend detection. Turkish J. Engng Environ. Sci. 27, 247–251.
Ouarda, T. B. M. J., Ashkar, F., Bensaid, E. & Hourani, I. (1994) Distributions statistiques utilisées en hydrologie: trans-
formations et propriétés asymptotiques. Département de Mathématique, Université de Moncton, Canada.
Sankarasubramanian, A. & Lall, U. (2003) Flood quantiles and changing climate: seasonal forecasts and causal relations. Water
Resour. Res. 39(5), 1134.
USWRC (US Water Resources Council) (1982) Guidelines for Determining Flood Flow Frequency. Bulletin 17B, Hydrology
Committee, USWRC, Washington, DC, USA.
Zhang, X., Harvey, K. D., Hogg, W. D. & Yuzyk, T. R. (2001) Trends in Canadian streamflow. Water Resour. Res. 37(4),
987–999.
ANNEXE
Quelques exemples du modèle GEV non-stationnaire
1. GEV(0) (μ, α, κ): correspond au modèle stationnaire où les paramètres sont constants:
μt = μ ; αt = α et κt = κ.
2. GEV(10) (μt = μ1 + μ2 Yt, α, κ): le paramètre de position est une fonction linéaire de la
covariable.
3. GEV(10) (μt = μ1 + μ2Yt, α = exp(α1 + α2Yt), κ): le paramètre de position et le logarithme du
paramètre d’échelle sont des fonctions linéaires de la covariable.
4. GEV(10) (μt = μ1 + μ2Yt + μ3Yt2, α = exp(α1 + α2Yt), κ): le paramètre de position est une