Vous êtes sur la page 1sur 71

ANALYSE FRQUENTIELLE HYDROLOGIQUE :

LOGICIEL HYFRAN-PLUS (VERSION-V2.1)

Salaheddine EL ADLOUNI ( 1 )

(1)

Professeur, Dpartement de Mathmatiques


et statistique, Universit de Moncton

Bernard BOBE ( 2 )

(2)

Professeur mrite
INRS-ETE

Version du 13 novembre 2014

Note : Les articles cits dans la liste des rfrences (page 61) et marqus par * sont disponibles lors
de linstallation du logiciel

Citation: El Adlouni, S. and B. Bobe (2014). Analyse Frquentielle avec le logiciel HYFRAN-PLUS.
Guide dutilisateur disponible avec la version
Dmo. http://www.wrpllc.com/books/HyfranPlus/indexhyfranplus3.html

TABLE DES MATIERES


1.

2.

Menu Principal ...................................................................................................... 6


1.1.

Interface ......................................................................................................... 6

1.2.

Fichier ........................................................................................................... 7

1.3.

dition ........................................................................................................... 8

1.4.

chantillon ...................................................................................................... 8

1.5.

Systme daide la dcision (SAD) ........................................................................... 9

1.6.

Ajustement .................................................................................................... 11

1.7.

Graphique ..................................................................................................... 13

1.8.

Affichage ...................................................................................................... 14

1.9.

Fentre......................................................................................................... 15

Tutorial ............................................................................................................. 15
2.1.

Saisie des donnes et tude des caractristiques statistiques de l'chantillon alatoire ................... 16

2.1.1 Description .................................................................................................... 17


2.1.2. Donnes ...................................................................................................... 18
a)

Tableur intgr au logiciel ................................................................................... 18

Donnes dsactives .......................................................................................... 20

Tri des donnes ............................................................................................... 22

Transformation des donnes ................................................................................. 22

b)

Importation des fichiers de donnes ......................................................................... 23

c)

Presse-papier ................................................................................................. 24

2.1.3. Statistiques de base .......................................................................................... 24


2.1.4. Tests dhypothse ............................................................................................ 25
2.1.5. Graphiques ................................................................................................... 29
2.2. Systme daide la dcision (SAD) ............................................................................. 33
2.3. Ajustement dune distribution statistique une srie de donnes.............................................. 49
2.3.1. Choix de la distribution statistique la plus adquate ....................................................... 49
Comparaison graphique ............................................................................................ 49
Critres dinformation .............................................................................................. 50
2.3.2. Ajustement ................................................................................................... 52
Rsultats de l'ajustement ........................................................................................... 52
Graphique ........................................................................................................... 53
Autre priode de retour............................................................................................. 54
Adquation .......................................................................................................... 55
2

Caractristiques statistiques de la distribution ajuste ........................................................... 56


Discordance ......................................................................................................... 57
Rfrences ............................................................................................................... 61
Annexe 1 : Sries dobservations ..................................................................................... 62
Appendice A : Intervalles de confiance asymptotiques des quantiles ............................................ 70
Appendice B : Classification des distributions ...................................................................... 71

Liste des Tableaux (Numros de page ajouter)


Tableau A.1 : Donnes observes de la srie 1
Tableau A.2 : Donnes simules de la srie 2
Tableau A.3 : Donnes transformes de la srie 2
Tableau A.4 : Donnes simules de la srie 3

--------------------------------------------------- 62
--------------------------------------------------- 64
--------------------------------------------------- 66
--------------------------------------------------- 68

Liste des Figures (Numros de page ajouter)


Figure 1 : Fentre douverture du logiciel HYFRAN-PLUS
-----------------------------------------------6
Figure 2 : Menu Fichier
-----------------------------------------------7
Figure 3 : Menu dition
------------------------------------------------8
Figure 4 : Menu chantillon
-------------------------------------------------------------------------9
Figure 5 : Menu SAD
----------------------------------------------------------------------------10
Figure 6 : Diagramme du SAD
----------------------------------------------------------------------------11
Figure 7 : Menu Ajustement
----------------------------------------------------------------------------12
Figure 8: Menu graphique
-----------------------------------------------------------------------------13
Figure 9 : Menu Affichage
------------------------------------------------------------------------------14
Figure 10 : Menu Fentre
--------------------------------------------------------------------------------15
Figure 11: Cration dun nouveau projet
--------------------------------------------------------------------16
Figure 12 : exemple de description du projet Harricana
-----------------------------------------------18
Figure 13 : Tableur intgr du logiciel (projet Harricana)
-----------------------------------------------19
Figure 14 : tableur intgr pour une donne dsactive (ligne 14 de lexemple du projet Harricana) ----20
Figure 15 : exemple de graphique correspondant une donne dsactive (projet Harricana) -----------21
Figure 16 : Dcision dinclure et dexclure une donne
--------------------22
Figure 17 : transformation des donnes
--------------------23
Figure 18 : Statistiques de base de lchantillon (projet Harricana)
--------------------25
Figure 19: Test dindpendance : projet Harricana
--------------------26
Figure 20 : Test de stationnarit (projet Harricana)
--------------------27
Figure 21 : Test dhomognit lchelle annuelle
--------------------28
Figure 22 : Test dhomognit lchelle saisonnire (projet Harricana)
--------------------29
Figure 23 : Observation sur papier de probabilit normal (projet Harricana)
--------------------30
Figure 24 : Histogramme des observations classes par valeur (projet Harricana)
-------------------31
Figure 25 : Histogramme des observations classes par mois (projet Harricana)
--------------------32
Figure 26 : Courbe chronologique (donnes annuelles)
--------------------32
Figure 27 : Diagramme (Cv, Cs) pralable lutilisation du test de log-normalit (srie 1) --------------34
Figure 28 : Dcision sur lutilisation du test de log-normalit (srie 1)
--------------------35
Figure 29 : Graphique log-log (srie 1)
--------------------36
Figure 30 : Dcision pour le test log-log (srie 1)
--------------------37
Figure 31 : Rapport de Hill (srie 1)
-------------------38
Figure 32 : Statistique de Jackson (srie 1)
--------------------38
Figure 33 : Diagramme (Cv, Cs) pralable lutilisation du test de log-normalit (srie 2) --------------39
Figure 34 : Dcision sur lutilisation du test de log-normalit (srie 2)
--------------------40
Figure 35 : Dcision du test de Jarque-Bera (srie 2)
-------------------41
4

Figure 36 : reprsentation graphique de lajustement de la srie 2 par la distribution Log-Normale ----42


Figure 37 : Diagramme (Cv, Cs) pralable lutilisation du test de log-normalit (srie 3) --------------43
Figure 38 : Dcision sur lutilisation du test log-normalit (srie 3)
-------------------44
Figure 39 : Diagramme log-log (srie 3)
--------------------45
Figure 40 : Dcision du graphique log-log (srie 3)
-------------------45
Figure 41 : Fonction Moyenne des Excs (srie 3)
--------------------46
Figure 42 : Dcision pour la Fonction Moyenne des Excs (srie 3)
--------------------47
Figure 43: Rapport de Hill (srie 3)
-------------------48
Figure 44 : Statistique de Jackson (srie 3)
--------------------48
Figure 45 : Comparaison graphique des ajustements de la srie 1
--------------------50
Figure 46 : Comparaison laide de critres dinformation des ajustements de la srie 1 ------------------51
Figure 47 : Illustration graphique dun ajustement par une distribution Gamma Inverse de la srie 1 ----53
Figure 48 : Rsultats de lajustement par une distribution Gamma Inverse de la srie 1 -------------------54
Figure 49: Illustration de lajout dune autre priode de retour
--------------------55
Figure 50 : Adquation de lajustement par une distribution Gamma Inverse de la srie 1 -----------------56
Figure 51 : Caractristiques statistiques pour un ajustement par une distribution Gamma Inverse de la
srie 1
--------------------57
Figure 52 : Test de discordance de la plus grande observation dans le cas dun ajustement par la
distribution Log-normale (srie 2)
--------------------58
Figure 53 : Ajustement de la loi Log-normale la srie 2 pour la mise en vidence des valeurs
discordantes sous lhypothse de Log-normalit.
-------------------59
Figure 54 : Test de discordance pour un ajustement par la distribution Log-normale avec une nouvelle
grande observation simule (srie 2).
--------------------60

1. Menu Principal
Le logiciel HYFRAN-PLUS a t conu pour lanalyse frquentielle en hydrologie particulirement
pour les valeurs extrmes. Ainsi pour lanalyse des crues, on sintresse au dbit maximum annuel.
Cependant il peut tre utilis pour nimporte quelle srie de valeurs extrmes dans dautres
domaines avec diffrents pas de temps, conditions que les observations soient Indpendantes et
Identiquement Distribues (Hypothses IID, cf 2.1.4 et Bobe et El Adlouni, 2015).

1.1.

Interface
Au dmarrage du logiciel, la fentre suivante (Figure 1) apparat avec la barre de menu compos
des menus suivants :
a) Fichier
b) Edition
c) chantillon
d) Systme dAide la Dcision (SAD)
e) Ajustement
f) Graphique
g) Affichage
h) Fentre
i) Aide (?)

Figure 1 : Fentre douverture du logiciel HYFRAN-PLUS

1.2.

Fichier
Ce menu (Figure 2) contient les options de base pour la cration, l'ouverture et l'enregistrement des
chantillons ainsi que les options d'impression.

Figure 2 : Menu Fichier


- Nouveau : Cette option permet de crer un nouveau projet. On entre les donnes manuellement
ou en utilisant le presse-papier.
- Ouvrir : Lors de la slection de cette option, une boite de dialogue permettant de slectionner un
fichier projet apparat. On peut choisir entre ouvrir un fichier de type HYFRAN-PLUS (*.hyf)
ou importer diffrents types de fichier.
- Importation : Cette option permet d'importer des fichiers de formats varis Pour utiliser cette
option, il suffit de slectionner le fichier importer dans son rpertoire et d'appuyer sur le
bouton ouvrir. Si le format du fichier est reconnu, le curseur sera positionn sur le bon
format de fichier dans le nouvel cran qui s'affiche. Par la suite la conversion du fichier au
format HYFRAN-PLUS s'effectuera aprs que l'utilisateur ait entr un nom pour ce nouveau
fichier.
- Enregistrer: cette option permet de sauvegarder les modifications effectues dans le fichier
projet.
- Enregistrer sous : l'option enregistrer sous permet de changer le nom ou le chemin d'accs
d'un fichier projet existant.
7

- Imprimer : L'ensemble des informations de toutes les fentres peuvent tre imprimes peu
importe le type de contenu (texte ou graphique).
- Configuration de l'impression : cette option permet de configurer l'imprimante (choix de
l'imprimante, du papier, de l'orientation).
- Rpertoire par dfaut : Cette option permet de choisir un rpertoire par dfaut pour tout fichier
de donnes.
- Haricana : La fentre correspondant au projet ouvert.
- Quitter : En choisissant cette option on quitte le logiciel HYFRAN-PLUS. Si des modifications
sur l'chantillon sont effectues et qu'elles n'ont pas t sauvegardes un avertissement
apparatra.
1.3.

dition
Ce menu (Figure 3) contient les options de base pour l'dition, c'est--dire annuler, couper, copier et
coller. On peut galement exporter les graphiques dans une autre application en choisissant loption
copier.

Figure 3 : Menu dition


1.4.

chantillon
Ce menu (Figure 4) contient les options utiles pour l'entre des donnes.

Figure 4 : Menu chantillon


- Insre une donne : Cette option est slectionne pour ajouter une donne.
- Dtruit une donne : l'aide de cette option, on efface une ou plusieurs donnes.
- Active/Dsactive une donne : Cette option permet de dsactiver une ou plusieurs observations
qui sont actives ou inversement d'activer une ou plusieurs observations inactives (cf Section
2.1.2),
- Active toutes les donnes non actives : Afin d'activer toutes les donnes qui sont inactives,
vous choisissez cette option,
- Dtruit toutes les donnes non actives : Afin d'effacer toutes les donnes qui sont inactives,
vous choisissez cette option.
1.5.

Systme daide la dcision (SAD)


Le SAD (Figure 5) est la principale addition la version antrieure de HYFRAN-PLUS (Version
2.0); il sagit dans HYFRAN-PLUS (Version 2.1), de lajout dun Systme dAide la Dcision
pour permettre le choix de la classe de distributions la plus adquate pour reprsenter une srie de
donnes. Les principaux lments du SAD sont prsents en dtail dans El Adlouni et Bobe
(2011) et El Adlouni, Bobe et Samoud (2012).

Figure 5 : Menu SAD


- Introduction au SAD : une prsentation succincte du SAD est offerte ainsi quune rfrence
aux articles publis propos du SAD.
- Diagramme SAD : Afin de mieux comprendre la mthodologie du SAD (Figure 5) une
illustration graphique des tapes est fournie dans linterface de HYFRAN-PLUS (Figure 6).
Elle reprsente les diffrentes tapes du SAD.
Le menu SAD (Figure 5) propose aussi les graphiques et les courbes sur lesquels repose le
systme daide la dcision tels que : le graphique log-normale, le graphique log-log, la
fonction moyenne des excs (FME), le rapport de Hill et la statistique de Jackson (cf El
Adlouni et Bobe, 2011 ; El Adlouni, Bobe et Samoud, 2012).
- Graphique Log-normale (1): Pour tester la log-normalit avec le test de Jarque-Berra.
- Graphique Log-log (1) : Vrifier lappartenance la classe C (distributions variations
rgulires).
- Fonction moyenne des excs (FME) (1): Vrifier lappartenance la classe D (distributions
sub-exponentielles).
- Rapport de Hill et Statistique de Jackson (1) : Analyse confirmatoire de la classe choisie.

Note : (1) Ces points sont dvelopps et illustrs par des exemples de la section 2.2

10

Figure 6 : Diagramme du SAD


1.6.

Ajustement
HYFRAN-PLUS permet d'ajuster diffrentes distributions statistiques (Figure 7) qui y sont
prsentes (Compaor, El Adlouni et Bobe, 2014) un chantillon alatoire respectant les
conditions IID [donnes Indpendantes et Identiquement Distribues, cf. la section 2.1.4] laide
de plusieurs mthodes d'estimation (Bobe et El Adlouni, 2015; Bobe et Askar 1991).

11

Figure 7 : Menu Ajustement


Loption comparaison permet de comparer plusieurs ajustements slectionns afin de pouvoir
choisir lequel convient le mieux pour reprsenter la srie de donnes considre. On peut comparer
les ajustements de manire graphique ou suivant diffrents critres :
- Graphique : il est possible de comparer les rsultats de plusieurs ajustements diffrents (de 2
5) l'aide d'un graphique sur papier de probabilit Normal ou Gumbel.
- Critres : deux critres sont disponibles, il sagit des critres dinformation dAkaike (AIC)
et Baysien (BIC) (cf. Ehsanzadeh, El Adlouni and Bobe, 2010).
Note :
- Longlet Halphen contient les trois lois de Halphen (type A, type B et type B Inverse) avec
leurs lois limites (Gamma et Gamma Inverse) (Morlat, 1956). Cependant, dans lajustement le
choix dune des trois lois se fait automatiquement en fonction des caractristiques de
lchantillon et des proprits thoriques de la famille des lois de Halphen (Perreault, Bobe
et Rasmussen, 1999).
- Longlet GEV englobe les trois distributions Frchet, Gumbel et Weibull. Le choix se fait
automatiquement en fonction de lestimation du paramtre de forme. Cependant, lutilisateur
peut choisir dajuster la loi Gumbel ou Weibull sparment (Figure 7).

12

1.7.

Graphique

Figure 8: Menu graphique


Ce menu (Figure 8) contient des options qui permettent d'ajouter ou d'liminer des lments sur les
graphiques. Il s'agit des options symboles, courbe, quantiles intervalle de confiance et
lgende.
De plus il est possible de slectionner le type de papier de probabilit sur lequel on dsire visualiser
les donnes et les courbes d'ajustement. Deux types de papier de probabilit sont disponibles :
Normal et Gumbel. Une distribution normale (resp. Gumbel) serait reprsente de manire linaire
sur un papier normal (resp. Gumbel).
Loption proprits des axes permet de faire un zoom sur une zone particulire du graphique. En
cas de recouvrement dune partie du graphique par la lgende, on peut remonter cette dernire en
utilisant cette option.
L'option Impression pleine page permet d'imprimer un graphique en pleine page. Il faut
slectionner cette option (apparition d'une marque devant cette option du menu), et ensuite aller
dans le menu Fichier pour imprimer. Par dfaut, l'impression sera en format paysage. Cette option
est conseille lorsquon rencontre des problmes d'impression avec certains modles d'imprimantes.
13

Loption Impression haute qualit permet dimprimer un graphique avec une plus grande
prcision au niveau des traits.
Note : Cette option fonctionne avec la majorit des imprimantes actuelles mais pas avec toutes.
1.8.

Affichage
Ce menu (Figure 9) permet dafficher ou non les barres doutils et dtat.

Figure 9 : Menu Affichage

14

1.9.

Fentre
Ce menu (Figure 10) permet de positionner les diffrentes fentres ouvertes et de naviguer entre
elles.

Figure 10 : Menu Fentre

2. Tutorial

Le logiciel HYFRAN-PLUS a t dvelopp dans lenvironnement du systme dexploitation


Windows, il est conu de faon prsenter clairement les tapes relies l'ajustement d'une
distribution statistique un chantillon alatoire. Ces tapes peuvent tre regroupes en deux
catgories:
- Saisie des donnes et tude des caractristiques statistiques de l'chantillon alatoire (section
2.1)
- Procdures dajustement (section 2.2 et 2.3)
Le logiciel HYFRAN-PLUS contient un projet par dfaut appel Harricana qui sera utilis dans
certaines parties du tutoriel.
Une bote onglets munies doptions adaptes correspond chacune des fonctions disponibles dans
HYFRAN-PLUS. On prsentera dans ce qui suit les diffrentes tapes dune analyse frquentielle
en utilisant les outils statistiques et graphiques dans HYFRAN-PLUS.

15

2.1.

Saisie des donnes et tude des caractristiques statistiques de l'chantillon


alatoire
Lorsquon cre un nouveau projet (Figure 11) ou que lon ouvre un projet existant partir du menu
Fichier, on obtient une bote onglets qui permet de saisir certaines informations sur le projet,
d'entrer ou de modifier des donnes, d'tudier certaines caractristiques statistiques de l'chantillon
alatoire associ au projet, d'effectuer certains tests statistiques, ainsi que de produire plusieurs
graphiques.
Pour effectuer ces diffrentes tches on doit naviguer entre cinq onglets diffrents, nomms :
1)Description
2)Donnes
3)Statistiques de base
4)Tests d'hypothse
5)Graphiques

Figure 11: Cration dun nouveau projet

16

2.1.1 Description
Dans longlet Description du projet (Figure 12), on retrouve les diffrentes informations sur le
projet qui sont utilises pour construire les graphiques ainsi que pour prsenter les tableaux de
donnes et de rsultats:
a) On entre dabord le titre du projet qui sera le titre des graphiques produits ensuite par
HYFRAN-PLUS.
b) On inscrit ensuite le nom de la variable qui apparatra comme le titre d'un des axes des
graphiques (l'abscisse ou l'ordonne, selon le graphique demand).
c) Puis on inscrit l'unit de mesure des observations qui sera indiqu la suite du nom de la
variable sur les graphiques.
d) On peut aussi spcifier le nombre de chiffres significatifs des donnes (entre 1 et 18). Cette
valeur est utilise pour prsenter les rsultats avec un nombre correct de chiffres significatifs
mais n'influence pas la prcision des calculs.
e) On peut choisir une dfinition pour le concept de priode de retour. Il peut s'agir soit :
o de l'inverse de la probabilit au dpassement pour ltude des crues,
o de l'inverse de la probabilit au non-dpassement pour ltude des tiages (cf. Bobe et
El Adlouni, 2015).
f) On peut choisir une formule de probabilit empirique (Bobe et Ashkar, 1991), qui est ensuite
utilise pour tracer les observations sur un papier de probabilit. Dans HYFRAN-PLUS, les
formules de probabilit empirique utilises sont de la forme=
suivante: Pk ( k - a ) / ( n - 2a + 1)
(cf. Bobe et El Adlouni, 2015; Bobe et Ashkar, 1991). Pk correspond la probabilit au
non-dpassement de lobservation X k dordre k dans lchantillon de taille n class en ordre
croissant.
La formule de Cunnane (a = 0.4) est utilise par dfaut dans le logiciel HYFRAN-PLUS mais
les autres formules disponibles peuvent tre utilises selon le choix de lutilisateur (Bobe et
Ashkar, 1991 Table 1.3 page 11).
g) On peut finalement inscrire des commentaires quelconques sur le projet. Les informations
inscrites dans la section Commentaires ne sont pas prises en compte par HYFRAN-PLUS
mais peuvent tre utiles l'usager pour dcrire le projet plus en dtail (Figure 12).

17

Figure 12 : Exemple de description du projet Harricana

2.1.2. Donnes
Il existe trois faons dentrer les donnes dans le logiciel HYFRAN-PLUS :
a) Utiliser le tableur intgr au logiciel (cf. Figure 13).
b) Importer un fichier de donnes (pour les formats reconnus par HYFRAN-PLUS); ce qui est
dcrit dans lune des sections suivantes.
c) Utiliser le presse-papier
a) Tableur intgr au logiciel
HYFRAN-PLUS est muni d'un tableur qui permet de saisir et de visualiser les donnes. Chaque
ligne correspond une observation et est divise en quatre colonnes (Figure 13):
1. Observation: la valeur numrique de chaque observation doit tre inscrite dans cette colonne;
2. Identificateur: on peut associer un numro squentiel chaque observation; si l'on veut inscrire
une date, elle doit ncessairement tre entre dans le format AAAA-MM-JJ; on peut omettre le
jour et le mois et entrer seulement lanne (AAAA);

18

3. Probabilit empirique: la probabilit empirique associe chaque observation est calcule


automatiquement et affiche dans cette colonne, en utilisant la formule spcifie dans la page
de description du projet (Figure 11);
4. Code: cette colonne peut tre utilise pour marquer d'un code certaines observations; ce code
doit tre compos d'un seul caractre; par exemple, on pourrait indiquer par un M les
donnes qui ont t mesures manuellement, et par un R les donnes qui ont t rvises.

Figure 13 : Tableur intgr du logiciel (projet Harricana)


Pour insrer une nouvelle donne (Figure 4), on utilise la touche Insrer du clavier ou l'option
quivalente du menu chantillon. Pour dtruire une ou plusieurs donnes, on slectionne la ou
les donnes (Figure 5), on utilise alors la touche Del du clavier ou l'option quivalente du menu
"chantillon" (Figure 4). Il est galement possible de copier toutes les donnes du tableur de
HYFRAN-PLUS dans le presse-papier en appuyant sur les touches Ctrl-A (Slectionner tout
dans le menu dition), ensuite les touches Ctrl-C (Copier dans le menu dition) et enfin les
touches Ctrl-V (Coller dans le menu dition) [Figure 3]. De plus plusieurs options dcrites
dans ce qui suit (dsactivation, tri et transformation des donnes) peuvent tre utilises partir du
tableur.

19

- Donnes dsactives
Un des avantages de HYFRAN-PLUS est de permettre de dsactiver des donnes sans les dtruire
(Figure 14). Ceci permet entre autres d'tudier la sensibilit d'une analyse statistique aux donnes
singulires. Ainsi une donne extrme peut tre reprsente sur le graphique de la distribution
ajuste mais navoir aucun poids dans lajustement de cette distribution.
Pour dsactiver une donne active ou activer une donne dsactive, on peut appuyer sur F5 ou
choisir l'option correspondante du menu chantillon (Figure 4).

Figure 14 : Exemple de tableur intgr pour une donne dsactive (ligne 14, projet Harricana)
Les donnes dsactives ne sont pas prises en compte pour effectuer les diffrents tests
d'hypothses et ajustements proposs par HYFRAN-PLUS. Cependant sur les graphiques elles sont
affiches l'aide d'un symbole diffrent (Figure 15).

20

Figure 15 : exemple de graphique correspondant une donne dsactive (projet Harricana)


Pour le calcul des probabilits empiriques, il est possible d'inclure ou d'exclure les donnes
dsactives (Figure 16). Si l'option Inclure les donnes dsactives dans le calcul des probabilits
empiriques est coche, toutes les observations (actives ou non) sont traites de la mme faon dans
le calcul des probabilits empiriques. La probabilit empirique des observations dsactives est
toujours calcule de la mme faon, sur la base de l'chantillon complet. Dans le cas contraire, la
probabilit empirique des observations actives est calcule sans tenir compte de l'existence des
observations dsactives.
Pour activer toutes les donnes non actives on utilise l'option "Active toutes les donnes non
actives" du menu "chantillon" (Figure 4). La destruction des donnes non actives se fait l'aide
de l'option Dtruire toutes les donnes non actives du menu "chantillon".

21

Figure 16 : Dcision dinclure et dexclure une donne


- Tri des donnes
Il est possible de trier les donnes par ordre croissant ou dcroissant, et en fonction soit :
- de la valeur des observations (colonne 1)
- de lidentificateur (colonne2).
Pour trier les donnes, on appuie sur le bouton "Trier" (Figure 16).
- Transformation des donnes
Dans HYFRAN-PLUS on peut transformer les donnes l'aide de plusieurs fonctions simples, ce
qui permet deffectuer lajustement dune loi la srie transforme des donnes. Pour transformer
les donnes, on doit appuyer sur le bouton "Transformer" (Figure 16). On ouvre alors une bote de
dialogue qui offre les transformations suivantes (Figure 17):
- Inverse: 1/ x
- Oppos: x
- Valeur absolue: x
-

Exponentielle: a x
Logarithmique: log a x
chelle: a x
Position: a + x
Puissance: x a
22

Figure 17 : transformation des donnes


Note: La valeur a correspond au paramtre de transformation, que l'on devrait spcifier dans cette
mme bote de dialogue. Dans le cas dune transformation logarithmique, a correspond la base
choisie. En pratique on considre a = 10 (logarithme dcimal) ou a = e (logarithme nprien).
b) Importation des fichiers de donnes
Le logiciel HYFRAN-PLUS permet dimporter divers types de format de donnes (Figure 2). Pour
importer des donnes il faut aller dans le menu Fichier et cliquer sur longlet Importation. Les
diffrents fichiers importables sont cits ci-dessous.
Formats HYDAT :
- Export Extreme
- Export Extreme Instantaneous
- Export Mean
- Print Extreme
- Print Mean
Format MATLAB : dans ce format texte, seules les donnes numriques sont prsentes, les
dates ne sont pas saisies. Les donnes sont spares les unes des autres par un ou plusieurs
espaces. Chaque ligne dans le fichier correspond une station.

23

Format Texte 1 colonne : les donnes numriques sont prsentes sur une seule colonne;
dans ce format, les dates ne sont pas entres. Lutilisateur rcupre lensemble de ces
donnes dans un seul fichier.
Format HCDN ASCII Annual Mean
Format Excel avec le mme ordre des colonnes que celui de HYFRAN-PLUS (Premire
colonne : Observations et Deuxime colonne lidentifiant qui est la date).
Format libre : pour pouvoir importer ce type de donnes dans le logiciel HYFRAN-PLUS
(incluant ou non des dates) le modle suivant doit tre respect:
- 1 ligne : on y entre un titre sur une seule ligne
- 2 ligne : puis on y inscrit les mots Format Libre sans guillemets mais avec un
espace entre Format et Libre
- Lignes suivantes : elles ont consacres aux donnes (1 donne par ligne). Les donnes
ne doivent pas contenir plus de 19 caractres en incluant le point dcimal; elles
contiennent un espace, une date ou un identifiant numrique (facultatif). Le format de
la date est yyyy/mm/jj (anne, mois puis jour). Le fichier doit tre enregistr en format
texte normal.
c) Presse-papier
Le presse-papier peut tre utilis pour coller des donnes partir dune autre application Windows
(traitement de texte, tableur, etc.). Il suffit d'utiliser les touches Ctrl- C (Copier du menu
dition) et Ctrl-V (Coller du menu dition, Figure 3) pour insrer le contenu du pressepapier dans le tableur intgr HYFRAN-PLUS.

2.1.3. Statistiques de base


La fentre des statistiques de base (Figure 18) prsente en plus du titre ventuel de l'tude les
statistiques suivantes de l'chantillon (cf. Bobe et El Adlouni, 2015):
-

La taille de lchantillon
La valeur minimum
La valeur maximum
La moyenne
Lcart-type
La mdiane
Le coefficient de variation
Le coefficient dasymtrie
Le coefficient d'aplatissement

Lorsqu'il y a des donnes non actives, les statistiques de base sont prsentes en deux colonnes. La
premire colonne donne les statistiques de l'chantillon des donnes actives seulement et la
deuxime colonne les statistiques de l'chantillon au complet (donnes actives et non actives).

24

Figure 18 : Statistiques de base de lchantillon (projet Harricana)

2.1.4. Tests dhypothse


Avant de procder l'ajustement d'un chantillon l'aide d'une distribution statistique, il est
primordial de vrifier si les donnes sont indpendantes et identiquement distribues (IID) (cf.
Bobe et El Adlouni, 2015; Bobe et Ashkar, 1991). En effet, les observations doivent tre des
ralisations Indpendantes de la mme variable alatoire et provenir de la mme distribution
statistique (i.e. Identiquement Distribues). Dans HYFRAN-PLUS, des tests statistiques sont
disponibles pour vrifier les hypothses d'indpendance, de stationnarit et d'homognit. Il s'agit
des quatre tests d'hypothse:
a) Test d'indpendance (Wald-Wolfowitz)
b) Test de stationnarit (Kendall);
c) Test d'homognit l'chelle annuelle (Wilcoxon);
d) Test d'homognit l'chelle saisonnire (Wilcoxon).
Note : Le test de Wilcoson est connu aussi sous le nom du test de Mann-Whitney.
Tous ces tests sont dcrits dans Bobe et Ashkar (1991) et Bobe (2000).

25

Dans l'onglet Tests d'hypothse (Figure 19) le titre du projet spcifi la description du projet
(Figure 12) est indiqu et on peut :
- en premier lieu choisir le type de test statistique effectuer;
- spcifier pour ce test l'hypothse nulle (H0) et l'hypothse alternative (H1).
- Pour chaque test on obtient :
- la valeur de la statistique du test et la p-value correspondante (probabilit au dpassement
de la statistique),
- la conclusion du test (obtenue partir de la p-value), c'est--dire l'acceptation ou le rejet de
l'hypothse nulle un niveau de signification de 5% ou de 1%.
a) Test d'indpendance (Test de Wald-Wolfowitz) : Le test d'indpendance de Wald-Wolfowitz
(Figure 19) permet de vrifier s'il existe une autocorrlation dordre 1, significative entre les
observations.
b) Test de stationnarit (Test de Kendall) : Le test de stationnarit de Kendall (Figure 20) permet
de vrifier s'il existe une tendance significative dans la srie.

Figure 19: Test dindpendance : projet Harricana

26

Figure 20 : Test de stationnarit (projet Harricana)

Note : Quand on choisit le test dhomognit (Figure 21) le bouton "Subdiviser l'chantillon"
devient apparent pour les deux tests d'homognit considrs dans ce qui suit. Il est ncessaire
dans ces cas de spcifier les deux sous-chantillons pour lesquels les moyennes vont tre
compares.

c) Test d'homognit l'chelle annuelle (Test de Wilcoxon ou de Mann-Whitney): Le test


d'homognit l'chelle annuelle (Figure 21) permet de vrifier si la moyenne d'un premier
sous-chantillon est significativement diffrente de celle d'un deuxime sous-chantillon. Ce
test peut, par exemple, tre utilis dans le cas du dplacement dune station de mesure si on
veut comparer la moyenne des donnes annuelles avant et aprs la date du dplacement c..d.
vrifier si les donnes appartiennent une population statistique de mme moyenne. Le
premier sous-chantillon est compos des observations de l'anne de dbut des observations
une anne de coupure. Le deuxime sous-chantillon est form des observations de l'anne
suivant l'anne de coupure l'anne de fin des observations. L'anne de coupure est spcifie
aprs avoir appuy sur le bouton Subdiviser l'chantillon.

27

Note : Pour effectuer ce test, il faut que l'anne soit spcifie pour chaque observation lors de
lentre ou de limportation des donnes (Figure 13).

Figure 21 : Test dhomognit lchelle annuelle


d) Test d'homognit l'chelle saisonnire (Test de Wilcoxon ou de Mann-Whitney): Dans le
tes dhomognit lchelle saisonnire (Figure 22), tout comme le test dhomognit
lchelle saisonnire le premier sous-chantillon est compos des observations comprises dans
la priode allant du mois m (dbut de la premire saison) au mois n (fin de la premire
saison). Le deuxime sous-chantillon est form des observations inclus dans la priode allant
du mois n+1 (dbut de la deuxime saison) au m-1 (fin de la deuxime saison). Les mois m et
n sont spcifis aprs avoir appuy sur le bouton Subdiviser l'chantillon (Figure 19). Ce
test peut tre utilis, par exemple, pour vrifier lhomognit des crues printanires, dues la
fonte des neiges (janvier-juin), et des crues automnales, dues aux prcipitations juilletdcembre), afin de savoir si on peut les regrouper dans le mme chantillon.
Note : Pour effectuer ce test, il faut que le mois soit spcifi pour chaque observation lors de
lentre ou limportation des donnes (Figure 13).

28

Figure 22 : Test dhomognit lchelle saisonnire (projet Harricana)

2.1.5. Graphiques
HYFRAN-PLUS offre la possibilit partir de l'onglet Graphiques (Figure 15) de visualiser les
donnes de diffrentes manires:
a) Observations sur papier de probabilit (normal ou Gumbel);
b) Histogramme des observations classes par valeur;
c) Histogramme des observations classes par mois;
d) Courbe chronologique.
Dans ce qui suit, ces quatre points seront dtaills et illustrs par des exemples.
a) Observations sur papier de probabilit (Figure 23) : Ce graphique prsente, sur papier de
probabilit normal ou Gumbel, les observations en fonction des probabilits empiriques de
l'chantillon. La slection du type de papier de probabilit est effectue dans le menu
"Graphique" (Figure 8) o l'on retrouve les deux options "Papier de probabilit normal" et "Papier
de probabilit Gumbel".

29

Figure 23 : Observation sur papier de probabilit normal (projet Harricana)


Note : Les points en rouge correspondent aux valeurs dsactives.
b) Histogramme des observations classes par valeur (Figure 24): l'histogramme des observations
classes par valeur est un graphique permettant de visualiser le nombre d'observations par classe
de valeur. Ce type de graphique donne une image de la fonction de densit de probabilit des
donnes.
Le nombre de classes quidistantes est calcul approximativement selon l'quation suivante:

= 5 log ( n )
Nombre de classes
O n est la taille de l'chantillon et [.] reprsente la partie entire.

30

Figure 24 : Histogramme des observations classes par valeur (projet Harricana)


Note : Les valeurs dsactives sont galement prises en compte dans la reprsentation sous forme
dhistogramme par une couleur diffrente (Figures 24 et 25).
c) Histogramme des observations classes par mois (Figure 25) : l'histogramme des observations
classes par mois est un graphique permettant de visualiser le nombre d'observation par mois.

31

Figure 25 : histogramme des observations classes par mois (projet Harricana)


d) Courbe chronologique (Figure 26) : Ce graphique prsente les observations en fonction du temps
(anne).

Figure 26 : courbe chronologique des donnes annuelles (projet Harricana)


Note : Les points en rouge correspondent aux valeurs dsactives.
32

2.2. Systme daide la dcision (SAD)


Avant de passer lajustement dune distribution statistique une srie de donnes il est
souhaitable de dterminer en premier lieu quelle classe cette distribution appartient (El Adlouni,
Bobe et Ouarda, 2008). Pour des fins dillustration on utilisera 3 sries (voir Annexe 1) :
- La srie correspondant au projet Harricana (Tableau A1; Srie 1) est disponible
linstallation de HYFRAN-PLUS. On montrera, dans ce qui suit (Figure 30), que la
distribution qui sajuste le mieux cette srie appartient la classe C,
- Une srie simule partir de la loi Log-normale (Tableau A2; Srie 2) puis transforme(1)
en loi normale (Tableau A3; Srie 2 transforme). La loi Log-normale est un cas limite des
classes C et D (El Adlouni, Bobe et Ouarda, 2008), et,
- Une srie simule partir dune loi Gamma (classe D) (Tableau A4; Srie 3).
Note : (1) En effet, si X = ln(Y) suit une loi Normale alors Y = eX suit une loi Log-normale.
Dans tous ces cas on utilise le SAD comme dcrit dans El Adlouni et Bobe (2011) ; El Adlouni,
Bobe et Samoud (2012). La Figure B-1 de lappendice B reprsente la classification des
distributions les plus utilises, en hydrologie, pour lajustement des valeurs extrmes, par rapport
leurs queues droites.
a) Srie 1 (Annexe 1 Tableau A.1) :
On effectue en premier lieu le test (Cv, Cs) (tape 1 du diagramme SAD, Figure 6) pour dcider si
on peut ensuite tester la log-normalit. Ceci est effectu en utilisant loption diagramme lognormale disponible dans le menu SAD du logiciel HYFRAN-PLUS (voir Figure 5). Cette option
permet de naviguer entre 4 onglets :
- Graphiques pour pouvoir observer le diagramme (Cv, Cs) (Figure 27),
- Dcision qui donne les conclusions du test (Cv, Cs) (Figure 28),
- Test JB qui reprsente les conclusions du test JB, quand on peut lutiliser,
- Aide qui contient linformation utile concernant les tests de log-normalit et de JarqueBera (Martel, El Adlouni and Bobe, 2012).

33

Figure 27 : diagramme (Cv, Cs) pralable lutilisation du test de log-normalit (srie 1)


- Le point ( Cv , Cs ) observ ( ) est situ en dessous de la droite (Figure 27), on dduit donc
(Figure 28) quon ne peut pas utiliser le test de log-normalit de Jarque-Bera (cf. Martel, El
Adlouni and Bobe, 2012).

34

Figure 28 : dcision sur lutilisation du test de log-normalit (srie 1)

- Donc on considre le graphique log-log (tape 5 du diagramme SAD, Figure 6) en utilisant


loption graphique log-log situe dans le menu SAD (Figure 5). Loption choisie nous
permet de naviguer entre 3 onglets :
o Graphique qui permet dafficher le trac du diagramme log-log pour le projet
tudi (Figure 29),
o Dcision qui permet de dterminer la classe laquelle la srie de donne
appartient (Figure 30) et,
o Aide qui contient des informations utiles relatives au test.

35

Figure 29 : Graphique log-log (srie 1)

La Figure 29 montre que la linarit de la courbe est acceptable, on en dduit donc que la srie
appartient la classe C (tape 6 du diagramme SAD, Figure 6). En effet (Figure 30), le coefficient
de corrlation observ tant suprieur la valeur critique, il nest donc pas significativement
diffrent de 1. On accepte donc lhypothse H0 : la courbe est linaire (cf. El Adlouni, Bobe et
Samoud, 2012).

36

Figure 30 : Dcision pour le test log-log (srie 1)


Note : Les valeurs critiques pour ltude de la linarit du diagramme log-log (Figure 30), ont t
obtenues par simulation (El Adlouni et Bobe 2011). Nous avons remarqu que les valeurs
correspondant aux deux seuils 1% et 5% sont identiques mme en considrant des simulations sur
10.000 chantillons.

On utilise le rapport de Hill et la statistique de Jackson (Figure 5) pour confirmer le choix


de la classe C (tape 10 du diagramme SAD, Figure 6). La Figure 31 montre que la
statistique de Hill converge vers une valeur constante diffrente de zro et la Figure 32
correspond la statistique de Jackson qui dans ce cas converge vers 2. Ces rsultats
confirment donc (El Adlouni et Bobe, 2011) que la srie 1 peut tre reprsente par une
distribution de la classe C : Frchet (nomme aussi EV2), Gamma Inverse, Halphen type B
Inverse, (Figure B-1, Appendice B).

37

Figure 31 : Rapport de Hill (srie 1)

Figure 32 : Statistique de Jackson (srie 1)

38

b) Srie 2 (Annexe 1 Tableau A.2):


- On trace le diagramme (Cv, Cs) pour savoir si on doit utiliser le test de log-normalit (tape 1 du
diagramme SAD, Figure 6).

Figure 33 : diagramme (Cv, Cs) pralable lutilisation du test de log-normalit (srie 2)


tant donn que le point (Cv, Cs) observ ( ) est au-dessus de la droite (Figure 33) et donc
appartient la zone HIB (cf. Martel, El Adlouni and Bobe, 2012), on en dduit donc (Figure 34)
que le test de log-normalit est applicable (tape 2 du diagramme SAD, Figure 6). On effectue donc
la transformation logarithmique (Figure 17) des donnes du tableau A.2 (Annexe 1) pour obtenir le
Tableau A.3.
-

La dcision du diagramme (Cv, Cs) permet de tester la log-normalit (on applique donc le
test de Jarque-Bera (JB).

39

Figure 34 : Dcision sur lutilisation du test de log-normalit (srie 2)

Le test de JB (Figure 35) dmontre que lhypothse de la log-normalit est satisfaisante, on suggre
donc lemploi dune distribution log-normale pour la reprsentation de la srie 2 des donnes (tape
3 du diagramme SAD, Figure 6).

40

Figure 35 : Dcision du test de Jarque-Bera (srie 2)

On remarque (Figure 36) que si lon choisit de reprsenter les donnes de la srie 2 transforme
logarithmiquement) par une distribution normale, lajustement correspondra une droite sur du
papier de probabilit normal. Cela confirme la validit de la loi Log-normale pour la srie 2. En
effet, Si Y=ln(X) suit une loi normale alors X suit une loi Log-normale.

41

Figure 36 : Reprsentation graphique de lajustement de la srie 2 transforme, par la distribution


Normale (chelle logarithmique)

c) Srie 3 (Annexe 1 Tableau A.4):


-

On effectue le test (Cv, Cs) (Figure 37) pour dterminer si on peut ensuite tester la lognormalit (tape 1 du diagramme SAD, Figure 6).

Le point ( Cv , Cs ) observ ( ) est situ en dessous de la droite (Figure 37), on dduit donc (Figure
38) quon ne peut pas utiliser le test de log-normalit de Jarque-Bera (cf. Martel, El Adlouni and
Bobe, 2012), comme dans le cas de la srie 1.
On considre alors, le graphique log-log (tape 5 du diagramme SAD, Figure 6) en utilisant loption
graphique log-log situe dans le menu SAD (Figure 5).
.

42

Figure 37 : Diagramme (Cv, Cs) pralable lutilisation du test de log-normalit (srie 3)

43

Figure 38 : Dcision sur lutilisation du test log-normalit (srie 3)

Nous pouvons constater, en considrant le digramme log-log (Figure 39), que la courbe nest pas
linaire (El Adlouni, Bobe et Samoud, 2012); on en dduit donc (Figure 40) quil faut utiliser le
graphique de la Fonction Moyenne des Excs (FME) (tape 7 du diagramme SAD, Figure 6).

44

Figure 39 : Graphique log-log (srie 3)

Figure 40 : Dcision du graphique log-log (srie 3)


45

Pour effectuer le test de la FME on slectionne loption Fonction Moyenne des Excs que
lon retrouve dans le menu SAD (Figure 5). Cette option permet de naviguer entre 3
onglets :
o Graphique pour observer le trac de la FME (Figure 41),
o Dcision qui permet dobtenir les conclusions du test de la FME (Figure 42) et,
o Aide qui contient linformation utile concernant le graphique e la FME.

On remarque que la pente est positive (Figure 41), on peut en dduire (El Adlouni et Bobe, 2011)
que les distributions de la classe D peuvent tre utilises pour reprsenter les donnes de la srie 3
(tape 9 du diagramme SAD, Figure 6; Figure B-1, Appendice B). Ceci est confirm par la Figure
42. En effet, la pente observe a0 tant suprieure la valeur critique ac, on rejette donc lhypothse
H0 que la pente est nulle (tape 9 du diagramme SAD, Figure 6) (El Adlouni, Bobe et Samoud,
2012).

Figure 41 : Fonction Moyenne des Excs (srie 3)

46

Figure 42 : Dcision pour la Fonction Moyenne des Excs (srie 3)

Note : Les valeurs critiques pour le diagramme FME (Figure 42), ont t obtenues par simulation
(El Adlouni et Bobe 2011). Nous avons remarqu que les valeurs correspondant aux deux seuils
1% et 5% sont identiques mme en considrant des simulations avec 10.000 chantillons.
-

On utilise le rapport de Hill et la statistique de Jackson (Figure 5) pour confirmer le choix


de la classe D (tape 10 du diagramme SAD, Figure 6). La Figure 43 montre que la
statistique de Hill converge vers une valeur nulle et la Figure 44 qui correspond la
statistique de Jackson prsente des irrgularits et ne converge pas vers 2. On en dduit
donc (El Adlouni, Bobe et Samoud, 2012) que la srie 3 peut tre reprsente par une
distribution de la classe D (Figure B-1, Appendice B), de type sub-exponentiel : Gumbel,
Halphen type B, Halphen type A,.

47

Figure 43: Rapport de Hill (srie 3)

Figure 44 : Statistique de Jackson (srie 3)


48

2.3. Ajustement dune distribution statistique une srie de donnes


Dans ce qui prcde, on a utilis le SAD pour choisir la classe qui reprsente le mieux la forme de
la distribution empirique. On procde ensuite lajustement des distributions de la classe retenue
la srie des observations. Les classes C et D contiennent plusieurs distributions (Figure B-1,
Appendice B). Le choix de la distribution la plus adquate peut tre effectu par le biais de
visualisation graphique ou en utilisant les critres dinformation (AIC et BIC).
Dans ce qui suit, on utilisera, titre dillustration, la srie 1 qui peut tre reprsente par une
distribution de la classe C (cf. Figure 30). HYFRAN-PLUS permet d'ajuster diffrentes
distributions statistiques un chantillon alatoire dobservations IID en considrant diffrentes
mthodes d'estimation.
Pour effectuer un ajustement on suit les tapes suivantes:
- Choisir, tour tour, chacune des distributions de la classe choisie (Classe C dans le cas de
la srie 1) dans le menu "Ajustement" (Figure 7);
- Choisir, pour chaque distribution, une mthode d'estimation dans la fentre contextuelle
qui apparait ensuite;
- Appuyer sur le bouton OK.

2.3.1. Choix de la distribution statistique la plus adquate


On a dj dmontr (Figure 30) que la srie 1 pouvait tre reprsente par une distribution de la
classe C (Frchet, Gamma Inverse, Halphen type Inverse B, Log-Pearson type 3) (Figure B-1,
Appendice B). Or le logiciel HYFRAN-PLUS permet de comparer lajustement de plusieurs
distributions afin de choisir le modle le plus adquat pour reprsenter la srie de donnes. Dans ce
qui suit on prsentera les mthodes (graphique et critres dinformation) permettant de discriminer
les distributions. On survolera lajustement pour les besoins de cette section.
Comparaison graphique
On peut comparer les rsultats de plusieurs ajustements diffrents l'aide d'un graphique sur papier
de probabilit normal ou Gumbel. Il faut premirement effectuer conscutivement l'ajustement des
distributions (cinq au maximum) comparer et ensuite slectionner l'option Comparaison du
menu Ajustement (Figure 7). Une boite de dialogue qui permet de slectionner les distributions
apparaitra.
Aprs avoir slectionn les distributions dintrt on obtient un graphique reprsentant les
distributions choisies ainsi que les probabilits empiriques des donnes de la srie 1 (Figure 45).
Note : On ne peut pas effectuer lajustement de la distribution Halphen de type B Inverse pour
cette srie de donnes car le systme dquations du maximum de vraisemblance ne converge pas
dans ce cas (Perreault, Bobe et Rasmussen, 1999).
On remarque sur la Figure 45 que la distribution Gamma Inverse (en bleu) reprsente mieux la
srie de donnes que les distributions Frchet (en rouge) et Log-Pearson 3 (en vert).
49

Figure 45 : comparaison graphique des ajustements de la srie 1


Note : La distribution de Frchet (EV2) correspond un cas particulier de la loi GEV (Generalized
Extreme Value).
Critres dinformation
Pour discriminer les diffrents ajustements on peut en outre utiliser les deux critres suivants
disponibles dans HYFRAN-PLUS (Ehsanzadeh, El Adlouni and Bobe, 2010):
- Critre dinformation dAkaike (AIC)
- Critre dinformation baysien (BIC)
Ces deux critres utiliss conscutivement (AIC puis BIC) permettent de construire un classement
de modles statistiques tenant compte du principe de parcimonie. Les meilleurs ajustements
correspondent aux plus faibles valeurs de ces critres (Ehsanzadeh, El Adlouni and Bobe, 2010).
Pour faire la comparaison il faut premirement effectuer conscutivement l'ajustement des
distributions de la mme classe comparer et ensuite slectionner l'option Comparaison du menu
Ajustement (Figure 7). Une boite de dialogue qui permet de slectionner les distributions (cinq au
50

maximum) apparaitra. Dans le cas du BIC, aprs avoir slectionn les distributions dintrt, on
spcifie le rapport des probabilits a priori (i.e. P(Mi) le poids donn a priori chaque distribution)
ainsi que la priode de retour. La probabilit a posteriori P(Mi|x) est ensuite dtermine, pour
chaque distribution, en tenant compte de la srie des observations pour en dduire le BIC (voir
Ehsanzadeh, El Adlouni et Bobe, 2010). Cette procdure conduit une fentre qui contient toutes
les informations relatives aux distributions compares (Figure 46).

Figure 46 : comparaison laide de critres dinformation des ajustements de la srie 1

Les critres AIC (Critre dInformation dAkaike) et BIC (Critre dInformation Baysien) ainsi
que les notations du tableau de la Figure 46 sont expliqus en dtail dans Ehsanzadeh, El Adlouni et
Bobe (2010).

Note : Les critres AIC et BIC favorisent lutilisation de distributions ayant le plus petit nombre de
paramtres (principe de parcimonie). Cependant, de manire gnrale pour la modlisation des
sries de maxima annuels en hydrologie, Morlat (1956) recommande lutilisation des distributions
trois paramtres pour prendre en compte la forme (asymtrie des distributions). En effet, dans le cas
de distributions 2 paramtres la forme est fixe (par exemple, le coefficient dasymtrie pour la loi
de Gumbel est 1.137)

51

2.3.2. Ajustement
En accord avec la comparaison graphique (Figure 45) et les critres AIC et BIC (Figure 46) la
distribution Gamma inverse est la plus adquate pour reprsenter la srie 1 (Rivire Harricana
Amos entre 1915-1994, Tableau A.1, Annexe 1). On reprsentera donc cette srie en utilisant la
distribution Gamma Inverse pour la partie du tutoriel concernant lajustement.
Lorsquon effectue lajustement dune distribution statistique un chantillon, une bote onglets
apparait (Figures 2 et 7), prsentant les rsultats de l'ajustement ainsi que les informations
connexes.
Pour accder aux diffrents aspects de lajustement on navigue entre les onglets suivants (Figure
47):
- Rsultats
- Graphique
- Adquation
- Caractristiques de la population
- Discordance (apparait seulement pour les lois Normale et Log-normale)

Rsultats de l'ajustement
La fentre des rsultats de l'ajustement (Figure 47) prsente les options suivantes:

Le projet, autrement dit le nom du fichier qui contient l'chantillon et son chemin d'accs;

Le titre du projet;

La taille de l'chantillon;

La valeur des paramtres estims de la loi Gamma Inverse;

Les quantiles xT pour 21 priodes de retour prdfinies. Dans l'ordre de gauche droite on a :
o la priode de retour (T = 1 / p ) , o p est la probabilit au dpassement de xT ;
o la probabilit au non-dpassement ( q = 1 p ) ,
o la valeur du quantile xT correspondant, l'cart-type du quantile xT et enfin,
o l'intervalle de confiance IC du quantile un niveau de confiance donn (La dmarche
thorique pour dterminer le quantile xT , l'cart-type du quantile xT et lintervalle de

confiance associ sont disponibles dans lAppendice A, Bobe et El Adlouni, 2015);


Un bouton Autre priode de retour;
Le niveau de confiance (95% par dfaut) de l'intervalle de confiance que l'on peut modifier.

52

Figure 47 : Rsultats de lajustement par une distribution Gamma Inverse de la srie 1

Graphique
Il est appropri d'analyser l'adquation d'un ajustement l'aide d'un graphique. HYFRAN-PLUS
permet la visualisation de l'ajustement sur papier de probabilit normal ou Gumbel (le choix du
papier est effectu dans le menu "Graphique", Figure 8).
Par dfaut, le graphique (Figure 48) prsente les donnes de l'chantillon, la courbe thorique de
l'ajustement (ligne rouge), l'intervalle de confiance (lignes bleues) dont le niveau est spcifi
l'onglet "Rsultats" et la lgende. Il est toutefois possible de retirer ou d'ajouter certains des
lments sur la Figure partir du menu Graphique que lon retrouve la barre des menus (Figure
8).

53

Figure 48 : illustration graphique dun ajustement par une distribution Gamma Inverse de la srie 1

Autre priode de retour


Lors d'un ajustement, HYFRAN-PLUS prsente les rsultats pour 21 priodes de retour, choisies de
manire rpondre la plupart des problmes tudis. Toutefois, il peut tre ncessaire dans le
cadre de certains projets, de connatre la valeur de la variable pour une ou plusieurs autres priodes
de retour.
Pour ajouter une priode de retour, partir de l'cran des rsultats de l'ajustement il faut procder
comme suit :
- Appuyez sur le bouton Autre priode de retour (Figure 47);
- La bote de dialogue Autre priode de retour apparat immdiatement (Figure 49);
- Dans la zone de texte Valeur de T entrez la nouvelle priode de retour que vous dsirez
ajouter.
- Appuyez sur le bouton OK. La nouvelle priode de retour est alors insre dans la liste.

54

Figure 49: illustration de lajout dune autre priode de retour


-

Modification du niveau de l'intervalle de confiance


Par dfaut, le niveau de l'intervalle de confiance est de 95%. Pour le modifier il faut utiliser les
flches situes droite de la zone de texte Niveau de confiance. Le niveau de confiance varie
de 1% 99 %. HYFRAN-PLUS affiche immdiatement les rsultats pour le nouveau niveau de
confiance.

Adquation
Afin de juger d'une manire objective de la qualit de l'ajustement aux donnes, il existe divers tests
statistiques d'adquation. Selon la distribution utilise et la taille dchantillon, HYFRAN-PLUS
prsente les rsultats obtenus pour certains des tests suivants (cf Bobe et El Adlouni, 2015 et
Compaor, El Adlouni et Bobe, 2013):
Test du khi-carr (applicable pour toutes les distributions statistiques);
Test sur les moments empiriques (applicable uniquement pour les distributions normale et
log-normale).
Dans l'onglet "Adquation" (Figure 50), on retrouve les informations suivantes:
Le projet c..d. le nom du fichier qui contient l'chantillon et son chemin d'accs (Figure
11);
Le titre du projet spcifi l'onglet Description du projet est indiqu (Figure 12);
55

L'hypothse nulle ( H 0 ) et l'hypothse alternative ( H1 ) ;


Les rsultats du test : i.e. la valeur de la statistique du test et la p-value de la statistique (cf
Bobe et El Adlouni, 2015 et Compaor, El Adlouni et Bobe, 2013);
Enfin la conclusion du test c..d. l'acceptation ou le rejet de l'hypothse nulle un niveau
de signification de 5% ou de 1%.

Figure 50 : Adquation de lajustement par une distribution Gamma Inverse de la srie 1


Caractristiques statistiques de la distribution ajuste
La fentre des caractristiques de la population (Figure 51) prsente les statistiques pour la
distribution utilise. Dans la premire colonne on retrouve les caractristiques de la population et
dans la seconde colonne on retrouve les caractristiques de lchantillon.
La taille de l'chantillon est donne la colonne des caractristiques de l'chantillon. Le projet et
le titre du projet apparaissent aussi dans cette fentre.

56

Figure 51 : Caractristiques statistiques pour un ajustement par une distribution Gamma


Inverse de la srie 1
Discordance
Cet onglet permet de vrifier, dans le cas de loi Normale et Log-normale, si l'chantillon comporte
des donnes singulires (outliers), c'est--dire des observations qui semblent ne pas provenir de la
distribution considre. Pour vrifier une telle ventualit, on utilise le test de Grubbs-Beck pour la
dtection de donnes singulires adapt pour les distributions normale et log-normale (Bobe et El
Adlouni, 2015).
Note : La majorit des tests de discordance sont bass sur lhypothse de normalit ou dans le cas
dune loi Log-normal en considrant une transformation logarithmique. En effet, si Y LN alors
X ln Y suit une loi normale.

Il existe deux tests, un pour la plus petite valeur et un autre pour la plus grande valeur de
lchantillon. On vrifie donc si la plus petite ou la plus grande observation est discordante par
rapport au modle envisag (loi Normale ou Log-normale).
Dans l'onglet Discordance, on retrouve les informations suivantes (Figure 52):
- Le choix du type de test : la plus petite ou la plus grande observation.
57

- Le projet c..d. le nom du fichier qui contient l'chantillon et son chemin d'accs
- Le titre du projet
- L'hypothse nulle ( H 0 ) et l'hypothse alternative ( H1 )
- Les rsultats du test : on retrouve dans ce cadre la valeur de la statistique du test et la pvalue de la statistique.
- Enfin, la conclusion du test c..d. l'acceptation ou le rejet de l'hypothse nulle un niveau
de signification de 5% ou de 1%

Figure 52 : Test de discordance de la plus grande observation dans le cas dun ajustement par la
distribution Log-normale (srie 2)
Cas de la srie 2 (Gnre partir dune loi Log-normale)
Lorsquon ajuste une loi Log-normale la srie 2, on remarque que la plus grande observation est
sur la ligne correspondant la borne suprieure de lintervalle de confiance des quantiles (Figure
53). On peut examiner si cette observation appartient la population.

58

Figure 53 : Ajustement dune loi Log-normale la srie 2 pour la mise en vidence des
valeurs discordantes sous lhypothse de Log-normalit.

Lapplication du test de discordance la srie 2 montre que lorsquon considre toute la srie, le
test ne permet pas de conclure sur la Log-normalit de toute la srie et donc sur lappartenance de la
plus grande observation 523 la population Log-normale (Figure 52). En effet, dans ce cas (Bobe
et El Adlouni, 2015) on sait seulement (Figure 52) que la p-value de T = 2.95 est telle que p est plus
petit que 0.129; mais elle peut alors tre suprieure ou infrieure la valeur critique de 5%.
Lorsquon ajoute une nouvelle valeur de lordre de 10% de plus que la plus grande valeur (523),
soit 575, lutilisation de la commande Discordance montre que cette nouvelle valeur est
discordante avec lhypothse de Log-normalit de la distribution. En effet, dans ce cas (Figure 54),
la p-value correspondant T = 3.64 est telle que p < 0.008 qui est infrieure lerreur de premire
espce de 0.05; et mme 0.01. Ce qui traduit une forte discordance.

59

Figure 54 : Test de discordance pour un ajustement par la distribution Log-normale avec une nouvelle
grande observation simule (srie 2)
La Figure 54 prsente le rsultat de ce test pour la nouvelle plus grande observation. La conclusion du test
est le rejet de lHypothse H0 : Toutes les observations proviennent de la mme population . En
conclusion, le test montre clairement (avec une p-value infrieure 0.008) que la valeur 575 ne fait pas
partie de la population sous lhypothse de Log-normalit.
Note : Lorsquune valeur singulire est dtecte, on doit vrifier sil sagit :
a. Une valeur aberrante (exemple : erreur de mesure ou de saisie) que lon peut liminer
ou,
b. Une valeur extrme relle et donc trs importante conserver. Cette validation doit tre
effectue partir du contexte hydro-mtorologique.

60

Rfrences
*Bobe B. et S. El Adlouni (2015). lments dAnalyse Frquentielle. Institut National de la Recherche
Scientifique (INRS-ETE). En cours de rvision.
Bobe, B., et F. Ashkar (1991). The Gamma Family and Derived Distributions Applied in Hydrology,
Water Resources Publications, Littleton, Colorado, 203 pages.
*Compaore C., S. El Adlouni et B. Bobe (2013). Analyse frquentielle en hydrologie : Logiciel
HYFRAN-PLUS. Stage-Coop de lUniversit de Moncton.
Ehsanzadeh E., S. El Adlouni et B. Bobe (2010). Frequency analysis incorporating a Decision Support
System (DSS) for hydro-climatic variables. Journal of Hydrologic Engineering, Vol 15:11, pp.
861-881.
*El Adlouni, S. et B. Bobe (2011). Decision Support System for Flood Risk Assessment. Volume 1-2,
p. 11-26.
*El Adlouni, S., B. Bobe et T.B.M.J. Ouarda (2008). On the tails of extreme event distributions.
Journal of Hydrology, 355, 16-33.
*El Adlouni S., B. Bobe et O. Samoud (2012). Guide pour les mthodes du systme daide la
dcision (SAD) DE HYFRAN-PLUS. Water Resources Publication
(http://www.wrpllc.com/books/HyfranPlus).
*Martel, B., S. El Adlouni et B. Bobe (2012). Comparison of the power of Log-Normality tests with
different right tail alternative distributions. Journal of Hydrologic Engineering, (ASCE). 18(1),
19. doi: 10.1061/(ASCE)HE.1943-5584.0000595.
Morlat (1956). Les lois de probabilit de Halphen, Revue de statistiques applique, 4(3) : pp 21-46.
Perreault L., B. Bobe et PF Rasmussen (1999). Halphen distribution system. I: Mathematical and
statistical properties. Journal of Hydrologic Engineering 4 (3), 189-199.

61

Annexe 1 : Sries dobservations


Nous prsenterons ci-dessous les donnes des sries 1, 2, 3 et 4 utilises pour le tutoriel de
HYFRAN-PLUS.
Il faut noter que la srie 1 correspond la srie par dfaut du projet Harricana contenue dans le
logiciel HYFRAN-PLUS pour exemple dapplication.
Les sries 2 et 4 sont des donnes simules partir du logiciel Matlab.

Observation
122
244
214
173
229
156
212
263
146
183
161
205
135
331
225
174
98
149
238
262
132
235
216
240
230
192
195
172
173
172
153
142

Srie 1
Probabilit empirique
Observation
0.0698
167
0.9052
179
0.7431
185
0.3815
117
0.7930
192
0.1945
337
0.7307
125
0.9551
166
0.1322
99.1
0.5062
202
0.2195
230
0.7057
158
0.1072
262
0.9800
154
0.7805
164
0.4190
182
0.0075
164
0.1446
183
0.8678
171
0.9302
250
0.0948
184
0.8429
205
0.7556
237
0.8928
177
0.8055
239
0.6060
187
0.6434
180
0.3566
173
0.3940
174
0.3691
167
0.1571
185
0.1197
232

Probabilit empirique
0.3192
0.4564
0.5686
0.0449
0.6185
0.9925
0.0823
0.3067
0.0200
0.6683
0.8180
0.2070
0.9426
0.1696
0.2818
0.4813
0.2943
0.5312
0.3441
0.9177
0.5436
0.7182
0.8554
0.4439
0.8803
0.5935
0.4688
0.4065
0.4314
0.3317
0.5810
0.8304
62

317
161
201
204
194
164
183
161

0.9676
100
0.0324
0.2319
163
0.2569
0.6559
203
0.6808
0.6933
219
0.7681
0.6309
182
0.4938
0.2693
184
0.5561
0.5187
118
0.0574
0.2444
155
0.1820
Tableau A.1 : Donnes observes de la srie 1

63

Observation
426
346
395
384
419
420
420
389
380
380
439
335
395
414
378
423
401
367
410
393
387
376
406
335
388
382
368
431
375
426
445
397
415
430
400
426
356

Srie 2
probabilit empirique
Observation
0.8044
350
0.0958
375
0.5449
452
0.3952
428
0.7046
355
0.7545
324
0.7246
381
0.4750
412
0.3353
443
0.3553
407
0.8842
361
0.0459
416
0.5349
359
0.6747
366
0.3154
378
0.7745
357
0.5948
393
0.2455
369
0.6447
392
0.5250
385
0.4351
387
0.2954
384
0.6248
456
0.0559
429
0.4551
406
0.3752
348
0.2555
343
0.8643
331
0.2754
523
0.7844
445
0.9142
414
0.5649
366
0.6846
360
0.8543
426
0.5848
472
0.7944
341
0.1357
386

probabilit empirique
0.1158
0.2854
0.9341
0.8244
0.1257
0.0160
0.3653
0.6547
0.8942
0.6347
0.1956
0.6946
0.1557
0.2355
0.3054
0.1457
0.5150
0.2655
0.5050
0.4052
0.4451
0.3852
0.9441
0.8343
0.6148
0.1058
0.0858
0.0359
0.9940
0.9042
0.6647
0.2255
0.1756
0.8144
0.9741
0.0758
0.4152
64

451
0.9242
400
0.5749
365
0.2156
331
0.0259
336
0.0659
439
0.8743
463
0.9641
387
0.4251
401
0.6048
488
0.9840
422
0.7645
388
0.4651
389
0.4850
420
0.7445
364
0.2056
360
0.1856
297
0.0060
379
0.3253
430
0.8443
359
0.1657
392
0.4950
420
0.7146
396
0.5549
460
0.9541
420
0.7345
380
0.3453
Tableau A.2 : Donnes de la srie 2, simules partir dune loi Log-normale

65

Observation
6.05
5.85
5.98
5.95
6.04
6.04
6.04
5.96
5.94
5.94
6.08
5.81
5.98
6.03
5.93
6.05
5.99
5.91
6.02
5.97
5.96
5.93
6.01
5.81
5.96
5.95
5.91
6.07
5.93
6.05
6.1
5.98
6.03
6.06
5.99
6.05
5.87
6.11

Srie 2-transforme
Probabilit transforme Observation
5.86
0.8044
5.93
0.0958
6.11
0.5449
6.06
0.3952
5.87
0.7046
5.78
0.7545
5.94
0.7246
6.02
0.4750
6.09
0.3353
6.01
0.3553
5.89
0.8842
6.03
0.0459
5.88
0.5349
5.9
0.6747
5.93
0.3154
5.88
0.7745
5.97
0.5948
5.91
0.2455
5.97
0.6447
5.95
0.5250
5.96
0.4351
5.95
0.2954
6.12
0.6248
6.06
0.0559
6.01
0.4551
5.85
0.3752
5.84
0.2555
5.8
0.8643
6.26
0.2754
6.1
0.7844
6.03
0.9142
5.9
0.5649
5.89
0.6846
6.05
0.8543
6.16
0.5848
5.83
0.7944
5.96
0.1357
5.99
0.9242

Probabilit transforme
0.1158
0.2854
0.9341
0.8244
0.1257
0.0160
0.3653
0.6547
0.8942
0.6347
0.1956
0.6946
0.1557
0.2355
0.3054
0.1457
0.5150
0.2655
0.5050
0.4052
0.4451
0.3852
0.9441
0.8343
0.6148
0.1058
0.0858
0.0359
0.9940
0.9042
0.6647
0.2255
0.1756
0.8144
0.9741
0.0758
0.4152
0.5749
66

5.9
5.8
0.2156
0.0259
5.82
6.08
0.0659
0.8743
6.14
5.96
0.9641
0.4251
5.99
6.19
0.6048
0.9840
6.05
5.96
0.7645
0.4651
5.96
6.04
0.4850
0.7445
5.9
5.89
0.2056
0.1856
5.69
5.94
0.0060
0.3253
6.06
5.88
0.8443
0.1657
5.97
6.04
0.4950
0.7146
5.98
6.13
0.5549
0.9541
6.04
5.94
0.7345
0.3453
Tableau A.3 : Donnes de la srie 2 transfome logarithmiquement (srie normale)

67

Observation

Srie 3
Probabilit empirique
Observation

Probabilit empirique

494

0.7146

572

0.8443

330

0.2754

580

0.8643

358

0.3154

467

0.6547

330

0.2655

549

0.8144

479

0.6946

524

0.7844

319

0.2255

360

0.3253

293

0.1357

459

0.6347

476

0.6747

369

0.3653

355

0.3054

308

0.1756

450

0.6148

488

0.7046

363

0.3553

412

0.4651

437

0.5649

381

0.4052

187

0.0060

440

0.5848

464

0.6447

543

0.8044

704

0.9341

454

0.6248

551

0.8244

428

0.5349

530

0.7944

439

0.5749

375

0.3952

410

0.4551

426

0.5250

320

0.2355

434

0.5549

511

0.7445

415

0.4850

616

0.8942

314

0.2056

344

0.2854

363

0.3453

719

0.9441

383

0.4251

383

0.4152

349

0.2954

375

0.3852

519

0.7645

308

0.1856

864

0.9840

318

0.2156

271

0.0958

303

0.1657

419

0.4950

449

0.6048

262

0.0758

651

0.9142

596

0.8743

473

0.6647

616

0.9042

521

0.7745
68

245

0.0359

603

0.8842

723

0.9541

191

0.0160

291

0.1257

384

0.4351

432

0.5449

449

0.5948

561

0.8343

500

0.7246

422

0.5150

273

0.1058

803

0.9741

298

0.1457

921

0.9940

511

0.7545

421

0.5050

390

0.4451

228

0.0259

476

0.6846

362

0.3353

302

0.1557

313

0.1956

247

0.0459

321

0.2455

507

0.7345

288

0.1158

577

0.8543

413

0.4750

658

0.9242

759

0.9641

255

0.0559

325

0.2555

270

0.0858

371
0.3752
259
0.0659
Tableau A.4 : Donnes de la srie 3, simules partir dune loi Gamma

69

Appendice A : Intervalles de confiance asymptotiques des quantiles

En AFH lajustement dune distribution statistique quelconque D , par la mthode M , un


chantillon dobservations de dbit maximum annuel de crue, a pour but de dterminer
lestimateur du quantile =
X T F 1 1 1/ T ; , o (estimation du vecteur des paramtres ) et

X T , sont des variables alatoires.

En gnral la distribution exacte du quantile X T est inconnue sauf pour certaines distributions :
exponentielle, normale ou log-normale. Mais lorsque N grand on admet que X T est distribue
asymptotiquement selon une loi normale :
- de moyenne X T (vraie valeur inconnue)
-

de variance var X T

X T

N X T ; var X T

X X T
u =T
var X T

N ( 0, 1)

Pour une loi donne var X T dpend de la mthode M destimation utilise (cf. Appendice D, Bobe
et Ashkar, (1991)) o lon retrouve des dtails de calculs pour les mthodes MM et MV. On peut
dduire lintervalle de confiance au niveau (1 ) de la vraie valeur X T partir de lquation de
X T .

Pour un ensemble distribution mthode ( D M ) on peut en dduire lintervalle de confiance


(IC) (1 ) de la vraie valeur inconnue X T au niveau de confiance (1 ) . On a (cf. Appendice E,
Bobe et Ashkar, (1991)):

X X T
u /2 =
1
P u /2 T

var
X
T

Ou encore :
P X T u /2 var X T X T X T + u /2

var X T =
1

u /2 correspond au quantile de la loi normale centr-rduite de probabilit au dpassement / 2 .

70

Appendice B : Classification des distributions

Gumbel
Halphen A, B
Gamma
Pearson type 3
Queue lgre

Class D

Normal

Frchet
Halphen IB
Inverse Gamma
Log-Pearson type3
Class C
Lognormal

Queue lourde

Class E
Exponential

Stable
Distributions

Pareto

Figure B-1: Distributions ordonnes par rapport la queue droite


(Tire de El Adlouni, Bobe et Ouarda, 2008).

71

Vous aimerez peut-être aussi