Vous êtes sur la page 1sur 44

Analyse frquentielle

I. Rappels de statistique

II. Ajustement dune srie statistique une loi de distribution

III. Loi de Gauss

. Loi de Gumbel
I

. Synthse

Par :
Harouna Karambiri et Dial NIANG
Institut International d'Ingnierie de l'Eau et de l'Environnement (2iE) (Groupe EIER-ETSHER)
UTER Gestion et Valorisation de l'Eau et l'Assainissement
E-mail: harouna.karambiri@2ie-edu.org ; dial.niang@2ie-edu.org 1
. Rappels de statistique

L'analyse frquentielle est une mthode statistique de


prdiction consistant tudier les vnements passs,
caractristiques d'un processus donn (hydrologique ou
autre), afin d'en dfinir les probabilits d'apparition future.

Cette prdiction repose sur la dfinition et la mise en


uvre d'un modle frquentiel, qui est une quation
dcrivant le comportement statistique d'un processus.
Ces modles dcrivent la probabilit d'apparition d'un
vnement de valeur donne.

2
2
. Rappels de statistique
Quelques dfinitions

Un ensemble dobjets ou de personnes dune tude


statistique est appel population.

La variable est dite discrte si elle ne prend que des


valeurs isoles (ex : entires). Elle est continue si elle
peut prendre toutes la valeurs dun intervalle (ex : R).

Une variable est dite alatoire si elle est le rsultat dune


preuve qui dpend du hasard.

3
. Rappels de statistique
Concepts de probabilit et de frquence
En statistique, lensemble des observations des dbits dun
cours deau durant une anne constitue une preuve; de
chaque preuve on tire divers rsultats dont le module
annuel. Lensemble de toutes les ralisations des rsultats m
(module) de toutes les preuves possibles forme une
population M: suite indfinie hypothtique dont nest jamais
connue quune infinie partie lchantillon E observ des
modules sur une priode dtermine de N annes.
La ralisation r dans la population M se produit n fois en N
annes; on appelle:

4
. Rappels de statistique
-frquence exprimentale de r dans lchantillon E:

n
f =
N
- probabilit de r dans la population M:

prob(r / M ) = lim quand N


n
N
La ralisation est reprsente par une valeur numrique variable alatoire X,
dont la fonction de rpartition est:

F(x) = Prob { X x }
la drive de F(X) est la densit de probabilit f(x) de la variable alatoire, et lon
peut crire:
+
Pr ob{b x a} = F (a ) F (b) = f ( x)dx 5

. Rappels de statistique

Exercice: On dispose dune srie de donnes pluviomtriques de la


station de Payerne de 1901 1979. Les valeurs obtenues sont
comprises entre 500 et 1600 mm. Calculer les frquences.

Corrig :
n
Classe ni fi f =
500- 600 1 0.013 N
600-700 1 0.013
700-800 5 0.063
800-900 8 0.101 N= 79, ni= effectif par classe,
900-1000 16 0.202 fi = frquence relative
1000-1100 13 0.165
1100-1200 16 0.202
1200-1300 11 0.139
1300-1400 6 0.076
1400-1500 1 0.013
6
1500-1600 1 0.013
.
Rappels de statistique

Pour la pratique des calculs de


e la frquence exprimentale, on
parle tantt de frquence au non dpassement F(x)
F(x)::

F ( x ) = prob X x

tantt de frquence au dpassement note P(x)


On a:
P(x) + F(x) = 1
NB: Si on classe un chantillon par ordre dcroissant, on
obtient la frquence au dpassement.
Si on classe un chantillon par ordre croissant, on obtient
la frquence au non dpassement.
7
. Rappels de statistique

Calcul de la frquence exprimentale

r 0. 5
Formule de Hazen
Hazen:: F ( x) =
n
n: taille de lchantillon; r : rang

r
Formule de Weibull
Weibull:: F ( x) =
n +1

8
. Rappels de statistique
Exemple: calculer la frquence exprimentale au non
dpassement des pluies mensuelles de la station de
Payerne avec la formule de Hazen
Anne Pluie (mm) Rang Frquence
exprimentale
1970 43 1 0.045
1971 46 2 0.136
1972 49 3 0.227
1973 50 4 0.318
1974 50 5 0.409
1975 53 6 0.500
1976 53 7 0.591
1977 53 8 0.682
1978 54 9 0.773
1979 55 10 0.864
1980 60 11 0.955 9
. Rappels de statistique

Temps de retour
retour::
Il est dfini comme tant linverse de la probabilit de
dpassement

1 1
T= =
P 1 F

Notion pratique mais ambigu : La dure de retour caractrise la raret


de lvnement considr, quil sagisse du dpassement dune valeur
forte ou du non-dpassement dune valeur faible. Aussi, il vaudrait la
dfinir comme linverse de la probabilit doccurrence de
lvnement considr.

10
. Rappels de statistique

Exemple :
 Pluie dcennale humide : la hauteur de pluie qui, chaque
anne, a seulement 10% de chance dtre dpasse, soit une
probabilit ou frquence annuelle de dpassement P = 0,1

 Pluie dcennale sche : la hauteur de pluie qui, chaque


anne, a seulement 10% de chance de ne pas tre atteinte,
soit une probabilit ou frquence annuelle de dpassement
P = 0,9.

11
11
. Rappels de statistique

Notion de risque
risque::

n
1
risque = 1 1
T
T=priode de retour
retour;; n=dure

risque = 1 probabilit (narrive jamais rien)


Exemple 1: Quel est le risque pour que quelque chose de
grave se passe en 50 ans pour un dbit de projet Q100.

12
. Rappels de statistique

Solution 1:
T = 100 ans
1
probabilit atteinte ou dpasse = = 0.01
100

probabilit non atteinte = 1 0.01 = 0.99

n 50

1 1
risque = 1 1 = 1 1 = 1 (0.99 ) = 0.39
50

T 100
On a donc 39%
39% de risque pour que le dbit de projet Q100 soit
dpass durant 50 ans
ans..
13
99))100 = 63
Si dure n = 100 ans, risque = 1- (0.99 63%
%
. Rappels de statistique

Exemple 2: Calculer la priode de retour pour quun vnement


arrive avec un risque de 10% pour une dure n = 20 ans

Solution 2:

1 1
risque = 1 1 1 = 1 risque n

T T
1 1
= 1 1 risque T =
n

T 1 1 risquen

1
T= = 190 ans
1 1 0.1
20
14
. Rappels de statistique
Caractristiques de lchantillon
Description de lchantillon : Lorsque lon dispose dune srie importante
( > 30 valeurs) il peut tre intressant de prsenter cet chantillon de
manire synthtique : numriquement ou graphiquement
Synthse numrique :
1
- moyenne arithmtique : x = xi
n
- paramtres de dispersion :
valeurs extrmes : Max( x ), Min( x )
i i
1
variance : s = ( x x )
n i
cart-type : S
1
s = ( x x )
variance non-biaise : n 1 i
s
coefficient de variation : CV = 15

x 15
. Rappels de statistique

- paramtres de distribution : mdiane et quantiles

1er dcile : valeur non dpasse dans 10% des cas (F=0.1)

mdiane : valeur non dpasse dans 50 % des cas (F = 0.5)

mode : valeur de probabilit maximale (peut tre diffrente de la valeur


moyenne si fonction asymtrique) (F=max)

dernier dcile : valeur non atteinte dans 90% des cas (F=0.9)

16
16
Synthse graphique :
- histogramme des frquences empiriques :
on fixe des classes [xi ; xi-1] et on compte combien de valeurs de
lchantillon se trouvent dans chaque classe (effectifs).

Trs simple mais le nombre de classes et le choix des classes


restent lapprciation de lintervenant !
Peut tre envisag pour comparer des chantillons de variables
proches (en valeur moyenne).

17
17
Synthse graphique :
- histogramme des
frquences empiriques :

18
18
.
Ajustement dune srie statistique une loi de distribution

Choix du type de loi :

-Pluies annuelles ou dbits moyens annuels: loi normale ou


loi lognormale

- Pluies journalires maximales, crues et tiages: loi de


Gumbel, loi de Frchet ou loi de Pearson

19
.
Loi de Gauss
La variable alatoire X suit une loi normale si sa fonction de rpartition
ou probabilit de non dpassement est de la forme:

1

F ( x) = Pr ob{X x} =
1 u

2u 2
e du
2

xx
avec u= variable rduite
s
Cette loi prsente 2 paramtres qui sont:
- la moyenne x et lcart type s

Thorme central limite: La somme de N variables alatoires


indpendantes, identiquement distribues et de variance finie, tend
vers une loi normale lorsque N tend vers l'infini. 20
.
Loi de Gauss
xx
variable centre rduite : u=
s
la transformation en variable rduite (u) ramne ltude de la loi
Normale N(0,1)  Il existe des tables.
loi symtrique par rapport : donc mdiane = moyenne
loi unimodale
loi non borne droite comme gauche

21
21
.
Loi de Gauss
La reprsentation graphique de la loi normale se fait sur un papier probabilit
normale appele aussi papier gaussien.

22
.
Loi de Gauss

Estimation des quantiles


quantiles:: pour la loi normale les quantiles
sont calcules avec la formule suivante:

xp = x + up s

avec xp le quantile la probabilit p, up variable rduite la


probabilit p. Cette droite est aussi appele droite de Henry.

Quelques Valeurs de u (variable rduite de Gauss) pour


quelques probabilits au non dpassement:
dpassement

F 0,01 0,025 0,05 0,10 0,15 0,20 0,50 0,80 0,85 0,90 0,95 0,975 0,99

u -2,33 -1,96 -1,64 -1,28 -1,04 -0,84 0,0 0,80 1,04 1,28 1,64 1,96 2,33

23
.
Loi de Gauss

Exercice dapplication
dapplication:: Calculer le module dcennal humide
(F(x)= 0,90),
90), le module centenaire humide (F(x)= 0,99), 99), le module
dcennal sec (F(x)= 0,10)
10) et le module centenaire sec (F(x)= 0,01)
01) pour
une srie de donnes dont

x= 292 mm et s = 90
Solution::
Solution
Les quantiles sont estims partir de la formule: xp = x + up s

F(x) 0,01 0,10 0,90 0,99


u -2,33 -1,28 1,28 2,33

Xp 83 177 407 501


(mm)
24
.
Loi de Gauss

Calcul des intervalles de confiance


confiance::
L intervalle de confiance permet dexpliquer limportance des
erreurs dchantillonnage
dchantillonnage.. Son calcul et son choix dcoulent de
ltude des distributions dchantillonnage cest-
cest--dire des lois
auxquelles sont soumises les caractristiques empiriques
dduites des chantillons
1 Moyenne et cart type
type::
. si N > 30 pour la moyenne et N > 50 pour lcart type
s
IC % pour x = x u
1
2 N
s
IC % pour s = s u
1
2 2N
Exemple:: si = 95%
Exemple 95% on aura
u 1
= 1,96 = u0,025
2
25
.
Loi de Gauss

Calcul des intervalles de confiance


confiance::
. si N < 30 pour la moyenne
t s
IC % pour x=x 1 t est la variable de Student
2 N
. si N < 50 pour lcart type
2 2
Ns Ns
IC % pour <s < 2
la variance suit la loi de 2
2
1
2
2


avec Pr ob[ ]= Pr ob[ ]= 1
2 2
1
2
2
2

2
r = N-1 : r est le nombre de degr de libert

2Quantiles
Quantiles::
s
IC % pour x = x u
p p 1 u 2 + 2 valable si N 30
p
2 2N
26
V. Loi de Gumbel

 Fonction de rpartition : F ( x ) = e e a ( x x0 )

 2 paramtres de la loi (xo,a) : x0 = paramtre de position et


a = paramtre dchelle
 Variable rduite : u = a ( x x0 )
 Loi non symtrique et unimodale : moyenne et mode diffrents
Loi non borne.
La loi de Gumbel nutilise que les frquences au non
dpassement

27
27
V. Loi de Gumbel
u
avec u = a ( x x0 ) x = + x0
a

En introduisant la valeur de u dans la fonction de rpartition on


obtient:

e u
F ( x) = e

et u = ln[ ln(F (x ))]


Quelques Valeurs de la variable rduite de Gumbel

F 0 ,10 0,20 0,50 0,80 0,90 0,95 0,98 0,99 0,999


u -0,834 -0,476 0,367 1,500 2,250 2,970 3,902 4,600 6,907

28
V. Loi de Gumbel
Ajustement mathmatique
Mthode des moments

1
= 0 , 780
a
0 , 577
x0 = x
a

Calcul des quantiles

up
xp = + x0
a 29
V. Loi de Gumbel
Calcul des intervalles de confiance des quantiles


Intervalle de confiance x p = x p u1 1 + 1.4 K + 1.1K 2

2 n 1
K = 0.780(u p 0.577 )

u1
= variable rduite de Gauss
2
u p = ln[ ln (F ( x ))] = variable rduite de Gumbel

Exercice: Ajuster la loi de Gumbel aux pluies mensuelles de la station


de Payerne.
Estimer les quantiles pour F(x)=0.90; 0.95et calculer leur intervalle
de confiance
30
V. Loi de Gumbel

Anne Pluie (mm) Rang Frquence Variable de


exprimentale Gumbel
1970 43 1 0.045 -1.1285
1971 46 2 0.136 -0.6894
1972 49 3 0.227 -0.3931
1973 50 4 0.318 -0.1355
1974 50 5 0.409 0.1123
1975 53 6 0.500 0.3665
1976 53 7 0.591 0.6423
1977 53 8 0.682 0.9597
1978 54 9 0.773 1.3555
1979 55 10 0.864 1.9200
1980 60 11 0.955 3.0679

Moyenne x = 51 mm
Ecart type = 4.59 mm
31
V. Loi de Gumbel
Calcul des paramtres de la loi

1
= 0.780 4.59 = 3.58 a = 0.2793
a
x0 = 51 0.577 3.58 = 48.93
Estimation des quantiles

up
xp = + x0
a
avec u p = ln[ ln(F ( x ))]
Calcul des intervalles de confiance des quantiles


Intervalle de confiance x p = x p u1 1 + 1.4 K + 1.1K 2
2 n 1
K = 0.780(u p 0.577 )

32
V. Loi de Gumbel

F(x) up x K Borne Borne


U1
2
infrieure suprieure

0.90 2.2504 57.0 1.64 1.3052 51.8 62.1


0.95 2.9702 59.6 1.96 1.8667 54.8 64.3
0.99 4.6001 65.4 2.57 3.1381 57.4 73.4

33
Test de 2:
On juge gnralement ladquation dune loi un chantillon par le
test du 2, variable alatoire dont la distribution a t tudie par
Pearson.
En pratique, on procde comme suit:

1) dcoupage en k classes. Ce dcoupage doit introduire des


classes dgale probabilit thorique et dun effectif dau moins 5
valeurs par classe.

=
2
k (n n )
i pi
2

2) calcul de
1 n pi
avec ni effectif observ de la classe i;
N effectif total
npi effectif thorique de cette mme classe n pi = =
nc nombre de classes
34
Test de 2:
3) Calcul du nombre de degrs de libert

= k p 1
avec k le nombre de classes et p le nombre de paramtres de
la loi.

Ladquation est admise si P(2)


est le seuil du risque dadquation. est choisi
gnralement gal 0.05 05.. ladquation est rejete si
P(2)0.05.

Exercice Tester lajustement de la loi de Gauss sur les


Exercice:
prcipitations annuelles de la station A (1906-1975).
35
Test de 2:
Numro Module Numro Module
(mm) (mm)
1 149.5 32 288.5
2 150.7 33 291.0
3 151.0 34 294.1
4 161.8 35 294.3
5 172.1 36 308.0
6 185.0 37 308.6
7 185.5 38 310.1
8 192.8 39 319.1
9 197.8 40 321.5
10 205.0 41 326.9
11 205.8 42 329.6
12 206.0 43 333.5
13 208.5 44 342.0
14 210.0 45 357.2
15 214.6 46 360.2
16 222.1 47 364.5
17 222.6 48 366.5
18 225.6 49 367.4
19 235.7 50 380.9
20 235.7 51 382.0
21 242.8 52 394.4
22 246.4 53 399.5
23 252.6 54 402.1
24 255.0 55 408.8
25 257.0 56 413.4
26 258.5 57 421.2
27 260.3 58 421.8
28 273.0 59 428.7
29 275.9 60 500.8
30 278.6 61 556.4
31 281.8
36
Test de 2:
Solution

=
2
k (n n )
i pi
2 ni effectif observ de la classe i;
npi effectif thorique de cette mme classe
N effectif total
1 n pi n pi = =
nc nombre de classes
Classe Limites des classes ni npi ni-npi (ni-npi)2 (n n )
i pi
2

n pi
1 188.5 7 7.6250 -0.6250 0.3906 0.0512
2 188.5 231.3 11 7.6250 3.3750 11.3906 1.4938
3 231.1 263.3 9 7.6250 1.3750 1.8906 0.2479
4 263.3 292.0 6 7.6250 -1.6250 2.6406 0.3463
5 292.0 320.7 6 7.6250 -1.6250 2.6406 0.3463
6 320.7 352.7 5 7.6250 -2.6250 6.8906 0.9037
7 352.7 395.6 8 7.6250 0.3750 0.1406 0.0184
8 395.6 9 7.6250 1.3750 1.8906 0.2479

3.66
cal
2
= 3 . 66 = k p 1 = 8 2 1 = 5
02. 05 = 11 . 07
2
Comme cal < 2
0 . 05 on accepte lhypothse
37
V. Synthse

lajustement dune srie statistique une loi de distribution


comporte 2 tapes:

- contrle et analyse des donnes

- analyse des frquences

38
V. Synthse
Contrle et analyse des donnes
Pour laborer un modle statistique partir des donnes
d'un chantillon, il faut que celles-ci soient dabord
homognes, stationnaires et indpendantes.

Homognit : les donnes proviennent toutes de la mme


population.
Exemple de non homognit:
Crues printanires et crues pluviales dans un mme
chantillon.

Stationnarit : Proprits statistiques invariantes dans le


temps, lexception des fluctuations alatoires du climat.
Exemple:
Dtournement de cours deau, urbanisation, changement
39
climatique et relocalisation de pluviomtre
V. Synthse

Indpendance : Les donnes doivent tre indpendantes: une


valeur de l'chantillon n'est pas influence par la valeur
prcdente, donc l'ordre o elle survient n'a pas d'importance.

Exemple de donnes dpendantes:


dbits journaliers en rivire

40
V. Synthse
Ajustement dune loi statistique en hydrologie
Choix de la variable tudier : pluie annuelle, pluie mensuelle, pluie
journalire maximale annuelle, dbit maximum annuel, dbit moyen annuel.
 Vrifier que lon a une VA, sans tendance ni cycle :
--> mthode de la moyenne mobile
 Vrifier lhomognit de la srie :
--> mthodes des doubles cumuls, cumuls des rsidus...
 Description de lchantillon.

 Classement de lchantillon des ralisations par valeurs croissantes


 Choix dune loi de probabilit adapte la variable et ltude
 Ajustement de la loi (mthode graphique et/ou numrique)
 Validation de laptitude de la loi dcrire lchantillon
 Dfinition de la valeur recherche Qo avec un intervalle de confiance
associ cette valeur.
41
41
V. Synthse
AJUSTEMENT D'UN ECHANTILLON DE PLUIES ANNUELLE A LA LOI NORMALE

tapes suivre dans la pratique :


1. Vrifier l'homognit de la srie et apporter les corrections ncessaires (voir TD
n1)
2. Description de l'chantillon (moyenne, cart-type, variance, maxi, mini, CV, etc..)
3. Classement de l'chantillon par valeurs croissantes
4. Tracer l'histogramme des frquences empiriques en prenant comme taille des
classes, environ 10% de l'cart maximal (Maxi - Mini) et estimer le mode de
l'chantillon.
5. Choix d'une loi de probabilit empirique F(xi) (frquence exprimentale)

i 0.5
F *( x ) = (HAZEN, pour ajustement une loi de GAUSS)
i n

i
F *( x ) = (WEIBULL, pour ajustement une loi de GUMBELL)
i n+1

42
V. Synthse
6. Tracer la courbe exprimentale F(xi) et dterminer la mdiane.
7. Comparer les valeurs centrales (moyenne, mode, mdiane). Si elles sont trs peu
diffrentes, on pourra supposer que la distribution est normale ou gaussienne.
8. Reporter les points (xi, F(xi)) sur un papier GAUSS. Si les frquences
exprimentales de non-dpassement suivent rigoureusement une loi normale, tous
les points seront aligns (droite).
9. Ajustement graphique d'une droite sur l'ensemble des points. Veuillez avoir une
bonne rpartition des points de part et d'autre de la droite. On peut ainsi dterminer
n'importe quel quantile par lecture directe sur la droite.
10. Ajustement par le calcul d'une droite sur les points. Pour cela, il faut utiliser la
moyenne et l'cart-type, puis calculer les coordonnes de deux points assez
loigns (gnralement F = 0.05 et F = 0.95).
11. Choisir une loi parmi les 2 lois ajustes en allant dans le sens de la scurit.
12. Dterminer l'intervalle de confiance et valider la loi utilise :
On dmontre que, sur l'infinit des chantillons d'observations possibles, la valeur xi
est distribue selon une loi normale de paramtres :

43
V. Synthse
Tracer l'intervalle de confiance % partir de quelques points xi en reliant
respectivement les bornes infrieures Ai entre elles et les bornes suprieures Bi
entre elles.
La loi sera accepte si au moins % des valeurs de l'chantillon se
trouve l'intrieur de l'intervalle de confiance trac.
Ce test graphique sera toujours prfr aux tests numriques qui sont
peu puissants (exemple test de )

13. On peut estimer n'importe quel quantile et lui associ un intervalle de confiance
tel que :

44

Vous aimerez peut-être aussi