Vous êtes sur la page 1sur 9

Chapitre 1 

: Notions de probabilité et analyse statistique appliquée à


l'hydrologie
1. Rappels :
On appelle variable aléatoire (V A), le caractère numérique (ou non) qui distingue chaque évènement
de l’échantillon.
 Type de variable :
Variable quantitative : continues discontinues ;
Variables quantitatives discrètes ;
Variable qualitatives.
1.1. Loi de probabilité :
Si la VA est une variable numérique, on peut considérer comme événement (e) favorable, le fait (X)
soit inférieur ou égal à une valeur (x) de l’ensemble E. la probabilité de voir arriver cet évènement est
une fonction numérique (x) comprise entre 0 et 1 et que l’on appelle fonction de répartition F(x).
F(x) = Prob(X ≤ x) = Prob (e/E).
1.2. Paramètre d’une variable aléatoire 
x−x́
Variable réduite : U = avec σ , x́  sont respectivement l’écart type et la moyenne de la série
σ
hydrologique.
σ = √ ∑ ¿ ¿ ¿ ¿ avec n : la taille de la série.
- La médiane : est le quantile à 50 %
- Mesure de la dissymétrie dite aussi coefficient d‘asymétrie
m3
Pearson propose d’utiliser le coefficient β 1 =
σ3
n
Avec m 3 moment centré réduite d’ordre 3 il est égal à : m 3 = ∑ ( x−x́)3
(n−1)(n−2)
Trois cas pour β 1 :
1) Si β 1 est purement positive la distribution est étalée sur la droite , on observe la succession
mode, moyenne et la médiane est la dissymétrie est dite positive.
2) Si β 1 est purement négative la distribution est étalée sur la gauche, on observe la succession
moyenne, médiane et mode est dissymétrie est dite négative.
3) Si β 1 est nul, dans ce cas la dissymétrie n’est pas forcément symétrique.
- Mesure de l’aplatissement :
Pearson propose d’utiliser le coefficient β 2
m4
β2= -3
σ4

1
1
Avec m 4 moment centré réduite d’ordre 4 il est égal à : m 4 = ∑ (x−x́)4
n
Trois cas pour β 2 :
1) Si β 2 positif, la distribution moyen aplatie que la distribution normale, alors que la
distribution est leptokurtique.
2) Si β 2 négatif, la distribution est plus aplatie que la distribution normale, alors que la
distribution est paltykurtique.
3) Si β 2 est nul l’aplatissement est le même que pour la loi normale, alors la distribution est
mésorkurtique.
Représentation graphique d’un échantillon
Il existe une infinité de façon de représenter graphiquement un jeu de donnée : diagramme de bâton,
courbe, nuage de point….
Deux représentations fondamentales pour les données quantitatives : histogrammes et la courbe de
fréquence cumulées
1.3. Comblement des lacunes par la méthode de régression linéaire
Pour combler les lacunes dans la série ayant des observations discontinues, nous avons procédé à la
méthode de régression linéaire.
Ce comblement de série discontinue non homogène est assuré par autre série homogène discontinue.
Pour que la méthode est efficace, il faut la régression soit linéaire et que les variables confrontées
suivant une loi normale. On estime la variable (Y) à partir la variable (X) par :
Y = a.X + b
Reconstituer n – k
Avec n tailles de la série (x) et k taille de la série y
X y
r k : coefficient de régression du couple (x k, y k)
- -
S k( y) ( x − x́)( y− ý)
a = r k. ,b=∑ - - k
sk (x) (x−x́ )2
N - -
2
Avec : Sk ( y) = σ y
- ?
Yk
- ? n-k
Y = a.X + b
- ?

Xk
xxxddd

2
Remarque :
À la fin de de calcul le coefficient de corrélation (r), on peut examiner ce dernier par test de Student (t)

N −1
sachant que : t = r
√ 1−r 2
avec n : taille de la série hydrologique étudiée.

T suit une distribution de Student avec γ = N-1 degré de liberté.


2. Type de la fonction de distribution
x
On dit qu’une fonction f est une densité de probabilité d’une variable aléatoire si P (X≤x) ∫ f ( u ) .du
−∾

Une densité de probabilité est une fonction qui permet de représenter une loi de probabilité sous forme
intégrale.
Une loi de probabilité possède une densité ʄ, il existe une loi de probabilité ayant ʄ pour densité de
probabilité.
n
fe (x) =
N
2.1. Fonction de distribution de la loi normale ou loi LAPALCE GAUSS.
L’expression de la fonction de densité de la loi normale est :
2
−(x− x́)
f(x) = 1 2σ
2
(*)
.e
σ . √2 π
Avec x́ la moyenne de la série.
(x− x́ )2
On peut remplacer par z2 avec z : variable réduit normale. L’équation (*) devienne comme
σ2
suite :
2
−z
2
z z
1 1
f(z) = .e 2
et F(z) = ∫ e 2 .dz
σ . √2 π σ . √2 π −∾
Les valeurs de F(z) sont fournies par la table de l’intégrale de Gauss.
2.2. Fonction de distribution de la loi log normale (dite loi de GALTON)
La fonction de répartition de la loi log- normale s’écrite :
2
z z
1
F(x) = ∫ e 2 .dz
σ . √2 π −∾
Avec z = a. log (x- x0) + b
Ou (z) suit une loi normale alors que la distribution de (x) est dite log- normale.
a, b et x0 sont des paramètres. x0 paramètre de position.
2.3. Fonction de distribution cas des valeurs extrêmes
La valeur minimale et maximale représente respectivement la valeur la plus faible et la valeur la plus
forte (haute) prise par la variable aléatoire.

3
Tout phénomène comporte des évènements rares qui sont aux extrêmes de sa fonction de densité de
probabilité. Ces extrêmes peuvent être des maximums et des minimums (Q étiages).
a) Fonction de répartition type I  (loi de Gumbel)
La fonction de répartition de la loi de Gumbel est :
−α ( x−x 0 )
F(x) = e−e
F(x) : fréquence au non dépassement FND.
α, x0 : coefficients d’ajustements.
Par changement de variable y = α (x- x0)
La loi de Gumbel s’écrite :
−y
F(x) = F(y) = e−e
y : variable réduite de Gumbel
F(y) fréquence au non dépassement
1
L’équation y = α(x-x0) représenté sous forme x = y+x0
α
1
Une approximation des valeurs et x 0 donnée par :
α
1
= 0,78 σ
α
0577
x0 = x́ -
α
y = -ln(-ln F(x))
b) Fonction de répartition type III (loi de Weibull)
La fonction de répartition est asymptotiquement du type III s’applique dans les cas extrêmes
minimaux. La fonction de répartition est :
n
x−b
F(x) = 1 -   −(
m −b
)
e
n
x−b
Est la fonction de densité de probabilité f(x) = n.(n-b) n-1 (m-b) −(
m −b
)
e
m = x́ + σ A(n), b = m - σ B(n)
Selon la méthode des moments les valeurs de A(n) et B(n) sont en fonction de coefficient d’asymétrie
et la valeur de (n) ne représentera pas la taille de la série.
1.3. Valeurs extrêmes d’une variable aléatoire
On appelle valeurs extrême ou aberrante une donnée observée pour une variable qui semble anormale
au regard des dont on dispose pour les autres observations de l’échantillon. O n peut distingue deux
types de situations dans lesquelles on rencontre des valeurs extrêmes :
1- Une valeur extrême peut indiquer une erreur de lecture, une erreur de saisie ou un évènement
particulier qui a perturbé le phénomène observé au point de le rendre incomparable aux autres.

4
Dans de tels cas, il faut soit corriger la valeur extrême si c’est possible, ou sinon supprimer
l’observation.
2- Une valeur extrême peut également être liée à un évènement atypique mais néanmoins connu
ou intéressant à étudiée.
1.4. Théorie générale d’ajustement
L’ajustement consiste à déterminer les paramètres d’une loi en fonction de l’échantillon observé. Pour
ce faire on utilise soit :
- La méthode des moments ;
- La méthode de maximum de vraisemblance.
1- Ajustement des paramètres de la loi de Galton
U = a. log10 ( x́ – x0) + b
*) Selon la méthode des moments :

σ4 ( x́ – x 0)3
=
m 4 σ 2 +3(x́−x 0 )2
1.517
a= σ2
√ log 10 ⁡(1+

1.153
( x́−x 0)
2
)

b= −a log 10 (x́−x 0)
a
La valeur de x0 est trouvée par approximation successive.
*) Selon la méthode de maximum de vraisemblance :
1 1 1 1
2,3026(∑ log 2 ( xi−x 0 ) − 2 ¿ ¿ ¿) = 1 (∑ log ⁡( xi−x 0 ))(∑
xi−x 0 n ∑
)( )-
n n xi−x 0

log ⁡( xi−x 0)
∑ xi−x 0
1
a = 1
2
1
log 2 (xi−x 0 ¿ )−
n. ∑ 2
¿¿
n ¿¿¿
a ∑ log ⁡( xi−x 0)
b=-
n
2- Ajustement des paramètres de la loi de Gumbel
*) Selon la méthode des moments :

(x−x́ )2
s = 0,78 𝞼x , x0 = x́−0,577 s 𝞼x =

*) Selon la méthode de maximum de vraisemblance :


√ ∑ n−1

5
−x
s −x

x́ = s +
∑ xe x0 = - s. ln( ∑ e
s
)
−x

∑e s n

Intervalle de confiance
L’intervalle de confiance possède trois propriétés. Son amplitude est d’autant plus grande que :
- Le degré de confiance (probabilité pour que la vraie valeur se trouve dans l’intervalle) choisi est
grand ;
- La dispersion ;
- la taille N de l’échantillon est réduite.
Le choix du degré de confiance dépend du risque du projeteur accepte. Le degré est choisi d’autant
plus élevé que l’on recherche la sécurité.
Les valeurs admises communément admises sont :
95 % pour les projets importants économiquement et/ ou exigent une sécurité élevé.
70 % pour des projets d’importance économique moindre et/ ou n’exigeant pas une sécurité très
poussée.
Remarque :
Dans un intervalle de confiance 95 %, on a 95 % de chances de trouver la varie valeur du paramètre
estimé, mais il reste 5 % de chance de trouver en dehors de l’intervalle, 2.5% pour que cette valeur
dépasse la marque supérieure de l’intervalle de confiance, 2.5% pour qu’elle soit inférieure à la marge
inférieure de cet intervalle de confiance.

1.5. Bande de confiance (cas de la régression linéaire)


Dans le cas de la régression linéaire Y = aX +b
Le calcul de la bande de confiance : I p % (Y/X) = a. x + b ± Z(p) 𝞼ɛ
I p % (Y/X) : bande de confiance de la variable Y liée à la variable X.
Z(p) : variable de Gauss (voir tableau de Gauss) ;
𝞼ɛ : l’écart type de résidu (ɛ) qui donne la longueur de la bande de confiance dans la direction des
ordonnées.
𝞼ɛ2 = 𝞼y2(1- r2).
r : coefficient de régression entre y et x.
Autre démarche de calcul ɛ :

( y existant − y estimé )2
ɛ = 𝞼y x =
√ n
ɛ : est dite erreur quadratique moyenne.
c’est l’écart type de y lié par x.

L’erreur quadratique moyenne a les mêmes propriétés que 𝞼.


Y

6
2𝞼y x 𝞼y x
𝞼y x : dans la figure corespond à la première bande de confiance

2.𝞼y x : dans la figure corespond à la deuxième bande de confiance

1.6. Test d’ajustement


Pour juger la qualité de l’ajustement d’une distribution théorique à une distribution expérimentale on
fait appelle aux tests d’adéquations ou de conformité. On utilise :
1) Test de kolmokorov smirnov ;
2) Test de khi deux.
Ajustement d’un échantillon à une loi de Goodrich
La fonction de répartition de la loi de Goodrich s’écrite :
1

F(x) = 1- e− A (x−α ) n

σ
Avec A−n = et Г  : fonction factorielle d’Euler.
√ Г 3−¿Г ¿ 2
1

Α : paramètre.
σ : Écart type est un paramètre de forme différent de zéro.
n> 0
φ(n) = β1 : coefficient de dissymétrie. D’où la valeur de coefficient (n) elle est en fonction de β1
1 Г 3−¿ Г 2

φ(n) = ( ¿) 1

Г 2−¿ Г . ¿ Г
2 −3 Г 1 ¿ 2
1 2−¿ Г 1

Г3 σ
Et α = x́ - et x́  : la moyenne de la série.
√ Г 2−¿Г ¿ 2
1

n 0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.80 0.85 0.90 0.95 1

φ(n) 0.069 0.217 0.359 0.496 0.631 0.764 0.896 1.028 1.16 1.294 1.43 1.567 1.708 1.852 2

Remarque : quelques caractéristiques de la fonction d’Euler 


Г 1 = Г (n + 1) ;
Г 2 = Г (2n + 1) ;
Г 3 = Г (3n + 1).
Et pour n +1 > 2 Г (n + 1) = (n -1). Г (n - 1).
Choix de la période de retour (T)

7
La période de retour T à prendre en compte doit dans chaque cas, faire l’objet d’une analyse mettant en
regard le coût d’investissement de l’infrastructure avec les conséquences d’un débordement pour l’usager,
les riverains, les ouvrages routiers (perturbations locales et temporaires de la circulation et situations à
risques) et enfin l’impact sur le milieu naturel.
En l’absence de ce type d’analyse, il est recommandé d’adopter les valeurs suivantes pour les périodes de
retour :
• barrages et ouvrages hydrauliques : 100 ans et plus ;
• sous autoroutes : 100 ans ;
• sous routes ou rétablissements de communications : 100 ans, 50 ans, voire 25 ans pour les bassins dont les
crues seraient limitées dans le temps et moyennant une incidence du débordement faible, voire nulle selon
les cas ;
• routes et autoroutes en zone inondable : le calage de l’infrastructure doit prendre en compte les enjeux liés
à la zone inondable.
Pour chaque type d’infrastructure, les conditions d’écoulement et l’effet d’une crue exceptionnelle doivent
être appréciés.

8
9

Vous aimerez peut-être aussi