Vous êtes sur la page 1sur 11

Parl, B. (1967): Basic Statistics, Doubleday, New York.

Riggs, H.C., (1968): Some Statistical Tools in Hydrology, United States Government
Printing Office, Washington, D.C.
Pacé, P. et Cluzel R. (1969) : Statistiques et Probabilités, Librairie Delagrave, Paris.
Viallet, F. (1970) : Statistiques et Recherche Appliquée, Chotard et Associés éd., Paris.
Laborde, J.P. (1982) : Eléments d’Hydrologie de Surface, Institut Nationale
Polytechnique de Lorraine, France.
Sachs, L. (1884): Applied Statistics, a Handbook of Techniques, Spring-Verlag Inc.,
New York.
Baillargeon, G. (1990) : Méthodes Statistiques de l’Ingénieur, Les Editions S.M.G.,
Trois Rivières, Québec, Canada.
_______________

Abdelwaheb SARI AHMED - Cours d'hydrologie II à distance -3 Licence Hydraulique 2122 Chapitre 1 Page : 11 de 11
Figure III-4 Calcul de la médiane

Dans notre cas on a :


 60 / 2   16  
Médiane  41     16  51,7 m 3 / s
 21 

On vérifie que :
moitié gauche histogramme = moitié droite
16 × 16 +14 × (51,7 - 41) = 7 × (57 – 51,7) + 9 × 16 + 6 × 16 + 4 × 16 + 2 × 16 + 2 × 16
256 + 149,8 = 37.1 + 368
405,8 ≈ 405,1
L’égalité est vérifiée.
6. Les paramètres de dispersion :
a) La variance s2La variance d'une série de valeurs est la moyenne arithmétique des
carrés des écarts entre ces valeurs et leur moyenne :
s2 

 xi  x 
2

 647,4
N 1
b) L'écart-type : L’écart-type s est égal à la racine carrée de la variance. Il mesure la
dispersion des valeurs étudiées autour de la moyenne.
2 ( xi ) 2
 xi 
 ( xi x)2  ( nxi  x)2 n
sx   
n 1 n 1 n 1
Dans notre cas : s = 25,4 mm.

c) Le coefficient de variation cv : cv  s / x  25,4 / 57,9  0,44


Il mesure la dispersion relative d'une série. C'est un nombre sans dimension.
____________________________
C. BIBLIOGRAPHIE

Spiegel, M.R. (1961): Statistics, Shaum Publishing Company, New York.


Dalrymple, T. (1962) : Flood Frequency Analysis, Manual of Hydrology : Part 3,
Flood - Flow Techniques, United States Government Printing Office, Washington, D.C.
Roche M. (1963) : Hydrologie de Surface, Gauthier-Villars ed. Paris.
Abdelwaheb SARI AHMED - Cours d'hydrologie II à distance -3 Licence Hydraulique 2122 Chapitre 1 Page : 10 de 11
d) d) La moyenne harmonique xh :
x h  N /  1 / xi   60 / 1,21  49,6 mm

e) e) La moyenne quadratique xq :
2
 xi
xq   239052,2 / 60  60,1 mm
N

f) f) Hiérarchie des moyennes :


On appelle moyenne d'ordre α la valeur xαtelle que
x   x1 x2 N.....x N  Nxi
   

Et l'on voit que si :


α = 2, on retrouve la moyenne quadratique,
α = 1, on retrouve la moyenne arithmétique,
α = - 1, on retrouve la moyenne harmonique,
Si α tend vers 0, on montre que la limite est la moyenne géométrique.
Nous noterons que la fonction xα est toujours croissante. La hiérarchie des moyennes
est donc celle des valeurs de α c'est-à-dire :
xh  x g  xa  xq
Dans notre exemple on a bien :
x h  49,6 mm  x g  53,40 mm  x a  57,9 mm  x q  60,1 mm

g) ) La médiane :
La médiane d'une série de chiffres ordonnés est la valeur du milieu, c'est à dire celle
qui partage l'échantillon en deux parties égales.
Géométriquement, la médiane est la valeur de l’abscisse x qui correspond à la verticale
qui divise l'histogramme en deux parties d'égale surface.
On calcule la médiane par la formule suivante :
N 
   f i  
Médiane  L1   2  c
 f médiane 
 
 
Où :
L1 = limite inférieure de la classe médiane,
N = nombre de valeurs dans l'échantillon,
 f i = somme des fréquences absolues de toutes les classes inférieures à la classe
médiane.
Fmédia ne = fréquence de la classe médiane
c = grandeur de la classe médiane.

Abdelwaheb SARI AHMED - Cours d'hydrologie II à distance -3 Licence Hydraulique 2122 Chapitre 1 Page : 9 de 11
La fonction de répartition, dite aussi fonction intégrale, est constituée par l'ensemble
des couples suivants :
- (xi, cumul des fréquences de la plus petite valeur jusqu'à celle de xi) pour les cumuls
ascendants (c’est à dire de la plus petite à la plus grande valeur). C’est la fréquence cumulée au
non-dépassement (FND)
- ou (xi, cumul des fréquences depuis celle de xi jusqu’à celle de la plus grande valeur de
l’échantillon) pour les cumuls descendants. C’est la fréquence cumulée au dépassement (FD).

100,0
90,0
Fréquences relatives cumulées

80,0
70,0
60,0
FD relatives cumulées
50,0
FND relatives cumulées
40,0
30,0
20,0
10,0
0,0
25 45 65 85 105 125 145
Bornes inférieures des classes

Figure III-3 Courbes des fréquences relatives cumulées

Dans le tableau III - 4 on a calculé les fréquences cumulées (au dépassement (FD) et
au non dépassement (FND)) jusqu’aux bornes des intervalles. La somme des fréquences de toutes
les valeurs plus petites que la limite supérieure d'un intervalle est appelée Fréquence cumulée
au non - dépassement (FND) : ainsi 87 % des pluies maximales journalières à Dar el Beidha
sont inférieures à 91 mm. En outre, la somme des fréquences de toutes les valeurs plus grandes
que la limite inférieure d'un intervalle est appelée Fréquence cumulée au dépassement(FD).
Ainsi, 13 % des pluies maximales journalières à Dar el Beidha sont supérieures à 91 mm.
On constate que : F.N.D. + F.D. = 87 % + 13 % = 100 %

5. Les paramètres de position :


a) a) Le mode (ou dominante) : C'est la valeur dont la fréquence est la plus grande (qui se
répète le plus souvent). Dans notre cas, cette valeur est 41,5 mm.

b) b) La moyenne arithmétique xa :
xa 
 xi  
somme des valeurs des var iables
 57 ,9 mm
N nombre total des var iables

c) c) La moyenne géométrique xg :
  xi  ; 1/ N  ln xi 
1 1/ N
x g  ( x1  x2  ...... xN ) N

238,5 / 60  3,98; x g  e3,98  x g  53,40mm


Abdelwaheb SARI AHMED - Cours d'hydrologie II à distance -3 Licence Hydraulique 2122 Chapitre 1 Page : 8 de 11
de la manière suivante :
- Dans la colonne 1, on porte les limites inférieures des classes,
- Dans la colonne 2, on calcule le nombre de valeurs de l’échantillon qui sont plus petites
que la limite de la classe, ainsi dans la première ligne il n’y a aucune valeur dans
l’échantillon qui soit inférieure à 25 mm. Dans la 3ième ligne il y a 37 valeurs de
l’échantillon qui sont inférieures à 57 mm, etc.
- Dans la 3ième colonne, on calcule les fréquences cumulées au Non dépassement, c’est-à-
dire le pourcentage de valeur qui est inférieure à 57 mm. Ainsi, dans la 3ième ligne ce
pourcentage est égale à : = 0,62 𝑜𝑢 62%. C’est-à-dire que 62% des valeurs de notre
échantillon sont inférieures à 57 mm.
- Dans la colonne 4, on porte les limites supérieures des classes,
- Dans la colonne 5, on calcule le nombre de valeurs de l’échantillon qui sont plus grandes
que la limite de la classe, ainsi dans la première ligne toutes les 60 valeurs de l’échantillon
qui soit supérieure à 25 mm. Dans la 3ième ligne il y a 23 valeurs de l’échantillon qui sont
supérieures à 57 mm, etc.
- Dans la 6ième colonne, on calcule les fréquences cumulées au Dépassement, c’est-à-dire
le pourcentage de valeur qui est supérieure à 57 mm. Ainsi, dans la 3ième ligne ce
pourcentage est égale à : = 0,38 𝑜𝑢 62%. C’est-à-dire que 38% des valeurs de notre
échantillon sont supérieures à 57 mm.
1 2 3 4 5 6
Fréquences absolues Fréquences relatives Fréquences absolues Fréquences relatives
Débits cumulées au Non- cumulées au Non- Débits cumulées au cumulées au
Dépassement (FND) Dépassement (FND) Dépassement (FD) Dépassement (FD)
< 25 0 0,00 > 25 60 100.0
< 41 16 0,27 > 41 44 0,73
< 57 37 0,62 > 57 23 0,38
< 73 46 0,77 > 73 14 0,23
< 89 52 0,87 > 89 8 0,13
< 105 56 0,93 > 105 4 0,07
< 121 58 0,97 > 121 2 0,03
< 137 60 1,00 > 137 0 0,00

Tableau III-4 Calcul des fréquences cumulées


60
Fréquences absolues cumulées

50

40
Fréquences absolues au dépassement cumulées- FD
30
Fréquences absolues au Non dépassement cumulées - FND
20

10

0
25 45 65 85 105 125 145
Bornes inférieures des classes

Figure III-2 Courbes des fréquences absolues cumulées


Abdelwaheb SARI AHMED - Cours d'hydrologie II à distance -3 Licence Hydraulique 2122 Chapitre 1 Page : 7 de 11
Le polygone des fréquences est obtenu en joignant les milieux des sommets des
rectangles de l'histogramme. On complète la ligne polygonale au moyen des segments AB et HI,
de façon telle que l'aire du polygone soit égale à l'aire de l'histogramme.
La fréquence relative d'une classe est obtenue en divisant la fréquence absolue de la
classe par le nombre total de données dans l'échantillon. Par exemple, la fréquence relative de la
2ème classe est :
21 / 60 = 0,35 ou 35 %.
Si on remplace, dans le tableau, la colonne des fréquences absolues par celle des
fréquences relatives, on obtient la distribution des fréquences relatives.

40 35,00
35
Fréquences relatives (%)

30 26,67
25
20 15,00
15 10,00
10 6,67
3,33 3,33
5
0
33 49 65 81 97 113 129
Centre des classes (mm)
25 35

Fréquences absolues 30
20
25
Fréquences absolues

Fréquences relatives
Fréquences relatives

15 20

10 15
10
5
5
0 0
34 50 66 82 98 114 130
Milieux des classes

Figure III-1 Histogrammes


Aire de l'histogramme = aire du polygone des fréquences = Σfi= 1
et aire de l’histogramme = aire du polygone des fréquences ni = N ; (N = 60 dans notre cas).

4. Courbes de fréquences cumulées ou fonction de répartition : La fonction de distribution


d'une variable est constituée par l'ensemble des couples (xi, ni) ou (xi, fi). Le calcul est réalisé
Abdelwaheb SARI AHMED - Cours d'hydrologie II à distance -3 Licence Hydraulique 2122 Chapitre 1 Page : 6 de 11
10 × 𝑙𝑜𝑔𝑁
𝑘 = 1+
3
où k = nombre d’intervalles et N = grandeur de l’échantillon. Dans notre cas
10 × 𝑙𝑜𝑔60
𝑘 = 1+ =7
3
Les limites des classes ne doivent pas coïncider avec les données de l'échantillon.

Numéro de Bornes des Centre de classe Effectif ou fréquence Fréquence relative


classe (i) classes (xi) absolue (ni) (fi)
1 25 ≤ P ≤ 41 33 16 26,67
2 41 ≤ P ≤ 57 49 21 35,00
3 57 ≤ P ≤ 73 65 9 15,00
4 73 ≤ P ≤ 89 81 6 10,00
5 89 ≤ P ≤ 105 97 4 6,67
6 105 ≤ P ≤ 121 113 2 3,33
7 121 ≤ P ≤ 137 129 2 3,33
60 100,00
Tableau III-3 Groupement des valeurs des débits

3- On détermine le nombre d'observations (ou de données) dans chaque intervalle, c'est-à-dire la


fréquence absolue ni de chaque classe.
4.- On détermine la fréquence relative fi = (ni / N), (N = nombre total d'observations contenues
dans l'échantillon).
L'ensemble des couples (xi, ni) ou (xi, fi) définit ce qu'on appelle la fonction de distribution de la
variable x.
On remarque ce qui suit :
a - une classe contient la limite inférieure, mais pas la limite supérieure, ceci afin d’éviter qu’une
valeur chevauche entre deux classes ou soit comptée deux fois ;
b - le groupement dénature la série initiale : perte d'information et altération de son contenu ;
c - le groupement, étant dépendant du statisticien, est arbitraire.
Le groupage des données fait perdre beaucoup d'informations. Ainsi, pour la classe [105 - 121 [,
l’on ne sait pas comment sont distribuées les données à l'intérieur de l'intervalle. Cependant le
groupage présente un avantage majeur, qui est celui d'avoir une vision globale de l'échantillon et
les caractéristiques principales de l'échantillon deviennent plus apparentes.
Le groupement devra donc être choisi de manière à concilier les avantages de la synthèse et les
inconvénients d'une trop grande altération.

3. Histogramme et polygone de fréquences : C'est la représentation graphique de la fonction


de distribution.
Un histogramme est une série de rectangles ayant :
a- leurs bases sur l'axe des x centrées au milieu des intervalles et dont la longueur est
égale à la grandeur de l'intervalle.
b- leurs hauteurs sont égales aux fréquences. De ce fait la surface d’un rectangle est
proportionnelle à la fréquence de l'intervalle qu'il représente.

Abdelwaheb SARI AHMED - Cours d'hydrologie II à distance -3 Licence Hydraulique 2122 Chapitre 1 Page : 5 de 11
• Toutes ces opérations sont indiquées dans le tableau III - 2.

1 2 3 1 2 3 1 2 3
Variable Effectif ou Fréquence Variable Effectif ou Fréquence Variable Effectif ou Fréquence
(xi) Fréquence Relative (xi) Fréquence Relative (xi) Fréquence Relative
Absolue (fi) Absolue (fi) Absolue (fi)
(ni) (ni) (ni)
26,8 1 0,017 44 1 0,017 61 1 0,017
29,1 1 0,017 44,2 1 0,017 64,9 1 0,017
29,8 1 0,017 44,3 1 0,017 65,5 1 0,017
30,4 1 0,017 44,9 1 0,017 68,5 1 0,017
31,5 1 0,017 45,1 1 0,017 71,9 1 0,017
32,5 1 0,017 45,2 1 0,017 73,6 1 0,017
34,2 1 0,017 46 1 0,017 79,1 1 0,017
34,5 1 0,017 46,9 1 0,017 83 1 0,017
34,8 1 0,017 48,5 1 0,017 85,9 1 0,017
36,2 1 0,017 48,7 1 0,017 86,2 1 0,017
37 1 0,017 50,3 1 0,017 86,7 1 0,017
37,3 1 0,017 52,6 1 0,017 91,6 1 0,017
39,3 1 0,017 52,9 1 0,017 92,5 1 0,017
39,6 1 0,017 53,2 1 0,017 93,3 1 0,017
39,7 1 0,017 55 1 0,017 104,4 1 0,017
40,7 1 0,017 56,3 1 0,017 108 1 0,017
41,5 2 0,033 57,1 1 0,017 115,2 1 0,017
41,8 1 0,017 59,3 1 0,017 124,3 1 0,017
42 1 0,017 60,5 1 0,017 136,6 1 0,017
Tableau III-2 Rangement des valeurs des pluies journalières maximales

2. Groupement des valeurs : Pour mettre en relief les caractéristiques de la série étudiée,
on opère des groupements en classes de valeurs.
• Un groupement consiste à remplacer toutes les valeurs situées dans un intervalle donné
par une valeur unique, appelée "centre de classe", à laquelle on attribue une fréquence
égale à la somme des fréquences des valeurs appartenant à cet intervalle. Dans la plupart
des cas, l’on recherche un découpage en intervalles égaux.
• Pratiquement, pour trouver les distributions fréquentielles, l’on procède comme suit :
a- On détermine la donnée la plus grande et la donnée la plus petite, et on calcule l'amplitude de
notre échantillon, qui est égale à la différence entre ces deux valeurs.
b - On divise cette amplitude en un nombre convenable d'intervalles de même grandeur. Le
nombre d'intervalles se situe entre 5 et 20 selon les cas. On utilise souvent la formule suivante :

Abdelwaheb SARI AHMED - Cours d'hydrologie II à distance -3 Licence Hydraulique 2122 Chapitre 1 Page : 4 de 11
Dans ce cas l’échantillon qu’on va étudier est représenté par les mesures qu’on a prises
pendant les 20, 30 ou 60 ans ou plus.

- 10.000 ans + 10.000 ans


Population

1960 2020
Echantillon
• Si l'échantillon est représentatif de la population, si l’échantillon a été bien choisi, des
conclusions importantes peuvent être tirées à partir de l'analyse de l'échantillon.

B. ANALYSE STATISTIQUE
Une série statistique est constituée par l'ensemble des valeurs du caractère étudié. Par exemple,
nous disposons de la série suivante de pluies maximales journalières à Dar El Beidha, Wilaya
d’Alger en mm.
1 2 1 2 1 2 1 2 1 2 1 2
An Pjmax An Pjmax An Pjmax An Pjmax An Pjmax An Pjmax
1952 32,5 1962 60,5 1972 91,6 1982 44,2 1992 92,5 2002 34,8
1953 29,1 1963 79,1 1973 124,3 1983 46,9 1993 37 2003 41,5
1954 71,9 1964 108 1974 86,7 1984 115,2 1994 50,3 2004 52,6
1955 37,3 1965 59,3 1975 42 1985 45,1 1995 40,7 2005 34,2
1956 34,5 1966 31,5 1976 61 1986 57,1 1996 64,9 2006 60,8
1957 85,9 1967 83 1977 48,5 1987 44 1997 52,9 2007 65,5
1958 44,3 1968 39,6 1978 93,3 1988 44,9 1998 48,7 2008 26,8
1959 104,4 1969 45,2 1979 55 1989 30,4 1999 41,8 2009 29,8
1960 73,6 1970 86,2 1980 39,3 1990 41,5 2000 43,3 2010 53,2
1961 68,5 1971 136,6 1981 39,7 1991 36,2 2001 46 2011 56,3
Tableau III-1 Série de pluies maximales journalières à Dar El Beidha, Wilaya d’Alger en mm

En général, ces données brutes ne sont pas organisées. Pour pouvoir analyser une telle série et
mettre en relief ses caractéristiques essentielles, l’on procède comme suit :

1. On ordonne la série :
• On peut ranger les valeurs étudiées soit dans l'ordre croissant soit dans l'ordre décroissant.
La différence entre la plus grande valeur et la plus petite est appelée l'amplitude de la série.
L’amplitude de la série des pluies journalières maximales (Pjmax) à Dar El Beidha est égale
à 136,6 – 26,8 = 109,8 mm
• Une valeur n'est inscrite qu'une seule fois et, en face, on indique le nombre de fois où l'on a
observé cette valeur. Ce nombre est l'effectif de la valeur ou sa fréquence absolue (ni) ; ainsi,
la fréquence absolue de la pluie journalière maximale 30,4 mm est 1.
• On peut également indiquer pour cette valeur la fréquence relative (fi) qui est le rapport entre
la fréquence absolue de la valeur et le total des fréquences absolues N = Sni = 60 de la série ;
ainsi, la fréquence relative de la Pjmax 30,4 mm est 1/60 = 0,017, celle de 41,5 mm est 2/60
= 0,033.
Abdelwaheb SARI AHMED - Cours d'hydrologie II à distance -3 Licence Hydraulique 2122 Chapitre 1 Page : 3 de 11
Introduction

• Nous avons appris en 2ième année le concept du bassin versant et nous avons appris à
mesurer les pluies, l’évaporation, l’infiltration et les écoulements (débit) des oueds.
• A Bab Ezzouar vous étudiez pour devenir, In Chaa ALLAH, un ingénieur en hydraulique
ou génie civil.
• Votre responsabilité, en tant qu’ingénieur de conception, est de concevoir des projets, des
ouvrages (pont, conduite d’assainissement, barrage, etc.) qui vont servir dans le futur et
pendant longtemps. Pour cela vous allez utiliser des données qui doivent être valables dans
le futur. L’étude de votre collecteur d’assainissement (ou autres ouvrages) va durer en
moyenne 2 ans, sa construction va prendre 5ans. Votre ouvrage servir dans 5 - 10 ans et il
aura une durée de vie de 30 ans.
• En d’autres termes, ce collecteur va servir de 2030 à 2060. Il va drainer les pluies de cette
période, Or vous ne connaissez pas les pluies de 2030 à 2060 !
• L’homme ne connait pas le futur, Seul Dieu le connait, alors comment faire ?
• Pour contourner cette difficulté l’ingénieur utilise les STATISTIQUES. Les statistiques
permettent de traiter les données du passé et fournir des données PROBABLES pour le
futur.
• Les statistiques sont une science qui utilise des méthodes scientifiques pour collecter,
organiser, synthétiser, présenter et analyser les données de tel ou tel phénomène. Elles
permettent aussi de tirer des conclusions valables et de prendre des décisions raisonnables
sur la base de ces analyses.
• Les statistiques permettent d'exploiter les informations recueillies pour établir toute
relation de causalité par l'interprétation et l'analyse.
• Ainsi, à partir d’une série de mesures de débits d’un oued, on peut connaitre, avec une
certaine probabilité, à l’aide des statistiques, les crues et les volumes d’eau qui seront
générés par cet oued dans le futur. On fait des prévisions des crues et des volumes futurs.
• Un phénomène aléatoire est un phénomène comportant des variables aléatoires, c'est-à-
dire des variables liées au hasard et dont les valeurs ne peuvent, en conséquence, être
connues à l'avance.
• Les statistiques sont appliquées dans presque tous les domaines de l'activité scientifique.
Lorsqu'on analyse des données relatives à un groupe d'individus ou d'objets, par exemple
les tailles des étudiants, les hauteurs et/ou les diamètres des troncs d’arbres dans une forêt,
les débits d'un cours d'eau, les pluies journalières maximales, il est souvent impossible ou
pas pratique d'examiner tous les éléments du groupe appelé population; on examine alors
une petite partie du groupe appelée échantillon.
• Si l’on veut étudier une caractéristique des étudiants de Bab Ezzouar : la taille moyenne
d’un étudiant ou une étudiante, par exemple, on ne va pas convoquer tous les étudiants,
mais seulement une partie (100 ou 200) qu’on appelle échantillon. Les 40.000 ou 50.000
étudiants de Bab Ezzouar représentent la population et les 100 ou 200 étudiants qu’on
étudie représentent l’échantillon.
• Pour ce qui est des pluies ou des débits ou n’importe quel phénomène naturel, la population
est représentée par la série de pluies ou de débits qui est tombée depuis des milliers
d’années auparavant et qui continuera à tomber pendant des milliers d’années par la suite.
Abdelwaheb SARI AHMED - Cours d'hydrologie II à distance -3 Licence Hydraulique 2122 Chapitre 1 Page : 2 de 11
USTHB – FGC

Cours d’hydrologie II – 3LHyd-2122

Chapitre 1 – Introduction aux statistiques

Abdelwaheb SARI AHMED – USTHB –FGC – Hydraulique –


Cours d'hydrologie II à distance -3 Licence Hydraulique 2122
Abdelwaheb SARI AHMED - Cours d'hydrologie II à distance -3 Licence Hydraulique 2122 Chapitre 1 Page : 1 de 11

Vous aimerez peut-être aussi