Soluion TD III - 1EE 1112

USTHB – FGC – 1MIGE-1112 TD n° 3
Série de TD n° III : Contrôle et critique des données
I- 1- Vérifier l’homogénéité de la série des pluies annuelles de la station pluviométrique de l’Oued FODDA (série précédente) pour un risque
de 5% en utilisant :
 le test de Wilcoxon,
 le test de Mann-Whitney
Années Pluies (mm) Années Pluies (mm) Années Pluies (mm)
1969 456.1 1977 321.6 1985 315.2
1970 349.7 1978 449.7 1986 245.5
1971 622.6 1979 653.4 1987 342.5
1972 520.9 1980 394.7 1988 297.3
1973 494.7 1981 587.0 1989 302.1
1974 302.1 1982 681.1 1990 321.6
1975 448.6 1983 257.2 1991 411.6
1976 576.7 1984 347.6 1992 443.9
2- Vérifier à l’aide du test de Grubbs et Beck les points singuliers de l’échantillon de la station A.
1 1 3
K N =−3.62201+6.28446 N 4 −2.49835 N 2 + 0.491436 N 4 −0.037911 N
II- Vérifier l’homogénéité des séries de précipitations annuelles des stations P1 et P2 en utilisant la station de référence par :
1- le test de Fisher-Snedecor pour α = 5%,
2- le test de test de Student pour α = 5%,
3- la méthode du double cumul,
4- la méthode des cumuls des résidus avec un intervalle de confiance de 99%.
Tableau 1. Données de précipitations annuelles enregistrées de 1971 à 1990

pour deux stations P1 et P2 dans un bassin versant et pour la station de référence du
bassin.
Année Station de référence (mm) Station P1 (mm) Station P2 (mm)
1990 806 763 764
1989 912 906 902
1988 931 915 918
1987 766 666 663
1986 1235 1263 1265
1985 964 1070 1072
1984 1145 1035 1051
1983 1218 1065 1063
1982 1269 1155 1120
1981 1360 1132 1195
1980 895 950 930
1979 1021 1014 1135
1978 1100 1022 1292
1977 1080 1037 1166
1976 1025 1012 1150
1975 1175 1100 1300
1974 1088 1041 1250
1973 1105 1021 1242
1972 1208 1165 1356
1971 1125 1050 1275
Solution
Exercice n°1
1-a Test de Wilcoxon :
Nous formons le tableau suivant pour faciliter les calculs. On commence par diviser notre série pluviométrique en deux échantillons de
longueurs respectives N1 = 10 valeurs et N2 = 14 valeurs (N = N1 + N2 = 10 + 14 = 24). Dans la première colonne on porte les dates des
mesures de pluie, dans la seconde colonne on porte les données brutes, dans la troisième colonne on porte le premier échantillon X, dans la
quatrième colonne on porte le deuxième échantillon Y, dans la cinquième et la sixième colonnes on porte respectivement les rangs et les
TD d’Hydrologie n°3 page 1 de 11

valeurs classées de la série originale, dans la septième colonne l’origine de la valeur de la série, c’est à dire on note si elle provient de
l’échantillon X ou de l’échantillon Y et dans la huitième colonne on inscrit le rang de la valeur qui provient de la série X.
. On calcule ensuite les valeurs de :
- Wx = ΣRang x
- des deux bornes Wmax et Wmin, données par les formules suivantes:
( N 1 + N 2 + 1) N 1−1 N 1 N 2 ( N 1 + N 2 +1) W max =( N 1 + N 2 +1) N 1−W min

W min =
2
− U 1− ¿ /2
√ 12
z1/2 représente la valeur de la variable centrée réduite de la loi normale correspondant à
et
1-
α/ 2 (au seuil de 95 %, nous avons z 1-µ /2 =1,96).
S Rang x = 151,
10×14(10+14+1) d’où Wmin = 91,03
W min =
(10+14+1 )10−1
2
−U 1− ¿ /2
12 √
Wmax = (11 + 14 +1) × 10 - 91,03 = 158,97
On vérifie l’inégalité: Wmin  Σ Rang x  Wmax c’est à dire : 91,03 < 151 < 158,97 ; on conclue que notre série est homogène.
1 2 3 4 5 6 7 8
Année Pluie
X Y Rangs X U Y Origine Rang X
s s
1969 456,1 456,1 653,4 1 245,5 Y
1970 349,7 349,7 394,7 2 257,2 Y
1971 622,6 622,6 587 3 297,3 Y
1972 520,9 520,9 681,1 4 302,1 Y
1973 494,7 494,7 257,2 5 302,1 X 5
1974 302,1 302,1 347,6 6 315,2 Y
1975 448,6 448,6 315,2 7 321,6 Y
1976 576,7 576,7 245,5 8 321,6 X 8
1977 321,6 321,6 342,5 9 342,5 Y
1978 449,7 449,7 297,3 10 347,6 Y
1979 653,4 302,1 11 349,7 X 11
1980 394,7 321,6 12 394,7 Y
1981 587 411,6 13 411,6 Y
1982 681,1 443,9 14 443,9 Y
1983 257,2 15 448,6 X 15
1984 347,6 16 449,7 X 16
1985 315,2 17 456,1 X 17
1986 245,5 18 494,7 X 18
1987 342,5 19 520,9 X 19
1988 297,3 20 576,7 X 20
1989 302,1 21 587 Y
1990 321,6 22 622,6 X 22
1991 411,6 23 653,4 Y
1992 443,9 24 681,1 Y
Somme = 151
1-a Test de Man-Whitney :

Test de Mann-Whitney : on divise notre échantillon en deux sous-ensembles de tailles respectives N1 et N2 avec: N1 < N2.
x1, x2, ........................... xi...................................xN1
y1, y2, ............................ yi...................................xN2
La taille de l'échantillon original est N = N1+ N2.
On classe ensuite nos valeurs par ordre croissant de 1 à N et l'on note les rangs R(x i) des éléments du premier sous-ensemble et R(y i) ceux
des éléments du second sous-ensemble dans l'échantillon original.
p
N 1 ×(N 1 +1)
S=N 1 × N 2−K L   R (xi )
K= L−
On définit K et S comme suit: 2 et ; avec i 1 ; c'est à dire la somme des rangs des
éléments de l'échantillon 1 dans l'échantillon original.

K est la somme des nombres de dépassements de chaque élément du second échantillon par ceux du premier échantillon.

S est la somme des nombres de dépassements des éléments du premier sous-ensemble (ou échantillon) par ceux du second.
On montre que lorsque N > 20, N1 > 3 et N2 > 3; K et S sont distribués selon une loi normale ayant :
N1× N 2
- une moyenne égale à: Ḱ= Ś=
2
N1× N2
- et un écart-type égal à: Sk =S s= ×( N 1 + N 2+ 1)
12
On peut alors tester l’hypothèse H0 que les deux sous-ensembles proviennent de la même population, au niveau de
K−K
T=| |
signification α, en comparant la grandeur:
sk avec la variable normale centrée réduite ayant une
probabilité de dépassement α /2. Si T < z1-α/2 on accepte H0
Nous allons appliquer le test de Mann-Whitney aux données pluviométriques de l’énoncé
On forme le tableau suivant pour faciliter la compréhension :
La colonne 1 donne les années.
La colonne 2 donne les pluies dans l’ordre où elles ont été relevées.
La colonne 3 indique les pluies triées par ordre croissant.
La colonne 4 donne rangs des données triées.
La colonne 5 donne les 10 valeurs de l'échantillon 1
La colonne 6 indique le rang de chaque valeur du sous-ensemble 1 dans l'échantillon original de 24 valeurs classées.
La colonne 7 donne les 14 valeurs de l'échantillon 2.
La colonne 8 donne le rang de chaque valeur du sous-ensemble 2 dans l'échantillon original de 24 valeurs classées.
La colonne 9 indique les valeurs du sous-ensemble 1 triées.
La colonne 10 donne le nombre de fois que chaque élément du sous ensemble 1 est dépassé par les éléments du sous-ensemble 2, la somme
des éléments de cette colonne est égale à S = 44.
La colonne 11 donne les valeurs du sous-ensemble 2 triées.
La colonne 12, enfin, donne le nombre de fois que chaque élément du sous-ensemble 2 est dépassé par les éléments du sous-ensemble 1, la
somme des valeurs de cette colonne est égale à K = 94.
On trouve : L = 151, K = 94 et S = 44 ; les équations et le tableau donnent respectivement les mêmes valeurs pour K et L.
N 1 × N 2 10 ×14 N1× N2 10 × 14
Ḱ= Ś= = =70 et Sk =S s= × ( N 1+ N 2+1 ) = × ( 10+14+1 ) =291,7 et
2 2 12 12
K− Ḱ 94−70
T= | ||
sk
=
291,7
=0,0823 |
Pour  = 95 % on a z1/2 =1,96 > T = 0,0823
Ce qui veut dire qu’on peut accepter l’hypothèse H 0 que les deux sous-ensembles proviennent de la même population et que notre série
pluviométrique est homogène.
1 2 3 4 5 6 7 8 9 10 11 12
Anné Pluies Pluies Rang Rang Rang Ech # 1 Nbre Ech # 2 Nbre
Ech # 1 Ech # 2
e mesurées triées s s s trié Dépass. trié Dépass.
1969 456,1 245,5 1 456,1 17 653,4 23 302,1 10 245,5 10
1970 349,7 257,2 2 349,7 11 394,7 12 321,6 8 257,2 10
1971 622,6 297,3 3 622,6 22 587 21 349,7 6 297,3 10
1972 520,9 302,1 4 520,9 19 681,1 24 448,6 3 302,1 9
1973 494,7 302,1 5 494,7 18 257,2 2 449,7 3 315,2 9
1974 302,1 315,2 6 302,1 5 347,6 10 456,1 3 321,6 8
1975 448,6 321,6 7 448,6 15 315,2 6 494,7 3 342,5 8
1976 576,7 321,6 8 576,7 20 245,5 1 520,9 3 347,6 8
1977 321,6 342,5 9 321,6 8 342,5 9 576,7 3 394,7 7
1978 449,7 347,6 10 449,7 16 297,3 3 622,6 2 411,6 7
1979 653,4 349,7 11 302,1 4 443,9 7
1980 394,7 394,7 12 321,6 7 587 1
1981 587 411,6 13 411,6 13 653,4 0
1982 681,1 443,9 14 443,9 14 681,1 0
1983 257,2 448,6 15
1984 347,6 449,7 16
1985 315,2 456,1 17
1986 245,5 494,7 18

1987 342,5 520,9 19

1988 297,3 576,7 20
1989 302,1 587 21
1990 321,6 622,6 22
1991 411,6 653,4 23
1992 443,9 681,1 24
L = 151 S= 44 K= 94
Exercice n°1 - 2
Le test de Grubbs et Beck pour détecter les points singuliers d’une série statistique1 :
Les séries statistiques peuvent présenter des points singuliers, ce qui veut dire que certaines observations (ou mesures) sont anormalement
élevées ou faibles en comparaison avec l’ensemble des autres données. L’occurrence ou la présence de points singuliers dans une série
statistique peut modifier significativement les résultats des analyses statistiques ultérieures, et il devient donc impératif de détecter leur
présence. Par exemple, lors des analyses des fréquences des étiages (faibles débits) ou des crues (gros débits), les points singuliers peuvent
influencer la grandeur des crues ou des étiages de faibles fréquences. Le problème de savoir comment traiter les points singuliers en
Hydrologie n’est pas encore résolu aujourd’hui. Beaucoup de statisticiens soutiennent que les points singuliers doivent être ignorés parce
qu’ils ne sont pas représentatifs de l’ensemble des données, d’autres hydrologues pensent qu’ils doivent être maintenus dans l’analyse car ils
représentent des données pertinentes et importantes. Evidemment, l’inclusion ou l’exclusion des points singuliers dépendra des buts de
l’analyse.
Plusieurs procédures sont utilisées pour identifier les points singuliers dans les séries chronologiques, celle présentée ci-dessous est le test
des points singuliers développé par Grubbs et Beck en 1972.
En appliquant ce test, on suppose que les logarithmes népériens des données suivent une loi normale. Les limites inférieures et supérieures
des points singuliers sont :
X L =exp ⁡( x́ −K N s) (1)
X H =exp ⁡( x́ + K N s) (2)
Où x́ et s représentent la moyenne et l’écart type des logarithmes népériens des données de l’échantillon. K N est la statistique de Grubbs and
Beck qui est fonction de la grandeur de l’échantillon et du niveau de signification. Pour un degré de signification de 10%, K N est donnée
par l’approximation suivante :
1 1 3
K N =−3.62201+6.28446 N 4 −2.49835 N 2 + 0.491436 N 4 −0.037911 N (3)
Où N est la grandeur de l’échantillon. Les données plus grandes que X H et plus petites que X L sont considérées des points singuliers.
Anné
Pluies mesurées Ln P Sh Sb
e
6,12
1969 456,1 -391,0 -262,7
3
5,85
1970 349,7 -497,4 -156,3
7
6,43
1971 622,6 -224,5 -429,2
4
6,25
1972 520,9 -326,2 -327,5
6
6,20
1973 494,7 -352,4 -301,3
4
5,71
1974 302,1 -545,0 -108,7
1
6,10
1975 448,6 -398,5 -255,2
6
6,35
1976 576,7 -270,4 -383,3
7
1977 321,6 5,77 -525,5 -128,2
1
Caissie, D. Hydrology of the Petit Codiac river basin in New Brunswick, Appendix A “Grubbs and Beck Outlier test”, Department of
Fisheries and Oceans, Science Branch, Diadromus Fish Division, Gulf Fisheries Management Regtion, P.O. Box 5030, Moncton, NB,
E1C9B6, Canada.
3
6,10
1978 449,7 -397,4 -256,3
9
6,48
1979 653,4 -193,7 -460,0
2
5,97
1980 394,7 -452,4 -201,3
8
6,37
1981 587 -260,1 -393,6
5
6,52
1982 681,1 -166,0 -487,7
4
5,55
1983 257,2 -589,9 -63,8
0
5,85
1984 347,6 -499,5 -154,2
1
5,75
1985 315,2 -531,9 -121,8
3
5,50
1986 245,5 -601,6 -52,1
3
5,83
1987 342,5 -504,6 -149,1
6
5,69
1988 297,3 -549,8 -103,9
5
5,71
1989 302,1 -545,0 -108,7
1
5,77
1990 321,6 -525,5 -128,2
3
6,02
1991 411,6 -435,5 -218,2
0
6,09
1992 443,9 -403,2 -250,5
6
La moyenne et l’écart type des logarithmes népériens sont respectivement : 6,003 et 0,299.
1 1 3
4 2 4
K N =−3.62201+6.28446 N −2.49835 N + 0.491436 N −0.037911 N
1 1 3
¿−3.62201+ 6.28446× 24 4 −2.49835 ×24 2 + 0.491436× 24 4 −0.037911 × 24=2,467
Et X L =exp ( x́−K N s )=exp (6,003−2,467 ×0,299 )=193,4 mm
X H =exp ⁡( x́ + K N s)=exp ( 6,003+ 2,467× 0,299 )=847,1mm
Comme dans notre série il n’y a pas de valeur située au-delà de ces bornes, on conclue que notre série ne présente pas de points singuliers.
Exercice n°2 -1 Test de Student
Soit X une variable normale connue sur deux échantillons de taille N1 et N2 soit
X 1 et X 2 ,
S 1 et S2 les moyennes et écart-
types calculés sur les deux échantillons 1 et 2.
X 1− X 2 ( N 1 −1) S 21 +(N 2−1 )S22
Soit
t=
s
√ 1
+
1
N 1 N2
où s=
√ N 1 + N 2−2
La variable t suit une loi de probabilité de Student, dont le paramètre (appelé degré de liberté) vaut 1 2N +N −2
.
Selon la valeur de t et donc de la probabilité d’apparition d’une telle valeur, on décide s’il est plausible ou pas de considérer que les deux
moyennes 1X et X2 deux estimations de celle de la population  (homogénéité des moyennes).

Si t(N1+N2-2) >t calculé pour un seuil de signification (1-), les deux échantillons sont considérés comme homogènes.
Dans notre cas, nous allons comparer la station de référence successivement avec les stations P1 et P2. Nous avons :
S Ref , P 1=√ ❑= √❑ et
S Ref , P 2=√❑= √ ❑
Où N1, N2 et N3 sont les longueurs des séries, X́ 1 , X́ 2 et X́ 3 leurs moyennes et S1, S2 et S3 leurs écarts types.

X́ 1− X́ 2 1071,4−1019,1
t 1,2= = =0,240
D’où 1 1 1 1
S 1,2 ×
X́ 1− X́ 3
+
N1 N2√ 689,78 ×
1071,4−1105,45
√ +
20 20
t 1,3= = =−0,156
Et 1 1 1 1
S 1,2 ×
√ +
N1 N3
689,78 × +
20 20 √
Le nombre de degrés de liberté est N 1 + N2 – 2 = 38 et le seuil de signification est 1 – α = 1 – 0,05 = 0,95. Pour ces valeurs la table de
Student donne t = 1,686 > t1,2 = 0,240 et t = 1,686 > t1,2 = -0,156 ; ce qui veut dire que les deux séries sont homogènes.
Exercice n°2 - 2 Test de Fisher-Snédécor Ce test permet de vérifier l’homogénéité des variances de deux échantillons issus de populations
normales, en supposant que leurs moyennes sont identiques.
2 2
S1 S2
F= 2
si S 1 > S2 sinon prend F= 2
Soit S2 S1
F suit une loi de probabilité de Fisher, de paramètres 1 ν =N −1 et ν =N −1

1 2 2
Si Fcalculé<F(1,2), les deux échantillons sont considérés comme homogènes pour un seuil de signification (1-).
Dans notre cas, nous allons comparer la station de référence successivement avec les stations P1 et P2. Nous avons :
S21 156,7 ² S23 187,7 ²
F 12= 2 = =1 ,36 et F 12= 2 = =1 , 43
S2 134,6 ² S1 156,7 ²
Les nombres de degrés de liberté sont respectivement ν 1 = N1 -1 = 20 – 1 = 19 et ν2 = N2 -1 = 20 – 1 = 19 et le seuil de signification est 1 – α
= 1 – 0,05 = 0,95. Pour ces valeurs la table de Fisher Snédécor donne :
F(ν1, ν2) = F(19,19) = 2,17 qui est plus grande que les valeurs calculées ; ce qui veut dire que les deux séries sont homogènes.
Exercice n°2 - 2 Méthode des doubles cumuls : Elle permet de détecter la non-homogénéité d'une série de mesures et de la corriger. La
méthode consiste à comparer les pluies (ou toute autre variable) cumulées d'une station B, à propos de laquelle on éprouve des doutes quant
à son homogénéité, avec les pluies cumulées d'une station A dont les mesures sont jugées homogènes.
Application de la méthode à la série P1 : On commence donc par établir le tableau ci-dessous: Dans les trois premières
colonnes on porte respectivement les années et les précipitations mesurées aux stations A et B. Dans les quatrième et cinquième colonnes on
calcule les cumuls respectifs des pluies aux stations A et B. Ensuite on porte ces valeurs sur du papier millimétré, avec les valeurs de A en
abscisses et les valeurs de B en ordonnées.
Anné Station de référence A Station B P1

Cumuls A Cumuls B
e (mm) (mm)
1990 806 763 806 763
1989 912 906 1718 1669
1988 931 915 2649 2584
1987 766 666 3415 3250
1986 1235 1263 4650 4513
1985 964 1070 5614 5583
1984 1145 1035 6759 6618
1983 1218 1065 7977 7683
1982 1269 1155 9246 8838
1981 1360 1132 10606 9970
1980 895 950 11501 10920
1979 1021 1014 12522 11934
1978 1100 1022 13622 12956
1977 1080 1037 14702 13993
1976 1025 1012 15727 15005
1975 1175 1100 16902 16105
1974 1088 1041 17990 17146
1973 1105 1021 19095 18167
1972 1208 1165 20303 19332

1971 1125 1050 21428 20382
On voit sur le graphique que les points s’alignent sur un seul segment de droite, ce qui est interprété comme quoi la série B
(P1) est homogène.
Application de la méthode à la série P2 : On commence donc par établir le tableau ci-dessous: Dans les trois premières
colonnes on porte respectivement les années et les précipitations mesurées aux stations A et C. Dans les quatrième et cinquième colonnes on
calcule les cumuls respectifs des pluies aux stations A et C. Ensuite on porte ces valeurs sur du papier millimétré, avec les valeurs de A en
abscisses et les valeurs de C en ordonnées.
Anné Station de référence A Station C P2

Cumuls A Cumuls C
e (mm) (mm)
1990 806 764 806 764
1989 912 902 1718 1666
1988 931 918 2649 2584
1987 766 663 3415 3247
1986 1235 1265 4650 4512
1985 964 1072 5614 5584
1984 1145 1051 6759 6635
1983 1218 1063 7977 7698
1982 1269 1120 9246 8818
1981 1360 1195 10606 10013
1980 895 930 11501 10943
1979 1021 1135 12522 12078
1978 1100 1292 13622 13370
1977 1080 1166 14702 14536
1976 1025 1150 15727 15686
1975 1175 1300 16902 16986

1974 1088 1250 17990 18236

1973 1105 1242 19095 19478
1972 1208 1356 20303 20834
1971 1125 1275 21428 22109
On voit sur le graphique que les points s’alignent sur deux segments de droite différents, c’est-à-dire qu’il y a une cassure sur
la droite au cours de l’année 1979. On suppose que le déplacement (ou autre cause d'erreur) s'est produit en 1979. Les données mesurées
après 1979 sont jugées bonnes et on ne doit corriger que les données précédentes (1979 à 1971).
La décision de corriger ou non les données de l’année1979 est prise après une connaissance détaillée des circonstances de
“ l’accident ” au cours de cette année.
On calcule les pentes m1 du segment de droite qui contient les données de 1990 à 1979, et m 2 du segment de droite qui contient
les données de 1979 à 1971.
22109−12078 10 031
m1= = =1,1263
21 428−12 522 8 906
12078−764 11314
m 2= = =0,9657
12522−806 11716
On calcule le rapport des pentes m2/m1 avec lequel on va multiplier les données des années 1979 à 1971 pour les corriger.
m 2 0.9657
= =0,765
m 1 1,1263
On porte ces valeurs sur la dernière colonne du tableau.
Une fois ces données corrigées, on refait l’opération.
Anné Station de référence A Cumuls C

Station C P2 (mm) Cumuls C Cumuls C corrigées
e (mm) A corrigées
1990 806 764 806 764 764 764
1989 912 902 1718 1666 902 1666
1988 931 918 2649 2584 918 2584
1987 766 663 3415 3247 663 3247
1986 1235 1265 4650 4512 1265 4512
1985 964 1072 5614 5584 1072 5584

1984 1145 1051 6759 6635 1051 6635
1983 1218 1063 7977 7698 1063 7698
1982 1269 1120 9246 8818 1120 8818
1981 1360 1195 10606 10013 1195 10013
1980 895 930 11501 10943 930 10943
1979 1021 1135 12522 12078 868,275 11811
1978 1100 1292 13622 13370 988,38 12800
1977 1080 1166 14702 14536 891,99 13692
1976 1025 1150 15727 15686 879,75 14571
1975 1175 1300 16902 16986 994,5 15566
1974 1088 1250 17990 18236 956,25 16522
1973 1105 1242 19095 19478 950,13 17472
1972 1208 1356 20303 20834 1037,34 18510
1971 1125 1275 21428 22109 975,375 19485
L’on voit que les points s’alignent sur une droite sans cassure; notre série a donc été rendue homogène. Si l’on constate une autre cassure, on
recommence l’opération.
Exercice n°2 - 2 Méthode des cumuls des résidus : On appelle résidu εi la différence entre la valeur observée d’une variable et la valeur de
la même variable obtenue à partir de l’équation de la droite de régression entre la variable explicative et la variable à expliquer.
Dans cet exercice, nous avons une série de référence A et deux séries pluviométriques P1 et P2 dont on veut en connaître l’homogénéité.
On calcule les caractéristiques suivantes :
A P1 P2
Moyenne MA = 1071,4 mm MP1 = 1019,1 mm MP2 = 1105,5 mm
Ecart type SA = 156,7 mm SP1= 134,6 mm SP2 = 187,7 mm
Entre la série A et la série P1 on a RAP1= 0,883 et ^P1 i=0,758 × A i+207,4
Entre la série A et la série P2 on a RAP2= 0,883 et t ^P2 i=0,935 × A i+103,7
^
On a doncε i =Pi − Pi .
Le cumul des k premiers résidus est appelé Z k =ε 1 + ε 2+ ε 3 +… … . ε k pour k < n + 1.

n
On sait que moyenne des ε i =0, d’où Z n=∑ ε i =0 et écart type des ε i=√ S P ×(1−R2AP ¿) .¿
1
On trace sur du papier graphique ZK en fonction de k, on obtient le tracé des cumuls des résidus qui sera une courbe oscillant autour de l’axe
des X.
Ensuite on définit pour chaque valeur de k l’écart ou résidu à ne pas dépasser pour un seuil de confiance α donné. Cet écart est représenté
par la longueur du segment ayant pour abscisse k centré sur l’axe des X et de longueur égale à :
z 1−α × écart type de Z k où z 1−α est la variable centrée réduite de Gauss ayant une probabilité de dépassement égale à 1−α et l’écart
2 2 2
2 2 2
type de Z k =S P × ( 1−R AP ) × k × ( n−k ) ×(n−1)/n .
Les extrémités des segments d’abscisse k et centrés sur l’axe des x décrivent une ellipse de grand axe égal à n
Ceci veut dire que pour une valeur donnée de k, il y a une probabilité α pour que le point représentatif de Zk soit à l’intérieur de ce segment.
Mais cela ne veut pas dire que pour l’ensemble du tracé la probabilité » qu’aucun point ne sorte soit égale à α (où α = seuil de signification =
0,99→
z 1−α =2,57).
2
Exercice n°2 – 2-a Méthode des cumuls des résidus appliquée à la série P1: Le tableau ci-dessous résume les calculs.
Dans la colonne 1, on a porté les différentes valeurs de k.
Dans la colonne 2, on porté les années de mesure.
Dans la colonne 3, on a porté les valeurs des pluies mesurées en mm, à la station de référence A.
Dans la colonne 4, on a porté les valeurs des pluies mesurées en mm, à la station P1.
Dans la colonne 5, on a porté les valeurs des pluies théoriques à la station P 1 obtenues grâce à l’équation de régression :
^P1 i=0,758 × A i+207,4
Dans la colonne 6, on a calculé les résidus εi grâce à l’équation : ε i =P1 i − ^
P1 i.
Dans la colonne 7, on a calculé les cumuls des résidus : Cumulk = Cumulk-1 + εk
Dans la colonne 8, on a calculé le haut de l’ellipse donné par l’équation :
z 1−α × écart type de Z k =z 1−α × S 2P 1 × ( 1−R 2AP 1) × k × ( n−k ) ×(n−1)/n2,
2 2
¿ 2,57 ×134 ,6² × ( 1−0,8832 ) × k ×(24−k)×23 /24²

Dans la colonne 9, on a calculé le bas de l’ellipse donné par l’équation :
2 2 2
- z 1−α × écart type de Z k =z 1−α × S P 1 × ( 1−R AP 1) × k × ( n−k ) ×(n−1)/n
2 2
¿−2,57 ×134 , 6² × ( 1−0,8832 ) ×k ×(20−k )× 19/20 ²
1 2 3 4 5 6 7 8 9
Station de référence Station P1 P1 Résidu Cumuls des Haut de Bas de
k Année
(mm) (mm) théorique s Résidus l'ellipse l'ellipse
0 0 0 0,0 0,0
1 1990 806 763 818,02 -55,02 -55,02 69,0 -69,0
2 1989 912 906 898,33 7,67 -47,35 130,8 -130,8

3 1988 931 915 912,73 2,27 -45,08 185,3 -185,3
4 1987 766 666 787,71 -121,71 -166,79 232,5 -232,5
5 1986 1235 1263 1143,05 119,95 -46,84 272,4 -272,4
6 1985 964 1070 937,73 132,27 85,43 305,1 -305,1
7 1984 1145 1035 1074,86 -39,86 45,57 330,5 -330,5
8 1983 1218 1065 1130,17 -65,17 -19,60 348,7 -348,7
9 1982 1269 1155 1168,81 -13,81 -33,42 359,6 -359,6
10 1981 1360 1132 1237,76 -105,76 -139,17 363,2 -363,2
11 1980 895 950 885,45 64,55 -74,62 359,6 -359,6
12 1979 1021 1014 980,91 33,09 -41,54 348,7 -348,7
13 1978 1100 1022 1040,77 -18,77 -60,31 330,5 -330,5
14 1977 1080 1037 1025,62 11,38 -48,92 305,1 -305,1
15 1976 1025 1012 983,94 28,06 -20,87 272,4 -272,4
16 1975 1175 1100 1097,59 2,41 -18,46 232,5 -232,5
17 1974 1088 1041 1031,68 9,32 -9,14 185,3 -185,3
18 1973 1105 1021 1044,56 -23,56 -32,69 130,8 -130,8
19 1972 1208 1165 1122,60 42,40 9,71 69,0 -69,0
20 1971 1125 1050 1059,71 -9,71 0,00 0,0 0,0
Somme = 21428 20382
Moyenne = 1071,4 1019,1
Ecart type
156,7 134,6
=
400
300
200
Résidus (mm)
100
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
-100
-200
-300
-400
Valeurs de n
Exercice n°2 – 2-b Méthode des cumuls des résidus appliquée à la série P2: Le tableau ci-dessous résume les calculs.
Dans la colonne 1, on a porté les différentes valeurs de k.
Dans la colonne 2, on porté les années de mesure.
Dans la colonne 3, on a porté les valeurs des pluies mesurées en mm, à la station de référence A.
Dans la colonne 4, on a porté les valeurs des pluies mesurées en mm, à la station P2.
Dans la colonne 5, on a porté les valeurs des pluies théoriques à la station P 2 obtenues grâce à l’équation de régression :
^
P2 i=0,935 × A i+103,7
Dans la colonne 6, on a calculé les résidus εi grâce à l’équation : ε i =P2 i − ^
P 2 i.
Dans la colonne 7, on a calculé les cumuls des résidus : Cumulk = Cumulk-1 + εk
Dans la colonne 8, on a calculé le haut de l’ellipse donné par l’équation :
z 1−α × écart type de Z k =z 1−α × S 2P 2 × ( 1−R 2AP 2) × k × ( n−k ) ×(n−1)/n2
2 2
¿ 2,57 ×187 , 7² × ( 1−0,7812 ) × k ×(24−k )× 23/24²

Dans la colonne 9, on a calculé le bas de l’ellipse donné par l’équation :
2 2 2
- z 1−α × écart type de Z k =z 1−α × S P 2 × ( 1−R AP 2) × k × ( n−k ) ×(n−1)/n
2 2
¿−2,57 ×187 , 7² × ( 1−0,7812) × k ×(20−k ) ×19/20 ²

1 2 3 4 5 6 7 8 9
P2
k Année Station de référence (mm) Station P2 (mm) Résidus Cumuls des Résidus Haut de l'ellipse Bas de l'ellipse
théorique
0 0 0 0,0 0,0
1 1990 806 764 857,3 -93,31 -93,31 142,0 -142,0
2 1989 912 902 956,4 -54,42 -147,73 269,0 -269,0
3 1988 931 918 974,2 -56,18 -203,92 381,1 -381,1
4 1987 766 663 819,9 -156,92 -360,83 478,3 -478,3
5 1986 1235 1265 1258,4 6,59 -354,24 560,5 -560,5
6 1985 964 1072 1005,0 66,96 -287,28 627,7 -627,7
7 1984 1145 1051 1174,3 -123,26 -410,54 680,0 -680,0
8 1983 1218 1063 1242,5 -179,51 -590,05 717,4 -717,4
9 1982 1269 1120 1290,2 -170,20 -760,25 739,8 -739,8
1
1981 1360 1195 1375,3 -180,28 -940,53
0 747,3 -747,3
1
1980 895 930 940,5 -10,52 -951,05
1 739,8 -739,8
1
1979 1021 1135 1058,3 76,67 -874,38
2 717,4 -717,4
1
1978 1100 1292 1132,2 159,81 -714,57
3 680,0 -680,0
1
1977 1080 1166 1113,5 52,51 -662,06
4 627,7 -627,7
1
1976 1025 1150 1062,1 87,93 -574,13
5 560,5 -560,5
1
1975 1175 1300 1202,3 97,69 -476,44
6 478,3 -478,3
1
1974 1088 1250 1121,0 129,03 -347,41
7 381,1 -381,1
1
1973 1105 1242 1136,9 105,14 -242,27
8 269,0 -269,0
1
1972 1208 1356 1233,2 122,84 -119,44
9 142,0 -142,0
2
1971 1125 1275 1155,6 119,44 0,00
0 0,0 0,0
Somme = 21428 22109
Moyenne = 1071,4 1105,45
Ecart type = 156,7 187,7
800
600
400
200
Résidus (mm)
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
-200
-400
-600
-800
-1000
Valeurs de n
Référence : Bernier J. (1977) – Etude de la stationnarité des séries hydrométéorologiques La Houille blanche N°4 – 1977 pp313-319.

Soluion TD III - 1EE 1112

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Soluion TD III - 1EE 1112

Transféré par

Droits d'auteur :

Formats disponibles

USTHB – FGC – 1MIGE-1112 TD n° 3

Série de TD n° III : Contrôle et critique des données

Tableau 1. Données de précipitations annuelles enregistrées de 1971 à 1990

TD d’Hydrologie n°3 page 1 de 11

( N 1 + N 2 + 1) N 1−1 N 1 N 2 ( N 1 + N 2 +1) W max =( N 1 + N 2 +1) N 1−W min

1-a Test de Man-Whitney :

éléments de l'échantillon 1 dans l'échantillon original.

TD d’Hydrologie n°3 page 2 de 11

TD d’Hydrologie n°3 page 3 de 11

1987 342,5 520,9 19

Exercice n°2 -1 Test de Student

moyennes 1X et X2 deux estimations de celle de la population  (homogénéité des moyennes).

TD d’Hydrologie n°3 page 5 de 11

F suit une loi de probabilité de Fisher, de paramètres 1 ν =N −1 et ν =N −1

Anné Station de référence A Station B P1

1972 1208 1165 20303 19332

Anné Station de référence A Station C P2

TD d’Hydrologie n°3 page 7 de 11

1974 1088 1250 17990 18236

Anné Station de référence A Cumuls C

1985 964 1072 5614 5584 1072 5584

TD d’Hydrologie n°3 page 9 de 11

¿ 2,57 ×134 ,6² × ( 1−0,8832 ) × k ×(24−k)×23 /24²

¿−2,57 ×134 , 6² × ( 1−0,8832 ) ×k ×(20−k )× 19/20 ²

2 1989 912 906 898,33 7,67 -47,35 130,8 -130,8

¿ 2,57 ×187 , 7² × ( 1−0,7812 ) × k ×(24−k )× 23/24²

¿−2,57 ×187 , 7² × ( 1−0,7812) × k ×(20−k ) ×19/20 ²

TD d’Hydrologie n°3 page 12 de 11

Vous aimerez peut-être aussi