Climat

ORGANISATION MÉTÉOROLOGIQUE MONDIALE
NOTE TECHNIQUE N° 81
QUELQUES METHODES
DE L'ANALYSE CLMATOLOGIQUE
par H. C. S. THOM
(traduite par R. ARLÉRY)
il
OMM-N°199
Secrétariat de l'Organisation Météorologique Mondiale - Genève - Suisse

WMO
199(F)
L'OMM
L'Organisation météorologique mondiale (OMM) est une institution spécialisée des

Nations Unies, et compte 136 Etats et Territoires Membres.
Les buts de l'Organisation sont les suivants :

— faciliter la coopération internationale en vue de l'établissement de réseaux de stations
effectuant des observations météorologiques, et de centres chargés de fournir une assis-
tance météorologique ;
— encourager l'établissement et le maintien de systèmes permettant un échange rapide
des renseignements météorologiques ;
— encourager la normalisation des observations météorologiques et assurer la publication
uniforme d'observations et de statistiques ;
— encourager les applications de la météorologie à l'aviation, à la navigation maritime, à
l'agriculture et à d'autres activités humaines ;
— encourager les recherches et l'enseignement en météorologie.
L'Organisation se compose des organes suivants :

Le Congrès météorologique mondial, qui est l'organe suprême de l'Organisation, réunit
tous les quatre ans les représentants de tous les pays Membres afin d'arrêter la politique
générale à suivre pour atteindre les buts de l'Organisation, d'adopter les Règlements tech-
niques relatifs aux pratiques météorologiques internationales et de définir le programme de
l'OMM ;
Le Comité exécutif, qui se compose de 24 directeurs de services météorologiques natio-
naux, se réunit au moins une fois par an pour conduire les activités de l'Organisation et
mettre à exécution les décisions prises par le Congrès, étudier les questions concernant la
météorologie internationale et le fonctionnement des services météorologiques et formuler
des recommandations à ce sujet ;
Les six associations régionales (Afrique, Asie, Amérique du Sud, Amérique du Nord et
Amérique centrale, Pacifique Sud-Ouest et Europe), qui sont composées des Membres de
l'Organisation, coordonnent les activités météorologiques dans leurs Régions respectives et
examinent du point de vue régional toutes les questions dont elles sont saisies ;
Les huit commissions techniques, qui sont composées d'experts désignés par les gouver-
nements Membres, sont chargées d'étudier les différentes branches techniques spécialisées
relatives à l'observation et à l'analyse du temps, à la prévision et à la recherche météoro-
logiques, ainsi qu'aux applications de la météorologie. Des commissions techniques ont été
établies pour la météorologie synoptique, la climatologie, les instruments et les méthodes
d'observation, les sciences de l'atmosphère, la météorologie aéronautiqtie, la météorologie
agricole, l'hydrométéorologie et la météorologie maritime.
Le Secrétariat, dont le siège est à Genève, Suisse, est composé d'un personnel scientifique,
technique et administratif international placé sous la direction du Secrétaire général. Le
Secrétariat entreprend des études techniques et assume la responsabilité des nombreux
projets météorologiques d'assistance technique et de coopération technique mis en œuvre
dans le monde entier en vue de contribuer au développement économique des pays intéressés.
Il publie également des notes techniques spécialisées, des guides, des manuels et des rapports
et, d'une manière générale, fonctionne comme intermédiaire entre les services météorologiques
du monde entier. Le Secrétariat travaille en étroite collaboration avec l'Organisation des
Nations Unies et les autres institutions spécialisées.
144 0 0
ORGANISATION MÉTÉOROLOGIQUE MONDIALE
WORLD t\rrbv^m£\c*i 0*<k*n\i*r'*N'
NOTE TECHNIQUE N° 81
QUELQUES METHODES
DE L'ANALYSE CLIMATOLOGIQUE
par H. C. S. THOM
(traduite par R. ARLéRY)
OMM-N°199
Secrétariat de l'Organisation Météorologique Mondiale - Genève - Suisse

1972
U * Vo
- 3133'
tffc+S^
© 1972, Organisation météorologique mondiale

L'édition anglaise de cette Note technique a été publiée en 1966
NOTE
Les désignations utilisées dans cette publication et la présentation des données qui y figu-
rent n'impliquent de la part du Secrétariat de l'Organisation météorologique mondiale aucune
prise de position quant au statut juridique de tel ou tel pays ou territoire, ou de ses autorités,
ni quant au tracé de ses frontières.
TABLE DES MATIERES
Page
Avant-propos V
Résumé (français, anglais, russe, espagnol) VII
Chapitre I - Les séries climatologiques
1.1 La distribution de fréquence 2
1.2 Distribution cumulée 3
1.3 Homogénéité d'une série de données 4
1.4 Ajustement des moyennes climatologiques 8

1.4.1 La méthode des différences 8
1.4.2 La méthode des rapports 10
Chapitre II - Estimation des paramètres de population
2.1 Généralités sur les statistiques 12
2.2 Paramètres statistiques les plus courants 13
2.3 Variabilité d'échantillonnage des moyennes climatologiques 15
Chapitre III - Les méthodes statistiques générales
3.1 Distributions de fréquence 18

3.1.1 La loi normale 19
Exemple 1 - Loi normale 20
3.1.2 La loi Gamma 21
Exemple 2 - Loi gamma 22
3.1.3 Les distributions de valeurs extrêmes 23
Exemple 3 - Distribution de valeurs extrêmes 28
3.1.4 La loi binomiale 30
3.1.5 La loi de Poisson 32
Exemple 4 - Loi de Poisson 33
IV TABLE DES MATIERES
Page
Chapitre III - Les méthodes statistiques générales (suite)
3.1.6 La loi binomiale négative 34

Exemple 5 - Loi binomiale négative 35
3.2 Corrélation et régression 38

3.2.1 Analyse de corrélation 38
3.2.2 Analyse de régression 42
Exemple 6 - Régression simple 56
Références 60
A V A N T - P R O P O S
A sa troisième session (Londres, décembre i960), la Commission de clima-

tologie (CCI) établissait un Groupe de travail des méthodes statistiques en clima-
tologie chargé, entre autres, d'examiner et de compléter une documentation relative
aux méthodes statistiques rassemblée par un groupe de travail antérieur de la CCI.
En conclusion de ce travail, le président du groupe, M. H.C.S. Thom,

rédigea un document traitant des méthodes d'analyse climatologique qui, sur recom-
mandation de la commission à sa quatrième session (Stockholm, août 1965), fut publié
dans la série des Notes techniques de l'OMM sous le titre : "Some methods of
climatological analysis". Vu la valeur de cet ouvrage pour la formation des jeunes
climatologistes, et en raison du nombre restreint de manuels en langue française
traitant aussi spécifiquement de l'application des méthodes statistiques à la clima-
tologie, la CCI, à sa cinquième session (Genève, octobre 1969), émit le voeu que la
Note soit également publiée en français. Le travail de traduction fut aussitôt
confié à M. R. Arléry, de la Météorologie Nationale à Paris, qui s'est brillamment
acquitté de la tâche qui lui était confiée.
J'ai le plaisir de présenter ici le résultat de son travail. Tout en

renouvelant mes remerciements à M. Thom et à tous ceux qui ont contribué à la prépa-
ration du texte original, je tiens spécialement à exprimer ma reconnaissance et ma
gratitude à M. Arléry pour le dévouement dont il a fait preuve. Il est hors de
doute que son travail sera grandement apprécié par l'ensemble des Membres de l'OMM.
£S~ZL-*4Ï5-B.+><•*• -m,
(D.A. Davies)
Secrétaire général
R E S U M E
L'analyse statistique moderne est l'aspect mathématique de l'analyse clima-

tologique, qui a pour objectif la prévision climatologique. La présente Note tech-
nique est une introduction aux principes fondamentaux sur lesquels repose l'élabora-
tion des prévisions climatologiques. Les méthodes d'analyse présentées sont illus-
trées par une série d'exemples.
Après avoir défini ce qu'est une série climatologique pour jeter les bases
d'une analyse statistique valable, l'auteur traite de la distribution de fréquence
(élément capital de l'analyse climatologique). De là, il passe naturellement à la
distribution cumulée pour obtenir des probabilités qui représentent les prévisions
climatologiques.
Etant donné que certains relevés météorologiques ne constituent pas des

séries climatologiques, en raison de leur hétérogénéité, l'auteur présente ensuite
quelques tests simples permettant de déterminer l'homogénéité. Il expose les
méthodes des différences et des rapports utilisées pour ajuster les variables,
ainsi que pour calculer les moyennes et les sommes de ces variables; il mentionne
leurs applications aux relevés climatologiques proprement dits. Il indique égale-
ment les limites de leur emploi et de leur interprétation.
Après avoir abordé, d'une manière générale, le problème fondamental des

paramètres de population, l'auteur passe au crible les divers paramètres statistiques
ordinaires. Il montre également comment on arrive à déterminer le degré de normalité
de divers paramètres statistiques courants; il définit et précise les seuils de con-
fiance de la moyenne.
La Note passe en revue plusieurs distributions de fréquence fondamentales :

normale, gamma, valeurs extrêmes, binomiale, Poisson et binomiale négative. L'auteur
fournit les meilleures estimations des paramètres et donne des instructions détaillées
pour les adapter aux données. Il présente des exemples d'application de ces para-
mètres à des séries climatologiques. Il montre également comment on applique la loi
binomiale pour obtenir les seuils de confiance des estimations de probabilités à
partir d'une répartition quelconque.
Les grandes lignes de l'analyse de corrélation et de régression sont

esquissées. L'auteur traite de la propagation de la variance dans les séries clima-
tologiques, notamment de l'effet de covariance. La corrélation est soigneusement
différenciée de l'autocorrélation qui ne peut être utilisée dans cette application
qu'avec des séries de données stationnaires. Les formules se rapportant à la pro-
pagation de la variance sont appliquées à une équation permettant de déterminer le
régime de refroidissement dans un système de climatisation.
VIII RESUME
L'auteur étudie en détail l'analyse de régression, notamment le cas du

passage forcé des droites de régression par l'origine. La variance est utilisée
pour vérifier la signification d'une relation et appliquée à la régression pro-
prement dite. Le test de linéarité est également décrit. Les erreurs de la
régression et l'erreur type - très importante - d'une prévision sont exposées.
La Note contient un exemple complet d'application de la méthode à une seule
variable indépendante. Les méthodes de régression simple et de corrélation mul-
tiple sont étendues à deux variables indépendantes et, finalement, à de nombreuses
variables indépendantes. La publication se termine par une bibliographie renvoyant
à des manuels et à des études statistiques.
SUNMARY
Modem statistical analysis is the mathematics of climatological

analysis, the objective of which is climatological prédiction. This Tech-
nical Note gives an introduction to the basic principles for the making of
such prédictions. The methods of analysis presented are applied to a séries
of illustrative examples.
After defining a climatological séries to lay the basis for valid

statistical analysis, the frequency distribution (the basic tool of climato-
logical analysis; is discussed. From this the cumulative distribution for
obtaining probabilities, vhich are the climatological prédictions, follows
naturally.
Since some meteorological records do not form climatological séries

because of heterogeneities, simple tests for homogeneity are given next. The
différence and ratio methods for adjusting, averaging and totalizing variables
are discussed,together with applications to actual climatological records.
Limitations are also presented on their use and interprétation.
The fundamental problem of estimating statistical parameters is
covered as it applies generally, and the ordinary statistical parameters are
discussed critically. The approach to normality of several common statistics
is also treated, and confidence limits are defined and given for the mean.
Several fundamental frequency distributions are treated, including

the normal, gamma, extrême value, binomial, Poisson, and négative binomial
distributions. Best estimâtes for the parameters are given together vith
complète instructions for fitting them to data. Examples of their applica-
tion to climatological séries are worked out. The application of the binomial
distribution in order to obtain confidence limits for the probability estimâtes
obtained from any distribution is also given.
Corrélation and régression analysis are discussed in gênerai. The

propagation of variance in climatological séries is treated, including the
effect of covariance. The correct corrélation is carefully differentiated
from the autocorrélation which can only be used in this application with sta-
tionary data séquences. The formulas for propagation of variance are applied
to an équation for cooling load in an air-conditioning system.
Régression analysis is discussed in détail, including linear ré-

gression forçed through the origin. The analysis variance is employed for
testing the significance of a relationship as well as to the régression itself.
The test for linearity is also given. The standard errors of the régression,
as well as the ail-important standard error of a forecast, are presented.. A
complète example of application to a single independent variable is discussed.
The simple régression and multiple corrélation methods are extended to two
independent variables and finally to many independent variables. Pinally,
there is a list of références to statistical textbooks and papers.
Pea»Me
CoBpeueHHbie CTaTMCTMHecKwe aHauwabi ABJHUOTCJX MaTe-

MaTHMecKHM acneKTOM KjiHMaTOJiorimecKHx aHajiHSOB, ijejibio K O -
Topwx HBjiaeTca KjiHMaTOjiorjmecKMK nporH03. B aToft TexHH-
MecKoK 3anwcKe .aaHO BBeaeHHe K OCHOBHHM npHHunnaM «HJIH
pa3paÔ0TKH TaKMx n p o m o s o B . MeTCUM npeacTaBjieHHwx ajiecb

aHajmaoB, HJiJiiocTpHpyioTCH PHAOM npwMepoB.
Ilocjie onpejiejieHHH KJlifMaTojiorHMecKHX cepuft, KOTO-
pwe nojioxemj B ocHOBy cTaTwcTimecKoro aHajM3a, aBTop p a c -

CMaTpuBaeT pacnpejieJieHHe q a c r o ï (OCHOBHOTO ojieneHTa KJIH-
MaTojiorHMecKoro aHajiHsa) • Ma aToro ecTecTBeHHO BwTeKaeT

o6o6meHHoe pacnpeêjieHMe nojiyMeHHbix BepojiTHOCTeft, KOTO-
poe H ecTb HM MTO MHoe, KaK KJiMMaTOjiorHMecKifft nporHoa,
yMMTbiBafl, MTO HeKOTopwe MeTeopojiorimecKHe .naHHbie

HaÔJiioAeHHft He noAroTaBJiHBanT KJiHMaTOjioruMecKHx cepMii B
COOTBeTCTByiomeit $OpMe B CBHaH C paaHOpOAHOCTb» KJIMMaTOJlOrM-
qecKHx A&HHbix, aBTop npejuiaraeT HecKOJibKO npocTbix c n o c o -
6OB AJIH npMBeAeHMA MX K OAHOPOAHOCTM* OH npejuiaraeT p a 3 -
jiHMHbie M pauHOHajibHbie MeTOjibi AJIH corjiacoBaHMfl, ocpe^HeHMa
H cyMMMpoBaHwa paajiHMHbix M3MeHeHHÎt, Mcnojib3yn $aKTHMecKwe
KJiHMaTOjiorMêcKMe jiaHHbie. OH yKasuBaeT Taxze Ha orpaHH-
MeHHH B MX HCnOJIbaOBaHHH H TOJIKOBaHHM.
Ilocjie oômeit oueHKM OCHOBHMX npoôjieM cTaTwcTHHec-

KHX napaMeTpoB, aBTop BbicKaauBaeT KpHTHêcKoe cyxaeHne,
Kaca»meeca OCHOBHMX npoÔjieM pacweTa CTaTHCTHMecKHX n a p a -
MerpoB. GH cosâji Taxxe MeTojL nojixojaa K HeKOTopbiM cTaTwc-
TMHecKHM oCoCiueHMHM; OH onpeaejiHji H yTOMHHJi npeaejiM AJia
onpeAejieHHH cpeAHHX 3HaMeHnft.
XI
EblJIM AOCTMrHyTbl HeKOTOpbie OCHOBHbie IIOBTOpJieMOCTM

pacnpeAejieHMi!: HopMajibHoro, rauMa, aKCTpeMajibHoro, <5MHO-
MMajibHoro, riyaccoHa M OTpHO,aTeJibHbie ÔMHOMMajibHbie.
ABTOP HaxojiMT HawjiyMiDMe cnocoôbi pacêTa napaiieTpoB M
aaeT jaeTajibHbie noacHeHHH AJIH McnojibaoBaHUH npw odpaÔOTKe

jiaHHbix Ha6juo.neHMH. OH .naeT npMMepw npHMeHeHwfl 3TMX napa-
MeTpoB B OTHomeHMM KjiMMaTOJiorHMecKHX cepHtt. TaKxe AaeTCiî
npHMeHeHHe MMHOMHajibHoro pacnpeAejieHMH axa nojiyMeHMH n p e -
AejiOB oueHKH BepoflTHOcreH, HCxo.na M3 jiwôbix pacnpe.iieJieHH#.
KoppejiHUHOHHbiH aHajiH3 M aHajiH3 ypaBHeHMft perpeccHw

paccMaTpHBaeTcn B oOmeii n j a H e . ABTOP OPHBOAMT paaHOBHA-
HOCTH BapwaUMH B KJIHMaTOJlOrHHeCKHX CepMJIX, B MBCTHOCTH 3 $ -
$eKT con3MeHeHMJt. ABTOP paajitmaer KoppenauMio OT aBTOKop-
pejIHUHM, KOTOpafl MOxeT ÔblTb HCn0Jlb30BaHa TOJlbKO C CepMHMH
CTaUHOHapHblX AaHHbJX. «ÊOpMyjIbl, OTHOCfllUMeCH K pa3HOBW.HHOCTH
BapnauHH npMMeHHWTCH K ypaBHeHww, onpejiejifliomeMy pexHM
oxjiaxjieHMa B KOHAHUMOHHWX CHCTeMax.
ABTOP .naeT AeTajibHbiH aHajma ypaBHeHHio perpeccHH,

BKjuoqaa JWHewHoe ypaBaeHue perpeccHH. Bap.MaHTbi aHajiMaa
HcnojibayioTca AJIH npoBepKH SHaqeHHH CBasefl, TaKxe KaK H JUH
caiiOH perpeccMM. «ftaeTca TaKxe nccjiejiOBaHMe jiHHettHOCTM

H npHBOAHTCfl Becbwa cymecTBeHHbie ODHÔKH perpeccun H TWIIHM-
Hbie omHÔKM B nporH03ax.

3anncKa cojiepxHT npMMep ncnojib30BaHMH MeTO.ua no npe,nejiy
HeaaBHCMMoit pa3H0BnAH0CTH. MeTOAbi npocToft perpeccaH H
CJIOXHOH KOppejiaUMM pacnpocTpaHeHbi Ha ABe He3aBKCHMbie
BapwamiM H , B KOHenHOM HTore Ha MHoromicjieHHbie HeaaBMCH-
Mbie BapwauMM. riy6jiHKau,Ha 3aKaHMHBaeTcn dw6jiHorp84)MeH,
KOTopaa ccbuiaeTca Ha yêCHbie nocodwfl H cTaTMCTMMecKHe
HCCJie.HO BaHMH.
RESUME*
El anâlisis estadlstlco moderno constituye el aspectoraateraâtlcodel anâllsis

cllmatolôglco, cuyo objetivo es la predlcclôn climatolôgica. Esta Nota Técnlca es una intro-
ducclôn a los prlnciplos bâslcos necesarlos para la elaboraciôn de talés predicclones. Los
métodos de anâllsis que se detallan se llustran por medlo de una série de ejemplos.
Después de haber deflnido lo que es una série cllmatolôgica, con el fin de esta-
blecer la base de un anâllsis estadlstlco valedero, el autor estudla la dlstrlbucion de fre-
cuencias que es un elemento fundamental del anâllsis cllmatolôglco. Siguiendo un orden
lôgico, se estudla a continuaciôn la distribuclôn acumulativa para la obtenclôn de las
probabilidades, que representan las predicclones cllmatolôglcas.
Como algunos reglstros de datos meteorolôgicos no forman séries cllmatolôglcas
debido a su heterogeneidad, el autor expone seguidamente algunos métodos sencillos que per-
miten verificar dicha homogeneidad. Explica los métodos de las diferencias y los cocientes
utllizados para ajustar, promedlar y totalizar las variables e indica sus aplicaciones a los
reglstros climatolôgicos proplamente dichos. Se exponen también las limitaclones referentes
a la utilizaciôn e Interpretaciôn de estos métodos.
Después de estudiar de un modo gênerai el fundamental problema de la estlmaclôn
de los paramètres estadlsticos, el autor hace un examen crltlco de los paramètres estadis-
ticos ordlnarios. Muestra asimlsmo el método que se sigue para determlnar el grado de norma-
lidad de varios parâmetros estadlsticos comunes y define y précisa los limites de confinanza
de la média.
La Nota estudla varias dlstribucipnes fundamentales de frecuencia : distribuclôn
normal, distribuclôn gamma, distribuclôn de los valores extremos, distribuclôn binomial, dis-
tribuclôn de Poisson y distribuclôn binomlal negatlva. El autor da cuenta de las estiraaclones
mâs aproximadas de los parâmetros e incluye instrucclones detalladas para su adaptaciôn a los
datos. Se exponen ejemplos de su aplicaciôn a las séries cllmatolôglcas y se estudla también
la aplicaciôn de la distribuclôn binomial con el fin de obtener limites de confianza para las
probabilidades estimadas que resultan a partir de una distribuclôn cualquiera.
Se trata de una raanera gênerai del anâlisis de correlaciôn y del de regresiôn y se
estudla la propagaciôn de la variancia en las séries cllmatolôglcas, incluyendo el efecto de
la covariancia. Seguidamente se explica con detalle la diferencla que existe entre la corre-
laciôn y la autocorrelaciôn, la cual solo puede ser utilizada en esta aplicaciôn si va acora-
panada de una série de datos estacionales. Las formulas de propagaciôn de la variancia se
aplican a una ecuaciôn que expresa el réglmen de enfriamiento en un sistema de acondiciona-
miento de aire.
El autor estudla detalladamente el anâllsis de regresiôn, incluyendo la regresiôn
lineal forzada a través del origen. El anâllsis de la variancia se utiliza para verificar
la significaciôn de una relaciôn y se aplica también a la regresiôn misma. Se describe el
método de verificaciôn de la linealidad y los errores tipo de regresiôn, asi como también el
error tipo de una predlcclôn, que es de la mayor importancia. La Nota contiene un ejemplo
completo de aplicaciôn del método a una sola variable independiente. Los métodos de regre-
siôn simple y de correlaciôn multiple se aplican a dos variables independientes y, finalmente,
a numerosas variables independientes.
La publicaciôn termina con una bibliografia en la que se hace referencia a diversos
textos y documentos estadlsticos.
3 Q (I) TJ TJ CO CL ^ j . ©> 3 (Q O © O ©o C 3 © > CL ©% O
rt rt- cr < N> 3 -h rt- C© L ta •1 rt-
Q r- H» © H» M' a ©o Q Q 3 M O ©% O 3 ©% 1— © s rt- © rt- O O
3 ©s rt- 73O rt- 3 o a« Oc 3 © <+
*1 H » © h- •P*.
H <
H r" 3" C © h CA Q M 3 h-
Q Q C 3 »i C 3 © tn (A © X H« 3 Q H 3 H- CA 1— © T J 3
a TJ O
©-
•*• «+*< t->
a •o
©« < © C ta h-" H rt- Q 3
< fe*«
H» O ©> © Q H- O O CO
H D O rt-
H- H
c_•• 3 m
H- ©-. O CL I— O CL O © 3 ta 3 rt •1 H -
O co • c c en C L T I
© H* 3 O Q 3 © a • O ©% © O •1 r- © I— rt- rt
O H» h M © CL © ©N C CL rt- X I
H W- rt 3 3 -ti <A 3 ta CA h - I—
1
CA —
( rt- M -+1 J— O © C
H- © rt-
O rt- • ta ©< r~ 3 H« 3 O T3 O r~ O h- * TJ ©rt- •
O CL H- Q 3 3 ©
3 CL 3 ta MC O C 3 73 © 3" O H« © CQ O © CA O © O 3 3
û . Q. © CL ©
o © © H« O TJ 3 ta
©x t— 3 3 C C
cr
CL CA CA © H - 1— ©% rt rt- en -
<z r- c a> f - a m
©» © CA 3 © © CL o © 73 r- o C Si •1 Si CA H © n © O «% O r©
-u H« « © O m 3 © Q C H m H- C 3 •1 H rt- CA 3 Si CL O CA
o O TJ 3 TJ c O <
a ta r - ®% —c3 Q Q ©N © © TJ O C r- 1 CO Q < rt-
© en C a h
3 © M TJ H 3 ta *i <
Q <
D CL Q © rt- 3 M CA rt •1 3 © O
<
a h - CL © 3 3
Q. O M ta
©» H« h-> <
Q o--o H- H 3 © Q rt- H« 3 H» ta H" m © CA © O © CL en *• ©.
Q rt
rt-TJ © M 3 © H N H Q H» rt-
H« H * • O ©N © CL C L CA Q rt
H* C O © M TJ rt-
3 (D H r" ui h» ©%© cr O rt- -h O © 3 © h" H« % TJ CO 3 0 H 3 rt- f— O 3"
H» %
• © rt-
© Q O i— cr Q 3 3 O co ta (A - h CL © flK 3 3 CA C L © CL O — Q C O
rt-
<D " D <t>> X t 3 TJ CL H '
cr © h- rt-
O •O Q ta CL -h O 3 •1 o ©% CA H« 1— O 3 H CL
O C O h r - © TJ © C O ta rt- 3 CL 3 © rt-
H- ON 3 H- © O r- 3 O TJ ©
rt
û . "D ©% M - r- •o ©> © H- ta r+ 3 © ^ H« © 3 •-t CA Q O <
o en © » 1— M> rt-
© 3 1— 1— Q en
<D C H- ta o -h CL © rt- T J ta -h CO O © CL t— H* O ©»*< C C
en » © 3 M- ta
O Q rt- CL
H- Si r- O -h -+1 N I 3 rt- h < © © CL C rt-3 3 CA © CA TJ
(-•
D O M a rt- TJ O M - C•• Q C (A C © ©% O N5 © rt- rt- H M- c CL Q O CA © O Qrt- CL
©
CQ i + M O H* O H» rt- (A
O 3 3 A ©> •1 M h O © O M CL 4 O « M- ^
H H 3
»1 H - H - rt rt
O 3 O ta H © Q •1 ta © 3 ta CA H - © CA cr O rt-
3 CA^ rt- 1—
O O 3 CA r- rt- rt
Q Q r*- JQ 3
ffl' M h - H« 3 - rt
O 3 © H 0) ^ CA © ©•>h- O © rt-
t— rt-
3 3 Q C O C H' C D © D H- 3 <
O © -«• 3 CO CL © O C © O rt CL X I D «
a. CQ X rt
H» 3 © ta rt-
© ta
©s *< (A C 3 © rt- r- 1— TJ © O © i-j • (Q CA Si CA © C 3
(D H- rt-
H - •o H« O C ta
© © (A rt © Q t— O CO H* C H« rt en Q r-
m
C 3 JQ •D O Xt o 3 h- C ta ta •H>1 ta
H- O rt- C rt- 1—TJ -h Q Q< > -Q Q CA CA O * r- co
•1 -h C m C c (A « a (O r- *• ta - l°a H^ C O 3 TJ H - C TJ © ©s « O 3 x:
CA H* O a> © 3 ta ©<. •D H©N © ta
rt- 3 H- o O CL * O J— H CA rt-
•1 H - 3 © TJ H V" rt Q u%
3 u> © C ••W H (A O O H« 3 © H« O \ta ta ©< O Q 3 ©s O en CA © 1— H - Si !-• J— ta
© m
h" M* 3 r- O M" H»< C r- -h O r- n 3 c 3" (A 3 © •* O 3 H- h- © © C ta © TO
3 (D Os-a 3 (0 © h- h" rt
H- H' 1— o O 3 O rt-
r" 3 h- H - CA O ' t— CA CA © -» CA i-i
CL rt- (0©
O ©— Q H« C 3 O rt-
O © o © H H <H- O rt- © TJ -» © O ta m
H» ^ r- ta h rt- cr rt-
© Q ta Q 1— 3 © a © © 3 CA 1— - h h - H h - h CL 3 o O D rt tn
O h- ta CL (O H« •1
© 3 <+
H' O ta <A 3 H- CA 3 CA \V O © Q m 3 O
<
H» (D
o rt- © © ©> h- rt- JQ H «rt- <Q C L ta
«v • I TJ Q Ô rt-
Q rt CA H « 3
o o
•1 O © « 3 3 H- rt
W
o
3 »taJ» X 3 H- ta rt- OM C O H« © rt-
Q H © © rt- C L CA O 3 CA CA 3 CA © CA en
a. (D— "O Q 3 © ©% Q' 3" O © 3 Si 3 ©-. •1«
H (A O CL h " rt-
H- © O © CA rt-
cr H-
P
I-I
c en rt- ta rt rt
(D i+ -a o 3 Q 3 H ©N Q (Q C O a © rt- © -h C O 3 © 3 CA 3 © CL C L H *
J— l C H O 1 a h- cr H» • © © •o © CL H - -h 3 Ort 3 3 rt- H
a>> Q © © ' Xt 1
Q' (D H- •o
r- r- a .a H« X n (— 1
© CL ©x © rt- TJ H
a. TJ CA h
c H
!-•
© 1 rt-
© (A ta © © ^ c o ta ©N ta H » Or- <
© © « *i Qrt- ta C ©% r" a.Q TJ < © ©
en CL M H -* 3 ©o o rt-
C © o H« o *• ©%rt- H» h-' 3 O © CA C Si 3 H •
c © © J— P
H» Q Q a *» © 3 © 3 H - CL 3 Q © O 3 ©^ X C © O 3 en H « H - rt <
Q CL
û. H O C t— 3 rt-
©s 3 H--0 rt-
© CLTJ © Q 3 3 •1 © O O O •1 m ta m
< •si rt- o rt- 8
© © M O © H-* © H - H « (A rt- TJ © H- 3 en C t— © s 3 Q H« C M
CA ©* 3 rt- •1
t— rt- M - © CL rt- rt-
O © O rt
H« ©» •1 H« O O 3
a
TJ
h ta •o c < en © © < ta cr
C H 3 © t-< Q. 3 O 3 C H - rt-
O T3 t-
t 3 Q CA 3 CL H © 3 3" H- © T>
3 3 H- © © -h © rt CL O O «* TJ C © O CA H - H - CA h - O
a Q O ©
cr
r- r-
c
8m
(D © o © ta
©> ©> H 3 ©> 3 C rt- ta
1— ©0 (O ©N X •1 CL l— C © © © 3 t-' © 3 1— co
3 ©» M 3" ta M ©<. © O •o
C •1 H - M O H- © 3 3 C O rt-
rt- H - X I CA O X
cr O O 1— 0 rt- MH « h" O rt- rt
H h- r- 3 r - H- Q 3 M 3 3 l-> 3 O O H H- H- 3 cm 3 C
h 3" cr 3 © <
Q © 3" CL © Q r- Q © ^ C O O Q CA © h-«< O 1— Q a 1— ©
(D Q u U ta
© a (0 h- C Q 3 © ta © rt- — C H- © CA H « © T J CQ 1 — Q' ©' 3
en 3 n O H» © M Si C — (Q (A CL rt-H - ta n en rt 3 Q O CL 3 3 O H- O O rt •—
©o h
<+h 3 X CL C © C 3 ta
O © © O O O © CA T J 1— © CL Q 3 C JQ 3 I— C L Q © rt-
a . M- C © M © H- CL 3 h- Q CL © TJ O CA C © nC en O © Q
© H - ©% < ©> • (A Q' O CL O -h H- TJh © 3 Q CO Ort © IQ CA rt-
H O C
J— © C « CO co O rt- © H « ©s ta 3 © cr • 1 1— T J h-" l— ta o CL H» O O X
r-> O rt-
© 3 O 3 r- 3 CL T) M- 3
Q -h i— rt- JQ H © O CL 3 " © Si ©> H« 3
Q 3 m 3 © o ta < < © © h-" C L (th. © © c ©% • t (O C oO rt- C O © O
o CL ©%
ferf*
•a (AH - •X3 •13 H' C O rt- Q 3 © O H» ^1 C TJ © 3" CA © < cr
(D H» C O rt ta
O C *"
3 c <+ o O O rt- © < TJ Q H»
*—•« -Q CO c rt- O CA Q 3 CA
•D
O X «+ © 3" H - <Q •D N © <H - s : 3rt- H
o 1— O 3 •• TJ O C © TJ 3 • Q ©
i+ O rt-
Q •1
©s O 3 © ©
•1' C 3 (O O © C rt- o H« 3 o
© ©N C CL cr H
•o
C H c ©» 3 C © © r- •a •»
H rt- H « •t Q
%_*• D O h- O H« rt H r-
t— Q 3 X CL • • rt© O ©s 3 J3 ^ (-•
© •-» Q' H Qrt- <
!-••
• Q 3 3" Q H« h - O ©
*W
<
a
Q H- rt
Q rt-
H» ta ta O a ©> c © ^ 1—' rt- © 3 3 Q r- c
rt- ©% H « M CL ^ 3 C• 3 ^ rt-
H- 1— h © 3 ta3 © CL O h" H IH ©N 3 1— © rt- <
O © rt-
h"
rt
M- o h- © O Q (A * 1 rt- 3 Q © © O <
1— H - © rt- O 3 3 rt
© J— O
O CL 3" rt
O
o © > 3 O ta
3 cr © ta
-h O H CA 3 • © H- 3 CA -h h- 3
3 Q H« 3 ta o3 ©3 © 3cr OH - i— © a. a H * CA rt-
H CA en © M C L H * CA «+ O © CA
C — 3 3 TJ 3 ta © 3 © H« a CA O 2 3 © TJ H - h- CA
H- 3 - h CL © ta (AC t-i© rt- 3 rt-
©N © ta H - <b> 3 © O TJ O (-' •O CA CA O
«+ •1 ta « i rt-
3 (D H- H- ©% H- O O © Q h- o CL rt- rt- H 3 H- © O 3 C CA CA r -
-h t— 3 C — f) h- CL O H- 3 Q H« © © H« rt CA CA C Q (-• -a C ^ © H«
H- H- 3 1— Q rt-
© © 3 rt- H < 3 3 H © CL rt- H H o O CA < 3
1 O © © 1 rt M» J3 CA © ©s
c H' Q
3 H- CA c •t 1 1
1
LES SERIES CLIMATOLOGIQUES
1.1 La distribution de fréquence
La distribution de fréquence est le moyen fondamental pour décrire et ana-

lyser une population. L'analyse consiste à estimer les caractéristiques de la dis-
tribution de fréquence de la population à partir de l'échantillon constitué par la
série climatologique. Pour cela, on répartit les données en intervalles de classes
qui sont des divisions du domaine de variation de la variable climatologique. Le
nombre optimal de classes est de 10 à 20. La différence entre la plus grande valeur
et la plus faible valeur de la variable est donc divisée en 10 à 20 intervalles
d'égale amplitude. Le procédé de partition est facilement illustré par l'exemple sui-
vant dans lequel on considère le total des précipitations (en mm) du mois d'août à
Genève. On partira du relevé des 30 ans 1927-1956 donné dans le tableau suivant :
TABLEAU 1
Précipitations d'août (en mm) è Genève (Suisse)
Année P Année P Année P

1927 250 1938 79 1949 49
28 147 39 85 50 110
29 83 40 18 51 100
30 108 41 105 52 125
31 171 42 48 53 57
32 62 43 41 54 206
33 67 44 44 55 107
34 119 45 133 56 144
35 157 46 158
36 23 47 54
37 78 48 72
Pour trouver l'intervalle de classe de la série climatologique, on opère

comme indiqué:la valeur maximale est 250 mm, la minimale 18 mm, l'étendue de
250 - 18 = 232 mm; 20 mm convient comme amplitude de l'intervalle de classe, puis-
qu'il en résulte 13 divisions. La répartition en classes donne le tableau suivant
des fréquences f correspondant aux précipitations p.
TABLEAU 2
Distribution de fréquence des précipitations d'août à Genève
P f P f
0-19 1 140-159 4
20-39 1 160-179 1
40-59 6 180-199 0
60-79 5 200-219 1
80-99 2 220-239 0
100-119 6 240-259 1
120-139 2
En pointant ces fréquences, sous forme de petis rectangles verticaux de

hauteur proportionnelle à f, on obtient l'histogramme des précipitations du mois
d'août à Genève. En outre la division de la fréquence f par le nombre d'années de
la série (ici 30) donne la fréquence relative des précipitations de chaque classe.
Ces valeurs empiriques sont des estimations des probabilités de répartition des to-
totaux mensuels des précipitations dans les diverses classes de la population.
1.2 Distribution cumulée
Le climatologiste est plus souvent appelé à estimer des probabilités rela-

tives à plusieurs intervalles de classes, ce qu'il obtient plus facilement à par-
tir de la distribution cumulée. Celle-ci fournit d'ailleurs de meilleures estimations
de la probabilité car la division arbitraire en classes, comme au tableau 2, néglige
une partie de l'information fournie par la série. Pour obtenir la distribution cumu-
lée, il faut d'abord ordonner les données comme suit :
TABLEAU 3
Distribution cumulée des précipitations d'août à Genève
m P P m P P m P F
1 18 0,032 11 72 0,355 21 119 0,677
2 23 0^065 12 78 0,387 22 125 0,710
3 41 0,097 13 79 0,419 23 133 0,742
4 44 0,129 14 83 0,452 24 144 0,774
5 48 0,161 15 85 0,484 25 147 0,806
6 49 0,194 16 100 0,516 26 157 0,839
7 54 0,226 17 105 0,548 27 158 0,871
8 57 0,258 18 107 0,581 28 171 0,903
9 62 0,290 19 108 0,613 29 206 0,935
10 67 0,323 20 110 0,645 30 250 0,968
Les valeurs F sont les fréquences relatives cumulées qu'on adopte pour
estimer les probabilités cumulées de la population. On les obtient par :
m « . , , ième
F = où m est le rang de la m valeur dans la liste des valeurs ordonnées
rT+1
selon les grandeurs croissantes, n le nombre de termes de la série climatologique
(ici 30). On divise par n + 1 au lieu de n pour avoir une meilleure estimation des
probabilités, en particulier aux limites de la distribution. On peut montrer que
m
donne la meilleure estimation simple de la probabilité.
ÏTTT
Les valeurs de F indiquent les probabilités que la précipitation soit infé-
rieure à une des valeurs p quelconques figurant dans le tableau. Par exemple, la pro-
babilité que p soit inférieure à 62 mm est F = 0,290; la probabilité que p soit supé-
rieure à 62 mm est donc 1 - F = 0,710. On notera que, si les probabilités sont estimées
pour une variable aléatoire continue comme les précipitations, ce serait méconnaître
les principes de l'échantillonnage que de parler de valeurs "atteintes ou dépassées"
ou "inférieures ou égales à", car la probabilité d'occurrence d'une valeur donnée

exactement est nulle. Mais on peut dire que la probabilité que p soit comprise
entre 62 mm et 125 mm est 0,710 - 0,290 = 0,420.
Ainsi, la distribution cumulée fournit non seulement toute l'information

disponible dans l'histogramme, mais, en plus, elle utilise chaque valeur individuelle
de la série pour l'estimation des probabilités. La distribution empirique cumulée
peut également être portée sur un graphique en pointant F en ordonnées et p en abscis-
ses et en reliant les points par des segments de droite. Les séries climatologiques
de variables discrètes se prêtent au même traitement.
On peut proposer un autre exemple de la même analyse pour les températures

moyennes d'août à Genève. La série a été ordonnée selon les grandeurs croissantes
dans le tableau 4.
TABLEAU 4
Température moyenne (°C) en août, à Genève
m t F m t F m t F
1 16,9 0,032 11 18,6 0,355 21 19,8 0,677
2 17,4 0,065 12 18,7 0,387 22 19,9 0,710
3 17,5 0,097 13 18,7 0,419 23 20,3 0,742
4 17,8 0,129 14 18,9 0,452 24 20,4 0,774
5 17,9 0,161 15 18,9 0,484 25 20,7 0,806
6 17,9 0,194 16 19,2 0,516 26 20,8 0,839
7 18,1 0,226 17 19,3 0,548 27 20,9 0,871
8 18,3 0,258 18 19,5 0,581 28 20,9 0,903
9 18,5 0,290 19 19,5 0,613 29 22,0 0,935
10 18,6 0,323 20 19,7 0,645 30 22,9 0,968
On remarquera, puisque la longueur de la série est la même, que les valeurs

de F sont les mêmes qu'au tableau 3; elles s'interprètent de manière identique. La
probabilité que t soit inférieure à 20,3°C est 0,742; celle d'avoir t > 20,3°C
est donc 1 - F = 0,258. L'intervalle moyen de récurrence (ou durée moyenne de
retour), c'est-à-dire le temps moyen qui sépare deux occurrences d'une valeur dépas-
sant t est r r77y Ainsi pour une température supérieure à 20,3°C, l'intervalle
moyen de récurrence est 1/0,258, soit environ quatre ans.
1.3 Homogénéité d'une série de données
Une série de données est dite homogène si elle est un échantillon d'une
population simple et unique. Puisque, par définition, une série climatologique est
homogène, l'analyse élémentaire des probabilités s'applique seulement aux vraies
séries climatologiques. Les séries précédentes de précipitations et de température
ont naturellement subi un premier examen avant d'être acceptées comme homogènes. Si
une série n'est pas homogène, il faut lui apporter des retouches pour que les estima-
tions statistiques qu'on en tirera soient des estimations valables des paramètres de
la population applicables aux derniers termes de la série ou qu'elles correspondent

aux estimations tirées d'une série homogène hypothétique comportant comme éléments
les données les plus récentes.
Si l'exposition des instruments a changé, il est nécessaire de vérifier,

par des tests statistiques, si l'on peut encore admettre l'homogénéité. Beaucoup
de méthodes anciennes pour tester l'homogénéité étaient incomplètes en ce sens
qu'elles ne fournissaient que des critères inadaptés à l'acceptation ou au rejet de
l'hypothèse d'homogénéité. La méthode la plus appropriée consiste dans l'application
d'un test statistique d'hypothèse qui permet de supposer l'homogénéité (hypothèse
nulle) et fournit une règle pour accepter ou rejeter cette hypothèse sur la base
d'une probabilité d'occurrence. Si la probabilité d'évidence de l'homogénéité est
faible, on conclura que la série est hétérogène. Si cette probabilité est élevée,
on admettra qu'il y a homogénéité. La règle doit préciser une probabilité limite
(niveau de signification) au-delè de laquelle il faudra rejeter l'hypothèse de l'homo-
généité et rechercher l'explication éventuelle de l'hétérogénéité. Dans la plupart
des cas, il sera difficile de spécifier la loi de probabilité sous l'hypothèse nulle
ou les causes possibles d'hétérogénéité; c'est pourquoi on doit le plus souvent uti-
liser les tests dits "non paramétriques".
Les cas de non-homogénéité dans une série de données météorologiques pro-

viennent le plus souvent de modifications de la moyenne, d'une tendance ou de quel-
que autre forme d'oscillation. Etant donné que ces phénomènes, particulièrement le
dernier, sont difficiles à mettre en évidence de manière précise, il vaut mieux uti-
liser un test non paramétrique qui n'exige pas une spécification exacte des formes
d'hétérogénéité ou de la distribution nulle. Un test bien connu, sensible à ces dif-
férentes alternatives, est le test des suites (séquences). Ce test s'opère en comp-
tant le nombre de suites u formées par les valeurs plus élevées ou plus basses que
la médiane (valeur située au milieu de la série des valeurs ordonnées) et en véri-
fiant le caractère significatif de u à l'aide d'une table de distribution de u.
Appliquons ce test aux températures moyennes d'août à Genève. Celles-ci sont don-
nées dans l'ordre chronologique dans le tableau 5.
TABLEAU 5
Suites dans la série de températures d'aoOt à Genève
1927 17,4 B 1942 19,9 A

28 20,9 A 43 20,9 A
29 18^7 B 44 22,9 A
30 18,7 B 45 18,9 B
31 16,9 B 46 19,2 A
32 20,8 A
33 20,4 A 1947 22,0 A
3* 17,9 B 48 18,9 B
35 18,1 B 49 20,7 A
36 18,5 B 50 19,7 A
51 19,5 A
1937 19,5 A 52 20,3 A
38 18,6 B 53 19,8 A
39 18,6 B 5* 18,3 B
4o 17,9 B 55 19,3 A
41 17,8 B 56 17,5 B
CLCfi O © (Q (A Q' H J3 C rt- Q_-o o C « + « A H- rt- h-l (A H « I - ' Q '
O © > © tn H « I— C 3 H» Q © O 3 © © % © H* M C S ©
3 3 «+ .a O © - © O 3 rt- C © 3 H 3 0 H« - H rt- 3
3 ©%-Q C (fi
3 Q C O 3 O W«-0 O H- û . 3 © rt-©%rt-H<
<th. H - C ^ (D H- H- 3 rt- © rt- C - h © © fi -
(A
( A © H H I
© H« © -h O © Q C © K| Q « 3 rt- (A H - © O
tn rt-
©> 3 tn Q CT 3 © © H* Q . O rt- © 3-
O *• O •* H * H« rt- J3 •
C O
CT - © Q O fi' C > ©
a. a O Q' "O © J3 C f C > 3 M H
Q -ti m 3
(fi fi. rt- O H C I — © © 3 1—0 0 . 0 0 . © I— H -
3 m 3 -h C H « <D i- H* fi. © Q (/)
CA (A © © 3 C h H- Ht « © 3
«+ (D © O 0) © •• H« - a CA tt l-f 3 CA ©
Q 3 -h 3 w c H O H* O.
H- 3 <+ Q rt-
1 O Q' ©
rt-• rt- 3 l-'Q.cr©^ H* O M "• - J0 JQ 3 < 3 rt-
Q rt- © % M- Q' O' O
(A
©x B H- H- 4 Q C T O C C C CT H - Q rt- fi
rt-
Q. (A © H- - Q H* (A 3 - ©
Q- O O h- 1— H» © fi i— H cr
O
a. 3 rt- 3 © - O C T M H * ©
O H» C Q. H- © û © © h-
3" ©•«H 4 H « i— o 3 a. H
cr 3 3 © N a 3 3 C ©
3 (0 O
Û . I — Q . (A o o M a 3" © • a
1— © . H t—
H « 0 " © N © 3 CTH'rt-C Q rt-CA
© flK H' H * H- tn
£a c a a c
Q C - b H O r t - H - 31-1 Q . CA CA
a O •o 0 \ Q. CD © 3 rt- H« Q 3 CT <6\ O <Q O CA O H«
O -Q r- rt- 3 © 3
a o (A © 1 — 3 - H« 3 Q © "O C 3 Q CA a . o
O C © cr -h rt- O H - O Q t-> O . * . .
(6 M 3 H» < 3 C © 3
h H- H rt- hc oa. fi. O 3 © O H- ©
•-i ©» rt- 3 H« 3 C © "D rt- O © "D ©» C rt-
00 —1 a» \jt ro H- O >* M 9* O • 3 "O rt- 3 3 © © H
© O
o JQ H M 3 <A 3 û. CA Q <D\ 3 H - © rt- rt- «A H- h X il
CA C 3" Q. C ©• © (fi 3 © H - CA O 3
T3 O (A
a
(A rt- ©
a m • Q © I - fi. © 3 < T B Û . rt- rt- J3 © C CA J3
O 3 o 3 p - ©N Q . CO | © »-f ©
O (A (—
© H V-1 H- H C (A H O C
3 © o c H H» Q C A C Û H © i + Q . I - J
O. M © (Q © Q •o
H tn VD 00 M O 3 O - © H» © m
o vo O c C © "D ©> © \ 4A CT I-" O "O H - CA CA rt-
© 3 »o C » T 3 © H < f i ' 0 ©
</>
3 rt- CA © Q. rt-
H»
o h- rt- Q Q 3 *-> ©> M
3 Û H Q »3 cr cr a n Q'ho
C CL 3 (D (A fi- H « H» O I— H« O h>. Q C A © H - 3 H O * < C
tn
<+ 3 «A -h 3 O O >û
o- to ro M H H1 H 3 m
Q © O« <+
(D Q H- H- 3 CT m o o C 0 3 W 3 I — IMt 3 Q (-••. g
O Vf) 00 •tr VI t-t
C (Q M» h- Q. H Q. h- O 3 O û . © c+ N« CL CT © 3 Q O ©>
X < (A H^ rt-
© C © © h - rt- 3 3 © 3 - « rt-H* © H 3 o S Q. m
< 3 . H-
O •1 •1
Q M- H - a Q (A © H- © Q . CL ©3 ©s 3 Q I—• © Q C© A ©x
to
3 H »1 © 3 3 rt-
(B> 3 o o I— C Q
O H- (A Q. H« O O © 3 3" © - rt- p . CL © © CA Q . 3
rt- (A CD a CA o fi - © H- Q . H- O ©
3 D Q> (D © 3 3
(A CA "O rt- Q . 3 CA < t- Q CA © O H* Q O
cr o- -h o- Q. C A
h h- (D •o
H ©s n Q © O C O O Q CL C -*» H- CA 3 3 (A
© M O . (Q "O H - 3 ©N rt- © CA ©
CD © 3 "D Tï »1 a n
CA
o < Ml 4P 4, ro Q O O ©'"O H < "O O © O
cr Q O H- S* ro <
< C © O « O Ml o io >* H* 3 © 3 O •o Q fi O H 3 tn 3 I— CA
a. t— o l II I— « C Q CA
© H C O ( A 3 © <e C © n t-> © r*. P
H « CA cr H »
O ©> rt- "» © 3 C © CA h rt- Q rt-
3 (A Q 1— Q H © »
CT o © 3 © © (-t © rt- C © CA CD © rt- C
rt- > p -D C CA O h 3 rt- rt- CA (-• Q ©
H H» © 8
o <a Hh -- cr
- H t-
o IO IO rt- - J3 © CL C © O"
O ©• 1— a © t-1 o\ IO ON M tn I— Q M
•1 «+ H*
S « © C rt- 3 © W © TJ fi. rt- h-1 ©
H ©% c o O © »1 H H rt- . O 3 C © rt- ©
© «A - (-• «A 3
m rt- c (A e+ o (D rt- H- O rt- h- a rr H - ^ H O rt-
©N o (A 3
•* 3 3 I-- 3 I I— C - h Q "O CA > © C H S
(A c rt- C
ô -h O © Q. fi' ©
H O < Q «O M ©
(D
a. h - a a. "TJ-O V/l » ro ro m
o •o ©^ 3 I V: rt- Os h" 13 O © CD U l
3 © ©. i5 >ft \s VI VD - >
3 * (A a.
O CT rt- 3 û. CA © © CT CC\ 3 r*- - h-
(D h Q ©- r" Q O H I— H 3 3
rt- 0 ) *< t— © ©« 00
-o © O" O »1 p . H«
fi.—II NH « "D © h" © CL-O Q . rt- O -
1— < o H « o Q O © C _ M © © H- rt- C O - O H H» C © Ct 3 <0
Q Q 3 © •D C ^ 2 © CA
H- rt-
3 " H» 4 «• 3 C CL H- 3
4 © > Q CA H O "D © H O © I— O
•D © ©' •o
H- Ô © tn C O CA 0» . Q C A 0 0 rt- fi ©
C (A ©rt- rt-
Q H-
3 - «+ H-
h • Q- I-" CA O C O © H* CD O H CL
(D Ut H" O
o 0n
cr 3 Q fi.
©
© O l-l C H« CA A C CA O X
• © © M 3 O c H» 3 O 0 0 O ©> O H"
Q (A O 00 < h-Cfi Q . 00 3 CA 3 NO
a C
a.
© rt- tn
M - (b
C <
o- m Q h - CL Q h O O "U CA -» (A © O -
i— 3 ©•. O tn h»» r— m © - «+ û 3 O «O © «+ CL rh h IO
rt-
H (A H * 3 (Q rt- © rt- C I— 3 O H O H © - X» H* < Cl •
•— rt-
H* H » (D H - © > (A 1 — 3 Q c+
C Q H 3 O fi. © H 3 (0 3 C C rt- © % - * ,
a»' 3 H « M» cr h 3 © © 3 © © 3 O 3 M. C © -h
rt-
© » h JQ (fi 3 (D 3 3 -h CA c+ O O CA © TJ © © CA © <D -n
(D C M- 3 <D> H « I - . o
© CA © -h O
O T3 O CA C X I h Q O > S Q -^ a
(0 rt- rt- (+ C
_
A Q. C O C O O Q h CA > rt- c ©%«o
H - (A © » (D Q O H "O H« C 3
Q- M O O (A O "» X o
<+ -* rt- 3 CA _ C rt- rt- 3 CL I— M 3 I —
© Q H H- fi. 3
h- — ©» 3 H- © (D - Q © I— © © CA
3" H« O O
Q rt- I ©> D ' Q 3 "D Q' © H * rt-
O H^ H - h- Q . 3 Q. I I I— X
C 3 O O a fi n
o C H« i • Q Q'
O 3 1 CA CA
1 3
O
plus proche de 0,10 ou 0,90. L'écart maximal par rapport aux probabilités exactes
est t 0,03. Si la valeur trouvée pour u est inférieure à la limite inférieure,
l'hétérogénéité est imputable à une tendance ou à un glissement de la moyenne; si
elle dépasse la limite supérieure, il faut penser à des oscillations.
Pour donner une application de cette procédure, on a délibérément rendu la

série du tableau 5 hétérogène en retranchant 1°C des valeurs de chacune des 12 pre-
mières années de la série et 0,5°C pour chacune des huit années suivantes.
La série ainsi dégradée est donnée dans le tableau 7.
TABLEAU 7
Série hétérogène de la température d'août à Genève
1927 16,4 1934 16,9 1945 18,4

28 19,9 35 17,1 46 18,7
29 17,7 36 17,5 47 22,0
30 17,7 37 18,5 48 18,9
31 15,9 38 17,6 49 20,7
32 19,8 39 18,1 50 19,7
33 19,4 40 17,4 51 19,5
41 17,3 52 20,3
42 19,4 53 19,8
43 20,4 54 18,3
44 22., 4 55 19,3
56 17,5
On a vu, au tableau 5, pour NA = N_ = 15, que u =15. Les limites

A D
extrêmes de u pour N. = 15 sont fixées, dans le tableau 6, à 12 et 19. La valeur
u = 15 étant située dans cet intervalle, elle n'est pas significativement différente
de celle qu'on peut attendre d'une série homogène et on admet donc l'homogénéité de
la série de départ.
Le tableau 7 montre que le nombre de suites est réduit à 11 par les deux
déplacements de la moyenne qui produisent, en effet, une sorte de tendance. Au
tableau 6, pour N. = 15, la probabilité d'avoir moins de 12 suites est 0,10. Comme
le tableau 7 n'en fait apparaître que 11, le test indique qu'il y a hétérogénéité.
On le savait, naturellement, puisqu'on avait provoqué artificiellement la rupture
d'homogénéité. Mais on soupçonnera, à partir de cet exemple, et on n'aura pas tort,
que l'aptitude d'un test de ce genre n'est pas très bonne pour trouver l'hétérogénéité
quand on ne connaît pas ce qui peut être la raison de la non-homogénéité. Ceci met
en lumière un point très important: le meilleur moyen de déceler l'hétérogénéité
est de bien connaître l'historique de la série d'observations pour voir si on risque
d'y trouver des raisons de douter de l'homogénéité. Si l'historique permet de mettre
en évidence des changements susceptibles de rompre l'homogénéité et si on peut préci-
ser la nature de ces causes et la période qu'elles ont affectée, des tests paramé-
triques plus puissants, t de Student, peuvent être utilisés pour déterminer la
signification de l'hétérogénéité. Mais de tels tests ne peuvent servir que si on
connaît a priori les périodes affectées par l'hétérogénéité et la nature de cette
dernière.
8 LES SERIES CLIMATGLOGIQUES
1.4 Ajustement des moyennes climatologiques
Le manque d'homogénéité d'une série de données climatologiques est généra-

lement dû à des facteurs de dérangement tels que le changement d'emplacement de la
station, des modifications d'exposition, etc. Bien que des essais aient été tentés,
dans le passé, pour homogénéiser des séries présentant de telles anomalies, il faut
bien se persuader qu'il n'est pas possible d'homogénéiser une série au sens où l'on
prétendrait la remplacer par une suite de valeurs individuelles ayant les mêmes pro-
priétés qu'un échantillon de la population hypothétique exacte. En d'autres termes, si
des données sont inexistantes pour une période particulière d'observation, il est
impossible de reconstituer les termes individuels de la série pour cette période.
La raison en est qu'un ajustement, quel qu'il soit, perturbe la variabilité et change
par là même l'échelle ou la dispersion de la distribution de fréquence. Il est
cependant possible d'ajuster certains paramètres statistiques de la série de telle
manière que les valeurs ajustées soient en effet les mêmes que celles qui auraient
été obtenues à partir d'échantillons tirés de la population hypothétique correcte.
L'application la plus courante de ces ajustements concerne les moyennes des séries
de données dont on se propose de déterminer les normales. Il est recommandé que de
tels ajustements ne soient faits, si possible que sur la base d'hétérogénéités con-
nues a priori.
On peut montrer par l'analyse théorique que les méthodes classiques des
différences et des rapports sont pratiquement optimales pour l'ajustement de moyen-
nes de températures et de précipitations. Ces ajustements sont souvent opérés pour
compenser des lacunes dans les observations ou corriger des hétérogénéités. La
méthode des différences utilise la différence entre les moyennes de température de
deux séries concomitantes comme facteur à ajouter b la moyenne de la série dispo-
nible. La méthode des rapports utilise le rapport entre totaux ou moyennes de pré-
cipitations de deux séries concomitantes comme facteur multiplicatif du total ou de
la moyenne de la série disponible. Le mieux sera d'illustrer ces ajustements par des
exemples.
La méthode implique la comparaison avec une station voisine ayant simul-

tanément recueilli des observations homogènes. Cette station doit être aussi voi-
sine que possible de la station pour laquelle il faut faire l'ajustement, car l'effi-
cacité de l'ajustement dépend de la corrélation entre les deux stations. Habituel-
lement, une station située à moins de 80 km, mais jouissant du même régime climatique,
offrira les conditions requises. On peut aussi prendre la moyenne de plusieurs sta-
tions et l'utiliser comme série de comparaison, mais ceci généralement n'accroît pas
la corrélation de façon appréciable. Si une seule station de comparaison ne procure
pas une série complète, on pourra avoir à procéder par étapes, une autre station de
comparaison étant utilisée pour chaque période d'observations disponibles.
1.4.1 La méthode des différences
Dans le tableau 7, on a délibérément provoqué l'hétérogénéité dans les

relevés de la température moyenne en retranchant 1,0°C pour chacune des douze premières
années, 0,5°C pour chacune des huit autres et laissant le reste inchangé. Supposons
LES SERIES CLIMATOLOGIQUES 9
maintenant que, durant ces deux premières périodes, la station ait changé de place
ou subi des modifications d'exposition des instruments et que nous désirions adapter
une moyenne de 30 ans aux conditions d'observation des dix dernières années. Voilà
le problème d'ajustement typique. D'autres arrangements de l'hétérogénéité dans un
relevé de données peuvent être pris en considération par de simples variantes de la
procédure.
Pour ajuster les moyennes de température et de précipitations des relevés

de Genève, en se donnant les valeurs des périodes hétérogènes et celles de la période
homogène, on a trouvé commode de choisir Lausanne comme station de comparaison. Cela
ne signifie pas forcément que Lausanne soit la meilleure station de comparaison pour
Genève; elle suffira ici à servir notre intention d'illustrer le procédé d'ajuste-
ment d'une hétérogénéité reconnue. La formule d'ajustement pour la température est
y = a + x (1)
x est la moyenne pour la période homogène à la station de comparaison correspondant

à la période hétérogène de la station pour laquelle est fait l'ajustement, y est
la moyenne ajustée. La constante d'ajustement a est estimée par l'équation
a = v - u (2)
v et û sont les moyennes pour une même période de relevés homogènes simultanés,
respectivement è la station de comparaison et à celle pour laquelle il faut faire
l'ajustement. La procédure d'ajustement de la température consiste donc à estimer
a en utilisant les relevés homogènes faits simultanément à la station de comparai-
son et à la station, à ajuster et à porter cette valeur dans l'équation (l) pour
obtenir la moyenne ajustée y. Les moyennes y, estimées pour les différentes parties
de la période de 30 années sont ensuite pondérées proportionnellement à la longueur
des séries partielles et il ne reste plus qu'à faire la moyenne sur 30 ans.
Les moyennes de chaque période, tirées du tableau 7 rendu artificiellement

hétérogène, figurent dans le tableau 8.
TABLEAU 8
Ajustement de la température moyenne à Genève
Lausanne x Moyenne non ajustée Genève y

de Genève
1927-38 17,9 (17,9) 19,3*
1939-46 18,4 (19,0) 19,8*
1947-56 18,2 19,6 19,6
Moyenne ajustée des 30 ans 19,5*
10 LES SERIES CLIMATOLOGIQUES
En portant les valeurs homogènes de û et v dans l'équation (2), on a une

estimation du facteur d'ajustement a = 19,6 - 18,2 = 1,4. L'équation (l)
donne alors:
pour 1927-1938: y = 17,9 + 1,4 = 19,3*

pour 1939-1946: y = 18,4 + 1,4 = 19,8*
En multipliant respectivement par 12, 8 et 10 les y des trois périodes,

faisant la somme et divisant par 30, on obtient la valeur 19,5*, estimation de la
moyenne ajustée de la température moyenne d'août à Genève. On remarquera qu'elle
reste comparable à la moyenne réelle 19,3 de la série non perturbée. Le procédé uti-
lisé donne la meilleure estimation de la moyenne 1927-1956 à Genève à partir de la
période de relevés homogènes 1947-1956.
1.4.2 La méthode des rapports
Pour donner un exemple d'application de cette méthode aux précipitations,

on a détérioré les relevés 1927-1956 de Genève en multipliant par 1,20 les données de
1927-1938 et par 0,90 celles de 1939-1946, sans toucher aux dix dernières. La série
hétérogène apparaît dans le tableau 9.
TABLEAU 9
Série hétérogène des précipitations en aoOt à Genève
1927 300 1936 28 1947 54

28 176 37 94 48 72
29 100 38 95 49 49
30 130 39 77 50 110
31 205 40 16 51 100
32 74 41 95 52 125
33 80 42 43 53 57
34 143 43 37 54 206
35 188 44 40 55 107
45 120 56 144
46 142
Avant de procéder à l'ajustement, il est facile de vérifier l'homogénéité

de la série, ce qui nous donnera l'occasion d'utiliser à nouveau le test des suites.
Ce test est naturellement inutile, puisqu'on sait qu'on a introduit des hétérogénéi-
tés. On trouve ici immédiatement que la médiane est 97,5. En comptant les suites
dans le tableau 9, on trouve u = 9, ce qui situe u hors de l'intervalle (12, 19)
indiqué dans le tableau 6 pour N^ = 15. On a donc confirmation de la non-homogénéité
et puisque u est inférieur à 12, on doit craindre une modification de la moyenne,
ce qu'on sait évidemment.
Puisque les hétérogénéités dans la série des précipitations résultent de

changements d'échelle dans la distribution de fréquence, il convient de procéder par
un ajustement d'échelle, donc en faisant intervenir le rapport de totaux homogènes.
LES SERIES CLIMATOLOGIQUES 11
Selon ce principe, si y est la précipitation pour une année particulière

à la station à ajuster et x la valeur correspondante à la station de comparaison,
on fera
2y = bzx (3)
la sommation étant étendue à une période hétérogène à la station à ajuster. La

constante d'ajustement b est estimée par l'équation
2v
b = (4)
Su
où Sv est la somme des précipitations pendant une période homogène à la station

à ajuster et Zu la somme pour la période correspondante à la station de comparai-
son. On doit naturellement se référer à la période la plus récente d'une station en
fonctionnement, puisque la valeur ajustée doit se rapporter aux observations tirées
de la population de la station en activité. La procédure consiste à estimer b
d'après (4) è partir de données homogènes d'une même période, puis d'appliquer (3) à
la période hétérogène.
TABLEAU 10
Ajustement des précipitations moyennes è Genève
£x è Lausanne Totaux non ajustés ry Genève

Genève
1927-•38 1 602 (1 613) 1 295*
1939-46 753 (570) 609*
1947-•56 1 267 1 024 1 024
Moyenne a justée 1V27-1956 97,6*
La période homogène commune 1947-1956 donne b = TnZf = 0,8082
L'application de l'équation (3) donne ensuite
sy = 1602 x 0,8082 = 1295*

puis ry = 753 x 0,8082 = 609*
1295 + 609 + 1024
finalement y = = 97,6*
"30"
Ceci est la meilleure estimation possible du total moyen des précipitations (1927-
1956) en août à Genève à partir de la série homogène 1947-1956. On remarquera que la
valeur réelle, d'après la série non perturbée est 99,9 mm.
CL CD* O CA CA CD Q. Q. Q. < 3 CA O h- Q. t+ P-
P. o_ < TJ TJ rt- a CLTJ O Q' Q TJ CA h- rt- P - O C L h-> N3
m h- P- P- P- X P » H« Q Q CD CD CD CD Q CD O P - TJ P« O 3" P1 •t CD* Q
O o O p - Q O CD* CD
C CD P - O O CD Q « CA CA h- 1 Q « 3 CA 3 h-« P- TJ P -1 T J CA T J Q CL CD* Q P. 3 • 1 CA •P -
3 3 3 3 3 C c+ TJ (-•
CD CD CQ H- h- 3
<
P-
o CD CA C•1 P- CD C XI CD Q P» P« rt- PP*- T J 3 CD*
CD <
CD* O (A (A73 P.
H- CD C P- H CD* m CD CD* CQ Q rt- C P> h - rt- rt-
h" CD O CD CD
• O P 1 •1 P - C CA rt- O <
(D h- H,
P« 1 •i Q P- 3 P- P- H O Q 3 CD* P - a CD O XI 3 3 •«Q Q
CA rt-
O 3 CA CD CD
CT CA rt- <
h-« H - 3 rt- X I X I h - CA 3 ri- CD cr rh P- C O CA |+ O O P«
rh * P> P - P« CCA CD* o 1- Q. CD -+i C C P- P« O c P « CA Q
< H CD P ' CD P» 3 O CD
Q 3 O 3 3 P> CD CD O CD Ort- Q ' CD CD CD CL •
O c CL ri- O ri- P, CD h" CA O XI 3 C
rh Q (Q P - TJ CA P « rt- 3 C « a . •1 H en C 3 P« P- 3 Q P- •* 3 rh C c 3 3 H
P- H« H " 3 h - CD> - O XI 3 3 3 h CL m C L CA O ri- Q •* TJ O Q CD (D CD CA C O
<+ «+ « \— • 1
w çA X l Q P« O Q 3 c •1 CD* CD c Q Q (D CD O CD T J 3 CD T J 3 Q P « ri- P C 3 rh a CL 3 CD*
rh C t— -n Q CD 3 C %^9 CA -+i Q CD CA P - CD P- O TJ CD O CD* CL 3
rt- *» a Q. rt- - *<
P< (D CD P ' h P- H-« H - CA CD P« CD - h t-> CQ I P - P. CL O O CA CA O. h-TJ O O CD T J CD*
Xl rt-
Q (A CD* i + CA CD M CD Q CD*
rt-
a O CA P, m Q •1 CD* O O CA CD 3 P« 3 rt- XI O O CD CA 3 3 O rt- a H
C 3 «* CD P> a 3 h Q. 3 3
rt-
CD x+ CD CD* 3 3 P' rt- X I CA CA C P - CQ M CD* 3 3 P- H O
CD ri- Q ' (A CA 3 H- P*
(+ CA CD H » M- h Q 3 O CD' CD* 3 CA O -+i C CD P « CD* H 3 O rh O Q P-
O O XI CD 3 H- CD CA rt- - h 3 " t+ H CD 3 •i C CD Q
rt-
Q rt- XI CD P» CD P> 3 P-
h Xi C 3 Q-v; C O CD rt- X I O C
rt- <+
P« Q H O P« rt-
Q CD* 3 P- C (D h-TJ CD' rh
CD C c+ c CD CD CD H - t+ Q . •1 C C 3 CA a. 3 CD P- P- CL X I CD O CD* rt-
P* O
rt- rt-
O CD CA CA T J rt- O O CD*
(A CD P- rt- 3 CA X »<
CD Q CD M» CD •-I CD ri- o P- rt-
P « (D C t— Q CA C C CD *mé* TJ rt-
•1 CA
c+ h- Q. o p» 3 t-> CT 3 P- 3 rt-
P - CL
«* CD CA CD C L P - *_»•
• O rt-
O C O 3 C CD
<D M P- P- o O CQ 3 Q. a C TJ P - TJ X i O P- CD CD C ri- P " 3 P« 3 O
rt- rt- rt-
P - CD o h - rt- 3 O p» CA
Q CA (D cr CD CD •o CD H- CD
rt- O CD Q C P- P- H P- Q O CA Q P- XI c r~ P « P »
rt- O o a. C m
P« CD rt-
CD CA C (A 3 3 rt-
H « CA P. CD 3 O TJ P- CD X] CD H C -h p, a CA 3 X I P> *<
CD (D H
3 -h h CA - h ort, C CD o T3 O CA TJ CA O 3 O CD C CA h O CD
rt- rt- CD O CA Q C CA 3 rt-
P» %
Q. O P « P- CD 3 rt- CD* 3 H« Q rt-
P- P« TJ CL CD ri- Q p « P * CA CA 3 rt-
P « rt- - 3 O TJ P" PI
CD* h Q. CD O c - h CD (+ •1 *<
H » CD H O" •1 CD 3 3 Q C CD CD Q C cr O O C rt-
3 " XI O CD CD CD 3 O CD
3 o -h P- -+>
*» *r 3 Q 3 M CD* CA C P- X XI c CQ CA CA CD» C P * CA 3 TJ CA
rt-
(D (D (A -h CD o P - CA -o c 3 O CD CL CL CL CQ Q ri- O C rt- rt-
P- O P > CD O rt-
P- rt-
P - O CD O rh O • C i
-i
4 P- 3 o O CD* O CD C rt- H CD CD P - CL 3 ri- *1 CD p - CA C P- XI
rt-
3 3 O P - ht CQ P. O H M CA M
3 Q. (A O 3 Q P. c
rt-
I-" •1 3 • CA O CD CD P - Q CA H O C cr1 3 P - h" • P« 3 P" P- O
P« m t+ O rt- CA CD rt-
P- 3 rt- >
P- rt-
3 O P- 1-1 O Q P> O 3 O P- TJ CD P CA CD O X l CD P » a
3 C Q O O . CD CD CD 3 O CA m CL 3 CD CD X ) CL Q Q CL CD C rt-
3" 3 rt-
H- r~ P. P. H 3 P» S
CD* 3 CD CD CA -H 3 XI m CD* P « CD P« rt- Q CA C C CD C L CD O " C •m • 1 CA CD CD
« Q rt-
P»
H- CD CD • 3 CA O O
CD (S P- m (D •D O CD C C H 3 CA CA CD CD CA H - CA C CD CA CA P * rh CD* P ^ 3 CA m
(A O CA CA P - c CA <+H» P» - h TJ
•*• P- rt-
P« < CD H- CD CA 3 CL C • CD O Cfl
• Q. • O O C H c+ Q .
rt-
M - CD O O CD r~ CD 3 3 • Q -h CA rt- P« (D CD t— rt- tn P 1 rt-
P« "» CD rt-
P- T
o
t— P -rt- h
«+
P* 3 CA 3 CD T J Q. 1— CA P. 3 h P- o Q H a CA CD CL O Xi P- CA û
(A X I P I p. 3 h» 3 C O CD P- 3 CA CD 3 rt- P I CD* p» Q' CL O C T J CQ C Q rh C 3» ^>
Tï
rt- <+ rt- 1 < <
C P - CD* Q t— fi O X CA CA 3 " a p « CA CL a P - TJ P Q XI 3 CD Q CA 3 P« CD CD M
rt-
H m P - rh XI O *f CA O Q Q C P- X O CD P- C CA O CA h rt-
H O CD H CD
3 a 3 C CA
o -H
P> (A
*< Q P- C 3 C
3
3 CA CD'
O t+
Q
rt-
rt-
cr p - 3 3 CA CA p- 3
CA
•1 v ; CD CD P^ CD
t—
P-
rt-
Q a
p> C
O CL O 3
CD
i
§ 7i
o- O CD CQ O. C H* p - o CD rt- TJ 3 3 C 3 O rh B P> (D m
c (D Q rt-
P« 3 M C CD t-> a CD CA O 3 XI Q CD C CD Q •-f n C P1 <
O cr
rt-
P> 3 CD CD' O *<
CD ^
•H
rh -h O XI CD CD r+ CA 3 rt-
c TJ c rh P, 3 CD CD 3 CD H p< rt-
CA CD CD h - rt- rh 3 73 PI
P- -+l 3 3 Q. C Q H* C CD C L P - CD P » CA CA rt- CD CD CA P- CD P * H TJ O 3 <
Q m PI
O P- O CD CD Q . C • CA 3 *—* Q . P - P« C CA P - CL rt-
P. rt-
O X CL Q rt-
P « CL - h CD CD O C CD P*
3 O • -h C (A CD CD CD P - CA CA O O m rt- CD C Q CD* XI cr a XI CD O CA T J CD </>
Q <+
c P- O CA 2 H« rt- 3 CD T J CD rt-
P« 3 P- O *-4* O <
Q C P* P - C CA 3 C rt-
CD CL C
3 O H (->• r+ H- Q XI Q. h- 1 3 O CQ P- XI 3 CD CL O ri- CDrt- h P- CD CD* CD O CD CL P- CA P. o
m
CD |-
CD CD CD* CA H - - H- C H* CD Q CD 3 P P- C CL -h P- c p-
CD M CA Q CA T J rh CA (D O C—
(D» CA P - Cfl O CD o- CA CD CA CA 3 p. Q CD CD O M «
(D n 3 Q O Q h" rh P* 3 CL "0
P< Q C O CA rl- 3 t+ cr 3 CA CA C
« P. CD CA CA CL P - C T -+l a
rt-
O O
rt-
P. O P « T J P - CD CD CD*
(/>
rh O CD CA P. CA •"« 3 h-« *1 rt- CD* p * CL 3 3 t+ C 3 P- - h p- P« C Q 3 3 O O CA rh %
C 3 rh P> rt- 3 Q C H- C a. CD CD CLTJ CD Q XI p . TJ CD* CD CD CD* H 3 Q TJ 3 TJ CD cz-
CD O rt- h- 1 CD CD cr 3 p- H rt- CD O C 3 P - T J CD O Q CD CD CD' C L rt- C O ht r
•o
Q -a 3 h" 3 3 rt-
H- c Q O CD CL CA C CA rt-
P- P- CD C Q Q ri- CA CD P - P* CD <
Q TJ 3
(A o i+ P- rt- rt-
CA CD CD* M 3 TJ ri- P - P. O P, CA H P- • CD O
rt- CD h
rt- O O 3 P- C P« ^>
H
(A *<
CA "D CD* H » < CA a . H> H «
rt- XCD CD CA CA (+
O 3 Q P- O CD* 3 P« CA rt-
P> CD P - 3 rh 1+ CD P* 3 M
TJ (A O CD CD »1 H - CA O CD O TJ CD* CL ri- C P * CD 3 [- Q cl- P. rh 3 CA P « P- C O CD*
H CD* P- rt- CA O <+
H* Q Q 3 3 TJ O O CD •1 CD P- CL H CD C CD' Q ri- CD Q —
CD* O . O CD' H rh (D
CD* Q . <O XI O 3 3 3 cr TJ O O 3 1 P- CA CD O H O CZ CA CD CL O - 3 H CA P- i
O Q 3 C C CD Q CD H " M C c CA CD P- 3 CA P. rt-P- 3 P*
rt-
h" CD 3 " C CD O ^
P- 3 CD 3 • CD rt- CD H. 1-1
« P- CA O rt-
P» M P* CD> CD Q H < CD CD P- O Q 3 Q' CL 3 -h
W rh rt-
Q CA a . <+
H « CD CA CD'
•-» rt-
t+ P - O 3 XI O 3 -n P. CD CD 3 TJ 3 CL CD O
CD* CQ P- O C O CA CA *» CD CD 3 O CQ C CD* - CD O CL P - CA rt- CA O rt- TJ TJ CD CL 3
CD C CD O h- 3 3 rt- t J 3 CA CA C <+ O C CD O TJ 3 CD Q X I CD* CA 3| TJ P» Q O (A O O O
3 <
CD P » O TJ O CD ^ C CD 3" P- TJ O cr C O CD> CL C h~> P. H CD P-
M (D •* »< O P. 3 O a . o- c
rt-
P« P- H CA CL Q C O rt- TJ p - p « •»
P- 3 3 CD h - P " Q rt- rh rt-
P-
Q. 3 CA O CD c CD h
•1 rt-
O Q 3 C CD rh P- 3 CA H P- O p- CD CA O O 3 P* O < rh
rt- O
<t)^ CD Q CD h O O 3 CD 0 3 C CD CA 3 ri- Q O T J p . CD rt- CD rh 3 CD' H H 1 CD CD> 3
-+i 3 rt-CA O rt- C (D 3" 3 H 3 H CA CD* P- P« -h 3 3 C 3 O CL C TJ h" CD
-^
-h -h CA P > h- Q rt- o(D O CA CD CD CQ P. 3 P" O CD' CA P - CD* CQ rt- h- O 3 Q O O *i
rt-
Q. C TJ
rt-
P. CL
p. P- CD CD o H« 3 o 1+ 3 h- Q. O C • P* C h- P- ri- Q CD P« 3 CD ht 3 C CD P. O CD CD
O O h - CA X CQ 3 c H- a. O O CA ri- CD CD O a- P CL ri- CL 3 3 O Q CD* CA TJ
Q Q TJ h" <+
H» 1 3 3 CD rt- P - TJ P» m CA 3 P« CD CD P - CD a . Q 3
• CL CL O C O
O O «•
O Q . H CD 3 CD CD CA P - h-> XI CD O H CA Q < CD' CD CD 3 " *» P- O rt-
O
P« P« 3 P - CD O "O M h- 1 < rt-
Q P- P- rt-
a O C CA CL P1 3 O CD O
rt-
O h rh O a CL Q 3 C
** « 1
Q CA CA 3 D- M O H- t- CL h- CA 3 P- Q C CL CD 4 CD P- C P« H Q P->TJ 3 Q rh CA
rt- CD»
CD* rt- P - T J 1 T J cr CD C O h- CD O Q Q P- 3 H p« CD* CD C O 3 Q CD 3 Q O 1 3 p. P»
rt-
CD
CD Q H CA CD 3 C 3 (Q rt- 3 CL (A O CA rt- 3 CQ P « O " CA CA TJ CA O 1 CA
*<
CA P, H CD O O CD P - rt- Q P- 1 3"
rt-
CD CD P « CA h- C 3
CD 1 >—
Q <+
rt- •1 •1 O 1 a
rt- XI CD CD
• P- 1
1 3 CA C CA Q
(D 3
CD
1
ESTIMATION DES PARAMETRES DE POPULATION 13
S'il est toujours désirable d'utiliser la plus efficace parmi les statis-
tiques disponibles, il est parfois utile, bien que cela ne soit pas essentiel dans
tous les problèmes, qu'on puisse également la considérer comme sans biais (erreur
systématique). Ceci signifie que la moyenne de la statistique pour m échantillons
de taille n tend vers la valeur vraie du paramètre quand m augmente indéfiniment
ou lorsque mn tend vers le nombre de termes de la population totale. L'efficacité
et l'absence de biais ne se produisent pas obligatoirement ensemble. La pratique
courante, en analyse climatologique, est de choisir une statistique efficace et de
la corriger pour le biais, si cette propriété s'avère nécessaire, comme dans les cas
où on doit calculer des sommes ou des moyennes de statistiques. On distingue géné-
ralement deux types de statistiques : a) celles qui sont des estimations directes
des paramètres d'une distribution de fréquence; b) celles qui sont des estimations
d'autres propriétés de la population. La moyenne et l'écart type empiriques sont
des estimations des paramètres de population ou de distribution dans le cas d'une
répartition normale. La moyenne est aussi une estimation de la moyenne d'une popu-
lation, ou espérance mathématique, quelle que soit la forme de la distribution.
2.2 Paramètres statistiques les plus courants
Le mode est défini comme la valeur de la variable aléatoire qui a la den-

sité de probabilité maximale. Si la forme analytique de la distribution de fréquence
est connue, des estimations efficaces du mode peuvent être obtenues en remplaçant
les paramètres de distribution par des estimations efficaces et en calculant le maxi-
mum de la courbe de fréquence par différentiation. Quand on ne connaît pas la forme
analytique de la distribution de fréquence, il n'existe aucune bonne méthode d'esti-
mation du mode. Si l'échantillon est grand, le centre de la classe ayant la plus
grande fréquence pourra être choisi comme estimation de mode. L'usage du mode n'est
généralement pas recommandé en climatologie.
On a beaucoup écrit sur les distributions multimodales en climatologie.

Dans la plupart des cas, la multiplicité des modes provient du mélange de petits
échantillons issus de populations différentes, donnant l'illusion qu'on a utilisé
un grand échantillon. Dans ces cas, l'existence de plusieurs modes n'a aucune réa-
lité, mais signifie seulement qu'on a appliqué l'analyse statistique de façon incor-
recte.
La médiane d'une population est la valeur de la variable dont la probabi-

lité de dépassement (ou de non-dépassement) est 0,50. Si la distribution de fréquence
est connue, la médiane peut être obtenue en recherchant la valeur de la variable
aléatoire jusqu'à laquelle il faut intégrer pour que la probabilité atteigne 0,50.
Si la courbe de distribution n'est pas connue, la meilleure évaluation de la médiane
peut être obtenue en lisant la valeur de fréquence 0,5 dans une distribution cumulée
comme celle qui peut être déduite des tableaux 3 ou 4. On peut estimer grossièrement
la médiane en prenant la valeur qui se situe au milieu de la série des valeurs ordon-
nées, ou, si ces dernières sont en nombre pair, la moyenne des deux valeurs du milieu
de cette série.
La médiane appartient à la classe des quantités appelées quantiles, défi-

nies comme les valeurs X_ telles que F soit la probabilité que X soit inférieur au
quantile Xp. La médiane X n - n est alors le quantile 0,50. Les quantiles doivent
14 ESTIMATION DES PARAMETRES DE POPULATION
être estimés h partir d'un ajustement analytique de la distribution, chaque fois que
c'est possible, car les évaluations basées sur les distributions cumulées empiriques
ou sur les séries de valeurs ordonnées risquent d'être très imprécises.
La moyenne est le paramètre climatologique le plus employé. Dans la plu-

part des cas, on l'obtient en faisant la somme des termes annuels de la série et en
divisant par le nombre d'années correspondant. La moyenne a deux propriétés. C'est
d'abord une estimation de 1'espérance mathématique,c'est-à-dire de la moyenne vraie
de la population. Ceci est important en climatologie appliquée, car la moyenne d'une
fonction linéaire de séries climatologiques est, de ce fait, une fonction linéaire
de la moyenne des séries. En second lieu, la moyenne est la valeur centrale de la
distribution normale, elle l'est donc aussi pour la distribution des séries clima-
tologiques qui suivent la loi normale. La moyenne, calculée comme indiqué précédem-
ment, est généralement l'estimation optimale de l'espérance mathématique des précipi-
tations et, pour la distribution de la température, à la fois de l'espérance mathéma-
tique et de la valeur centrale.
Les moments par rapport à la moyenne, ou moments centrés,sont aussi commu-

nément employés dans les travaux de climatologie statistique. On les définit pour
une population R par
»»r " f (* - «) r f (x) dx (5)
c est dit moment d'ordre r , u est la moyenne, f(x) est la densité de proba-
bilité, R est le domaine sur lequel f(x) est définie. L'estimation sans biais
du moment de second ordre ou variance est
I
2 <x - «>* (6)
s •— — — — — » *
n - 1
La racine carrée de la variance définit l'écart type. Les moments d'ordre plus élevés
peuvent être estimés par
î (*-5)r
mT (7)
Le moment de troisième ordre est souvent utilisé pour la mesure de la dissymétrie

de la fonction de répartition, celui du quatrième ordre pour la mesure de l'aplatis-
sement. On peut employer, à cet effet, les statistiques
3 4
g, - —— et g2 = —T—— 3, qui sont les estimations des paramètres Y. et ?«.
s s
Pour une distribution normale Y. = Y « = 0. On substitue parfois a g« la
n
/ -/
B /V _ Vf
statistique a s -il ' dont la distribution est plus simple. L'utilisation
ns r r
ESTIMATION DES PARAMETRES DE POPULATION 15
de moments d'ordre supérieur à 4 n'est ordinairement pas recommandée en climatologie,

car ils sont soumis à de fortes variations, compte tenu de la faible longueur des
séries climatologiques habituellement disponibles. Il faut encore insister sur le
fait que, si on dispose de bonnes estimations des paramètres de distribution, c'est
la formule (5) qu'on devrait utiliser directement pour l'estimation des moments.
Une autre statistique, utilisée occasionnellement, est l'étendue, qui ne

sert que pour des travaux grossiers et ne peut être recommandée en raison de sa très
grande variabilité. Liées à l'étendue, les valeurs extrêmes possèdent une variabi-
lité encore plus grande, car elles dépendent énormément de la longueur de la série
d'observations. Les valeurs extrêmes de chaque année peuvent naturellement être ajus-
tées par des distributions appropriées. Les statistiques de ces distributions per-
mettent une meilleure évaluation des extrêmes individuels. Par exemple, les quan-
tiles de ces distributions sont indépendants de la longueur des relevés utilisés;
ils donnent donc une information solide sur les valeurs rares.
Le coefficient de variation ou écart type relatif a aussi été utilisé en

climatologie. C'est le rapport de l'écart type à la moyenne -|- . Prise en valeur
absolue, cette statistique dépend de l'interprétation qu'on peut donner à l'écart
type. Si la distribution n'est pas normale, cet écart type n'a pas de signification
simple et le coefficient de variation est de peu de valeur. Cependant, quand plu-
sieurs populations ont la même forme analytique, il peut être intéressant de comparer
leurs coefficients de variation. Dans ce cas, l'estimation ordinaire peut ne pas
être efficace. Une meilleure estimation peut être obtenue en utilisant les fonctions
appropriées des estimations des moments d'après l'équation (5).
2.3 Variabilité d'échantillonnage des moyennes climatologiques
La variabilité d'échantillonnage ou fidélité d'une statistique est souvent

mesurée par son écart type qui, appliqué à une statistique, est communément appelé
son erreur type. Pour qu'on puisse valablement interpréter un écart type ou une
erreur type, on doit se trouver en présence d'une distribution normale ou voisine de
la normale. Bien que la distribution de diverses séries climatologiques ne soit pas
normale, la distribution de leur moyenne tend vers la normalité dès que les relevés
deviennent raisonnablement longs. Ceci résulte du théorème central limite selon
lequel la distribution des moyennes tend vers la normale quand la taille de l'échan-
tilloni augmente, quelle que soit la distribution des termes individuels, à la seule
condition que les moments du second ordre existent. Les distributions de tous les
éléments météorologiques admettent toujours des moments du second ordre; les moyen-
nes climatologiques seront donc à peu près normalement distribuées dès que les rele-
vés seront suffisamment longs, par exemple 30 années.
L'erreur type empirique de la moyenne x d'une série climatologique est
s (x) = , où n est le nombre d'années de la série et s l'écart type des

Vn
valeurs constituant la série climatologique. Ceci est vrai quelle que soit la forme
de la distribution de x. Dans le cas où la distribution est à peu près normale et
si la taille de l'échantillon est au moins de 30 années, on peut déterminer des
16 ESTIMATION DES PARAMETRES DE POPULATION
limites de confiance pour la moyenne en utilisant les tables de la loi normale. Si

s est calculé sur un nombre d'années n <. 30, il est nécessaire de passer aux
tables de la loi de t (Student), avec n - 1 degrés de liberté. Ainsi, pour
n $i 30, l'intervalle de confiance au niveau 0,90 sera, pour la moyennes
x - 1,64 s(x)< ji < x + 1,64 s(x)
où - 1,64 et + 1,64 sont les valeurs è P = 0,05 et P = 0,95 tirées de la table de la

distribution noramale. Ceci veut dire que la vraie valeur de la moyenne, ou moyenne
i* de la population, a une probabilité de 0,90 d'être comprise entre
x - l,64s(x) et x + l,64s(x) ou que, si de tels intervalles pouvaient être cal-
culés pour des périodes successives de relevés de même taille que celui qui a servi
à calculer x, 9 sur 10 de ces intervalles contiendraient |» . L'intervalle de
confiance donne une bonne mesure de la justesse de x. Comme dans les tests statis-
tiques utilisés précédemment, on a adopté le seuil de probabilité de 0,90, complément
de 0,10, parce qu'on ne peut attendre de la plupart des statistiques intervenant en
météorologie qu'elles atteignent une justesse justifiant une plus grande confiance
dans l'intervalle qui contiendrait la vraie valeur du paramètre.
Pour déterminer dans quelle mesure la distribution des moyennes approche

la normalité, on peut employer la statistique de dissymétrie:
g 9
l 2
g (x) = et celle d'aplatissement ou kurtosis g«(x) = . Dans un cas
1 /— ^ n
Vn
extrême, ces deux statistiques peuvent, dans l'échantillonnage, prendre, par exemple,
les valeurs empiriques g. = 2 et g« = 6 (distribution en J). Selon les formules
précédentes, et pour une moyenne de 30 années, g, (x) est alors réduit à 0,365 et
g« (x) à 0,2. Le faible écart è la normalité mis en évidence par ces statistiques
n'accroît la probabilité de l'intervalle de confiance que de 0,900 à 0,901. L'effet
maximal pour une valeur particulière quelconque de probabilité sera inférieur à 0,03.
Ainsi, même avec des conditions aussi extrêmes de dissymétrie et d'aplatissement
dans la série climatologique originale, la distribution des moyennes de 30 ans peut
être considérée comme normale sans risque de biais sérieux dans les probabilités.
CHAPITRE III
LES METHODES STATISTIQUES GENERALES
Les problèmes fondamentaux de l'analyse climatologique peuvent être clas-

sés selon trois types généraux : (1) problèmes de spécification qui se posent à pro-
pos du choix de la forme analytique de la population, (2) problèmes d'inférence sta-
tistique pour l'estimation des paramètres de la population, l'application des tests
d'hypothèse et le calcul des intervalles de confiance, (3) problèmes de relation de
comparaison entre plusieurs variables climatologiques ou entre variables climatolo-
giques et non climatologiques.
Le problème de spécification consiste dans le choix de la forme de la dis-

tribution de fréquence de la population de la variable climatologique. On peut soit
opérer empiriquement, soit utiliser des raisonnements théoriques. La spécification
empirique revient le plus souvent à admettre l'existence d'une distribution de proba-
bilité dont la courbe cumulée a la forme caractéristique en ogive. C'est la démarche
qu'on a déjà adoptée pour préciser la distribution des précipitations des mois d'août
à Genève. Le cas échéant, l'examen de nombreux échantillons suggérera telle ou telle
forme mathématique de distribution paraissant convenir le mieux au calcul. Quant à
la spécification théorique de la distribution de la population, elle apparaît toujours
sous forme mathématique. Cette forme est indiquée par les caractères divers de la
variable : échelle, position, allure de la répartition, comportement corrélatif, etc.
Le choix de la loi normale peut résulter de l'application du théorème central limite.
Dans les problèmes d'inférence statistique, la phase d'estimation des para-

mètres de distribution réside dans la recherche des statistiques les plus satisfaisan-
tes qui sont, comme on l'a vu, celles qui ont une faible dispersion. C'est générale-
ment la méthode du maximum de vraisemblance qui fournit la meilleure estimation de ces
paramètres.
On doit toujours associer aux estimations des paramètres un intervalle de

confiance qui donne une mesure de leur degré de justesse. On fera éventuellement
des tests d'hypothèse pour s'assurer que la population remplit certaines conditions
prescrites ou voir si les paramètres diffèrent d'autres groupes de paramètres de même
caractère. On a déjà fait des tests, par exemple, pour examiner l'homogénéité des
séries de température et de précipitations. La recherche d'un intervalle de confiance
et l'application d'un test d'hypothèse sont des problèmes de même nature qui concer-
nent, tous deux, les distributions des estimations ou statistiques.
La mise en évidence de relations peut concerner soit seulement des varia-

bles climatologiques, soit des variables climatologiques associées h des variables
non climatologiques. Le premier problème se présente quand il s'agit de trouver des
fonctions de données climatologiques pour remplacer des variables qui font défaut, ou
pour former une nouvelle variable ayant certaines propriétés particulières. Si, par
18 LES METHODES STATISTIQUES GENERALES
exemple, des statistiques de température journalière ne peuvent pas être obtenues

directement ou conduisent à des calculs trop onéreux, on peut être amené à en recher-
cher des estimations à partir des statistiques mensuelles. La variable "degré-jour"
est un exemple simple d'une fonction de la température ayant des propriétés pratiques
spéciales que ne possède pas la température. Le second type de problème, où des
variables climatologiques sont liées à des variables d'une autre nature, se rencon-
tre dans tout problème de climatologie appliquée. On cherche essentiellement, dans
ce dernier genre de problème, à expliciter une relation permettant de transformer
une distribution de fréquence de la variable climatologique en une distribution de
fréquence de la variable appliquée. Un exemple simple est fourni par la relation
entre les degrés-jour et la consommation de chauffage dans un immeuble, ce qui permet-
tra de déduire la distribution des consommations de chauffage à partir de celle des
degrés-jours.
Comme les problèmes d'inférence, en climatologie, sont étroitement liés à

ceux de spécification, on les traitera ensemble. Le problème des tests d'hypothèse
a déjà été évoqué à l'occasion des tests d'homogénéité; la place ne permet pas de
le développer davantage. D'autres détails sur ces tests peuvent facilement être
trouvés dans la littérature statistique. Le problème des corrélations sera traité
séparément.
3.1 Distributions de fréquence
Un exemple de spécification de la population a déjà été utilisé au début

du chapitre I où l'on a étudié la distribution empirique des précipitations du mois
d'août à Genève. La seule considération théorique a été d'admettre l'existence d'une
population et le caractère aléatoire de la variable pour en déduire les probabilités
cumulées. Dans beaucoup de cas d'analyse climatologique, la spécification d'une dis-
tribution empirique est tout ce qui est nécessaire ou justifié. C'est seulement
quand on dispose d'une théorie solide, ou s'il s'agit d'ajuster différentes distri-
butions pour comparer ou lisser leurs statistiques, qu'on utilisera des distributions
théoriques. Dans les autres cas, un ajustement mathématique n'ajoute que peu de
choses.
Les distributions de fréquence sont de deux types généraux, discrètes ou

continues. Dans la distribution discrète, la densité de probabilité est fonction
d'une variable aléatoire discontinue, c'est-à-dire qu'elle varie par paliers. La
variable aléatoire climatologique discrète la plus courante est la fréquence absolue:
nombre de jours avec grêle, avec pluie, etc. Dans les distributions continues, la
fonction de probabilité s'applique à une variable aléatoire continue comme la tempé-
rature, la pression, les précipitations ou tout autre élément mesuré sur une échelle
continue. Il est souvent commode de traiter une variable discrète comme si elle
était continue. Dans certaines applications particulières, des variables aléatoires
continues peuvent aussi être transformées en variables aléatoires discrètes. La hau-
teur des nuages, par exemple, est une variable continue qui peut être transformée en
une variable discrète constituée par les nombres de hauteurs au-dessous et au-dessus
d'un seuil h donné.
On a accordé une très grande importance à l'ajustement des données météo-

rologiques par des distributions de fréquence, mais le plus souvent à partir de
LES METHODES STATISTIQUES GENERALES 19
considérations de nature empirique. Souvent aussi, l'ajustement a été appliqué à

des populations définies de façon incorrecte, comme des mélanges de séries diffé-
rentes, ce qui a conduit à des interprétations entièrement déformées. Le manque de
place nous oblige à n'examiner ici que les distributions les plus courantes.
3.1.1 La loi normale
La distribution continue la plus importante dans l'analyse statistique

est la loi normale ou de Gauss. Sa densité de probabilité est
2 l
f (x) - • '
ii et a étant respectivement la moyenne et l'écart type de la population. Leurs

meilleures estimations sont x" et s que l'on obtient, à partir des valeurs de
l'échantillon, par
* • • •
et
I(x-x) 2
. /
n - 1
La fonction de répartition normale F(x) = / f(t)dt ne peut pas s'exprimer

•/-oo
à l'aide de fonctions simples mais doit être évaluée au moyen d'un développement en
série. Diverses tables ont été établies pour la loi normale ou des fonctions qui
s'y rattachent. Elles utilisent comme argument la variable réduite
X
u = " ** que l'on appelle variable réduite. En utilisant cette dernière variable/
lq fonction de répartition prend la forme
1 2
2 "
du
qui peut être adaptée h n'importe quelle loi normale, simplement en assignant à
M et a les valeurs appropriées. Ainsi, une table unique avec l'argument t , qui
est, en même temps, la table d'une loi normale avec une moyenne nulle et un écart type
égal è l'unité, suffit pour obtenir les probabilités dans une loi normale quelconque.
Naturellement, F(t) donne la probabilité que u soit inférieur à t . La probabi-
lité que u soit plus grand que t est donc 1 - F(t), et F(t2) - F(t.) est la
probabilité que u soit compris entre t. et t„.
L'importance de la loi normale en climatologie provient, dans une large

mesure, du théorème central limite qui fait que les moyennes et les sommes d'un
nombre suffisant de séries climatologiques tendent à être normalement distribuées.
Par exemple, les séries pluviométriques sur de courtes périodes, pour lesquelles
la précipitation moyenne est faible, peuvent avoir des distributions très dissymétri-
ques. Si on allonge la période, plusieurs périodes courtes se trouvent ajoutées et
la moyenne augmente. Ainsi, la taille de la moyenne est, en quelque sorte, une mesure
du nombre de périodes qui ont été groupées. Quand la moyenne augmente, le total des
différentes périodes composantes se rapproche d'une distribution normale. On cons-
tate que, sauf conditions exceptionnelles, les périodes avec des précipitations moyen-
nes d'au moins 500 mm possèdent des distributions proches de la loi normale, le plus
grand écart de probabilité étant d'environ 0,01 au voisinage de la médiane. Et même
pour des moyennes de l'ordre de 250 mm, dans des conditions ordinaires, ce plus grand
écart ne dépasse guère 0,02.
La loi normale permet ainsi un bon ajustement de la plupart des variables

météorologiques non bornées, telles que la température ou la pression. Bien entendu,
l'échantillon à ajuster doit provenir d'une série climatologique homogène. Ce ne
doit pas être un échantillon d'un mélange de populations différentes, comme ceux qui,
dans le passé, ont conduit à des conclusions erronées, par exemple distributions de
fréquence comportant plusieurs modes, etc.
EXEMPLE 1 - LOI NORMALE
On sait que les températures moyennes mensuelles ont une distribution assez
voisine de la loi normale. Pour ajuster cette distribution, il faut estimer la
moyenne et l'écart type. Les formules d'estimation sont
ix
• B
et
2
s »
77 [ . . ' - ; (..>•]
Les calculs nécessaires sont indiqués ci-dessous pour la température moyenne (en °C)
de janvier à Akureyri, Islande.
Année Température Année Température
1932 -2/2 1947 3,2

1933 2,4 1948 -0,5
1934 -0,5 1949 -3,3
1950 X
1935 1,8 J7
1936 -6,0 1951 -3,5
1937 0,5 1952 -2,9
1938 -1,3 1953 -0,4
1939 -3,4 1954 1,6
1940 -0^4 1955 -3,5
1941 -3,1 1956 -3 8
1942 1,0 1957 0,8
1943 -2,9 1958 -3,6
1944 -3,8 1959 -5,7
1945 -4,3 1960 -0,6
1946 1961 0,0
2 Jo
La somme des températures est -40,70
donc x = - 4 ?;. 70 = -1,36°C
2
2x = 240,49 et JgjL* . i ^ ± 9 = 55,22
o 1*5,27
s
~ - 6,3986
29
d'où « - «6,3986 - 2,53»C
Les valeurs de la probabilité sont obtenues, è partir de la table de loi normale,

par l'équation
x(F) = x + s t(F)
x(F) est le quantile de x de probabilité F et t(F) est le quantile corres-

pondant de la variable réduite. Pour déterminer, par exemple, x(0,10), c'est-à-
dire la température au-dessous de laquelle x se trouvera, en moyenne, une fois sur
10, la table normale donne t(0,10) = -1,28
Donc, x(0,10) = -1,36 - 2,53 x 1,28 = -4,6°C
On remarque qu'en 30 ans la température de janvier à Akureyri a été inférieure à

-4,6 deux fois, ce qui est satisfaisant vu le nombre relativement petit que repré-
sente 30.
3.1.2 La loi Gamma
Etant donné qu'un certain nombre de variables climatologiques continues ont

une limite inférieure nulle, il est important de rechercher une distribution qui
puisse être utilisée pour ce genre de variables. La loi gamma, qui admet zéro
comme borne inférieure, a été trouvée convenable pour l'ajustement de plusieurs de
ces variables. Elle correspond à la densité de probabilité
six) - - î — j-*;f
pYr(v)
/3 étant un paramètre d'échelle, 7 un paramètre de forme, r(7) la fonction gamma
ordinaire de 7 .
Les moments donnent, en la circonstance, de médiocres estimations des paramètres. On

dispose cependant d'estimations exhaustives dont les valeurs approchées sont four-
nies par les expressions
et
Y-
7('R
X
Y
A étant donné par
I in x
A - in x -
(in est le logarithme népérien)

La fonction de répartition, de laquelle on peut tirer les probabilités, est
G(X) - / 9(0 dt
o
Des tables de Pearson (tables de la fonction r incomplète) donnent G(u), avec

x
X 1 X
u s , Y = P + 1 et u s —
a
P\/?
On a trouvé que la fonction gamma s'ajustait bien aux séries climatologiques de pré-
cipitations. Dans le cas où ces séries contiennent des valeurs nulles, on peut
employer une fonction de distribution mixte des zéros et des valeurs continues des
totaux de précipitations
H(x) == q + p G(x)
où q est la probabilité des valeurs nulles et p = 1 - q.

Ainsi, quand x = 0, H(0) = q, comme ce doit être. Si m est le nombre de zéros
de la série climatologique, q est estimé par "L.
EXEMPLE 2 - LOI GAMMA
On a trouvé que cette distribution s'ajuste convenablement aux données plu-

viométriques mensuelles. Les estimations de 0 et y sont obtenues par la méthode du
maximum de vraisemblance, en posant
lin x
A - lu x - — — —
n
alors
et
» -4-
Les calculs nécessaires pour les précipitations de novembre (en mm), à Reykjavik,
Islande, sont les suivants :
Année P r é c i p i t a t i o n s In x Année Précipitations In x
1932 151,0 5,0173 1947 13,3 2.5877

1933 116., 1 4,754 5 1948 99,2 4,597 2
1934 74,9 4,3162 1949 72,0 43276 7
1935 58,8 4,074 2 1950 57.9 4,058 7
1936 91,4 4,5153 1951 25,1 3,222 9
1937 44,3 3,7910 1952 60,0 4,094 3
1938 51,4 3,9397 1953 86,9 4,464 8
1939 50,2 3,9160 1954 147,2 4,9918
1940 79,0 4,3694 1955 37,0 3,6109
1941 108,5 4,6868 1956 193,3 5,264 2
1942 87,0 4,4659 1957 58,7 4,072 5
1943 129,2 4,8614 1958 212,1 5.357 1
1944 41,5 3,7257 1959 44,3 3,7910
1945 101,3 4,6181 1960 26,8 3,288 4
1946 53,4 3,9778 1961 96,4 4,568 5
x x 2 468,2
Le tableau donne x = = 82,273
n 30
et lnx = 4,4100. La moyenne des logarithmes est
slnx 127,2760
-—. _ 20 " 4'Z4ZD
D'où A = 4,4100 - 4,2425 = 0,1675
v—
1*11 + 4
0,1675
3,14
- 26,20
3,14
Pour déterminer la probabilité que les précipitations soient inférieures à 50 mm, il

faut passer à la forme normalisée
t(F) = -£- = 50
p " 26,20
= 1,91
Les tables de la loi gamma montrent que, pour Y = 3,14 et t = 1,91, la

valeur de F est 0,28. La probabilité que les précipitations de novembre à
Reykjavik soient inférieures à 50 mm est donc 0,28.
3.1.3 Les distributions de valeurs extrêmes
Dans des problèmes d'application, la variable climatologique à considérer

est souvent la valeur annuelle extrême, maximale ou minimale. On suppose, en effet,
que si une structure peut, dans un projet, résister à la plus forte (ou à la plus
faible) valeur de l'année, elle résiste à toutes les autres. C'est la distribution
des valeurs extrêmes annuelles qui fournit alors la prévision climatologique appro-
priée. Jusqu'à présent, c'est la loi de Fisher-Tippett du type I qui a suscité le
plus grand intérêt* Elle a été largement utilisée par Gumbel. La fonction de répar-
tition est donnée par
x -a
F(x) = e -e
Le double signe correspond aux valeurs maximales (signe moins) ou aux valeurs mini-
males (signe plus). La loi de Fisher-Tippett, type II, a aussi été employée en cli-
matologie. C'est une transformation exponentielle du type I. Elle peut être ajus-
tée en utilisant une distribution du type I en lnz (voir exemple 3).
Comme dans les autres distributions dissymétriques, les moments donnent

une estimation médiocre des paramètres. Lieblein a proposé une méthode simple d'ajus-
tement du type I qui permet une estimation des quantiles avec une variance minimale.
C'est une propriété qui doit être recherchée en climatologie où notre objectif final
est d'obtenir des quantiles ou des probabilités.
La procédure d'ajustement de Lieblein impose de conserver soigneusement

l'ordre chronologique original des séries climatologiques et de les diviser en sous-
groupes adaptés aux calculs. La table de pondération suivante est indispensable pour
ces calculs.
Table de pondération des variables ordonnées
m X
.2 X X X X
\ l .3 .4 .5 .6
2 a 0,91637 0,08363
b -0,72135 0,72135
3 a 0,65632 0,25571 0,08797

b -0,63054 0,25582 0,37473
4 a 0,51100 0,2639*1 0,15368 0,07138
b -0.55862 0,08590 0,22392 0,24880
5 a , 0,41893 0,24628 O.I676I 0,10882 0,05835

b -0,50313 0,00653 0,13045 0.18166 0,18448
•
6 a 0,355^5 0,22549 0,16562 0,12105 0,08352 0,04887
b -0,45928 -0,03599 0,07319 0,12673 0,14953 0,14581
Comme précédemment, on suppose que la série climatologique échantillon

comporte n termes. L'ordre chronologique original étant conservé, ces n valeurs
sont divisées en sous-groupes de taille m. On notera que la table de pondération
permet de choisir m entre 2 et 6. Il convient de choisir m le plus grand possible.
Si la taille de l'échantillon est, par exemple, n = 30, on choisira m = 6
plutôt que m = 5. Si n n'est pas un multiple de 4, 5 ou 6, une pondération addi-
tionnelle sera nécessaire. Mais supposons d'abord n = 30. L'échantillon, con-
servé dans son ordre original, est divisé en k = 5 sous-groupes de taille
m = 6. Les données sont alors arrangées dans chacun des sous-groupes selon leurs
valeurs croissantes. Le £ ème sous-groupe contiendra, dans l'ordre, les valeurs
x
il' x i2' x i3' x i4' x i5' x i6
Ces sous-groupes ordonnés sont alors arrangés selon le tableau suivant :
x x x x X x
ll 12 13 14 15 16
X X x x X x
21 22 23 24 25 26
X X X x X x
31 32 33 34 35 36
x X X x X x
41 42 43 44 45 46
X x X x X X
51 52 53 54 55 56
S S S S S S
.l .2 .3 .4 .5 .6
a a a a a ft
-l .2 .3 .4 .5 .6
6
ft
.lS.l a
.2 S .2 a
.3 S .3 a
.4 S .4 a
.5 S .5 a
.6 S .6 £
VjS.j
b b b b b b
.l .2 .3 .4 .5 .6
6
b .1
. S .1
. b .2
0 S .2
, b .3
-S .3
, JB .4
b .4 A b .5
-S .5
,. b fi
.oS .»
fi Ib .S
.3 ..j
Le point indique qu'aucune opération n'est à faire sur l'indice qu'il remplace.
Chaque colonne des x est d'abord sommée pour obtenir les S#.. Ces derniers
sont alors multipliés par les a. de la table de pondération et on fait la somme de
la ligne : z a. S .. Les S . sont ensuite multipliés par les b . et on a la somme
I b.. S.. de la ligne.
Dans la fonction de répartition du type I, la quantité en exposant

x — a
— g — est une variable réduite, en d'autres termes une variable dont l'origine se
trouve en a et dont l'échelle de mesure est 8 .
Si x est un quantile de x (la valeur de x correspondant à la probabilité
F = p ) , on a
x - a
P
P
P
ou
X a
P - *pyp
Lieblein a montré que, pour y fixé, une estimation de x à variance minimale est
p p
fournie par
X a s k ( b 8 k ) y
P • À . j . / • " . j . / p
Les estimations à variance minimale de a et B sont alors
1 m
k j=l .j .j
et
m
1
Dans l'échantillon considéré (n = 30), on a

o
a* = -=- a .S .
5 j=d .j .j
6
l 2
p
* k c
5 j=l .j .j
En portant ces valeurs dans la fonction de répartition du type I, on obtient une

estimation des probabilités F(x).
Dans le cas où m = 5 ou 6 n'est pas un sous-multiple de la taille n de

l'échantillon, un autre calcul simple est nécessaire. Supposons que n soit égal
à 33 au lieu de 30. Quand on a divisé la série en 5 groupes de 6 valeurs, il reste
les 3 valeurs les plus récentes. On forme, avec elles, un sous-groupe m' = 3
et on range ces trois valeurs dans l'ordre croissant. Appelons-les x,., x,~ et
61 62
X
63* ^ n f ° r m e ^ e tobleau suivant, avec les poids correspondant à m' = 3.
x x x
61 62 63
a a a
.1 .2 .3
a
3
m' = 3 .lx61 a
.2x62 a
.3x63
b b b
de même .l .2 .3
b
.lx61 b
.2x62 b
.3x63 ».j"6j
L'estimation pour cet échantillon est alors
«p » **.JX6J + (Ib
.JX6J)YP
En posant n = km + m' (ici : 33 = ( 5 x 6 ) + 3), Lieblein a montré

que l'estimation
o du quantile v de la variable de l'échantillon de taille n est
donnée par
v* k» • •• u•
p • —D xp • —
a p
Ceci donne, pour l'estimation finale,
• m aJ ï S : ->• ro
a* - ]™Z , -? + 2. 2 0 . S .
n k n .) . j
u_ m b : S • _t m
et fi* = J= 2 _ - L ^ J + fl. r b . S
n k n .j .j
L'ajustement pour un échantillon de taille quelconque est une simple adaptation de la

procédure qui vient d'être décrite. Pour les valeurs minimales ou les extrêmes infé-
rieurs, on inverse simplement l'ordre d'arrangement dans les lignes des tableaux de
calcul, c'est-à-dire qu'au lieu d'aller des valeurs les plus basses aux plus élevées,
il faut aller des plus élevées vers les plus basses. Les autres parties des tableaux
restent les mêmes.
EXEMPLE 3 - DISTRIBUTION DE VALEURS EXTREMES
La loi la plus communément utilisée est celle de Fisher-Tippett du type I.

La distribution du type II est cependant considérée comme la plus appropriée pour
l'ajustement des vitesses maximales du vent. Sa fonction de répartition est
La loi du type II étant la même que celle du type I où la variable est remplacée
par son logarithme, l'ajustement des deux distributions peut être illustré en étu-
diant la distribution, selon le type I, du logarithme de la vitesse maximale annuelle
du vent. Cette vitesse est exprimée ici en miles par heure.
Le calcul est fait pour les données de l'aérodrome de Birmingham (Alabama).

Comme les ingénieurs considèrent, dans leurs projets, le vent à une hauteur norma-
lisée de 30 pieds (10 mètres) au-dessus du sol et que la hauteur de l'anémomètre a
varié, il est d'abord nécessaire de réduire toutes les vitesses du vent à la hauteur
uniforme de 30 pieds. On utilise pour cela la loi de variation en puissance
—/ y = -^—*- P , l'exposant pour l'aérodrome de Birmingham étant pris égal à-yr
Sous forme logarithmique, la formule s'écrit
In 30 - In z
In v(30) = In v(z) +
v(z) est la vitesse du vent à la hauteur z de l'anémomètre et v(30) la vitesse

à la hauteur de 30 pieds. Les calculs sont présentés dans le tableau suivant :
Année v(z) In v(z) z In z In 30 - In z l a v (50)

7
1944 52 3,9512 62 4,1271 -0,1037 3,8475
1945 54 3,9890 n n n 3,8853
1946 49 3.8918 » n » 3,7881
1947 48 3,8712 63 4,1431 -0,1060 3,7652
1948 47 3,8501 n n n 3,7441
1949 49 3,8918 n n n 3.7858
1950 47 3,8501 n n n 3.7441
1951 65 4,1744 n n n 4,0684
n n il
1952 60 4,0943 3,9883
n n il
1953 47 3,8501 3,7441
n il n
1954 48 3,8712 3,7652
1955 65 4,1744 » n n 4.0684
n ti n
1956 56 4,0254 3,9194,
n ti
1957 56 4,0254 •' 3,9194
n n ti
1958 45 3,8067 3,7007
1959 52 3,9512 n 4,1431 -0.1060 3,8452
ti n ti
1960 59 4,0775 3.9715
il n n
1961 54 3,9890 318830
1962 43 3,7612 n n n 3,6559
tt n n
1963 47 3,8501 3,7441
n ii n
1964 43 3,7612 3,6552
Pour la commodité du langage, gardons la notation x = In v(30). La

meilleure division en sous-groupes est : 3 groupes de six et un de 3, ce qui donne
le tableau ci-après :
Nt
0,355*5 0,225*9 0,16562 0,12105 0,08352 0,04887
b -0,45928 -0,03599 0,07319 0,12673 0,14953 0,14581
i
x.
16
3,7441 3,7652 3,7858 3.7881 3,8475 3,8853
3,7441 3,7441 3,7652 3.9883 4,0684 4,0684
3,7007 3}8452 3,8830 3,919* 3,919* 3,9715
11,1889 11,3545 11>4340 11,6958 11,8353 11,9252
^L
81
1 0,65632 0,25571 0,08797
-0,6305* 0,25582 0,37473
3,6552C 3,66520 3,74410
Pour les 3 groupes de six, on utilise les lignes m = 6 de la table de pondé-

ration (a.., b..) ce qui donne
J J
1
£ ç 11/4183 RnA.
73 2fl.. hz
j S..
j = = 3,8061
3
6
0,2800
et j b. S. = 0,0933
De même, pour le groupe simple de 3, on obtient
3 665<
i - , i ( • '
Pour revenir au groupe de 21 valeurs, on prend les 18/21 de la part qui revient aux
3 sous-groupes de 6 et les 3/21 de celle qui provient du sous-groupe de 3.
±f= 0,8571 2Ï-= 0,1429
d'où a* = 0,8571 x 3,8061 + 0,1429 x 3,6656 = 3,7860

et flj* = 0,8571 x 0,0933 + 0,1429 x 0,0359 = 0,0852
Ce sont les paramètres de la loi du type I de In v. Les paramètres pour la loi du

type II sont donnés par
a
1
e et 7
02 = = "g 1
soit
py = e3'7860 = 44,08
1
= 11,74
0,0852
Les quantiles s'obtiennent immédiatement en prenant deux fois les logarithmes de la

fonction de répartition, ce qui donne
In In (i)
In v(P) = lnfl?
'2 -"
Ainsi, pour F = 0,98, valeur de calcul usuelle
v(o,98) . exp [3,783 - "*3'9 ] = 61,3 miles/heure

11,74 J
3.1.4 La loi binomiale
Cette distribution s'ajuste généralement mal aux données climatologiques

en raison des corrélations qui apparaissent lorsque les probabilités d'occurrence
sont suffisamment élevées sans s'opposer à l'une de ses conditions d'application.
Elle est cependant importante, car elle est reliée aux lois de Poisson et binomiale
négative qui s'appliquent respectivement aux faibles probabilités (événements rares,
le plus souvent non corrélés) et aux événements corrélés. En raison de cette rela-
tion, elle a parfois été utilisée pour donner des estimations grossières simples de
probabilités, pour remplacer celles, encore plus grossières, fournies par les extrêmes
observés des fréquences relatives. L'aspect le plus intéressant de la loi binomiale
dans l'analyse climatologique c'est qu'elle donne la distribution des probabilités
estimées déduites d'une fonction de répartition quelconque, empirique ou théorique.
Elle permet donc de déterminer des intervalles de confiance pour des probabilités
estimées et des quantiles.
La fonction de probabilité binomiale s'écrit
f(x) - Ç ) p x (l- P )"- x

p étant la probabilité d'occurrence d'un événement, 1 - p la probabilité de non-

occurrence et x le nombre de fois que cet événement se produit sachant que x
peut prendre les valeurs 0, 1, 2, m. La fonction de répartition est alors don-
née par
F x x
< > " tïo 0 vUi-v)^, t-o, i,
Ceci donne naturellement la probabilité que la fréquence soit x ou plus faible

que x. On estime généralement p par 2 x , n étant le nombre total d'occurrences
n
ou de non-occurrences de l'événement. Les événements climatologiques qui peuvent
être considérés sous cet angle sont très variés : jours avec grêle et jours sans
grêle, jours de pluie et jours sans pluie, jours avec précipitations inférieures à
un certain seuil u et jours avec précipitations supérieures à u, observations
de visibilité inférieures è V et celles supérieures à V, etc. Beaucoup de ces
variables sont plus ou moins en corrélation entre elles quand on les considère dans
leur succession chronologique, ce qui limite l'emploi de la loi binomiale. Aussi,
dans ce cas, ne peut-on l'utiliser que pour des estimations grossières et approchées,
quand on ne dispose que de données globales et qu'on désire des résultats rapidement.
L'importance de la loi binomiale en climatologie provient de ce qu'elle

permet d'obtenir des intervalles de confiance pour des probabilités estimées. Si la
probabilité F(h), que x soit plus petit que h, est estimée à partir d'une fonc-
tion de répartition théorique ou empirique, on voit facilement que, dans l'échantillon-
nage, on peut partager les probabilités en deux parties, celles qui correspondent à
x inférieur è h et celles qui correspondent à x supérieur è h. Ceci constitue
une loi binomiale. Si la taille de l'échantillon est m et s'il y a c valeurs
inférieures à h, F(h) = p La vraie valeur ^ de F est alors comprise avec
la probabilité 1 - 2 a dans l'intervalle p < <f> < p. avec les valeurs p. et p.
tirées de
£c 0 < <lV
et
«-X
Alors, la probabilité
P ( P L < * < P„) - 1 - 2a
définit l'intervalle de confiance de q> au niveau 1 - 2 a . Les formules ont été

présentées de manière è pouvoir être utilisées dans les "Tables of the Binomial
Probability Distribution" (U.S. National Bureau of Standards) où des interpolations
doivent être faites sur a et 1 - a , qui sont les fonctions des tables dans cette
application. L'ouvrage de Dixon et Massey "An Introduction to statistical analysis"
donne des diagrammes des limites de confiance pour 1 - 2a = 0,80, 0,90, 0,95 et 0,99*
Elles correspondent aux formules et tableaux qui permettent d'obtenir p. et p... La
probabilité 0,90 est le coefficient de confiance le plus élevé qui devrait ordinai-
rement être utilisé dans l'analyse climatologique.
-1 c
Si l'on emploie la notation en fonction inverse h = F (—), l'intervalle
dé confiance pour la vraie valeur v du quantile h peut alors être exprimé par
la relation de probabilité
p
[F"l(pLJ < n• r ¥~lto\lU ' 1
- 2a
Ceci s'obtient simplement en cherchant les valeurs de x qui correspondent aux

limites F = p. et F = p.. de l'intervalle de confiance.
Il est à noter que les deux intervalles de confiance sont indépendants de

la forme fonctionnelle de F, ce qui, en un certain sens, correspond à une méthode
non paramétrique. Si la forme de la fonction F est connue, on pourra peut-être
disposer d'intervalles de confiance paramétriques qui seront moins larges que ceux
obtenus précédemment. Certains auteurs admettent cependant que p et les quantiles
correspondants sont normalement distribués. Cette hypothèse simplificatrice ne peut
donner une bonne approximation que pour les valeurs proches du milieu de la distri-
bution F(x). Pour les valeurs de F(x) voisines de 0 ou de 1, il vaut mieux
utiliser les intervalles de confiance fournis par la loi binomiale. Ces intervalles
sont légèrement trop étendus, mais ils reflètent la véritable forme de la distribu-
tion de F(h).
3.1.5 La loi de Poisson
Quand m devient grand et que p tend vers zéro, la moyenne M = mp

restant constante, la distribution binomiale tend vers la loi de Poisson. Cette
loi convient donc à l'ajustement des faibles probabilités (événements rares)» Comme
cela signifie, pour les séries climatologiques, qu'il ne se produit, en moyenne, qu'un
très petit nombre de cas dans un intervalle de temps de l'ordre de l'année ou d'une
fraction d'année, la corrélation entre deux événements successifs sera ordinairement
faible. La oi de Poisson s'ajustera donc bien à la fréquence annuelle de la grêle
si la fréquence moyenne n'est pas trop élevée, à la fréquence annuelle des grandes
tempêtes, des typhons, etc. La fonction de répartition de Poisson se présente sous
la forme
*+
*•(*) - A
X n t.
'° t!
car la fonction de probabilité est
f(x) - |»
Cette loi ne dépend que d'un seul paramètre, la moyenne n , dont la meilleure estima-
— Sx
tion est x = . Les probabilités s'obtiennent immédiatement à partir de F(x),
à l'aide d'une table d'exponentielles et d'une table de factorielles.
EXEMPLE 4 - LOI DE POISSON
La loi de Poisson ne peut être appliquée qu'à des fréquences absolues.

Elle convient en cas d'événements rares tels que la fréquence annuelle des cyclones
tropicaux, de la grêle, etc. Le cas considéré ici est le nombre annuel des cyclones
tropicaux ayant atteint la côte orientale des Etats-Unis entre 1887 et 1956. La
série est homogène, car tous les cyclones atteignant la côte ont été aisément dénom-
brés.
La variable x est le nombre de cyclones dans une année, g est la fré-

quence observée du nombre x, F l'estimation de la fonction de répartition et g
la fréquence estimée correspondante. Les tests et calculs d'ajustement figurent
dans le tableau ci-dessous (tous les logarithmes sont des logarithmes décimaux).
2
X 6„ 6 * 8« x x log X log x! log p P g„ F (g -s) /g
o o 0 c c c c 0 c
(1) (2) (3) eo (5) (6) (7) (8) (9) (10) (11)
0 1 0 0 0 0 1,61990 0,0240 1,68 0j024

1 6 6 6 0„57171 0 1,04819 0,0895 6.27 0,114 0,1135
2 10 20 40 1,14342 0,30103 0,77751 0,1669 11,68 0,280 0,2416
3 16 48 144 1,71513 0,77815 0,68292 0,2075 14,53 0,488 0,1487
4 19 76 304 2,28684 1,38021 0,71327 0,1935 13,55 0,681 2,1921
5 5 25 125 2,85855 2,07918 0,84053 0,1444 10,11 0,826 2,5828
6 8 48 288 3,43026 2,85733 1,04697 0,0898 6,29 0,916 0,4649
7 3 21 147 4,00197 3,70243 0a32036 0^0478 3,35 0.963
8 1 8 64 4,57368 4,60552 1J65174 0,0223 1,56 0,986 0,0545
9 _1 _£ 81 5,14539 5,55976 2,03427 0,0092 0,64 0,995
70 261 1199 5,7981
Pour vérifier la validité de la loi de Poisson, le test de X donne
(7
x2(69) = °x U 9 9 )
-261=60,6
261
2
La table de X indique
p[x2(69) >-60,6] 2*0,70

2
La valeur de X n'est pas significative et le modèle de distribution de Poisson
est à conserver. Sous forme logarithmique, l'expression de la fonction de probabi-
lité est
log g c = x log x - log xï - x log e
Dans le tableau, il suffit de déduire de la colonne 5 (x log x), la colonne

6 (log xi) et * log e (= 0,43429 x = 0,43429 x 3,73 soit 1,61990), pour avoir
log P (colonne 7). P est donné dans la colonne 8 et est l'estimation pour chaque
x . En multipliant le nombre total 70 par P , on obtient (colonne 9) l'estimation
de la fréquence d'occurrence g . Dans la colonne 11, on compare les fréquences
observées et calculées par le test en X^, dont le total est donné au bas de la
colonne. Pour ce test, il est nécessaire de grouper les fréquences observées, quand
elles sont inférieures à 5 (voir colonne 2). Ceci laisse une répartition de x en 7
classes: un degré de liberté est perdu pour le total, un pour l'estimation de la
moyenne. Il en reste donc 5 et la table de X* donne
P[x2(5)>5,798 î] =-0,30
L'ajustement de la fonction de Poisson est donc bon.
3.1.6 La loi binomiale négative
Cette distribution convient à l'ajustement de variables aléatoires dichoto-

miques discrètes liées à des événements individuels ayant tendance à être corrélés.
Ainsi, quand il s'agit de phénomènes qui se groupent, en moyenne, en trop grand
nombre au cours d'un intervalle annuel, cette loi convient mieux que celle de Poisson.
Par exemple, pour le nombre annuel de jours de grêle ou la fréquence annuelle des
typhons, l'ajustement par une loi binomiale négative sera meilleur si le nombre moyen
d'occurrences est élevé. Les variables continues ne doivent en général pas être
ajustées avec des distributions théoriques conçues pour des données discontinues, à
moins qu'on ait pu faire, au préalable, la transformation en une variable discrète,
par exemple en une variable dichotomique. Il existe dans la littérature météorolo-
gique un certain nombre de mauvais ajustements de ce genre. En revanche, il peut
être utile d'ajuster des données discontinues par des distributions continues.
On dispose d'un test d'hypothèse pour vérifier la validité de la loi de

Poisson. Ainsi, si l'expression
2 Ix
X„ . » n - Ix
n-i
Zx
(où n est le nombre d'années d'observations) n'est pas supérieure à la valeur à

0,05 dans une table de X 2 avec n-1 degrés de liberté, la loi de Poisson peut
convenir. Si elle excède la valeur à 0/05, il faut utiliser la loi binomiale néga-
tive, dont la fonction de probabilité est
x
r(x*k) P
f(x)
r(x+i)r(k) (1+p)k+x
La fonction de répartition est donnée par
Les estimations de p et k par la méthode des moments sont
.2
P* .i(.2.,) .-2l.
et
-2
k* = x x
2 - I*
S - X
2
où x et s sont respectivement la moyenne arithmétique et la variance de l'échan-
tillon.
L'estimation par les moments n'est pas toujours suffisamment efficace.

Fisher a proposé un critère qui conduit à rechercher une meilleure procédure d'ajus-
tement si l'efficacité tombe au-dessous de 9QJS. En particulier, si
(1 +—-) (k» + 2)<20

p*
il vaudra mieux adopter la méthode du maximum de vraisemblance. Cette méthode est
trop complexe pour être examinée ici. On trouvera des détails dans Thom, 1957.
EXEMPLE 5 - LOI BINOMIALE NEGATIVE
Dans la loi de Poisson, la population a une moyenne égale à la variance.

Quand il y a un groupement de fréquence dans des années individuelles, par exemple,
la variance devient supérieure à la moyenne. La distribution prend alors l'allure
d'une loi binomiale négative. C'est le cas du nombre de jours de grêle (ou fréquence
de la grêle) à Abilene, Texas, pour les 65 années 1886-1950. La variance est ici
s^ = 5,25 tandis que la moyenne est 5? = 3,58; les données nécessaires pour les
calculs d'ajustement sont rassemblées dans le tableau ci-après (voir page 36) où x
est le nombre de jours de grêle, g la fréquence annuelle observée des jours de

grêle, g la fréquence calculée, k et p les paramètres de la loi binomiale néga-
c
tive (tous les logarithmes sont des logarithmes décimaux). Le test de validité de
la loi de Poisson est
v*/,^ 65 x 1171 - 233 = 93,7

X (64; = —233
La table de X donne
P(X2(64) >93^7)<.0 9 02
L'écart à la loi de Poisson est donc significatif et il faut essayer un ajustement

par la loi binomiale négative. La formule de la fonction de probabilité pour la loi
binomiale négative est
gc(x) = K
(1 + p*)k» + x
r(k* + x)
où p* et k* sont les statistiques et K =
r(x+i)r(k*)
Le problème se ramène au calcul de p* et k* pour obtenir g
2 f F*"
logP c
X 8
o V S x
o
log K x logj—— P
c g
c
(1) (2) (5) (4) (5) (6) (7) (8) (9)

0 5 0 0 0,0 0^0 -1,27820 0,0527
1 11 11 11 0,88595 -0,49812 -0,89059 0,1287 8,57
2 11 22 44 1,52594 -0,99624 -0,75050 0,1776 11,54
5 8 24 72 2,05515 -1,49456 -0,75945 0,1822 11,84
4 10 40 160 2^46006 -1^99248 -0,81062 0,1547 10,06
5 9 45 225 2,82891 -2,49060 -0,95989 0,1148 7,46
6 7 42 252 5,15420 -2,98872 -1,11272 0,0771 5,01
7 2 14 98 5,44555 -5,48684 -1,51951 0,0479 5,11
8 2 16 128 5,70946 -5,98496 -1,55570 0,0279 1,81
9 1 9 81 5,95084 -4,48508 -1,81044 0,0155 1,01
10 _1 10 100 4,17529 -4,98120 -2,08611 0,0082 0,55
65 255 1 171
233
La moyenne est x = vg = 3,58
La variance est (233)

1171 - 65
= 5,2466
64
L'estimation par les moments donne

-2
k* = —-r-~ " 7,6901
s -x
et
2 -
s
p* = -x = — = 0,4655
x k*
Log K est tiré des tables de la fonction gamma, en utilisant la valeur de k*. Le
dernier terme de l'expression de la fonction de probabilité est partagé en deux fac-
teurs dont un seul contient x. Son logarithme est donné dans la colonne 6. L'autre
facteur a pour logarithme
k* log = -1/ 27820

Ll + PP*'
*J
Log P est alors obtenu en ajoutant à log K (colonne 5) le terme correspondant de
la colonne 6 et en retranchant 1,27820. La fréquence calculée est finalement obtenue
par g = 65 P . La validité de l'ajustement s'apprécie en comparant g et g .
C C r\ C O
On utilise encore le test en X . A cette fin, il faut, au préalable, grouper les
deux premières fréquences ainsi que les quatre dernières. Ceci laisse sept degrés
de liberté dont deux sont encore à déduire du fait de l'ajustement de k et p.
MOT* * 2 (5) =i (
«c - «o) 2 „ 2/83
«c
2
La table de X montre que
P(X2(5) > 2,83) > 0,70
L'ajustement est donc acceptable.
On rappelle que Fisher a montré que l'ajustement par les moments n'est pas
toujours efficace pour la loi binomiale négative. Le critère qu'il a proposé pour
juger si cet ajustement est acceptable est
c
= f1 +
è*> k
P ( * + 2) > 20
Dans le cas présent
C = 30,51 > 20
L'efficacité de la méthode des moments est donc ici satisfaisante.

Si, par exemple, on trouvait C ^ 20, il faudrait avoir recours a une esti-
mation de p* et k* par la méthode du maximum de vraisemblance (voir Thom, 1957).
3.2 Corrélation et régression
L'utilisation la plus importante de l'analyse de corrélation dans l'analyse

dimatologique est liée à l'existence de corrélations entre séries climatologiques du
fait de la persistance naturelle de la variable météorologique au long de l'année.
Les problèmes de corrélation se présentent aussi quand on traite de com-

binaisons de deux ou plusieurs variables en variables composées et aussi dans
l'étude du comportement de la variabilité dans les relations de problèmes théoriques
ou appliqués. La plupart des autres applications de la corrélation découlent de
l'analyse de régression.
L'analyse de régression s'applique chaque fois qu'on se propose d'estimer

une relation fonctionnelle permettant de prévoir la valeur d'une variable à partir
de celles d'une ou de plusieurs autres. On l'utilise principalement pour relier entre
elles certaines variables météorologiques ou rapporter des variables d'application à
des variables météorologiques. Cette analyse permet aussi l'étude des variations sys-
tématiques des variables climatologiques dans le temps, mais ceci est d'un intérêt
tellement spécialisé qu'on ne s'en occupera pas ici. Dans certains cas de ce genre,
l'analyse de régression est d'ailleurs une simple variante de ce que nous considére-
rons ici, sauf que la variable indépendante est le temps et que les termes de la
régression peuvent être des fonctions, harmoniques ou de toute autre forme.
3.2.1 Analyse de corrélation
Au sens strict, l'analyse de corrélation en climatologie consiste généra-

lement à essayer de chiffrer les effets de la corrélation entre des séries climato-
logiques. Si, par exemple, la série de températures moyennes du 1er et celle du
2 mai ont des variances empiriques s? et s? , la série constituée par la moyenne
des températures du 1er et du 2 mai a une variance qui est affectée par la corréla-
tion entre les séries du 1er mai et du 2 mai. De même, la variance de la moyenne
des séries du 1, 2, 3, .... m mai sera affectée par les corrélations entre les m
séries climatologiques. On peut évidemment considérer de telles séries climatolo-
giques pour une semaine, un mois ou une autre fraction quelconque de l'année.
S'il est nécessaire de toujours travailler sur des séries climatologiques,

il est tout aussi indispensable; dans le présent aspect de l'analyse dimatologique,
de prendre les coefficients de corrélation appropriés en considération. Les seuls
coefficients de corrélation utilisés dans ce type d'analyse sont ceux qu'on calcule
h partir des termes homologues d'un couple quelconque de séries climatologiques.
Si les deux séries concernent le même élément, elles seront reculées dans le temps
au cours de l'année ce qui conduira à une séquence complète de telles corrélations.
Les couples de séries climatologiques peuvent être séparés par différentes unités
de temps, de sorte qu'on pourra leur associer un décalage déterminé dans le temps.
A cause de la nature séquentielle dans le temps de ces coefficients de corrélation,

et pour différencier des coefficients d'autocorrélation, on les appellera coefficients
de corrélation de séquence. Le coefficient de corrélation de séquence entre la ième
et la jième série climatologique est défini par
E( Xi - F ^ (XJ - Mj)
p(xi,xi) =
1
a
Le numérateur est l'espérance mathématique du produit des écarts de x. et x. à

la moyenne de leur population respective; il est appelé covariance. Le dénominateur
est le produit des écarts types des populations des x^ et des x.. L'estimation
empirique du coefficient de corrélation de séquence est donnée par
m
, 2 . (x.. -x.) (x., -X.)
r(x.,x.) * !5=i V s ' '
i ] ns.s.
Ici x., est le Jcième terme (année) de la iième série climatologique et x., le
kième terme (année) de la jième série climatologique, et x.,s. et x.,s. les
moyennes et écarts types empiriques respectifs.
Le coefficient de corrélation de séquence doit donc être soigneusement dis-

tingué du coefficient d'autocorrélation (qu'on appelle quelquefois coefficient de cor-
rélation sériale). Le coefficient de corrélation de séquence est réellement un coef-
ficient de corrélation simple dont l'évolution dans le temps est indépendante des
effets de la variation annuelle de la moyenne et de l'écart type. Le coefficient
d'autocorrélation, au contraire, est influencé par les variations de la moyenne et de
l'écart type. Dans les méthodes discutées ici, il serait toujours faux d'utiliser
un coefficient d'autocorrélation.
Pour les séries climatologiques des 1er, 2, 3, ... m mai, évoqués précé-
demment, il existe m(m-l) couples possibles de séries. Comme on a évidemment
p(x.,x.) = p(x.,x.), il y a seulement s—- corrélations de séquence différentes.

Elles doivent toutes être prises en considération si on étudie la variance de la
série somme ou de la série moyenne obtenues en sommant ou en moyennant chaque année
les valeurs du 1er au m mai. Si i et j prennent toutes deux leurs valeurs pos-
sibles dans la même séquence de séries, la variance empirique de la somme pourra être
exprimé par
[ m 1 m2_ L O m m .
V
Ceci est la variance de la fonction linéaire y = j x.

X
i=l
Si les x. ont des poids k. différents, de sorte que la fonction linéaire devienne
2 k.x., la variance s'écrit
i=l X x •
( î k i * i ) - ài*î 8i + 2ài j i kikjsisd r(x

i» x j )
On notera que, si les r(x.,x.) sont nuls, la relation se réduit à la simple for-
mule de la variance
( î ^ i ) • &AA
Si m = 2 et si k« est affecté d'un signe négatif, la formule donne

2 2 9 0
v(k lXl - k 2 x 2 ) = kjSj + k 2 s 2 - 2k 1 k 2 s 1 s 2 r(x iy x 2 )
Si m = 2, avec k. = 1 et k„ = - 1 ,
v(xL - x 2 ) = Sj + s 2 - 2s x s 2 r(x lt x 2 )
Pour r(x. ,x«) = 0, toujours avec k. = 1 et k« = -1
VlXj-Xj) = Sj + 8 2
1 1m
Si k = -, la relation linéaire devient une simple moyenne y = — ? , x £ , et
la variance devient
m
.1 xi\
/i=l ! rm 2 m m
Ainsi, la température moyenne de juin a une variance, formée par les variances quoti-
diennes et les corrélations de séquence, donnée par
30
JU
v
/i£i x *\ 1
r30 2 30 30
l
(J±L±) = _ [ I s\ + 2 I I . • r ( x . , x )J
L
V 30 / 900 i=l * i=lj>i 1 J X 3
La variance du total des précipitations de juin est exprimée, en fonction des

variances quotidiennes individuelles et des corrélations de séquence, par
( '30 \
i=l i l
30 ,
i=l î
+2
30 30
ill jïi V j r <*i>V
Etant donné que les précipitations totales mensuelles ont rarement une distribution
voisine de la loi normale, on aura plus souvent intérêt à considérer la variance de
la moyenne ou de la normale de n années,
À I *«
1
n 1-1
Cette variance est

n2 \1-1 V
Toutes ces formules restent applicables si les x. sont des variables

relatives à différents éléments observés simultanément ou non. Cela les rend uti-
lisables dans les problèmes de climatologie appliquée où la variable d'application
est une fonction linéaire des paramètres météorologiques. Par exemple, la charge
du refroidissement de l'air extérieur dans un système de conditionnement d'air peut
être estimée avec une très bonne approximation par une expression linéaire
q = -kjt + k2t' + k„
où t est la température du thermomètre sec, t' celle du thermomètre mouillé, les

valeurs des k résultant de considérations purement physiques. Etant donné que les
valeurs usuelles de calcul de t et t' sont distribuées à peu près normalement,
la variance de q est importante. Les formules déjà citées donnent
v(q) = kj v(t) + k* v(f) - 2 ^ ^ r(t,f)
L'écart type de q est alors
s(q) = V^(q~)
et la moyenne de q est donnée par
q = -kj$ + k2ï' + k 3
Il en résulte que la fonction de répartition normale N[q; q, s(q)] fournit les

probabilités pour des prévisions climatologiques basées sur les distributions de t
et t'. L'analyse de corrélation prend encore d'autres formes en analyse
climatologique, mais la plupart d'entre elles restent étroitement apparentées è l'ana-

lyse de régression. En fait, chaque fois qu'il s'agit de rechercher des liaisons
entre variables aléatoires, l'analyse de régression est le moyen le plus approprié
auquel on puisse recourir.
3.2.2 Analyse de régression
Une régression est une relation fonctionnelle entre une variable dépen-
dante et une ou plusieurs variables indépendantes. Pour un ensemble donné de valeurs
des variables indépendantes, la régression donne la valeur moyenne de la variable
dépendante. L'analyse de régression est utilisée en climatologie pour estimer les
constantes dans les relations fonctionnelles où elles ne sont pas données directement
comme des quantités physiques. On l'utilise pour établir des relations aussi bien
entre des séries climatologiques qu'entre séries climatologiques et variables d'appli-
cation. Dans le dernier cas, la régression peut souvent être calculée sans faire
appel à une série climatologique pour autant qu'on dispose de séries de valeurs de
la variable indépendante qui forment des échantillons aléatoires et simples dans
chaque ensemble et qui couvrent une étendue de valeurs égale à celle de la série
climatologique. Ainsi la relation entre une variable d'application et les variables
climatologiques peut souvent être établie a partir de courtes séries de valeurs simul-
tanées des deux variables.
Le premier problème dans l'analyse de régression est celui de l'estimation

des constantes. On le résoud habituellement en appliquant la méthode des moindres
carrés aux résidus de la fonction de régression lorsqu'on y a introduit les valeurs
des variables indépendantes. On ne peut cependant minimiser les résidus de la varia-
ble dépendante que si les valeurs des variables indépendantes sont bien fixées ou
essentiellement mesurées sans erreur. Si cette condition n'est pas remplie, on intro-
duira des biais dans les constantes de la régression. Comme on l'a indiqué précédem-
ment, les valeurs de chaque variable doivent aussi être mutuellement indépendantes.
Les estimations par les moindres carrés ont certaines propriétés d'optimisation qui
en font une méthode de choix pour l'ajustement des régressions.
Le principe des moindres carrés est très général et peut être appliqué à
presque n'importe quel type de fonction.
Si la fonction de régression est de la forme
y = R(x^t ..., x^; pg, p^f ..., p^)
la somme des carrés des écarts s'exprime par
le =I
j Cyj " R(x
ir —• x
kjî *o' Pi» • » *yfi2 - *<yd - Rj) 2
où j prend toutes les valeurs de l'échantillon de 1 à n. Les moindres carrés

sont obtenus en minimisant la somme des carrés des écarts, c'est-à-dire en égalant
à zéro les dérivées partielles de cette somme par rapport à 0 , 0., ..., 0,
Ceci donne le système d'équations dites normales
r f hy, - B,)2 = 0
2
i f e * ^ - v • °
jfeî(srj - v 2
• °
La solution simultanée de ces équations fournit les estimations par les moindres
carrés, des constantes 0 , fi., ...., 0.»
La fonction de régression R peut naturellement prendre une variété infinie de
formes. C'est néanmoins la forme linéaire que l'on utilise le plus et on ne consi-
dérera ici que des régressions linéaires à une ou deux variables indépendantes. Mais
des fonctions plus compliquées peuvent être analysées en recherchant leurs propres
équations normales selon le procédé déjà décrit.
On écrira de préférence l'équation de régression linéaire à une variable indépendante

sous la forme
T = a + B (x-H)
du fait que, si x est mesuré par rapport à sa moyenne n , l'estimation de a par

la méthode des moindres carrés devient indépendante de celle de 0 . Les estimations
par les moindres carrés de a et de 0 à partir d'un échantillon de n couples
(x,y) sont
a s
et
n _
ly(x-x)
Mx-x)2
la sommation étant étendue aux n couples de l'échantillon. On peut alors écrire

l'équation de régression
yc = a + b(x-x)
Si a s 0, pour des raisons physiques, l'équation se simplifie en y = bx
et on a alors une seule équation normale donnant l'estimation par les moindres carrés
Ixy
b =
Ix<
Il est souvent nécessaire de tester l'ajustement d'une régression pour s'assurer de
sa réalité et de sa linéarité. Ceci se fait au mieux grâce a l'analyse de variance,
qui est une technique proposée par R.A. Fisher pour analyser les carrés moyens- asso-
ciés aux diverses composantes de la variation. Pour la régression linéaire étudiée
ci-dessus, la variation totale de y se divise en une variabilité prise en compte
dans la régression et une variabilité résiduelle dont la régression ne rend pas
compte. Ceci peut être exprimé de façon commode dans un tableau d'analyse de variance.
Analyse de variance
somme des carrés degré de liberté carré moyen
prise en compte par

la régression S(yc -y)2 - % 1
>
résiduelle Hy-yf =V<^ n-2 VS

n-2
totale (par rapport

à la moyenne ky-y)2 .0,. n-1
Le "degré de liberté" est un terme utilisé par R.A. Fisher pour désigner le nombre
entier par lequel il faut diviser la somme des carrés afin d'obtenir le carré moyen.
Quand on a estimé la moyenne et fixé ainsi sa valeur, il ne reste que n-1
observations dont les variations sont libres; la nième valeur se déduit automati-
quement du fait que les n valeurs doivent avoir pour moyenne la moyenne déjà fixée.
En d'autres termes, un degré de liberté a été utilisé pour estimer la moyenne et il
reste n - 1 degrés de liberté pour évaluer le carré moyen par rapport à la moyenne.
Comme on n'en a pas besoin ici, il n'est pas calculé. Un autre degré de liberté est
perdu dans l'estimation de b; il reste donc n - 2 degrés de liberté pour calculer
le carré moyen résiduel. On voit que la somme des degrés de liberté des composantes
de la variabilité dans un tableau d'analyse de variance est égale au total des degrés
de liberté. Les sommes des carrés Q_ et CL s'obtiennent de
n? . n -
QT = ly2 - I (ly)2
•T
et -X-.2
[ly(x-x)]
2R =
2(x-x) 2
2 °R
Le carré du coefficient de corrélation s'écrit r = -jr—
S"
2
ce qui montre que r donne la proportion de la variation exprimée par la régression,
Il s'en suit que, si l'on utilise le coefficient de corrélation pour apprécier le
degré de liaison, il est préférable de conserver son carré pour obtenir une estima-
tion réaliste de la fraction de la variabilité prise en compte par la régression. Ce
carré est, naturellement, toujours plus petit que r.
Le tableau d'analyse de variance fournit aussi un test de signification de
la linéarité de la régression. La statistique est donnée par
QR/i
F(lfn-2) =
(QT-QR)/n-2
Elle doit être comparée à une.table de F (ou rapport de variance) avec les degrés
de liberté 1 et n - 2 aux niveaux de signification 0,10 ou 0,05, pour juger s'il
existe réellement une relation linéaire; ou, en d'autres termes, si le carré moyen
pris en compte dans la régression linéaire est suffisamment grand par rapport au carré
moyen résiduel, pour décider qu'une régression existe réellement et qu'elle n'est pas
simplement l'effet d'un échantillonnage au hasard.
On a souvent tendance a attribuer trop d'importance aux tests de signifi-

cation ou tests d'hypothèse. On pourrait ainsi conclure que, si une régression a
été jugée significejtive, on n'a pas à se préoccuper d'autre chose; ceci est pour-
tant loin d'être vrai, car il y a deux sortes de signification, pratique et statis-
tique. Si une régression est sans signification pratique, il est de peu d'utilité
de tester sa signification statistique. Si, au contraire, elle présente une signi-
fication pratique, on doit appliquer un test d'hypothèse pour juger de sa réalité.
Dans le cas de la régression linéaire, la signification pratique est mesurée par le
carré du coefficient de corrélation qui indique dans quelle proportion la variabilité
totale résulte de la régression. On observera que, si r<0,50, c'est-à-dire
2
r -C 0,25, l'utilité pratique de la régression sera vraiment' douteuse.
Si l'échantillon de valeurs de la variable indépendante x peut être divisé,

disons, en au moins quatre classes ou colonnes avec au moins deux valeurs de y dans
chaque classe, on peut dresser un second tableau d'analyse de variance conduisant à
un test de linéarité. Un tel test nous indiquera s'il est ou non nécessaire d'ajou-
ter à la formule des termes de degré plus élevé, pour améliorer l'ajustement.
Si les données sont rangées en classes ou en colonnes, la colonne j con-

tenant nj valeurs, la variabilité totale peut être divisée en une variabilité entre
les moyennes de colonnes classées dans l'ordre croissant des x et une variabilité
à l'intérieur des colonnes ou variabilité résiduelle. Ceci conduit au second tableau
d'analyse de variance.
Analyse de variance
Somme des carrés Degré de liberté Carré moyen

Moyenne; k n .
de
colonne!
-\2
|ïiï-a».j<*.r*>*-*i k-1 V{k"1)
Rési- k n
=QT QM n-k (Qj-QÂn-k)
duelle ii.CÎ ^ r * - ^ "
k .j - 1 k .j 0
Totale I i v 2 _ ± ( l l v ) = 0 n-1
v
j=l i=l yij n lj=l i=l y ij'
Un test F peut être fait dans ce tableau en calculant
P(k-1, n-k) =
V11-1
<VV /n - k
Si F n'est pas significatif, il n'existe aucune relation, linéaire ou autre,

entre x et y. Si l'on avait, au départ, quelque doute, à la fois sur la linéarité
et sur l'existence d'une relation, ce test aurait dû être fait en premier.
On verra dans le premier tableau d'analyse de variance que l'ajustement de

la régression linéaire laisse une partie de la variabilité sous la forme d'une somme
de carrés Q^ - 0^ non expliquée par la régression. Si l'ajustement peut être
amélioré en utilisant une fonction plus compliquée, cette amélioration doit éliminer
ou réduire la variabilité résiduelle. Ainsi, la somme résiduelle des carrés peut
devenir la variabilité totale dans un troisième tableau d'analyse de variance. Le
principe des moindres carrés voulant que le maximum de la variabilité soit absorbé
par l'ajustement des moyennes de colonnes, le résidu de cet ajustement doit être le
plus petit possible. Si ce résidu est soustrait de celui qu'a laissé la régression
linéaire, la partie restante est le résidu de l'ajustement des moyennes de colonnes
après application de la régression linéaire. L'analyse de variance se présente
ainsi:
Analyse de variance
Somme des carrés Degré de liberté Carré moyen
Moyennes de colon-
nes après régres- k-2
k-2
sion
Résidu des moyen-
2r e M n-k *r "M
nes de colonnes n-k
Résidu de la régres*
sion linéaire QT-QR n-2
Le test de linéarité se fait maintenant en comparant
F (k-2, n-k) =
W1n-k
aux valeurs correspondant aux degrés de liberté k - 2 et n - k d'une table de F.
Si ce test est significatif, la régression linéaire ne suffit pas à expliquer toute
la variabilité et il faut essayer des termes de plus haut degré.
Quand la droite de régression a été trouvée significative à la fois sur le

plan pratique et du point de vue statistique, il reste à rechercher l'erreur qui
découle de son utilisation. A cet effet, on considère l'intervalle de confiance
de Y, vraie valeur de y et l'intervalle de prévision de y-Y, écart à la régres-
sion vraie. On les obtient en prenant la variance de y et celle de {y-y ) d'après
c c
l'équation de régression. Les racines carrées de ces variances fournissent les
écarts types demandés. L'écart type de y pour une valeur de x fixée est
(x-x)2
'D^f* »4WïT+ ^]
l(x-x)2
L'intervalle de confiance à 0,90 pour y attaché à une valeur donnée de x, y(x)

est donné par
*KU)-%o5in-2) 8
[y c (x) J < T (x)
< yc(x) + t
o,95 (n - 2) 8 C y c (x) ] l = °» 90
où Y(x) est la vraie valeur de y (x) pour x donné et t_ _,.(n-2) la valeur de

probabilité 0,05 dans une table t de Student. Il faut se rappeler que y (x) est
une valeur moyenne liée et non une valeur y à prévoir. Cet intervalle de confiance
ne se rapporte qu'à cette moyenne et ce n'est pas l'intervalle de confiance d'une
valeur particulière prévue. Ce dernier doit être obtenu à partir de l'écart type des
observations des y rapportées à la vraie droite de régression. Ceci inclut la varia-
bilité des points par rapport à la droite de régression empirique et la variabilité
des y ou la régression empirique,
c
L'écart type, pour x donné, est
Q
•v V R , (x-x-)2
u
n-2 " Kx-x)'
On l'appelle quelquefois erreur type de la prévision, en langage statistique. L'inter-

valle de prédiction à 9Q& pour une valeur prévue de y, x étant donné, est donc
p y (x) c
* c " "b,05(n-2) s (y- T ( x Q [y-***)] < y c (*) + ^ 9 5 ("- 2 >s [y-Y(x)| } = 0,90
où t est le même que pour l'intervalle de confiance de Y*.
Comme dans le cas du calcul des charges de refroidissement de l'air en

conditionnement d'air, il peut se faire que deux variables météorologiques entrent
en jeu, mais que les équations les reliant à la variable de calcul comportent des
constantes que des considérations physiques ne suffisent pas à déterminer. Le pro-
blème devient, dans ce cas, celui d'une régression à deux variables indépendantes.
D'une autre manière, on peut également traiter comme une régression linéaire à deux
variables indépendantes le cas d'une régression à une variable où la forme linéaire
ne suffit pas à expliquer toute la variabilité et où il convient d'ajouter une forme
quadratique.
A trois dimensions, la régression linéaire peut être représentée d'une façon

adéquate par
x
lc " b l + b2(x2 " V *b3(x3 ~ V
auquel cas b, est estimé par x..
* Voir exemple 6 à la fin du chapitre.

Les b sont appelés coefficients de régression. On les estime à partir des équa-
tions normales générales mentionnées précédemment, ramenées au cas particulier d'un
système à deux variables indépendantes.
Si on adopte la notation générale suivante
6ij =I.(xi-xi)<xj-x\j)
on a
Qu=I(x1-î1)2
et
fi12 B ïtxj-itj) (x2-jc2)
Les équations normales pour deux variables indépendantes s'expriment alors par
fi22b2 + fi23b3 = Q 1 2
Q 23 b 2 * Q 33 b 3 - Q n
ou, en notation matricielle
00
ra-a
Sous cette forme, on voit immédiatement comment les équations normales peuvent être
généralisées à la régression è un nombre quelconque de dimensions. Les coefficients
b autres que b. peuvent être obtenus directement par la résolution simultanée des
équations normales, mais on trouvera plus commode d'exprimer ces solutions à l'aide
des multiplicateurs de Gauss qui permettent d'étendre le calcul è un nombre quelconque
de variables indépendantes.
Avec les multiplicateurs de Gauss c.., et en notation matricielle, la

première équation devient
{
'22 '23 22 *23
= 1
'23 c,,«
33 '23 C
33 J Lo
ou, dans le cas général, avec k variables
[clfel = 1
l'indice 1 n'apparaissant pas parce que les x sont pris par rapport à leur
moyenne.
L'inversion donne
D0 = H -1
C'est-à-dire la matrice des C est la matrice inverse de celle des Q. Les b
se calculent alors à partir de l'équation
s
12
!
13
= C
{
'2k lk
Si
D s
°23 " V ^ S
les c sont donnés par
22
'23
et
c
33 = V *
Les b sont alors donnés par
b X
l = l
b = C
2 22 Q 12 +
°23Q13
et
b C
3 = 23 Q 12 + C
33 Q 13
Les solutions pour k variables dépendent du calcul de la matrice inverse de celle

des Q. Ceci se fait facilement par la méthode des pivots.
Le méthode est simple à appliquer, mais la place manque pour la discuter

ici (voir Rao ou Snedecor pour les détails). L'examen des hypothèses sur la régres-
sion est encore facilité par l'analyse de variance. Il faut, pour cela,introduire
deux autres formes Q
! = Q
1.2...k ll ~ b 2 Q 12 ~ b 3 Q 13 ~ ••' ~ b k Q lk
et
Q = Q - b 0
p-q *PP p-q pq
ou
p.q %/%n
b est le coefficient empirique de régression entre x et x .

P,cl p q
L'analyse de variance de la régression multiple est alors
A/V de la régression multiple
Somme des carrés degrés de liberté
prise en compte par Q 2

ll " Q1.23
x 2 et x 3
non expliquée par Q n-3

1.23
x 2 et x«
Totale Q n-1
n
Le coefficient de régression multiple est donné par
2 (QQll-
u- QQ1.23)
i.
r
i.23 *v—q^—'
et le test de signification de la régression multiple s'effectue en considérant
(Q11-01.23)/2
F(2 n 3)
'" " - a a -
Les trois analyses de variance simples sont les suivantes
A/V de x. en Xg
Somme des carrés degré de liberté

liée à x„ Q 1
ir Q 1.2
non liée à x« Q n-2
1.2
totale Q
ll n-1
Le coefficient de corrélation simple entre x. et x« est alors donné par
r
1.2
*L1
et le test en F considère
P U . „- 2 ) • ( ^ ^ • 0
Q
1.2/n-2
A/V de x. en x,.
somme des carrés degré de liberté

liée è x. Q
ll * Q1.3
non liée à x. n-2

<1.3
totale
11 n-1
Q
ll - Q1.3
1.3
Q
ll ' Q1.3
F(l, n-2) =
Q
1.3/ n - 2
A/V de XQ en x^

liée h x« Q 1
22 " Q2.3
non liée è x» Q n-2
2.3
totale Q22 n-1
'22 - % . :
2.3
'22
F(l, n-2) B fe "J^'3

^.S/1'
et r
L'analyse des coefficients de régression partielle r.g 3 i3 2
peut être faite à partir des quantités déjà disponibles dans les tableaux précédents.
Ces coefficients expriment respectivement la corrélation entre x^ et Xg quand on
a éliminé l'influence de x„ et la corrélation entre x1 et x^ après élimination
de l'influence de x«. Les tableaux d'analyse de variance fournissent encore de
façon commode les éléments pour les coefficients de corrélation et leurs tests de
signification. Ils permettent aussi de voir si l'ajustement en x„ réduit de
manière significative les résidus résultant de l'ajustement de x^ en x^ et si
l'ajustement en x« réduit le résidu après ajustement de x, en x^. Ceci est
important pour juger de l'utilité d'ajouter une variable ou, comme on le verra plus
loin, une puissance de la variable.
A/y partielle de x. en x~

accroissement dû Q 1
1.2 " Q1.23
b x
3
non pris en compte Q n-3

1.23
par x 2 et x«
non pris en compte n-2

par X2 °1,
Q
1.2 * Q1.23
13.2
«1.2
Pour vérifier le caractère significatif de ce coefficient de régression partielle

et de l'influence de x» après l'ajustement de x. en x-, on considère
Q
1.2 " Q1.23
F(l, n-3) s *"• *
Q
1.23/n 3
A/V partielle de x. en x^

accroissement dû à Q 1
1.3 " Q1.23
x
2
non pris en compte Q n-3

1.23
par x 2 et x^
non pris en compte Q

1.3 n-2
par x 3
Q
2 1.3 " Q 1.23
r12
'3 ' Q
1.3
On forme
Q
l 3 ' Q l 23
FI, n-3) . QQ1<3 n P3
1.23/"" 3
pour vérifier le caractère significatif de ce coefficient de régression partielle et

de l'influence de x« après l'ajustement de x. en x«. Le schéma de formation des
tableaux d'analyse de variance montre comment on peut étendre le cas de deux variables
indépendantes à un nombre plus élevé.
L'analyse pour l'équation du second degré
X = b + b
lc l 2X+b3x2
peut être conduite par la méthode précédente en remplaçant simplement x„ par les
carrés des valeurs de x et en substituant de même des puissances plus élevées aux
autres termes linéaires. La seule différence est que b. sera maintenant déduite de
b
l " *1 " b2*2 " l b3 Ix2
On constatera encore que les multiplicateurs de Gauss sont très commodes pour obtenir
les écarts types de x. et de (x.-SU) qui permettent de déterminer les limites
de confiance, [j^ est la valeur vraie de x. pour un couple (x2, x~). Les écarts
types pour une régression à trois dimensions sont alors donnés par
s(x lc ) = f — : — L - + c 22 (x 2 -x 2 ) + c 33 (x 3 -x 3 ) + 2c 23 (x 2 -x 2 ) (x3-x3lJ J*
pour un couple particulier (x_, x.).

L'erreur type d'une prévision sera, de même
s(xrS) , { J L ^ £i + i + c 2 2 (x 2 -x 2 ) 2 + c 3 3 (x 3 -x 3 ) 2 + 2c 23 (x 2 -î 2 ) Uj-ïjfl}*
Comme dans le cas simple à deux dimensions, l'intervalle de confiance peut être
déterminé en utilisant la variable t de Student avec, ici, (n-3) degrés de liberté.
Quand il y a k variables indépendantes, les écarts types deviennent
,,Xlc,. pL^* [i • ih ,i2 o ^ - v uâ}*

la sommation étant telle que chaque terme rectangle apparaît deux fois/
et ,,„,-*, . { M ^ Q + 1 + j 2 j 2 Cij(lrïi) (x .. ; . a ji
Pour déterminer les intervalles de confiance avec la variable t de Student, on

adoptera (n-k) degrés de liberté.
EXEMPLE 6 - REGRESSION SIMPLE
On demande de trouver la relation linéaire entre la consommation quotidienne d'élec-

tricité d'un hôtel, en kwh, et les degrés-jours au-dessus de 65°F, les données
observées étant les suivantes :
x(DD) y(kwh)
5 878
8 1 081
10 1 160
16 2 948
14 3 094
14 3 002
19 3 275
8 ï 200
10 1 357
17 3 354
18 3 254
9 1 355
0 11
148 25 969
On tirera de ces données zx = 148; ïy s 25 969; ixy = 370 330;

2 2
ix = 2 056; ï y = 68 241 641.
2 2
D'où y = 1 997,62; n = 13; ÎJÙ s 1 684,92; ^ = 51 876 073,8;
et ÎÏH = 295 647,08.

n '
On a immédiatement les sommes réduites des carrés
Q ^ = Xxy - ± ixly = 74 682,92
I(x-x)2 = 2 056 - 1 684,92 = 371,08

et
Q T = *(y-y) 2 = 68 241 641 - 51 876 074 = 16 365 567
Alors
b = ^2— 2 . 7 4 682 ' 92 = 201,26

Kx-x") 371,08
ï = ifl = 11,38
13
25 9 6 9
a =y = = 1 997,62
13
D'où
y c = 1 997,6 + 201,3 (x - 11,4)
soit, en éliminant x
y = -297,2 + 201,3 x
La régression fait apparaître un léger décalage de 297,2 kwh. Ceci indique que le
conditionnement d'air n'est utilisé que quand la température dépasse légèrement 65°F.
Si on passe outre, pour que la régression donne y s 0 pour x = 0, le coef-
ficient de régression est simplement
b m Xxy o 3T0_23fi = M ,
Ix 2 2 056
et
y» = 180,1 x
Une simple analyse de variance permet de tester la régression et de trouver la

corrélation :
Degré de
Variabilité Somme des carrés liberté Carré moyen
prise en compte par la . Qj . 15 030 556 1 15 030 556

régression . .
'non expliquée par la Q T -Q B = 1 335 011 il 121 365
régression
par rapport à la moyenne Q T = 16 365 567 12
Le rapport des carrés moyens est distribué comme F avec 1 et 11 degrés

de liberté
F(l, 11) • » 0 3 ° " 6 - 123,8

121 365
La table de F montre que
F{F(1,U) > 4,84}^ <0,05
La régression est donc significative.

Le,carré du coefficient de corrélation entre x et y, qui est proportionnel à la
quantité d'information, est donné par
2 «B = 1? 030 ??6 _ 0 9 184

r = 16 365 567
Ceci indique que la régression linéaire rend compte dans une forte proportion de la
liaison entre y et x (plus de 9055). Le carré du coefficient de corrélation doit
toujours être préféré pour avoir une mesure honnête du degré de liaison. Pour estimer
l'erreur d'une prévision, il faut calculer l'erreur type de y - Y ou Y est la
valeur vraie de y . Cette erreur type est donnée par
s(y - Y) = n
\ n -2 L K x - 3Ï)2 J J
1
121 365 [1,077 +
l 371,08
I}
J)
- 2
Si x = 15, par exemple, (x - x) = 184,96
Alors
s(y-Y) = (x - x ) 2 = 184,96
y 121 365(1,077 x 0,498)
-V 191 150 = 437,2
y - Y étant distribué comme t avec n - 2 degrés de liberté, on trouve, dans une

table t, pour 11 degrés de liberté, que les valeurs de t correspondant aux pro-
babilités 0,05 et 0,95 sont + 1,796.
Donc 1,796 x 437,2 = 785,2. La valeur vraie de y ou Y pour x = 15°F a

donc une probabilité de 0,90 d'être comprise dans l'intervalle (3020 ± 785), c'est-
à-dire
p{2 2 3 5 < Y < 3 805[ = 0,90

REFERENCES
Les cinq premiers ouvrages de la liste sont recommandés comme références générales.
Aitken, A. C. — Statistical mathematics (1939). Oliver and Boyd, Londres.
Snedecor, G. W. ~ Statistical methods (1956). Iowa State Press, Ames, Iowa,
Dixon, W. J., et Massey, F. J. —- Introduction to statistical analysis, première

et deuxième éditions, (1951) et (1957). McGraw-Hill, New York.
Hald, A. — Statistical theory with engineering applications (1952). John Wiley,

New York.
Mood, A. M. — Introduction to the theory of statistics (1950). McGraw-Hill,

New York.
Fisher, R. A. — Statistical methods for research workers (1938), septième édition

et les suivantes. Oliver and Boyd, Londres.
Gumbel, E. J. — Statistics of extrêmes (1958). Columbia University Press, New York.
Lieblein, J. — A new method of analysing extreme-value data (1954). U. S. Nat.

Adv. Comm. For Aero., Technical Note No. 3053.
Pearson, K., et al. — Tables of the incomplète r-function (re-issue 1951).

Cambridge University Press, Londres.
Pearson, E. S., et Hartley, H. 0. — Biometrika tables for statisticians,

Vol. 1, (1956). Cambridge University Press, Londres.
Quenouille, M. H. — Associated measurements (1952). Butterworths, Londres.
Rao, C. R. — Advanced statistics in biométrie research (1952). John Wiley,

New York.
Thom, H. C. S. — The frequency of hail occurrence, Archiv fUr Météorologie, Geo-

physik und Bioklimatologie, Série B, Band 8, 2 Heft (1957). pp. 185-194.
U.S. National Bureau of Standards — Tables of the binomial probability distribution

(1950). Applied Mathematics Séries 6.
Weatherburn, C. E. — A first course in mathematical statistics (1949). Cambridge

University Press, Londres.
NOTES TECHNIQUES de l'OMM
No. 90 Measurcment of peak discharge by indirect methods. Prepared by M. A. Benson.
No. 91 Methods in use for the réduction of atmospheric pressure.
No. 92 Hydrological forecasting (Proceedings of the WMO/Unesco Symposium on Hydrological Forecasting, Surfers'
Paradise, Australia, 1967).
No. 93 Vertical wind shear in the lower layers of the atmosphère.
No. 94 Measurcment of atmospheric radioactivity. By O. Suschny.
No. 95 Aeronautical meteorology (Proceedings of the Scicntific and Technical Conférence on Aeronautical Meteorology,
London, 18-29 March 1968).
No. 96 Air pollutants, meteorology, and plant injury (Report of the Working Group on Plant Injury and Reduclion of
Yield by Non-radioactive Air Pollutants of the Commission for Agricultural Meteorology, prepared by E. I.
Mukammal, chairman - C. S. Brandt - R. Ncuwirth - D. II. Pack - W. C. Swinbank).
No. 97 Practical soil moisture problems in agriculture (Report of the Working Group on Practical Soil Moisture Problems
in Agriculture of the Commission for Agricultural Meteorology, prepared by G. Stanhill, chairman - W. Baier -
J. J. Doyle - M. Gangopadhyaya - L. A. Razumova - E. J . Winter).
No. 98 Estimation of maximum floods (Report of a working group of the Commission for Hydrometeorology).
No. 99
Meteorological factors affecting the epidemiology of wheat rusts (Report of the Working Group on Meteoro-
logical Factors Affecting the Epidemiology of Wheat Rusts of the Commission for Agricultural Meteorology,
No. 100 prepared by W. H. Hogg, chairman - C. E. Hounam - A. K. Mallik - J. C. Zadoks).
No. 101 Data processing for climatological purposes (Proceedings of the WMO Symposium, Asheville, N.C., 1968).
Meteorology and grain storage. By C. V. Smith.
N° 102 Les seiches et dénivellations causées par le vent dans les lacs, baies, mers, estuaires. Par le professeur
L. J . Tison et le professeur G. Tison, J r .
No. 103 Sea-surface température (Lectures presented during the scientific discussions at the fifth session of the Com-
mission for Maritime Meteorology).
No. 104 Proceedings of the WMO/IUGG Symposium on Radiation, including Satellite Techniques.
No. 105 Artificial modification of clouds and précipitation. By Morris Neiburger.
No. 106 Meteorological aspects of air pollution.
No. 107 Meteorological observations in animal experiments. Edited by C. V. Smith.
No. 108 Urban climates (Proceedings of the Symposium on Urban Climates and Building Climatology, jointly organized
by the World Health Organization and WMO, Brussels, October 1968) (Volume I).
No. 109 Building climatology (Proceedings of the Symposium on Urban Climates and Building Climatology, jointly
organized by the World Health Organization and WMO, Brussels, October 1968) (Volume II).
N° 110 L'utilisation des radars météorologiques pour l'aéronautique (Rapport d'un groupe de travail de la Commission
des instruments et des méthodes d'observation, préparé par IL Treussart, président - W. B. Beckwith -
S. G. Bigler - K. Otani - V. V. Kostarev - R. Schwarz).
No. 111 The planning of meteorological station networks. By Professor L. S. Gandin.
No. 112 Performance requirements of aerological instruments. An assessment based on atmospheric variability. By
C. L. Hawson.
No. 113 Weather and animal diseases. By L. P . Smith.
No. 114 Meteorological factors in air pollution. By A. G. Forsdyke.
No. 115 Machine processing of hydrometeorological data. Prepared by a working group of the Commission for Hydro-
meteorology.
No. 116 Investigations on the climatic conditions of the advancement of the Tunisian Sahara. By Professor H. Flohn
(with the collaboration of M. Ketata).
No. 117 Use of weirs and flumcs in stream gauging (Report of a working group of the Commission for Hydrology).
No. 118 Protection of plants against adverse weather. By G. W. Hurst and R. P . Rumney.
No. 119 The application of micrometeorology to agricultural problems (Report of the Working Group on Agrometeo-
rological Aspects of Micrometeorology of the Commission for Agricultural Meteorology).
No. 120 Review of forecast vérification techniques. By E. M. Dobryshman.
No. 121 Dispersion and forecasting of air pollution (Report by a working group of the Commission for Atmospheric
Sciences, prepared by R. G. Munn, chairman - A. E. J. Egglcton - L. Facy - D. H. Pack - F . H. Schmidt).
No. 122 Sonic environmental problems of livestock housing. By C. V. Smith.

Climat

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Climat

Transféré par

Droits d'auteur :

Formats disponibles

ORGANISATION MÉTÉOROLOGIQUE MONDIALE

(traduite par R. ARLÉRY)

Secrétariat de l'Organisation Météorologique Mondiale - Genève - Suisse

L'Organisation météorologique mondiale (OMM) est une institution spécialisée des

Les buts de l'Organisation sont les suivants :

L'Organisation se compose des organes suivants :

WORLD t\rrbv^m£\c*i 0*<k*n\i*r'*N'

Secrétariat de l'Organisation Météorologique Mondiale - Genève - Suisse

© 1972, Organisation météorologique mondiale

Résumé (français, anglais, russe, espagnol) VII

Chapitre I - Les séries climatologiques

1.1 La distribution de fréquence 2

1.2 Distribution cumulée 3

1.3 Homogénéité d'une série de données 4

1.4 Ajustement des moyennes climatologiques 8

Chapitre II - Estimation des paramètres de population

2.1 Généralités sur les statistiques 12

2.2 Paramètres statistiques les plus courants 13

2.3 Variabilité d'échantillonnage des moyennes climatologiques 15

Chapitre III - Les méthodes statistiques générales

3.1 Distributions de fréquence 18

3.1.6 La loi binomiale négative 34

3.2 Corrélation et régression 38

A sa troisième session (Londres, décembre i960), la Commission de clima-

En conclusion de ce travail, le président du groupe, M. H.C.S. Thom,

J'ai le plaisir de présenter ici le résultat de son travail. Tout en

L'analyse statistique moderne est l'aspect mathématique de l'analyse clima-

Etant donné que certains relevés météorologiques ne constituent pas des

Après avoir abordé, d'une manière générale, le problème fondamental des

La Note passe en revue plusieurs distributions de fréquence fondamentales :

Les grandes lignes de l'analyse de corrélation et de régression sont

L'auteur étudie en détail l'analyse de régression, notamment le cas du

Modem statistical analysis is the mathematics of climatological

After defining a climatological séries to lay the basis for valid

Since some meteorological records do not form climatological séries

Several fundamental frequency distributions are treated, including

Corrélation and régression analysis are discussed in gênerai. The

Régression analysis is discussed in détail, including linear ré-

CoBpeueHHbie CTaTMCTMHecKwe aHauwabi ABJHUOTCJX MaTe-

pa3paÔ0TKH TaKMx n p o m o s o B . MeTCUM npeacTaBjieHHwx ajiecb

Ilocjie onpejiejieHHH KJlifMaTojiorHMecKHX cepuft, KOTO-

pwe nojioxemj B ocHOBy cTaTwcTimecKoro aHajM3a, aBTop p a c -

MaTojiorHMecKoro aHajiHsa) • Ma aToro ecTecTBeHHO BwTeKaeT

poe H ecTb HM MTO MHoe, KaK KJiMMaTOjiorHMecKifft nporHoa,

yMMTbiBafl, MTO HeKOTopwe MeTeopojiorimecKHe .naHHbie

Ilocjie oômeit oueHKM OCHOBHMX npoôjieM cTaTwcTHHec-

EblJIM AOCTMrHyTbl HeKOTOpbie OCHOBHbie IIOBTOpJieMOCTM

MMajibHoro, riyaccoHa M OTpHO,aTeJibHbie ÔMHOMMajibHbie.

ABTOP HaxojiMT HawjiyMiDMe cnocoôbi pac^eTa napaiieTpoB M

aaeT jaeTajibHbie noacHeHHH AJIH McnojibaoBaHUH npw odpaÔOTKe

KoppejiHUHOHHbiH aHajiH3 M aHajiH3 ypaBHeHMft perpeccHw

ABTOP .naeT AeTajibHbiH aHajma ypaBHeHHio perpeccHH,

caiiOH perpeccMM. «ftaeTca TaKxe nccjiejiOBaHMe jiHHettHOCTM

Hbie omHÔKM B nporH03ax.

El anâlisis estadlstlco moderno constituye el aspectoraateraâtlcodel anâllsis

1.1 La distribution de fréquence

La distribution de fréquence est le moyen fondamental pour décrire et ana-

Précipitations d'août (en mm) è Genève (Suisse)

Année P Année P Année P

Pour trouver l'intervalle de classe de la série climatologique, on opère

Distribution de fréquence des précipitations d'août à Genève

En pointant ces fréquences, sous forme de petis rectangles verticaux de

1.2 Distribution cumulée

Le climatologiste est plus souvent appelé à estimer des probabilités rela-

WORLD t\rrbv^m£\ci 0<kn\ir'*N'