Vous êtes sur la page 1sur 11

R EVUE DE STATISTIQUE APPLIQUÉE

W. K RYSICKI
Application de la méthode des moments à l’estimation des
paramètres d’un mélange de deux distributions de Rayleigh
Revue de statistique appliquée, tome 11, no 4 (1963), p. 25-34
<http://www.numdam.org/item?id=RSA_1963__11_4_25_0>

© Société française de statistique, 1963, tous droits réservés.


L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti-
lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im-
pression systématique est constitutive d’une infraction pénale. Toute copie ou im-
pression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme


Numérisation de documents anciens mathématiques
http://www.numdam.org/
APPLICATION DE LA MÉTHODE DES MOMENTS
A L’ESTIMATION DES PARAMÈTRES D’UN MÉLANGE
DE DEUX DISTRIBUTIONS DE RAYLEIGH

W. KRYSICKI
Professeur à l’Ecole Polytechnique de LODZ (Pologne)

I - INTRODUCTION

Comme on le sait, ce n’est que rarement, dans les applications


pratiques, que l’on rencontre une population générale homogène. Beaucoup
plus souvent apparaissent des populations hétérogènes, formées par le
mélange de deux, et parfois d’un plus grand nombre, de populations dans
lesquelles la caractéristique étudiée est soumise à la même distribution
d’un type de densité connu f (x, a, b, ... ) mais avec diverses valeurs
des mêmes paramètres a, b, en nombre fini. En désignant par p le
...

pourcentage de la première des populations partielles et nous limitant au


cas d’une population générale composée de deux populations partielles ,
nous obtiendrons la formule de la densité d’un mélange de deux distri-
butions :

p f (x, al, bl, ... ) + ( 1 - p) f (x, a2, b2, ... ) (1.1)


En 1894 K. Pearson [1](1) a publié le premier ouvrage sur ce sujet,
ouvrage concernant l’estimation des paramètres du mélange de deux dis-
tributions normales.
Dans son travail, il étudiait la fonction :

où ni +
n 2 = N désignait le nombre total des observations ; il est évident
qu’il suffit de poser nl/N = p pour que la droite de la formule (1.2) pren-
ne l’aspect (1.1).

Gumbel [2], Mendenhall et Hader [3], ainsi que Ridder[4] ont pu-
blié d’autres travaux dans ce domaine.

II - PRESENTATION DU PROBLEME

Dans le présent travail nous adoptons la distribution de Rayleigh


comme distribution paraissant dans la formule (1. 1) ; la densité est alors
définie par la formule

---------------

(1) Ces numéros correspondent aux références bibliographiques.

Revue de Statistique Appliquée. 1963 - Vol. XI -


N 4 25
Il est facile de démontrer que cette densité atteint un maximum pour
x =
Vk dont la valeur est :

Ainsi la dominante de cette distribution est x =


V-7.
Pour établir la médiane Me de la distribution il faut résoudre
l’équation

d’où nous obtenons

La courbe de la densité possède un point d’inflexion

Fig. 1.

La figure (1) représente la courbe de densité de Rayleigh pour


k =
0, 25 où l’on a indiqué la mode Mo, la médiane M., ainsi que l’abs-
cisse du point d’inflexion. La figure (2) correspond à k 0, 0625. =

26 Revue de Statistique Appliquée. 1963 - Vol. XI - N’ 4


Conformément à (1. 1), la densité du mélange de deux distributions
de Rayleigh dans la proportion p : (1 - p) est exprimée par la formule (2. 2) :

Fig.3.

Les figures 3 et 4 donnent les densités du mélange de deux distri-


butions de Rayleigh pour diverses valeurs des paramètres.
Les moments simples de la distribution de Rayleigh (2. 1) donnés
par la formule

peuvent être calculés facilement en exprimant l’intégrale ci-dessus par


la fonction gamma.

Ainsi dans le cas où m est un nombre pair nous obtenons, après


quelques transformations :

03B12l =
(2k)l r (l + 1) l= 1, 2, 3, ... (2.3)
et dans le cas où m est un nombre impair :
-

Revue de Statistique Appliquée. 1963 - Vol. XI - N’ 4 27


Fig. 4

Supposons maintenant que l’on a pris un échantillon aléatoire de n


éléments de la population générale formée du mélange de deux distribu-
tions de Rayleigh dont la densité est donnée par la formule (2. 2). Les
résultats étant

xj, x2, ....., x, (2. 5)


A partir des résultats (2. 5) nous calculons les moments simples de
l’échantillon et il s’agit d’estimer sur cette base les paramètres incon-
nus du mélange (2. 2).

Nous allons considérer deux cas selon que le rapport p : (1 - p)


est connu ou non.

III - 1er CAS : p ET LES PARAMETRES b1 ET b2 INCONNUS

Dans ce cas, pour estimer les trois paramètres p, bl, b2 nous uti-
liserons les trois premiers moments simples calculés à l’aide de l’échan-
tillon aléatoire (2.5)

Désignons les estimateurs des paramètres inconnus p, kil k?/ cal-


culés à partir des trois premiers moments simples (3.1) par p, k1, k2,
alors des formules (2.3), (2.4), (3.1) nous obtiendrons :

28 Revue de Statistique Appliquée. 1963 - Vol. XI -


N’ 4
En introduisant des inconnues auxiliaires définies par la formule

nous allons ramener le système d’équations (3. 2) à un système de trois


équations rationnelles

Tirons p de la première des équations (3.4) et portons cette valeur


dans la seconde et dans la troisième de ces mêmes équations ; dans ce
cas on peut présenter ce système sous la forme :

Introduisons encore une fois de nouvelles inconnues

u1 + u2 = v (3. 6)
u1 u2 = w

Alors le système (3. 5) prend la forme

c1 v - w = c2 (3.7)
c 1 ( V 2 - w) - vw = C3
où l’on a substitué

En résolvant le système (3. 7) nous obtenons

Revue de Statistique Appliquée. 1963 - Vol. XI -


N 4 29
Pour plus de commodité introduisons les notations

On aura donc

Pour obtenir les estimateurs recherchés ki = u2i, i = 1, 2, à partir


des formules (3.6) et (3.11), nous calculons

et nous obtenons l’équation

M2k2 - (A2 - 2BM) k + B2 = 0 (3.13)

Nous basant sur (3. 10) et (3. 8), nous obtenons finalement une équa-
tion dont lés racines constituent les estimateurs recherchés ki, i = 1, 2,
des paramètres inconnus ki :

Il est évident qu’en calculant les racines de l’équation (3.14) en


fonction des moments al, a 2’
a3’ calculés à partir de l’échantillon, nous
pouvons obtenir soit des racines complexes conjuguées, soit des racines
réelles qui ne seront pas toutes les deux positives. Cela peut prouver
que notre hypothèse que la population étudiée a été formée du mélange
de deux distributions de Rayleigh n’est pas vraie, mais cela peut aussi
arriver lorsque l’échantillon ne contient pas de nombreux éléments bien
que notre hypothèse soit vraie.
Pour des échantillons de grande taille avec une probabilité égale à
1, en admettant que notre hypothèse est vraie, nous aurons les inégalités
(3.15), ci-après.
Dans le cas où l’équation admettra deux racines positives, il reste
la question de savoir laquelle des deux racines de l’équation (3.14) est
l’estimateur kl
et laquelle l’estimateur k2 ?
allons montrer que c’est indifférent : il résulte de la forme
Nous
des équations du système (3. 2) que l’échange simultané qu’on y fait de
k1 et k2
d’une part et de p et 1 - p d’autre part ne change aucune des
équations du système (3. 2).
Prenons donc l’une des racines de l’équation (3.14) comme par kl,
exemple, la plus petite, que nous désignerons par k’, par là même nous
considérons la seconde racine k" comme k2
et calculons p par exemple
de la première des équations. (3. 2).

30 Revue de Statistique Appliquée. 1963 - Vol. XI - N 4


Si cependant au début nous avions adopté le contraire, c’est-à-dire
k’ = k"
k2, = kl, le second membre de l’égalité précédente représenterait
alors 1 - p.
Les estimateurs kl, k2
ainsi obtenus des paramètres inconnus kl,
sont fonction des moments de l’échantillon. Comme la va-
(al,
k2 a2,
leur moyenne du moment ai de l’échantillon est égale au moment a, de
a3)
la population générale, il résulte donc du théorème de Khintchine que le
moment ai dans l’échantillon, pour n ~~ , converge en probabilité
vers le moment
ai dans la population, si ce dernier existe, évidemment.
Si donc kl f k2, de la continuité des et point estimateurs kl k2 au
considérés comme fonctions des (al, a2,
(03B11 03B12 , a3 ) il résulte qu’ils
a3),
sont des estimateurs convergents pour des paramètres inconnus kl, k2
car si en même temps les
ai’ (i = 1, 2, 3) sont suffisamment proches
des ai’ on a alors :

kl &#x3E; 0, k2 &#x3E; 0 et 0 p 1 (3.15)

Considérons maintenant le cas kl = k2 = k

Alors

Calculons ensuite les limites en probabilité (stochastiques) des coef-


ficients de l’équation (3.14) : pour n ~ ~, on a :

Ces limites stochastiques sont - comme on le sait - égales aux


valeurs moyennes des distributions asymptotiquement normales que sui-
vent, pour les grandes valeurs de n, les variables aléatoires figurant à
la gauche des dernières expressions. Les variances de ces variables ont
la forme [5, 27. 7]
Cn-1 + 0 (n-3/2)
où C est une constante déterminée.

IV - 2ème CAS : p CONNU, LES PARAMETRES bl, b2 INCONNUS

Ce cas se présente en pratique assez souvent, et notamment lorsque


dans la production en série effectuée par exemple par deux machines (ou
ensembles de machines) le nombre des objets fabriqués en série par cha-
que machine (ou chaque ensemble de machines) dans un même temps est

Revue de Statistique Appliquée. 1963 - Vol. XI -


N’ 4 31
connu. Dans ce cas p est connu et il ne reste à estimer par la méthode
des moments que les paramètres b1 et b2 du mélange des distributions
de Rayleigh. Il suffit donc de prendre en considération les deux premiè-
res équations du système (3. 2) et après l’introduction des inconnues auxi-
liaires selon la formule (3. 3) - les deux premières équations de systè-
me (3.4). Après élimination de U2 nous obtenons de ce système l’équa-
tion suivante par rapport à l’inconnue ul :

De cette équation, nous déduisons ul, et ensuite, nous basant sur


la formule (3. 3), nous obtenons

où q = 1 - p.
Remplaçant p par q dans l’équation (4. 1), nous obtiendrons une équa-
tion concernant u2, il en résulte qu’en échangeant p et q, le second mem-
bre de l’égalité (4. 2) va déterminer les deux valeurs La première des k2.
équations (3.4) montre que, si dans la formule (4. 2) nous posons le si-
gne plus, nous obtiendrons la valeur correspondante de l’estimateur k2
en échangeant réciproquement dans cette formule p et q et en posant le

signe moins devant la racine carrée.


Au signe moins devant la racine carrée dans la formule (4. 2) pour
kl, correspond, outre le changement entre p et q, le signe plus devant
la même racine carrée, le second membre de l’équation (4. 2) représen-
tera alors k2.
Si donc p =
1 2, les équations concernant ul et u2 deviennent identi-
ques, alors l’une des valeurs (n’importe laquelle) déterminée par la for-
mule (4. 2) est considérée comme et l’autre comme k1 k2.
Si p f 122, alors lorsque k1 &#x3E;
k2 il faut adopter dans la formule (4. 2)
le signe supérieur, si au contraire k1 k2 on adopte le signe inférieur
et, dans la formule pour k2 les signes contraires à ceux qui sont donnés.

V - VARIANCE ASYMPTOTIQUE DES ESTIMATEURS

Dans le cas général, c’est-à-dire lorsqu’il s’agit de l’estimation


des trois paramètres inconnus p, bl, b2 le calcul des variances asymp-
totiques des estimateurs serait assez pénible et sans grand intérêt, aussi
nous bornerons-nous au cas où p est connu.

Nous aurons alors [4, 27. 7. 3]

où l’on doit calculer les valeurs des dérivées partielles au point

32 Revue de Statistique Appliquée. 1963 - Vol. XI - N 4


a2 = 03B12 ~ 2 (pkl + qk2L q = 1 - p

Nous calculons donc les variances et la covariance des moments


(par exemple selon [6, (10.5), (10.6)]) et nous obtenons :

La variance du moment de l’échantillon a2 dépend également du qua-


trième moment a4 de la population générale que nous déterminons à par-
tir des formules (2. 3) et (3. 2).

Ceci étant posé, nous aurons :

Nous calculons ensuite les dérivées partielles supposant k1 &#x3E;


k2,
c’est-à-dire admettant dans la formule (4. 2) le signe supérieur nous
obtenons

Les valeurs de ces dérivées au point (al, a2 ) déterminé par la


formule (5. 2) seront respectivement

Pour finir, nous portons (5.3), (5.4), (5.5) et (5.8) dans (5.1) et
nous obtenons :

Revue de Statistique Appliquée. 1963 - Vol. XI - N 4 33


REFERENCES

[1] PEARSON K. - Contributions to the mathematical theory of evolution.


Philos Trans. Roy. Soc. London, Vol. 185 A, 1894, 71-110.
[2] GUMBEL E. J. La dissection d’une répartition. Annales de l’Uni-
-

versité de Lyon, Série 3, Section A, Fascicule 2, 1940, 39-51.


[3] MENDENHALL W. , HADER R. J. - Estimation of parameters of mixed
exponentially distributed failure time distributions from censored
life test data. Biometrika, Vol. 45, 1958, 504-520.

[4] RIDDER P. - The method of moments applied to a mixture of two


exponential distributions. Annals of math. Stat. , 1960.
[5] CRAMER H. - Mathematical Methods of statistics, 1946.
[6] KENDALL M. G. , STUART A. - The advanced theory of statistics,
vol. 1, 1958.

34 Revue de Statistique Appliquée. 1963 - Vol. XI - N’ 4

Vous aimerez peut-être aussi