Chap Stat 4

Estimation paramètrique III
Skander HACHICHA
skander.hachicha@enit.utm.tn
Université de Tunis El Manar

Ecole nationale d’ingénieurs de Tunis
Estimation paramètrique III 1 / 36

Skander HACHICHA 1 / 36
Echantillons gaussiens
Définition
Soit (X1 , · · · , Xn ) un échantillon de la loi normale N (0, 1).
On appelle loi du "Khi-deux" à n degrés de libertés, la loi de la
variable aléatoire réelle
Un = X12 + · · · + Xn2 .
On la note χ2 (n). Elle est aussi la loi Gamma de paramètres ( n2 , 12 ) et

admet pour densité
n
1 2
2 1 n
f n , 1 (x) = e− 2 x x 2 −1 IR∗+ (x).
2 2 Γ( n2 )

Définition
Soit (X1 , · · · , Xn ) un échantillon de la loi normale N (0, 1).
On appelle loi de Student à n degrés de libertés, la loi de
√
nY
τn = q
X12 + · · · + Xn2
où X1 , · · · , Xn , Y sont des variables aléatoires indépendantes de

même loi N (0, 1). On la note t(n). Sa densité est donnée par
!− n+1
Γ( n+1
2 ) x2 2
fτn (x) = n √ 1+ .
Γ( 2 ) nπ n

Définition
On appelle loi de Fisher à n et m degrés de libertés, notée F (n, m),
la loi de la variable aléatoire réelle
Un /n mUn
F = =
Vm /m nVm
où Un et Vm sont des variables aléatoires indépendantes de loi

respectivement χ2 (n) et χ2 (m). Sa densité est donnée par
n m n
Γ( n+m
2 )n m
2 2 x 2 −1
f (x) = n+m IR+ (x).
∗
Γ( n2 )Γ( m
2 ) (m + nx) 2

Remarque
1 La loi de χ2 (n) est la loi Gamma de paramètres ( n2 , 12 ), on a
ainsi
E(Un ) = n et V(Un ) = 2n
Il y a des tables de la loi χ2 (n) pour
√ n ≤ 30.√Dans les
applications on peut admettre que 2Un − 2n − 1 suit
approximativement la loi N (0, 1).
2 Soit la variable aléatoire tn de loi de student à n degrés de
libertés, on a alors
n
E(tn ) = 0, ∀n ≥ 2 et V(tn ) = , ∀n ≥ 3.
n−2

Remarque
La densité de la loi de Student tend vers la densité de la loi normale
N (0, 1) lorsque n tend vers +∞. Il y a des tables de la loi de Student
pour n ≤ 30 ; pour n > 30, dans les applications, on peut admettre
que tn suit approximativement la loi N (0, 1).

Proposition
Soit (X1 , · · · , Xn ) un échantillon de la loi normale N (m, σ) et soient
n n
1X 2 1 X
Xn = Xk , Sn = (Xk − X n )2 .
n k=1 n − 1 k=1
Alors, on a
1 Pn
1 La variable X n = n k=1 Xk suit la loi normale N (m, √σn ) ou
√
n
encore σ (X n − m) suit la loi normale N (0, 1).
1 Pn
2 La variable n−1 S 2 = n−1
σ2 n σ2 n−1 k=1 (Xk − X n )
2 suit la loi du
χ2 (n − 1).
3 Les variables aléatoires X n et Sn2 sont indépendantes.
√

X√n −m
4 La variable aléatoire Tn = n 2
suit la loi de Student à
Sn
(n − 1) degrés de liberté.
Démonstration
1) Le vecteur X = (X1 , · · · , Xn ) est gaussien puisque ses
composantes sont de loi normales et indépendantes, donc X n qui est
une combinaison linéaire des composantes de X est une variable
2
aléatoire de loi normale de paramètres E(X n ) = m et V(X n ) = σn .
2)On pose Xk = σYk + m où Yk est de loi normale N (0, 1) et donc
Z = √1n nk=1 Yk est aussi de loi normale. Ainsi, on a :
P
σ
Xn = √ Z + m
n
n
n−1 2 X
S n = Yk2 − Z 2 .
σ2 k=1

Démonstration
Soit maintenant A la matrice orthogonale n × n dont les éléments de
la première ligne sont tous égaux à √1n et soit U = AY où Y est le
vecteur gaussien de composantes Yk .
Le vecteur U est gaussien et sa première composant U1 vaut Z.
Puisque A est orthogonale, on a ||Y ||2 = ||U ||2 et donc
Pn 2 Pn 2
k=1 Yk = k=1 Uk . Ainsi,
n
n−1 2 2 2
Uk2 .
X
S n = ||Y || − Z =
σ2 k=2
Enfin ΣU = ΣAY = AΣY At = AIAt = I où I est la matrice

identité. Les composantes de U sont donc indépendantes et de loi
Pn
N (0, 1). Cela entraîne que n−1 2
σ 2 Sn =
2
k=2 Uk suit la loi χ2 (n − 1),
√
et que cette variables est indépendantes de X n = nU1 .

Démonstration
3) On a
√ Xn − m 1
Tn = n−1 .
√σ
q
n−1 2
n σ 2 Sn
Tn suit donc la loi tn−1 d’après 1), 2) et 3).

Intervalle de confiance
Soit (X1 , · · · , Xn ) un n−échantillon de loi Pθ sur R où θ ∈ Θ. On

suppose que Θ ⊂ R mais tout ce qui va suivre peut être généralisée
dans le cas Θ ⊂ Rk . On estime le paramètre réel inconnu θ par
l’estimateur T (X1 , · · · , Xn ) dont pour une réalisation (x1 , · · · , xn )
de l’échantillon (X1 , · · · , Xn ) fournit une estimation ponctuelle
T (x1 , · · · , xn ) de θ. Cette estimation n’est pas reproductible (puisque
pour une autre réalisation (x′1 , · · · , x′n ) de l’échantillon on obtient
une autre estimation T (x′1 , · · · , x′n ) du paramètre θ) et on n’a pas
aucune idée de sa précision et l’erreur T (X1 , · · · , Xn ) − θ commise
en remplaçant θ par T est à la fois aléatoire et dépendante du
paramètre inconnu θ.

Le risque quadratique est une mesure "deterministe" de cette erreur

(ou plutôt de son carré), mais il dépend encore de la valeur inconnue
θ. Donc plutôt que d’estimer θ par une seule valeur T (x1 , · · · , xn ),
on préfère donner un ensemble de valeurs vraisemblable de θ. On
utilise pour cela, la notion de "fourchette d’estimation" ou encore la
notion d’intervalle de confiance qui a une forte probabilité de contenir
la vraie valeur du paramètre θ. Cet intervalle est choisi de manière à
contrôler par un niveau de confiance, les chances que le résultat aurait
d’être confirmé si on renouvelait l’expérience.

Définition
Soit α ∈ [0, 1] donné. On appelle intervalle de confiance de niveau de
confiance (1 − α) pour le paramètre θ un intervalle Iα (dépendant de
l’observation) qui a la probabilité 1 − α de contenir la vraie valeur
du paramètre θ
Pθ (θ ∈ Iα ) = 1 − α
Remarque
La probabilité (1 − α) est appelée niveau de confiance ou seuil de
confiance (le plus souvent fixé à 0.9, 0.95,0.99 ou 0.999).

Construction pratique
Soit (X1 , · · · , Xn ) un n−échantillon de loi Pθ et Tn un estimateur de

θ, on prendra le meilleur estimateur possible. On cherche à déterminer
(si possible) des fonctions t1 et t2 de θ telles que
Pθ (t1 (θ) ≤ Tn ≤ t2 (θ)) = 1 − α
Or cette démarche ne va pas toujours aboutir car le calcul de t1 (θ) et

t2 (θ) est très complexe. Le probléme est que la loi de Tn dépend de
paramètre θ, alors que α est un réel fixé à l’avance qui ne doit pas
dépendre de θ. Donc on ne peut déterminer t1 (θ) et t2 (θ) ne
dépendant que des observations que si la loi de Tn ne dépend pas de θ,
ce qui n’est pas toujours le cas. Ainsi, pour trouver un intervalle de
confiance, la méthode la plus efficace consiste à chercher une fonction
pivotale φ(Tn , θ), c’est à dire une variable aléatoire fonction à la fois
du paramètre θ et des observations (X1 , · · · , Xn ), dont la loi qu’on
espère connue ne dépend pas de θ.
Ainsi la détermination de l’intervalle de confiance de θ consiste à

déterminer les réels aα et bα telles que
Pθ (aα ≤ φ(Tn , θ) ≤ bα ) = 1 − α
Le problème revient à inverser cet intervalle et donc à déterminer les

valeurs a = a(Tn ) et b = b(Tn ) telles que
Pθ (a(Tn ) ≤ θ ≤ b(Tn )) = 1 − α
Mais le choix de aα et bα reste arbitraire puisque seule une équation

permet de les déterminer soit Pθ (aα ≤ φ(Tn , θ) ≤ bα ) = 1 − α ou
encore par passage au compémentaire
Pθ ((φ(Tn , θ) < aα ) ∪ (φ(Tn , θ) > bα )) = 1 − (1 − α) = α

ou encore
Pθ (φ(Tn , θ) < aα ) + Pθ (φ(Tn , θ) > bα ) = α
ou Pθ (b(Tn ) < θ) + Pθ (a(Tn ) > θ) = α

Posons α1 = Pθ (b(Tn ) < θ) et α2 = Pθ (a(Tn ) > θ). Ainsi, si α1 et
α2 sont non nuls, l’intervalle est bilatéral.

Remarque
En raison de la signification concrète du paramètre θ, on peut être
amené à construire un intervalle unilatéral de la forme
(a(Tn ) > θ) avec α1 = 0 et α2 = α
(b(Tn ) < θ) avec α1 = α et α2 = 0.

Dans le cas d’une loi symétrique, on construira un intervalle bilatéral
symétrique
α
α1 = α2 = .
2

Exemple
Etant donné un n−échantillon (X1 , · · · , Xn ), on peut construire des
intervalles de confiances à niveau 1 − α donné de la moyenne et de la
variance à l’aide de la moyenne empirique X n et de la variance
empirique Sn2 . La loi de l’échantillon est la loi de Bernoulli B(θ) avec
θ ∈]0, 1[. On se propose de déterminer un intervalle de confiance de
niveau 1 − α pour le paramétre θ qui est l’Espérance de la loi B(θ).

Exemple
1 En appliquant l’inégalité de Bienaymé-Chebytchev :
θ(1 − θ) 1
Pθ |X n − θ| > a ≤ 2
≤ =α
na 4na2
d’où
1

Pθ |X n − θ| ≤ √ ≥1−α
4nα
1 1
ainsi l’intervalle [X n − √4nα , X n + √4nα ] est donc un
intervalle de confiance au moin 1 − α pour θ.
2 En appliquant le théorème central limite, (ce qui fournit un
intervalle meilleur (à un niveau donné):
√
pour n suffisamment
n(X n −θ)
grand (nθ ≥ 5 et n(1 − θ) ≥ 5 ), √ suit
θ(1−θ)
approximativement la loi normale N (0, 1)
Exemple
d’où √ !
n(X n − θ)
Pθ | p | ≤ bα = 1−α
θ(1 − θ)
or
√ !
n(X n − θ)
Pθ | p | ≤ bα ≃ φN (0,1) (bα ) − φN (0,1) (−bα )
θ(1 − θ)
= 2φN (0,1) (bα ) − 1

où φN (0,1) est la fonction de répartition de la loi N (0, 1).
Ainsi φN (0,1) (bα ) = 1 − α2 et on en déduit la valeur de bα à l’aide de
la table de la loi N (0, 1).

Exemple
Pour obtenir l’intervalle de confiance, on résoud en θ l’inégalité
suivante
θ(1 − θ)
(X n − θ)2 ≤ b2α
n
! !
b2 b2 2
ou encore 1+ α θ 2 − 2X n + α θ + Xn ≤ 0
n n

Exemple
or le discriminant
!2 !
b2 2 b2
∆= 2X n + α − 4X n 1+ α =
n n
!
b2α b2α
+ 4X n (1 − X n ) >0
n n
l’équation admet donc deux solutions distinctes et l’intervalle de
confiance
" de niveau 1 − α pour θ est défini par ces deux solutions
#
b2 b2
p 2
p 2
nX n + α −b b2α /4+nX n −nX n nX n + α +b b2α /4+nX n −nX n
α α
2
n+b2α
, 2
n+b2α

Exemple
p 2
2bα b2α /4+nX n −nX n
La longueur de cet intervalle est L = n+b2α .
2 2
On peut vérifier que L ≤ n+b bα 2
2 , car bα /4 + nX n − nX n ≤ bα4+n
et
α
ainsi calculer la valeur minimale de n permettant d’obtenir des
intervalles de longueur inférieure à une constante donnée.
Pour simplifier les calculs on procède à une nouvelle approximation

Exemple
1 On remplace θ(1 − θ) par sa valeur maximale 14 , ainsi on a
bα

Pθ |X n − θ| ≤ √ ≥1−α
2 n
et l’intervalle de confiance de niveau 1 − α pour θ est donc

bα bα

Xn − √ , Xn + √ .
2 n 2 n
2 On remplace θ(1 − θ) par X n (1 − X n ) et on obtient l’intervalle

de confiance de niveau 1 − α pour θ
 s s 
X n − bα
X n (1 − X n ) X n (1 − X n ) 
, X n + bα .
n n

Intervalle de confiance pour les paramètres de loi
normale
Soit (X1 , · · · , Xn ) n−échantillon de loi normale N (m, σ), on peut

construire des intervalles de confiances à niveau 1 − α donné de la
moyenne et de la variance à l’aide des estimateurs X n et Sn2 de m et
de la variance σ 2 dont les lois explicites sont connues et caculables .

normale
La loi de l’échantillon est la loi normale N (m, σ) où σ est connu. On
se propose de déterminer un intervalle de confiance pour m
connaisant σ. On estime θ par l’estimateur de la moyenne
√
empirique
σ n
X n de loi N (m, √n ). Ainsi la fonction pivotale est σ (X n − m) et
suit la loi symétrique normale N (0, 1). Ce qui permet de déterminer
un intervalle de confiance tel que
√ !
n
Pθ | (X n − m)| ≤ bα = 1 − α
σ
or
√ !
n
Pθ | (X n − m)| ≤ bα ≃ FN (0,1) (bα ) − FN (0,1) (−bα )
σ
= 2FN (0,1) (bα ) − 1

normale
Ainsi FN (0,1) (bα ) = 1 − α2 et on en déduit la valeur de bα à l’aide de

la table de la loi N (0, 1). Par suite
σ σ

X n − bα √ , X n + bα √
n n
est un intervalle de confiance de niveau (1 − α) pour m.

normale
La loi de l’échantillon est la loi normale N (m, σ) où σ est inconnu.

On se propose de déterminer un intervalle de confiance pour m. On
estime m par l’estimateur de la moyenne empirique X n et σ 2 par
l’estimateur
n
1 X
Sn2 = (Xi − X n )2 .
n − 1 i=1
√ 2
Les statistiques σn (X n − m) et (n − 1) Sσn2 sont indépendantes et de
lois respectives normale N (0, 1) et Khi-deux χ2 (n − 1) à (n − 1)
degrè de liberté . Ainsi la fonction pivotale
!
√ Xn − m
n p
Sn2
suit la loi symétrique de student à n − 1 degrés de liberté.

normale
Ce qui permet de déterminer un intervalle de confiance tel que

!
√ (X n − m)
Pθ | n p 2 | ≤ cα =1−α
Sn
et on en déduit la valeur de cα à l’aide des tables de la loi t(n − 1) (ou

de la loi N (0, 1) si n > 30). Par suite
" p p #
S2 S2
X n − cα √ n , X n + cα √ n
n n
est un intervalle de confiance de m de niveau 1 − α.

normale
La loi de l’échantillon est la loi normale N (m, σ) où m est connu. On
se propose de déterminer un intervalle de confiance pour σ 2
connaissant m. On estime σ 2 par l’estimateur sans biais
n
1X
σn2 = (Xi − m)2 .
n i=1
La fonction pivotale
nσn2
σ2
suit la loi de χ2 (n) qui n’est pas symétrique, ce qui permet de
déterminer un intervalle
!
nσ 2
Pθ aα ≤ 2n ≤ bα =1−α
σ
normale
par passage au compémentaire on a

!
nσ 2 nσ 2
Pθ (aα ≥ 2n ) ∪ ( 2n ≥ bα ) =α
σ σ
ou encore
! !
nσn2 nσn2
Pθ ≤ aα + Pθ ≥ bα =α
σ2 σ2
Il ya une infinité de façon de choisir aα et bα de sorte que

2
Pθ aα ≤ nσ σ2 ≤ bα soit égale à 1 − α.
n

normale
On montre que les valeurs pour lesquelles bα − aα est minimum (on

cherche à obtenir l’intervalle de confiance le plus étroit possible) sont
telles que
! !
nσn2 α nσn2 α
Pθ ≤ aα = et Pθ ≥ bα = .
σ2 2 σ2 2
Les tables de la loi de χ2 (n) permettent de déterminer aα et bα . Par

suite " #
nσn2 nσn2
,
bα aα
est un intervalle de confiance de σ 2 de niveau 1 − α.

normale
La loi de l’échantillon est la loi normale N (m, σ) où m est inconnu.
On se propose de déterminer un intervalle de confiance pour σ 2 . On
estime σ 2 l’estimateur sans biais
n
1 X
Sn2 = (Xi − X n )2 .
n − 1 i=1
2
De plus (n−1)S
σ2
n
suit la loi de χ2 (n − 1) ce qui permet de déterminer
un intervalle
!
(n − 1)Sn2
Pθ aα ≤ ≤ bα =1−α
σ2
par passage au compémentaire on a
!
(n − 1)Sn2 (n − 1)Sn2
Pθ (aα ≥ ) ∪ ( ≥ bα ) =α
σ2 σ2
normale
ou encore
! !
(n − 1)Sn2 (n − 1)Sn2
Pθ ≤ aα + Pθ ≥ bα =α
σ2 σ2
Soient α1 , α2 tels que α1 + α2 = α, les tables de la loi de χ2 (n − 1)

permettent de déterminer aα et bα tels que
! !
(n − 1)Sn2 (n − 1)Sn2
Pθ ≤ aα = α1 et Pθ ≥ bα = α2 .
σ2 σ2
Par suite " #

(n − 1)Sn2 (n − 1)Sn2
,
bα aα
est un intervalle de confiance de σ 2 de niveau 1 − α.
normale
Pour la variance σ 2 de la loi normale N (m, σ) avec

θ = (m, σ) ∈ R × R∗+ (moyenne et variance inconnues), la variable
aléatoire (n−1) 2
σ2 Sn suit la loi du
χ (n − 1), les tables de la loi χ2 (n − 1) permettent de déterminer
2
aα/2 et a1−α/2 tels que

α α
Pθ (χ2n−1 < aα/2 ) = et Pθ (χ2n−1 < a1−α/2 ) = 1 −
2 2
h i
et d’en déduire l’intervalle a(n−1) Sn2 , (n−1) 2
aα/2 Sn , (lorsque n > 30, on
p √ 1−α/2
utilise que 2χ2n − 2n − 1 suit approximativement la loi N (0, 1)).

Merci


Chap Stat 4

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chap Stat 4

Transféré par

Droits d'auteur :

Formats disponibles

Estimation paramètrique III

Université de Tunis El Manar

Estimation paramètrique III 1 / 36

On la note χ2 (n). Elle est aussi la loi Gamma de paramètres ( n2 , 12 ) et

Estimation paramètrique III 2 / 36

où X1 , · · · , Xn , Y sont des variables aléatoires indépendantes de

Estimation paramètrique III 3 / 36

où Un et Vm sont des variables aléatoires indépendantes de loi

Estimation paramètrique III 4 / 36

Estimation paramètrique III 5 / 36

Estimation paramètrique III 6 / 36

Estimation paramètrique III 8 / 36

Enfin ΣU = ΣAY = AΣY At = AIAt = I où I est la matrice

Estimation paramètrique III 9 / 36

Tn suit donc la loi tn−1 d’après 1), 2) et 3).

Estimation paramètrique III 10 / 36

Soit (X1 , · · · , Xn ) un n−échantillon de loi Pθ sur R où θ ∈ Θ. On

Estimation paramètrique III 11 / 36

Le risque quadratique est une mesure "deterministe" de cette erreur

Estimation paramètrique III 12 / 36

Estimation paramètrique III 13 / 36

Soit (X1 , · · · , Xn ) un n−échantillon de loi Pθ et Tn un estimateur de

Pθ (t1 (θ) ≤ Tn ≤ t2 (θ)) = 1 − α

Or cette démarche ne va pas toujours aboutir car le calcul de t1 (θ) et

Ainsi la détermination de l’intervalle de confiance de θ consiste à

Le problème revient à inverser cet intervalle et donc à déterminer les

Mais le choix de aα et bα reste arbitraire puisque seule une équation

Pθ ((φ(Tn , θ) < aα ) ∪ (φ(Tn , θ) > bα )) = 1 − (1 − α) = α

Estimation paramètrique III 15 / 36

Pθ (φ(Tn , θ) < aα ) + Pθ (φ(Tn , θ) > bα ) = α

ou Pθ (b(Tn ) < θ) + Pθ (a(Tn ) > θ) = α

Estimation paramètrique III 16 / 36

(a(Tn ) > θ) avec α1 = 0 et α2 = α

(b(Tn ) < θ) avec α1 = α et α2 = 0.

Estimation paramètrique III 17 / 36

Estimation paramètrique III 18 / 36

= 2φN (0,1) (bα ) − 1

Estimation paramètrique III 20 / 36

Estimation paramètrique III 21 / 36

Estimation paramètrique III 22 / 36

Estimation paramètrique III 23 / 36

et l’intervalle de confiance de niveau 1 − α pour θ est donc

2 On remplace θ(1 − θ) par X n (1 − X n ) et on obtient l’intervalle

Estimation paramètrique III 24 / 36

Soit (X1 , · · · , Xn ) n−échantillon de loi normale N (m, σ), on peut

Estimation paramètrique III 25 / 36

= 2FN (0,1) (bα ) − 1

Ainsi FN (0,1) (bα ) = 1 − α2 et on en déduit la valeur de bα à l’aide de

est un intervalle de confiance de niveau (1 − α) pour m.

Estimation paramètrique III 27 / 36

La loi de l’échantillon est la loi normale N (m, σ) où σ est inconnu.

suit la loi symétrique de student à n − 1 degrés de liberté.

Ce qui permet de déterminer un intervalle de confiance tel que

et on en déduit la valeur de cα à l’aide des tables de la loi t(n − 1) (ou

est un intervalle de confiance de m de niveau 1 − α.

Estimation paramètrique III 29 / 36

par passage au compémentaire on a

Il ya une infinité de façon de choisir aα et bα de sorte que

Estimation paramètrique III 31 / 36

On montre que les valeurs pour lesquelles bα − aα est minimum (on

Les tables de la loi de χ2 (n) permettent de déterminer aα et bα . Par

Estimation paramètrique III 32 / 36

Soient α1 , α2 tels que α1 + α2 = α, les tables de la loi de χ2 (n − 1)

Il ya une infinité de façon de choisir aα et bα de sorte que