Vous êtes sur la page 1sur 4

Ecole Centrale de Casablanca Décembre 2017

Correction succincte
Examen Statistiques (UE Concevoir par la physique et ses outils) : Session 1

Durée : 1h30
Seul document autorisé : formulaire manuscrit personnel (une feuille A4 recto-verso)
Calculatrice autorisée. Les autres appareils électroniques sont interdits.
Téléphones portables interdits
Le barème est donné à titre indicatif. Il sera tenu compte dans la notation du soin
apporté à la rédaction, notamment dans la justification des résultats et dans la
présentation du raisonnement.

Exercice 1 (4 points)
Un ingénieur veut tester la distribution de l’origine du vent sur un site. On note X la variable aléatoire
qui indique l’origine principale du vent pour un jour. Les valeurs possibles pour X sont : N (Nord ),
S (Sud ), E (Est) et O (Ouest).
L’ingénieur veut tester l’hypothèse nulle suivante avec une erreur de première espèce α = 0.1 :
1 1
H0 : P (X = N ) = , P (X = S) = ,
2 6
1 1
P (X = E) = , P (X = O) = .
6 6
L’ingénieur observe l’origine du vent pendant n = 300 jours et obtient la répartition suivante

Origine du vent N S E O
Nombre de jours observé 123 61 60 56

Soit Z ∼ χ2 (k). Les valeurs de x telle que P (Z ≤ x) = p sont :

k↓ p→ 0.05 0.1 0.9 0.95


3 0.35 0.58 6.25 7.81
4 0.71 1.06 7.78 9.49
5 1.15 1.6 9.24 11.07
6 1.64 2.2 10.64 12.59

1) Rappeler la formule de la statistique de test du χ2 d’adéquation pour le problème de test considéré


ici.
Calculer sa valeur à partir des données fournies dans l’exercice.
Correction :
C’est le problème de test d’adéquation à une loi fixée. Cf cours pour la statistique de test. Elle vaut
environ 10 ici.
2) Quelle est la loi asymptotique de la statistique de test sous l’hypothèse H0 ?
Correction :
La loi asymptotique sous l’hypothèse nulle est la loi χ2 (3) car il y a 4 modalités et c’est le problème
de test d’adéquation à une loi fixée.

1
3) Quelle décision prenez-vous à partir des données de l’exercice?
Correction :
La région de rejet est de la forme {T > t} où t est le quantile d’ordre 1 − α de la loi χ2 (3). D’après
le tableau, ce quantile vaut 6.25; il est plus petit que la statistique de test et la valeur T = 10 est
donc dans la région de rejet. La décision est que l’on rejette l’hypothèse nulle H0 avec une erreur de
première espèce égale à 10%.

Exercice 2 (16 points)


Soit un échantillon X1 , . . . , Xn de n variables aléatoires i.i.d. ayant pour densité
x  x
f (x; λ) = 2 exp − I{x≥0} ,
λ λ
où λ est un paramètre inconnu strictement positif.
Le modèle étudié est supposé être régulier.
Les données numériques pour tout l’exercice sont les suivantes. La taille de l’échantillon est n = 70.
On dispose de la somme des valeurs observées :
70
X
xi = 644.
i=1

Soit Z ∼ N (0, 1). Les valeurs de z telle que P (Z ≤ z) = p sont :

p 0.5 0.6 0.7 0.8 0.9 0.95 0.975 0.99


z 0 0.25 0.52 0.84 1.28 1.64 1.96 2.33

Partie I : Estimation (8 points)


1) Calculer l’estimateur du maximum de vraisemblance, noté λ̂n . et donner sa valeur au vu des
données numériques.
Correction :
L’E.M.V. vaut
n
1 X
λ̂n = Xi .
2n
=1

2) Calculer l’estimateur par la méthode des moments pour le moment d’ordre 1.


Est-il différent de l’estimateur du maximum de vraisemblance?
Correction :
Même estimateur.
3) Calculer le biais de l’estimateur λ̂n .
Correction :
Si la question précédente a été bien faite, la réponse à cette question est quasi immédiate. L’estimateur
est sans biais.
4) Calculer l’information de Fisher de la loi de densité f (x; λ) pour le paramètre λ.
Correction :
Calcul simple. Il suffit d’appliquer le cours.
5) Par un théorème du cours de Statistiques, justifier le résultat suivant

√  λ2
  
L
n λ̂n − λ −→ N 0, .
n→+∞ 2

2
Correction :
Le modèle étant supposé régulier, on a la normalité asymptotique de l’E.M.V.
6) Par un théorème du cours de Probabilités, retrouver le résultat de la question précédente.
Correction :
C’est l’application du Théorème Central Limite qui donne le résultat. Il faut bien entendu vérifier ses
hypothèses d’application et calculer la variance de X.
7) Déterminer pour le paramètre λ un intervalle de confiance bilatéral asymptotique de niveau 95% à
l’aide des données numériques fournies au début de l’exercice.
Correction :
L’application du théorème de Slutsky était parfaitement inutile ici car les calculs directs sont faciles.
Attention! L’intervalle de confiance est bilatéral et de niveau 95%. Cela signifie qu’on va chercher
a = −b tels que ! !
√ λ̂n
P a≤ n − 1 < b ' 0.95
λ
Donc vu que la loi limite est la loi gaussienne standard, on choisira b tel que Φ(b) = 0.975, soit b = 1.96
et non b = 1.64 comme cela a été souvent utilisé dans les copies (cette valeur donne un intervalle de
confiance de niveau 90%!).
Partie II : Test (8 points)
On souhaite maintenant tester H0 : λ = 5 contre H1 : λ = 4.
1) Trouver la région de rejet telle que l’erreur de première espèce soit asymptotiquement égale à 10%.
Quelle décision prenez-vous à partir des données numériques fournies au début de l’exercice?
Correction :
On écrit le test du rapport des maximums des vraisemblances (ici on a le cas de deux hypothèses
simples). La région de rejet est de la forme
Q   
 ni=1 X 42
i
exp − Xi
4 1 {Xi >0} 
W= Q   >k
 n Xi exp − Xi 1 
i=1 52 5 {Xi >0}
(   n ! )
1 1 X
= exp − Xi > k 0
5 4
i=1
n o
= λ̂n < k 00 ,

où k, k 0 , k 00 sont des constantes.


Pour ajuster le seuil, on utilise le fait que sous H0 , on a vu la première partie sur l’estimation :
!
√ λ̂n L
2n − 1 −→ N (0, 1) .
5

Il faut surtout éviter d’utiliser le théorème de Slutsky ici car on connaı̂t la valeur de λ sous H0 .
Le seuil vaut 4.46. Comme λ̂n = 4.6, on ne peut pas rejeter l’hypothèse H0 avec une erreur de
première espèce de 5%.
2) Déterminer approximativement la puissance du test.
On ne cherchera pas à donner la valeur exacte de la puissance mais seulement une approximation
numérique, par exemple on écrira : la puissance est comprise entre 70% et 80%.

3
Correction :
Il suffit ici d’utiliser le fait que sous l’alternative :
!
√ λ̂n L
2n − 1 −→ N (0, 1) .
4

La puissance est comprise entre 80% et 90%


3) Quelle est la taille minimale d’échantillon suffisante pour obtenir une puissance de test égale à 99%
tout en maintenant l’erreur de première espèce asymptotiquement égale à 10%?
Correction :
Si on a pris soin de faire les calculs théoriques précédemment (notamment sans remplacer la valeur de
n sauf lors des applications numériques), on trouve facilement que le seuil kn et la valeur n doivent
vérifier les deux équations suivantes :

  
kn
Φ 2n −1 ' 0.1
5

  
kn
Φ 2n −1 ≥ 0.99
4

L’erreur souvent faite est de remplacer kn par la valeur numérique trouvée dans les questions précédentes
mais il faut bien comprendre que cette valeur n’était adaptée que pour la taille d’échantillon n = 70.
On est donc amené à résoudre les deux équations :

 
kn
2n − 1 = −1.28
5

 
kn
2n − 1 ≥ 2.33
4

En multipliant la première équation par 5 et la seconde par 4 puis en soustrayant la première équation
à la seconde, on obtient : √
2n ≥ 4 × 2.33 + 5 × 1.28,
ce qui donne comme n > 0 :
(4 × 2.33 + 5 × 1.28)2
n≥ = 123.6
2
La taille minimale de l’échantillon est donc n = 124.

Vous aimerez peut-être aussi