Académique Documents
Professionnel Documents
Culture Documents
Correction succincte
Examen Statistiques (UE Concevoir par la physique et ses outils) : Session 1
Durée : 1h30
Seul document autorisé : formulaire manuscrit personnel (une feuille A4 recto-verso)
Calculatrice autorisée. Les autres appareils électroniques sont interdits.
Téléphones portables interdits
Le barème est donné à titre indicatif. Il sera tenu compte dans la notation du soin
apporté à la rédaction, notamment dans la justification des résultats et dans la
présentation du raisonnement.
Exercice 1 (4 points)
Un ingénieur veut tester la distribution de l’origine du vent sur un site. On note X la variable aléatoire
qui indique l’origine principale du vent pour un jour. Les valeurs possibles pour X sont : N (Nord ),
S (Sud ), E (Est) et O (Ouest).
L’ingénieur veut tester l’hypothèse nulle suivante avec une erreur de première espèce α = 0.1 :
1 1
H0 : P (X = N ) = , P (X = S) = ,
2 6
1 1
P (X = E) = , P (X = O) = .
6 6
L’ingénieur observe l’origine du vent pendant n = 300 jours et obtient la répartition suivante
Origine du vent N S E O
Nombre de jours observé 123 61 60 56
1
3) Quelle décision prenez-vous à partir des données de l’exercice?
Correction :
La région de rejet est de la forme {T > t} où t est le quantile d’ordre 1 − α de la loi χ2 (3). D’après
le tableau, ce quantile vaut 6.25; il est plus petit que la statistique de test et la valeur T = 10 est
donc dans la région de rejet. La décision est que l’on rejette l’hypothèse nulle H0 avec une erreur de
première espèce égale à 10%.
√ λ2
L
n λ̂n − λ −→ N 0, .
n→+∞ 2
2
Correction :
Le modèle étant supposé régulier, on a la normalité asymptotique de l’E.M.V.
6) Par un théorème du cours de Probabilités, retrouver le résultat de la question précédente.
Correction :
C’est l’application du Théorème Central Limite qui donne le résultat. Il faut bien entendu vérifier ses
hypothèses d’application et calculer la variance de X.
7) Déterminer pour le paramètre λ un intervalle de confiance bilatéral asymptotique de niveau 95% à
l’aide des données numériques fournies au début de l’exercice.
Correction :
L’application du théorème de Slutsky était parfaitement inutile ici car les calculs directs sont faciles.
Attention! L’intervalle de confiance est bilatéral et de niveau 95%. Cela signifie qu’on va chercher
a = −b tels que ! !
√ λ̂n
P a≤ n − 1 < b ' 0.95
λ
Donc vu que la loi limite est la loi gaussienne standard, on choisira b tel que Φ(b) = 0.975, soit b = 1.96
et non b = 1.64 comme cela a été souvent utilisé dans les copies (cette valeur donne un intervalle de
confiance de niveau 90%!).
Partie II : Test (8 points)
On souhaite maintenant tester H0 : λ = 5 contre H1 : λ = 4.
1) Trouver la région de rejet telle que l’erreur de première espèce soit asymptotiquement égale à 10%.
Quelle décision prenez-vous à partir des données numériques fournies au début de l’exercice?
Correction :
On écrit le test du rapport des maximums des vraisemblances (ici on a le cas de deux hypothèses
simples). La région de rejet est de la forme
Q
ni=1 X 42
i
exp − Xi
4 1 {Xi >0}
W= Q >k
n Xi exp − Xi 1
i=1 52 5 {Xi >0}
( n ! )
1 1 X
= exp − Xi > k 0
5 4
i=1
n o
= λ̂n < k 00 ,
Il faut surtout éviter d’utiliser le théorème de Slutsky ici car on connaı̂t la valeur de λ sous H0 .
Le seuil vaut 4.46. Comme λ̂n = 4.6, on ne peut pas rejeter l’hypothèse H0 avec une erreur de
première espèce de 5%.
2) Déterminer approximativement la puissance du test.
On ne cherchera pas à donner la valeur exacte de la puissance mais seulement une approximation
numérique, par exemple on écrira : la puissance est comprise entre 70% et 80%.
3
Correction :
Il suffit ici d’utiliser le fait que sous l’alternative :
!
√ λ̂n L
2n − 1 −→ N (0, 1) .
4
L’erreur souvent faite est de remplacer kn par la valeur numérique trouvée dans les questions précédentes
mais il faut bien comprendre que cette valeur n’était adaptée que pour la taille d’échantillon n = 70.
On est donc amené à résoudre les deux équations :
√
kn
2n − 1 = −1.28
5
√
kn
2n − 1 ≥ 2.33
4
En multipliant la première équation par 5 et la seconde par 4 puis en soustrayant la première équation
à la seconde, on obtient : √
2n ≥ 4 × 2.33 + 5 × 1.28,
ce qui donne comme n > 0 :
(4 × 2.33 + 5 × 1.28)2
n≥ = 123.6
2
La taille minimale de l’échantillon est donc n = 124.