Académique Documents
Professionnel Documents
Culture Documents
Méthodes Statistiques
3 Table 11
• Exemple
Par exemple, dans le cas d’une naissance, on peut se demander s’il s’agit
d’une fille ou d’un garçon. Si on dénombre k naissances de filles parmi n nais-
k
sances, on calcule la fréquence empirique égale à et on se demande si les
n
observations confirment l’hypothèse d’équiprobabilité des sexes.
On convient de coder la réalisation d’un événement par 1 et celle de son
contraire par 0 : (
1 si succès
X=
0 si échec
Le nombre Sn de succès parmi n réalisations de l’événement est la somme
des Xi pour i = 1, . . . , n :
n
X
Sn = Xi
i=1
1
Si p0 est la vraie probabilité de l’événement, la variable X suit une loi de
Bernoulli de paramètre p0 et la variable Sn suit une loi binomiale B(n, p0 ).
On a la formule suivante pour calculer la probabilité que la somme vaille k :
On sait que
2
On peut alors construire le test de proportions pour grand échantillon en
prenant comme hypothèse nulle :
H0 : p = p0
p̂ − p0
Sous l’hypothèse H0 , la variable Z = r suit asymptotiquement une
p0 (1 − p0 )
n
loi normale N (0, 1).
Dans le cas d’un test bilatéral au seuil α, on détermine le quantile uα tel que
P (|Z| > uα ) = α
n ≥ 30 n p0 ≥ 5 n (1 − p0 ) ≥ 5
• Exemple
Supposons que, dans une maternité, sur 2000 naissances, 960 enfants étaient
des filles. On teste l’hypothèse H0 que p = 1/2 au seuil α = 5%.
La proportion empirique est donc 960/2000 = 48%, inférieure aux 50% at-
tendus. Est-ce significativement différent ?
On calcule la variable de décision:
960/2000 − 0, 5
Z= r = −1.788854
0, 5 × 0, 5
2000
Au seuil α = 5%, la valeur critique est 1,96. La statistique calculée se situe
entre -1,96 et 1,96, ce qui fait qu’on ne peut pas rejeter l’hypothèse H0 .
• Exemple
Une roulette de casino comporte 37 cases : la case 0 est de couleur verte et les
autres, numérotées de 1 à 36, sont alternativement rouges et noires. Un joueur
a remarqué que, sur 300 parties, le zéro était sorti 13 fois. Peut-il conclure, au
seuil 5%, que la roulette est défectueuse ?
3
La probabilité théorique que la case verte sorte est, en supposant l’équiprobabilité
1
de toutes les cases, de p0 = = 0.0270. Cela constitue l’hypothèse H0 .
37
On choisit ici de formuler l’hypothèse alternative sous la forme :
H1 : p 6= p0
4
On n’utilise pas de statistique ou de variable de décision. On compare di-
rectement la probabilité de rejeter l’hypothèse au risque α. S’il est très im-
probable, sous l’hypothèse H0 , d’obtenir les données observées alors on rejette
l’hypothèse nulle.
Le test binomial est un test exact utilisé dans le cas d’une variable aléatoire
ayant deux modalités. On va voir son fonctionnement sur un exemple.
Pour un test bilatéral, l’hypothèse nulle est que le nombre d’observations
dans une classe est conforme à une probabilité théorique connue d’avance et
l’hypothèse alternative est que les valeurs observées diffèrent des valeurs atten-
dues.
Pour un test unilatéral, l’hypothèse nulle est que le nombre d’observations
dans une classe est inférieur ou égal à la valeur attendue et l’hypothèse alterna-
tive est qu’il est strictement supérieur.
• Exemple
On joue à pile ou face 15 fois et on obtient 3 faces. Peut-on dire, au seuil
5%, que la pièce est truquée ?
On appelle S la variable aléatoire représentant le nombre de faces.
L’hypothèse H0 est que la pièce est équilibrée autrement dit que la proportion
PF de faces est égale à la proportion PP de piles, donc à 1/2.
L’hypothèse H1 , au vu des résultats obtenus, sera PF < PP .
Donc (
H0 : PF = PP
H1 : PF < PP
C’est un test unilatéral.
Sous l’hypothèse H0 , on connaît la loi de probabilité exacte suivie par la
variable S : c’est la loi binomiale B(15, 1/2) de paramètres n = 15 (nombre
d’expériences) et p0 = 1/2 (probabilité de faces).
Par définition, on a :
P (S ≤ 3) = P (S = 0) + P (S = 1) + P (S = 2) + P (S = 3)
= 0.00003 + 0.00046 + 0.0032 + 0.0139
= 0, 01759
≈ 1, 76%
5
Voici une représentation graphique des densités de masse de la loi binomiale
B(15, 1/2).
0.15
0.10
0.05
1.76 %
0.00
0 1 2 3 4 5 6 7 8 9 10 12 14
P (S ≤ 4) = P (S ≤ 3) + P (S = 4)
= 0, 01759 + 0.0417
= 0.05929
≈ 5, 93%
6
0.15
0.10
0.05
5.92 %
0.00
0 1 2 3 4 5 6 7 8 9 10 12 14
7
• Exemple
Avec un échantillon de taille n = 10, on a n − 1 = 9 degrés de liberté et les
tables de la loi du χ2 donnent les valeurs suivantes pour les quantiles :
a = 2.70 et b = 19.02
χ2(n)
0.10
0.05
95%
0.00
a=2.7 b=19.02
0 5 10 15 20 25
Remarques
• Exemple
Une société fabrique un câble en acier trempé galvanisé dont la charge de
rupture est de 210 kg avec une marge de 5 kg. Un contrôle de qualité effectué
sur 10 bobines a conduit aux résultats suivants :
203.70 211.80 201.60 226.00 213.30
201.80 214.90 217.40 215.80 206.90
8
Cet échantillon confirme-t-il la marge annoncée ?
On calcule la moyenne et la variance modifiée de l’échantillon :
(n − 1)s2 (n − 1)s2
≤ σ2 ≤
b a
9
Avec les données de l’exemple précédent, on a
5.39 ≤ σ ≤ 14.30
• Approximations de la loi du χ2
Lorsque la taille de l’échantillon est grande, les quantiles de la loi du χ2 ne
sont pas toujours disponibles dans les tables (car les tables ne vont en général pas
au-delà de 30 degrés de liberté). On peut néanmoins, si n est grand, remplacer
la loi du χ2 par des lois approchantes.
Une loi du χ2 à n degrés de liberté a pour espérance n et pour variance
2n. Si Y ∼ χ2 (n), alors le théorème central limite permet d’affirmer que Z =
Y −n
√ tend en loi vers la loi normale N (0, 1). On construit donc l’intervalle
2n
d’acceptation pour la variable Z avec la loi normale, plutôt que pour la variable
Y avec la loi du χ2 . On obtient ainsi approximativement en notant uc la valeur
critique (uc = 1, 96 si α = 5%):
√ √
n − uc 2n ≤ Y ≤ n + uc 2n
lorsque n → +∞.
À partir√de la statistique
√ Y calculée dans le test de variance, on calcule
la quantité 2 Y − 2n − 1 et on voit si elle est dans la région d’acceptation
(fournie par la loi normale) ou pas.
10
On n’utilise ces approximations que si n est grand (pratiquement, n ≥ 30).
L’intérêt de l’approximation de Fisher par rapport au théorème central limite
est qu’elle procure une convergence plus rapide.
√ √
− uc ≤ 2 Y − 2n − 1 ≤ uc
√ √ √
⇐⇒ 2n − 1 − uc ≤ 2 Y ≤ 2n − 1 + uc
1 √ 1 √
⇐⇒ ( 2n − 1 − uc )2 ≤ Y ≤ ( 2n − 1 + uc )2
2 2
La quantité de gauche joue le rôle de la borne a et celle droite celui de la borne
b.
3 Table
Fonction quantile de la loi du χ2
ν\P 0.01 0.025 0.05 0.1 0.9 0.95 0.975 0.99
1 0.000 0.001 0.004 0.016 2.706 3.841 5.024 6.635
2 0.020 0.051 0.103 0.211 4.605 5.991 7.378 9.210
3 0.115 0.216 0.352 0.584 6.251 7.815 9.348 11.345
4 0.297 0.484 0.711 1.064 7.779 9.488 11.143 13.277
5 0.554 0.831 1.145 1.610 9.236 11.070 12.833 15.086
6 0.872 1.237 1.635 2.204 10.645 12.592 14.449 16.812
7 1.239 1.690 2.167 2.833 12.017 14.067 16.013 18.475
8 1.646 2.180 2.733 3.490 13.362 15.507 17.535 20.090
9 2.088 2.700 3.325 4.168 14.684 16.919 19.023 21.666
10 2.558 3.247 3.940 4.865 15.987 18.307 20.483 23.209
11 3.053 3.816 4.575 5.578 17.275 19.675 21.920 24.725
12 3.571 4.404 5.226 6.304 18.549 21.026 23.337 26.217
13 4.107 5.009 5.892 7.042 19.812 22.362 24.736 27.688
14 4.660 5.629 6.571 7.790 21.064 23.685 26.119 29.141
15 5.229 6.262 7.261 8.547 22.307 24.996 27.488 30.578
16 5.812 6.908 7.962 9.312 23.542 26.296 28.845 32.000
17 6.408 7.564 8.672 10.085 24.769 27.587 30.191 33.409
18 7.015 8.231 9.390 10.865 25.989 28.869 31.526 34.805
19 7.633 8.907 10.117 11.651 27.204 30.144 32.852 36.191
20 8.260 9.591 10.851 12.443 28.412 31.410 34.170 37.566
11