Vous êtes sur la page 1sur 15

Dossier délivré pour

DOCUMENTATION
19/09/2008

Statistique inférentielle
Tests statistiques
par Nathalie CHÈZE
Statisticienne
Maître de conférences à l’université Paris X-MODALX

1. Problème concret..................................................................................... AF 170 - 2


2. Théorie des tests...................................................................................... — 2
2.1 Modèle d’échantillonnage .......................................................................... — 2
2.2 Tests paramétriques .................................................................................... — 2
2.3 Tests non paramétriques............................................................................. — 2
2.4 Erreurs et risques......................................................................................... — 2
2.5 Construction d’un test d’hypothèses ......................................................... — 3
3. Tests paramétriques ................................................................................ — 3
3.1 Test d’une hypothèse simple contre une hypothèse simple.................... — 4
3.1.1 Théorie de Neyman-Pearson ............................................................. — 4
3.1.2 Exemples ............................................................................................. — 5
3.2 Tests d’hypothèses multiples ..................................................................... — 7
3.2.1 Hypothèse simple contre hypothèse multiple ................................. — 7
3.2.2 Hypothèse multiple contre hypothèse multiple............................... — 8
3.3 Tests de comparaison de paramètres ........................................................ — 9
3.3.1 Comparaison de deux échantillons gaussiens indépendants ........ — 9
3.3.2 Comparaison de deux proportions pour des échantillons
indépendants de grande taille ........................................................... — 10
3.3.3 Cas apparié.......................................................................................... — 10
3.4 Remarques ................................................................................................... — 11
3.4.1 Lien entre tests d’hypothèses bilatérales
et intervalles de confiance ................................................................. — 11
3.4.2 Degré de signification ........................................................................ — 11
4. Quelques tests non paramétriques ..................................................... — 11
4.1 Tests d’ajustement....................................................................................... — 12
4.1.1 Tests du χ 2 .......................................................................................... — 12
4.1.2 Tests basés sur la fonction de répartition empirique ...................... — 14
4.2 Tests non paramétriques de comparaison de lois .................................... — 14
Références bibliographiques ......................................................................... — 15

ans de nombreux domaines, on est amené à prendre des décisions au vu


D de données collectées. La statistique inférentielle : estimation, développée
dans l’article [AF 168], fournit des éléments permettant de spécifier du mieux
possible, à partir de ces observations, le modèle probabiliste qui a engendré
les données : détermination du modèle, estimation des paramètres inconnus et
validation du modèle.
Le problème de décision, étudié dans ce présent article, consiste à trancher
entre deux hypothèses, au vu des observations. Nous allons présenter sur un
exemple concret les différentes questions que l’on peut se poser et qui amènent
à des problèmes de tests de nature différente.

La lecture des articles [AF 166], référence [3] et [AF 168] référence [2] est indispensable pour
une bonne compréhension du problème présenté.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Sciences fondamentales AF 170 − 1

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
STATISTIQUE INFÉRENTIELLE _____________________________________________________________________________________________________________

1. Problème concret Définition 2


Un n-échantillon est une suite (X 1 , X 2 , ..., X n ) de n v.a.
indépendantes et de même loi, à valeurs dans l’espace E (en
Supposons qu’une usine fabrique des pièces sur une machine. général E =  , E =  , ou E =  d ). On lui associe le modèle
Le diamètre de chaque pièce dépend du réglage de la machine, le suivant : on a une famille (µ θ )θ ∈Θ de probabilités sur E, et
réglage est d’autant meilleur que le diamètre de la pièce est proche on pose Ω = E n, qu’on munit des probabilités P θ = µ 3n sous
d’une norme d 0 ; mais comme le réglage ne peut être parfait, on θ
lesquelles les variables aléatoires X i (x 1 , ..., x n ) = x i forment un
n’a jamais exactement d 0 . Le diamètre de chaque pièce peut être n-échantillon de loi µ θ .
modélisé par une variable aléatoire X. De plus, chaque pièce fabri-
quée a une probabilité θ inconnue, mais la même pour toutes les
pièces, d’être défectueuse, c’est-à-dire de diamètre supérieur à la
norme d 0 . Ce nombre θ dépend du réglage de la machine, le 2.2 Tests paramétriques
réglage est d’autant meilleur que θ est proche de 0 ; mais comme
le réglage ne peut être parfait, on n’a jamais θ = 0. On fabrique un
certain nombre n de pièces qui servent à tester le réglage. L’obser- Considérons le modèle statistique (Ω,  , (Pθ ) θ ∈Θ ). On suppose
vation consiste à mesurer le diamètre X des pièces de l’échantillon que la probabilité P θ est connue, au paramètre θ inconnu près.
de taille n et compter le nombre Y de pièces défectueuses parmi Nous supposons que Θ est divisé en une partie Θ 0 et son
ces n pièces. On peut alors se poser plusieurs types de problèmes. complémentaire Θ1 . L’objectif d’un test paramétrique est, au vu de
l’observation de l’échantillon (x 1 , ..., x n ), de « décider » si la vraie
■ On veut vérifier si la machine est « bien réglée », c’est-à-dire si θ valeur de θ se trouve dans Θ0 ou dans Θ1 .
est suffisamment petit. Cela revient à s’assurer que la vraie valeur On note H 0 , l’hypothèse nulle selon laquelle θ ∈ Θ 0 et H 1
de θ ne dépasse pas un seuil critique θ 0 fixé à l’avance (sinon, il faut l’hypothèse alternative selon laquelle θ ∈ Θ1 .
refaire le réglage de la machine) : cela s’appelle tester le fait que
θ  θ 0 . Ce type de tests paramétriques sera étudié au paragraphe 3.

■ On veut préciser la loi de probabilité inconnue de X. Cela revient 2.3 Tests non paramétriques
à résoudre un problème d’ajustement de la loi empirique observée
sur l’échantillon à une loi théorique : il s’agit d’un test d’ajustement
Dans la pratique, on ne peut pas toujours se placer dans le cadre
ou d’adéquation étudié au paragraphe 4.
précédent. La loi de probabilité de X, notée P X dans ce paragraphe,
■ Il peut arriver que la production se fasse sur deux chaînes diffé- est supposée inconnue. L’objectif des tests non paramétriques est
rentes. Le diamètre des pièces issues de la seconde chaîne est de décider, au vu des observations de l’échantillon (x 1 , ..., x n ), si X
modélisé par une variable aléatoire Z. suit une loi de probabilité P 0 donnée.

● On peut se demander si Z suit la même loi de probabilité que X.


On note H 0 , l’hypothèse nulle selon laquelle P X = P 0 et H 1
Cela revient à comparer deux échantillons dont les lois de proba- l’hypothèse alternative selon laquelle P X ≠ P 0 .
bilité des populations mères sont inconnues ; cela entre dans le Nous allons maintenant donner le vocabulaire indispensable à la
cadre des tests non paramétriques traités au paragraphe 4. théorie des tests.
● Supposons que les lois de probabilité de X et Z soient connues,
de moyenne m X et m Z inconnues. On se demande si les deux
chaînes sont réglées de la même façon, c’est-à-dire si m X = m Y . 2.4 Erreurs et risques
C’est un exemple de tests de comparaisons de paramètres, étudiés
au paragraphe 3.3.
Dans un problème de décision, deux types d’erreurs sont
possibles :
• l’erreur de première espèce est l’erreur commise lorsqu’on
décide de rejeter H 0 alors que celle-ci est vraie ;
2. Théorie des tests • l’erreur de deuxième espèce est l’erreur commise lorsqu’on
décide de ne pas rejeter H 0 alors que celle-ci est fausse.
Nous présentons ici le formalisme commun aux différents tests Les conséquences de ces erreurs sont d’importances diverses.
cités précédemment avant d’en étudier les spécificités. Revenons à l’exemple du paragraphe 1 concernant les pièces
défectueuses, pour bien comprendre cette remarque.
Soit θ 0 la valeur limite de la proportion des pièces défectueuses
2.1 Modèle d’échantillonnage acceptable. On veut décider, au vu du nombre Y de pièces défec-
tueuses observées dans un échantillon de taille n, si l’on accepte
ou non l’hypothèse H 0 : θ > θ 0 .
Rappelons la définition du modèle d’échantillonnage étudié dans
le précédent article [AF 168]. Rejeter à tort l’hypothèse θ > θ 0 revient à ne pas régler de nou-
veau la machine alors qu’elle devrait l’être. La conséquence est le
mécontentement des clients, voire des problèmes de sécurité si
Définition 1 des pièces défectueuses sont utilisées. Ne pas rejeter à tort θ > θ 0
On appelle modèle statistique (Ω,  , (Pθ )θ ∈Θ ), la donnée revient à effectuer un réglage supplémentaire (inutile) de la
d’un espace d’états Ω, qui est l’ensemble de tous les résultats machine. La conséquence de cette décision est moins grave que la
possibles de l’expérience réalisée ; cet espace est muni de la précédente.
tribu  des événements et la donnée d’une famille (Pθ )θ ∈Θ de À toute décision correspond une probabilité de prendre la bonne
probabilités sur (Ω,  ). décision et une probabilité de se tromper :
• le risque de première espèce, noté α, est la probabilité de
On appelle statistique toute variable aléatoire (en abrégé v.a.) l’erreur de première espèce, c’est-à-dire la probabilité de rejeter à
sur cet espace à valeurs dans un espace mesuré (E,  ). tort H 0 ;

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
AF 170 − 2 © Techniques de l’Ingénieur, traité Sciences fondamentales

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
____________________________________________________________________________________________________________ STATISTIQUE INFÉRENTIELLE

• le risque de deuxième espèce, noté β, est la probabilité de — a - choisir les hypothèses H 0 et H 1 en privilégiant H 0 ;
l’erreur de deuxième espèce, c’est-à-dire la probabilité de ne pas — b - fixer le risque de première espèce du test α selon la gra-
rejeter à tort H 0 ; vité des conséquences de l’erreur de première espèce ;
• la puissance du test, notée 1 – β, est la probabilité de rejeter — c - construire la région de rejet ;
avec raison H 0 . — d - regarder si les observations se trouvent ou non dans W ;
Dans l’exemple étudié, le risque de première espèce correspond — e - conclure au rejet ou non-rejet de H 0 .
à la probabilité de ne pas régler de nouveau la machine alors Pour un α fixé, on peut construire différentes régions de rejet,
qu’elle devrait l’être et le risque de deuxième espèce correspond à donc différents tests. Le meilleur des tests, à α fixé, est celui qui
la probabilité de régler de nouveau la machine alors qu’elle était minimise le risque de seconde espèce β (de façon équivalente,
déjà bien réglée. celui qui maximise la puissance 1 – β ). Il s’agit d’un problème
On peut résumer ces différents risques sous la forme du mathématique assez complexe. Pour le résoudre, on introduit le
tableau 1. critère de qualité suivant, critère utilisé uniquement pour les tests
paramétriques.

Tableau 1 – Erreurs et risques Définition 3


Soit un test T de région de rejet W, de niveau α.
Vérité
Décision a) Un test T ′ de région de rejet W ′ est dit plus puissant que T
H 0 est vraie H 1 est vraie s’il est de niveau α ′  α et si P θ (W ) < P θ (W ′), ∀θ ∈ Θ1 .
b) Le test T est uniformément plus puissant (en abrégé : UPP)
Ne pas rejeter H 0 Bonne décision Mauvaise décision s’il n’existe pas de test T ′ plus puissant que T.
1–α β
Rejeter H 0 Mauvaise décision Bonne décision Dans certains cas, on peut déterminer un test le plus puissant, ce
α 1–β
qui n’est pas vrai en général. On verra quelques exemples dans la
suite.
L’idéal est d’avoir les risques de première et de deuxième espèce
les plus proches possibles de zéro. Malheureusement, on peut
montrer que ces deux risques varient en sens inverse : quand l’un
diminue, l’autre augmente. Dans la pratique, on construit les tests
d’hypothèses de telle sorte que l’erreur de première espèce soit
3. Tests paramétriques
celle qui a les conséquences plus graves. Pour cela, on choisira
pour hypothèse nulle H 0 , l’hypothèse pour laquelle le rejet à tort Considérons la modélisation statistique (Ω,  , (Pθ )θ ∈Θ ). On sup-
est le plus préjudiciable. pose que la loi P θ de X est connue, de paramètre θ ∈ Θ ∈ 
Dans notre exemple, l’erreur la plus grave est de ne pas régler inconnu.
de nouveau la machine alors qu’elle devrait l’être, c’est-à-dire reje- Nous supposons que Θ est divisé en une partie Θ 0 et son
ter l’hypothèse θ > θ 0 à tort. Cela revient donc à poser H 0 : θ > θ 0 complémentaire Θ1 . Les tests paramétriques permettent de tester
et H 1 : θ  θ 0 . l’hypothèse H 0 : θ ∈ Θ0 contre l’hypothèse H 1 : θ ∈ Θ1 . Sous ces
Cette façon de procéder revient à fixer le niveau du test α à une hypothèses, le risque de première espèce (resp. de deuxième
valeur d’autant plus petite que l’erreur de première espèce peut espèce) peut s’écrire α (θ ) = P θ (W ), θ ∈ Θ0 (resp.
avoir des conséquences graves. Les valeurs usuelles de α sont β (θ ) = 1 – P θ (W ), θ ∈ Θ1). On appelle niveau du test la constante
10 %, 5 %, 1 %. Cette optique rend le problème dissymétrique. On sup θ ∈Θ0 P θ (W ).
privilégie l’hypothèse H 0 . Par exemple, on ne prendra pas néces- Les ensembles Θ0 et Θ1 peuvent prendre plusieurs formes, ce
sairement la même décision, au vu des observations, suivant que qui nous amène à étudier plusieurs situations.
l’on teste H 0 : θ > θ 0 contre H 1 : θ  θ 0 ou H 0 : θ  θ 0 contre
H 1 : θ > θ 0 . On en verra un exemple dans le paragraphe 3.1. ■ Cas (1) : test d’une hypothèse simple contre une hypothèse
simple : Θ = {θ 0 , θ 1}
Remarque
Il vaut mieux dire « ne pas rejeter H 0 » que « accepter H 0 ». En H0 : θ = θ0
effet, si l’on rejette H 0 , c’est que les observations sont telles qu’il
est improbable que H 0 soit vraie. Par contre, si on ne rejette pas
contre ( θ1 ≠ θ0 )
H 0 , c’est que les observations ne permettent pas de dire que H 0 H1 : θ = θ1
est fausse, mais cela ne veut pas dire pour autant que H 0 est vraie.
On peut remarquer que, dans ce cas, le niveau du test est égal
à α et le risque de deuxième espèce vaut β = 1 – P θ1 (W ).
■ Cas (2) : test d’une hypothèse simple contre une hypothèse
2.5 Construction d’un test d’hypothèses multiple : Θ ⊂ 
H0 : θ = θ0
On appelle règle de décision, une règle qui permet de décider contre
H 0 ou H 1 au vu des observations, sous la contrainte que le
H1 : θ ≠ θ0
risque de première espèce du test α soit fixé.
■ Cas (3) : test d’une hypothèse multiple contre une hypothèse
Pour établir cette règle, l’idée est de construire une région criti- multiple : Θ ⊂ 
que ou de rejet du test, notée W ⊂ Ω. Elle sera déterminée grâce à H0 : θ1  θ  θ2
la modélisation probabiliste, développée dans la suite.
contre
Récapitulons la démarche à suivre pour effectuer un test
d’hypothèses : H 1 : θ < θ 1 ou θ > θ 2

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Sciences fondamentales AF 170 − 3

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
STATISTIQUE INFÉRENTIELLE _____________________________________________________________________________________________________________

■ Cas (4) : test d’une hypothèse multiple contre une hypothèse


multiple : Θ ⊂  Théorème de Neyman-Pearson
Pour tout α ∈ ]0, 1[ donné, il existe un test UPP de niveau α,
H0 : θ  θ0 défini par la région de rejet W :
contre L ( x, θ 0 )
H1 : θ > θ0 
W = x ∈ Ω : ------------------------  k
L ( x, θ 1 ) 
■ Cas (5) : test d’une hypothèse multiple contre une hypothèse Pour simplifier, nous donnons seulement quelques éléments de
multiple : Θ ⊂  démonstration dans le cas des variables aléatoires réelles, à
H0 : θ  θ0 L ( X, θ 0 )
densités telles que ------------------------- ait également une densité.
contre L ( X, θ 1 )
H1 : θ < θ0 Démonstration simplifiée ♦
Soit T le test de région de rejet W, de niveau α = P θ0 ( W ), définie
dans le théorème.
■ Cas (6) : test d’une hypothèse multiple contre une hypothèse
multiple : Θ ⊂  Soit T ′ un autre test de région de rejet W ′, de niveau α. Mon-
trons qu’il est nécessairement moins puissant que T, c’est-à-dire
H 0 : θ  θ 1 ou θ  θ 2 que P θ1 ( W ) > P θ1 ( W ′ ) .
contre Notons I l’ensemble intersection de W et W ′, U = W – I et
H1 : θ1 < θ < θ2 V = W ′ – I.
D’après la construction de W, on a :
Remarquons que le cas (2) est un cas particulier du cas (3) en
prenant θ 1 = θ 2 = θ 0 . Le cas (1) correspond au cas (rare) où Θ peut L ( x, θ 0 )
∀x ∈V , ->k
-----------------------
être réduit à deux valeurs θ 0 et θ 1 . Il est cependant d’un grand L ( x, θ 1 )
intérêt pédagogique et permet de présenter la méthode, qui sera
ensuite généralisée dans les autres cas. De plus, comme α = P θ0 ( W ) = P θ0 ( W ′ ) , on en déduit que
P θ0 ( U ) = P θ0 ( V ) .

3.1 Test d’une hypothèse simple


Cette égalité peut s’écrire :  U
L ( x, θ 0 )dx =  V
L ( x, θ 0 )dx .
Comparons maintenant la puissance des tests P θ1 ( W ) et
contre une hypothèse simple

Soit deux nombres réels θ 0 ≠ θ 1 . On cherche à tester, au


P θ1 ( W ′ ) . Comme P θ1 ( W ) =  U
L ( x, θ 1 )dx +  I
L ( x, θ 1 )dx et

niveau α :
H0 : θ = θ0
P θ1 ( W ′ ) =  V
L ( x, θ 1 )dx + I
L ( x, θ 1 )dx , i l s u f fi t d e c o m p a r e r

contre U
L ( x, θ 1 )dx et  V
L ( x, θ 1 )dx .
H1 : θ = θ1
D’après ce qui précède :

   
au vu d’observations x = (x 1 , ..., x n ) d’un n-échantillon de loi
1 1
3n
Pθ = µθ . L ( x, θ 1 )dx < ------ L ( x, θ 0 )dx = ------ L ( x, θ 0 )dx  L ( x, θ 1 )dx
V k V k U U

Il s’ensuit que ∀ W ′ de niveau α, P θ1 ( W ) > P θ1 ( W ′ ). ♦


3.1.1 Théorie de Neyman-Pearson Remarques
• La signification intuitive de ce théorème est claire : il s’agit de
On note L (x, θ ) la fonction de vraisemblance de x en θ (définie refuser H 0 lorsque la vraisemblance de l’échantillon en θ 0 est plus
au paragraphe 3.2.1.1.2, définition 6, de l’article [AF 168]) dont on « petite » que celle en θ 1 .
rappelle la définition ci-dessous.
• Le risque de première espèce est égal, dans les tests d’hypo-
thèses simples, au niveau du test :
Définition
On se place dans le cadre d’hypothèses suivant : on appelle
vraisemblance du paramètre θ, l’application L : Θ →  + définie
L ( X, θ 0 )

α = P θ0 ( W ) = P θ0 -------------------------  k
L ( X, θ 1 ) 
par : Ce qui nous permet d’obtenir la constante k, comme quantile de
— cas (a) : si E est fini ou dénombrable : L ( X, θ 0 )
la v.a. ------------------------- . Si cette v.a. a une densité, on pourra trouver k
L ( X, θ 1 )
L (x 1 , x 2 , ..., x n , θ ) = P θ ({x 1 , x 2 , ..., x n })
pour toute valeur de α.
— cas (b) : si E =  ou  d et P θ admet une densité f θ : • Le risque de deuxième espèce vaut, dans ce cas, β = P θ1 ( W ) ,
L (x 1 , x 2 , ..., x n , θ ) = f θ (x 1 , x 2 , ..., x n , θ) où W représente le complémentaire de W, c’est-à-dire la région de
non-rejet de H 0 .
Explicitons de manière détaillée sur un exemple simple, cette
Le théorème suivant de Neyman-Pearson permet de construire méthode qui permet d’obtenir un test UPP et donnons ensuite des
un test UPP dans ce cadre. exemples, sans calcul, de tests pour des lois usuelles.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
AF 170 − 4 © Techniques de l’Ingénieur, traité Sciences fondamentales

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
____________________________________________________________________________________________________________ STATISTIQUE INFÉRENTIELLE

3.1.2 Exemples σ
D’où, K = m 0 – u 1– α ---------- avec u 1–α quantile d’ordre 1 – α de la loi
n
N (0, 1), lu dans une table statistique donnée dans l’article
3.1.2.1 Test sur l’espérance d’une loi normale N (m,  2 ), [Form. AF 169].
 connu
La région de rejet du test est donc :
Considérons un n-échantillon (X 1 , ..., X n ) de loi normale
N (m, σ 2), σ connu. On veut tester, au niveau α, les hypothèses σ
suivantes : W =
x ∈ Ω : x n  m 0 – u 1– α ----------
n 
H0 : m = m0
Il ne nous reste plus qu’à étudier la puissance du test
contre ( m0 ≠ m1 ) 1 – β = P m 1 (W ) :
H1 : m = m1 1 – β = Pm 1 ( X n  K )

■ Pour déterminer la région critique W, on utilise le théorème de ce qui peut s’écrire, si l’on centre et si l’on réduit la variable X n
Neyman-Pearson et, pour cela, on doit écrire le rapport des vrai- sous l’hypothèse H 1 :
semblances (cf. [AF 168], § 2.1) :

L ( x, θ 0 )
n 1 – β = Pm 1  Xn – m1 K – m1
n --------------------------  n ----------------------
σ σ 
L ( x, θ 1 )  1
2σ 2 ∑ i
- = exp – -------------
-----------------------
i=1
 ( x – m 0 ) 2 – ( xi – m 1 ) 2   Le calcul de la puissance se réduit donc au calcul de la fonction
L ( x, θ 0 ) K – m1
Le logarithme étant monotone, étudier ------------------------  k revient à de répartition de la loi N (0, 1) en n ---------------------- , qui peut, par exem-
L ( x, θ 1 ) σ
étudier l’inégalité suivante : ple, se lire facilement sur une table statistique.
n Donnons maintenant un exemple numérique pour illustrer
∑  ( xi – m 1 ) 2 – ( xi – m 0 ) 2   2 σ 2 lnk l’importance du choix des hypothèses nulle et alternative. Le fait
i=1 d’inverser H 0 et H 1 peut amener à changer de décision.

En simplifiant les termes de gauche dans l’inégalité, on obtient ■ Exemple numérique


finalement : La législation en vigueur impose aux aéroports certaines normes
n concernant les bruits émis par les avions au décollage et à l’atterris-
( m 0 – m 1 ) ∑ xi  k ′ sage. Ainsi, pour les zones habitées proches d’un aéroport, la limite
i=1
tolérée se situe à 80 décibels. À partir de cette limite, l’aéroport doit
indemniser les riverains. Les habitants d’un village voisin assurent
n 2 2
avec k ′ = lnk + ------  m 0 – m 1  .
σ2 que le bruit au-dessus d’une certaine partie de leur village atteint la
2 valeur limite de 80 décibels. L’aéroport affirme qu’il n’est que de
Deux cas se présentent. 78 décibels. Afin de trancher entre les deux parties, on mesure
● m 0 > m 1 : on déduit de l’inégalité précédente la forme de la l’intensité du bruit provoqué par le passage de 100 avions. Le bruit
région de rejet : moyen émis par ces 100 avions est de 79,1. On admet que l’intensité
n du bruit causé par un avion suit une loi normale de moyenne m déci-

x ∈ Ω : x  bels et de variance 49 décibels2. On admet aussi que les intensités


1
W = n = ------ ∑ x i  K
n du bruit causé par différents avions sont indépendantes entre elles.
i=1
● On choisit de tester :
k′
(où K = -------------------------------------, donné pour indication, car seule la forme de H 0 : m = 80
n (m 0 – m 1)
la région de rejet nous intéresse). contre
● m 0 < m 1 : dans ce cas, on obtient : H 1 : m = 78

W = (x ∈ Ω: xnK ) au niveau 5 %.
Le risque de première espèce représente la probabilité de décider
c’est-à-dire qu’on rejette l’hypothèse H 0 au risque α si l’échantillon que l’aéroport n’indemnise pas les riverains alors qu’ils devraient
observé x n  K . l’être.
Le risque de deuxième espèce représente la probabilité de décider
Il reste donc à déterminer la valeur de la constante K. Expli-
que l’aéroport indemnise les riverains alors qu’ils ne devraient pas
quons, toujours sur cet exemple, la méthode.
l’être.
■ Détermination de K On voit bien que le test, formulé de cette façon privilégie les
Limitons nous au cas m 0 > m 1 . Puisque le risque de première riverains.
espèce est égal à α, on a : D’après ce qui précéde, la région de rejet du test est :

α = Pm 0 ( X n  K )
W = x ∈ Ω : x n  80 – 1,645
49
----------- = 78,83
100 
D’après le paragraphe 2.1 de l’article [AF 168], la variable aléa-
Comme x n = 79,1 > 78,83, on ne rejette pas H 0 et on indemnise
X n – m0 les riverains.
toire n ------------------------- suit une loi N (0, 1), sous P m 0 . On peut donc
σ
La puissance du test vaut :
écrire :

α = Pm 0  X n – m0 K – m0
n -------------------------  n ---------------------
σ σ  
X n – 78
σ
78,83 – 78
1 – β = P m 1 10 ----------------------  10 ------------------------------
7  = 0,8869

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Sciences fondamentales AF 170 − 5

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
STATISTIQUE INFÉRENTIELLE _____________________________________________________________________________________________________________

● On choisit maintenant de tester : Xn–m


n ---------------------- , car σ est inconnu. D’après le paragraphe 2.3 de
H 0 : m = 78 σ
Xn–m
contre l’article [AF 168], la v.a. n ---------------------- suit une loi de Student
S*
n
H 1 : m = 80 St (n – 1).

au niveau 5 %. On obtient donc la région critique :


Le risque de première espèce représente la probabilité de décider
x ∈ Ω : x 
s* n
que l’aéroport indemnise les riverains alors qu’ils ne devraient pas W = n  m 0 – t 1– α -----------
l’être. n
Le risque de deuxième espèce représente la probabilité de décider où t 1–α est le quantile d’ordre 1 – α de la loi St (n – 1), lu dans une
que l’aéroport n’indemnise pas les riverains alors qu’ils devraient table statistique de l’article [Form. AF 169].
l’être.
On voit bien que le test, formulé de cette façon privilégie l’aéroport.
3.1.2.3 Test sur la variance d’une loi normale N (m,  2 ),
D’après ce qui précède, la région de rejet du test est : m connu
Considérons un n-échantillon (X 1 , ..., X n ) de loi normale
W = x  ∈ Ω: 7
x n  78 + 1,645 --------- = 79,17
10  N (m, σ 2), m connu. On veut tester les hypothèses suivantes, pour
un niveau α donné :
Comme x n = 79,1 < 79,17, on ne rejette pas H 0 et on n’indem- 2
H0 : σ2 = σ0
nise pas les riverains.
La puissance du test vaut : contre
2
H1 : σ2 = σ1
  = 0,8869
X n – 80 79,17 – 80
1 – β = Pm 1 10 ----------------------  10 ------------------------------
σ 7 2 2 2
On se limite au cas σ 0 > σ 1 , le cas σ 0 < σ 1 s’en déduisant en
2

changeant le sens des inégalités.


● Conclusion : au niveau 5 %, les deux tests précédents de même
puissance nous donnent des conclusions contradictoires. Si l’on Le calcul du rapport des vraisemblances donne une région de
regarde les deux régions de rejet, on voit qu’on prend les mêmes déci- rejet de la forme :
n
sions si x n  78,81 ou x n  79,17 . Par contre, on prend des déci-
sions contradictoires si 78,83 < x n < 79,17 . Cela est dû à la méthode
W = x ∈ Ω : ∑ (x – m )i=1
i
2 K

de Neyman-Pearson, qui permet de construire des tests UPP mais qui
On sait, d’après le paragraphe 2.2 de l’article [AF 168], que la v.a.
privilégie H 0 en fixant le niveau α. n
n ^2 1
n∑ i
^2
Dans ce cas, un moyen de départager les deux parties est de - σ suit une loi du χ 2 (n ), avec σ
-------- - ( X – m )2 .
n = -----
construire un troisième test pour lequel les risques de première et de σ2 n
i=1
deuxième espèce sont égaux. Comme cela, on ne privilégie pas On peut donc écrire :
d’hypothèses. Pour cela, il suffit de prendre comme région de rejet, 2


^


K
 
78 + 80 n
pour le premier cas W = x ∈ Ω , x n  ---------------------- , respectivement α = P
σ0
2
2
-  ---------
------------- 2
-
2 σ0 σ0

 
78 + 80
pour le deuxième cas W = x ∈ Ω , x n  ---------------------- . Dans les deux 2
D’où, K = c σ 0 où c est le quantile d’ordre α de la loi χ 2 (n ), qui
2
cas, on prend la décision m = 80 et on indemnise les riverains. On peut être lu, par exemple, dans une table statistique associée
peut calculer le niveau du test α = 0,0764 = β. Ce test n’est pas (cf. article [Form. AF 169]).
comparable aux deux premiers car, pour pouvoir comparer des tests On obtient finalement comme région de rejet :
entre eux, il faut qu’ils soient de même niveau.
2

^
Nous donnons ci-après des exemples usuels, mais sans détailler
les calculs, la méthode étant identique à celle qui vient d’être expo-
W =  x ∈ Ω : -------------
2
n
-c
σ0

sée.
n – 1 ∗2
Dans le cas où m est inconnue, on utilise la v.a. ---------------S n qui
3.1.2.2 Test sur l’espérance d’une loi normale N (m,  2 ), σ2
 inconnu suit une loi du χ (n – 1) (d’après le paragraphe 2.2 de
2
n ^2
Considérons un n-échantillon (X 1 , ..., X n ) de loi normale - σ . On obtient la même
l’article [AF 168]), au lieu de la v.a. --------
σ2 n
N (m, σ 2), σ inconnu. On veut tester les hypothèses suivantes, pour
région de rejet mais, dans ce cas, c représente le quantile d’ordre
un niveau α donné :
α de la loi χ 2 (n – 1).
H 0 : m = m0
contre 3.1.2.4 Test sur la proportion p
H 1 : m = m1
Considérons un n-échantillon (X 1 , ..., X n ) de loi de Bernoulli de
paramètre ou proportion p. On veut tester les hypothèses sui-
On se limite au cas m 0 > m 1 , le cas m 0 < m 1 s’en déduisant en vantes, au niveau α fixé, pour p 0 ≠ p 1 ∈ ]0, 1[ :
changeant le sens des inégalités.
H0 : p = p0
On peut reprendre les étapes de construction du test de l’exem-
Xn–m contre
ple précédent, en utilisant la v.a. n ---------------------- plutôt que la v.a.
S* n
H1 : p = p1

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
AF 170 − 6 © Techniques de l’Ingénieur, traité Sciences fondamentales

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
____________________________________________________________________________________________________________ STATISTIQUE INFÉRENTIELLE

On se limite au cas p 0 > p 1 , le cas p 0 < p 1 s’en déduisant en Si la taille de l’échantillon est suffisamment grande (en pratique,
changeant le sens des inégalités. n  30 ), on peut construire une région critique asymptotique. Par
La forme de la région de rejet s’obtient facilement par le calcul Xn – p0
du rapport des vraisemblances : le théorème de la limite centrale (cf. [3]), la v.a. ---------------------------------------- suit
p 0(1 – p 0)
n -------------------------------
W = x ∈ Ω : ∑ x  K i=1
i approximativement une loi N (0, 1), sous H 0 . On obtient donc la
n

région de rejet :
Puisque le risque de première espèce est égal à α, on a :

α = Pp 0
∑
n
Xi  K
 W =  x ∈ Ω:
p 0 (1 – p 0)
x n  p 0 – u 1– α --------------------------------
n 
i=1

n avec u 1–α quantile d’ordre α de la loi N (0, 1), lu dans une table
∑ Xi n’étant pas bijective, on ne
statistique (cf. [Form. AF 169]).
La fonction de répartition de
i=1
trouvera pas toujours une région de rejet de niveau exactement
égale à α, car il n’existe pas forcément une constante K telle que
n 3.2 Tests d’hypothèses multiples
α = Pp 0
 ∑ Xi  K
i=1
 . Deux possibilités s’ouvrent à nous : soit on
Ce paragraphe est consacré à la recherche de tests UPP dans les
cherche un test de niveau non pas égal à α mais de niveau  α , cas (2) à (6) d’hypothèses unilatérales et bilatérales, décrits au
soit on cherche un test mixte qu’on définira ci-après. début du paragraphe 3.
■ Cas d’un test de niveau inférieur ou égal à 
Écrivons que le niveau de test est inférieur à α :
3.2.1 Hypothèse simple contre hypothèse multiple
n
Pp 0
∑
i=1
Xi  K  α
 ■ Considérons tout d’abord le test unilatéral. On veut tester, au
niveau α :
n H 0 : θ = θ0
La variable aléatoire ∑ Xi suit une loi binomiale B (n, p ) (se
contre
i=1
reporter à l’article [AF 166] référence [3]). H 1 : θ > θ 0 ( ou bien θ < θ 0 )

Ainsi, sa fonction de répartition est constante par morceaux. La


Pour chaque θ 1 > θ 0 , on doit donc tester une hypothèse simple
constante K va donc être l’unique nombre tel que :
contre une hypothèse simple :
P ( Y  K ) = α1
P ( Y  K + 1 ) = α 2 , avec α 1  α < α 2 H 0 : θ = θ0
contre
où la probabilité P ( Y  y ) peut être, par exemple, lue dans une H 1 : θ = θ 1 , avec θ 1 > θ 0 , ( ou bien θ = θ 1 , avec θ 1 < θ 0 )
table statistique de la loi B (n, p 0).
■ Cas d’un test de niveau égal à  : test mixte En reprenant les étapes de la méthode précédente pour le test
n sur l’espérance d’une loi normale N (m, σ 2), σ connu, on voit que
Dans le cas précédent, on a obtenu P p 0
∑
i=1

X i  K  α . Pour la forme de la région critique dépend seulement du sens de l’iné-
galité m 1 > m 0 ou m 1 < m 0 . La région de rejet ne dépend donc
obtenir un test de niveau égal à α, on peut choisir une règle de pas de m 1 , on obtient donc la même région de rejet que dans le
décision aléatoire de la façon suivante : soit une constante cas (1) et le test obtenu est donc UPP dans un sens que l’on va pré-
γ ∈ ]0, 1[ telle que : ciser. Pour cela, il faut introduire une nouvelle notion.
n n
α = Pp 0
 ∑ Xi  K
i=1
 + γ Pp 0
 ∑ Xi = K + 1
i=1
 Définition 4
On appelle courbe d’efficacité d’un test sur le paramètre θ, la
On procède de la façon suivante : courbe représentative de la fonction β : Θ → [0, 1], définie par :
n β (θ ) = 1 – Pθ (W )
— on rejette H 0 si ∑ xi  K ;
β (θ ) est la probabilité de ne pas rejeter H 0 , quel que soit θ.
i=1
n
— on accepte H 0 si ∑ xi > K + 1 . Remarque
i=1
Dans le cas où l’observation tombe sur le point frontière Par définition, β (θ0) = 1 – α et pour θ ∈ Θ1 , β (θ) représente le
n risque de deuxième espèce.

∑
i=1

x i = K + 1 , on réalise un tirage au sort. Avec une probabilité γ, On dit que le test précédent est UPP, c’est-à-dire que sa courbe
d’efficacité est, en tout point θ, au-dessous de la courbe d’efficacité
on rejette H 0 et avec une probabilité 1 – γ, on ne rejette pas H 0 . de n’importe quel autre test.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Sciences fondamentales AF 170 − 7

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
STATISTIQUE INFÉRENTIELLE _____________________________________________________________________________________________________________

■ Considérons maintenant le cas (2) qui est un test bilatéral : ● Par la méthode de Neyman-Pearson, on obtient la région de


0,02
H 0 : θ = θ0 rejet, au niveau 10 %, W = x ∈ Ω : x n  23,65 – 1,645 ------------- ou
10
contre 0,02
H1 : θ ≠ θ0 10 
x n  23,65 + 1,645 -------------- , c’est-à-dire W = (x ∈ Ω : x n  23,64 ou

x n  23,66 ). Comme x n = 23,661 ∈ W, on rejette H 0 . On peut


au niveau α.
calculer la puissance de ce test en m = 23,63 et m = 23,67 qui vaut
Cela revient à tester une hypothèse simple contre une hypothèse η (23,63) = η (23,67) = 0,9429.
multiple : ● Pour les mêmes hypothèses, on considère la région de rejet
H 0 : θ = θ0
suivante : W = (x ∈ Ω : x n  23,6409 ou x n  23,6624 ). On peut cal-
contre
culer α qui vaut 10 %. Comme x n = 23,661 ∈ W , on ne rejette
H 1 : θ = θ 1 , avec θ 1 ≠ θ0 pas H 0 . On peut comparer les deux tests car ils sont de même niveau.
Pour cela, calculons la puissance de ce test en m = 23,63 et m = 23,67.
Reprenons l’exemple du test sur l’espérance d’une loi normale Elles valent respectivement η ′ (23,63) = 0,9573 et η’(23,67) = 0,8849.
N (m, σ 2), σ connu pour donner une idée de l’approche générale
de ce test. Finalement, au niveau 10 %, on a :
Considérons un n-échantillon (X 1 ,..., X n ) de loi normale η ′ (23,67) < η (23,63) = η (23,67) < η ′ (23,63)
N (m, σ 2), σ connu. On veut tester les hypothèses suivantes au Aucun des deux tests n’est plus puissant que l’autre.
niveau α :
H0 : m = m0
3.2.2 Hypothèse multiple contre hypothèse
contre
multiple
H1 : m ≠ m0
Par abus de langage, on notera, dans ce paragraphe, α le niveau
On décompose ce test en deux tests de niveau α /2 : du test.
H0 : m = m0 ■ Examinons tout d’abord le cas (3) ; on veut tester au niveau α :
contre
H 0 : θ1  θ  θ2
H 1 : m = m 1, m 1 < m 0
contre
et H 1 : θ < θ 1 ou θ > θ 2
H0 : m = m0
Ce test englobe le précédent. Pour les mêmes raisons, il n’existe
contre
pas de tests UPP pour ce type d’hypothèses. On peut construire
H 1 : m = m 1, m 1 > m 0 une région de rejet W comme réunion de deux régions de rejet
définies au paragraphe précédent. Par contre, dans ce cas,
La méthode de Neyman-Pearson nous donne comme région de contrairement aux précédents cas étudiés, le risque de première
rejet de niveau α / 2, respectivement pour chaque test, espèce n’est pas égal au niveau du test. Le niveau du test est défini
σ par α = sup θ ∈ [ θ1 , θ2 ] P θ ( W ) .
W 1 = x ∈ Ω : x n  m 0 – u 1– α /2 ---------- et
 
n
σ ■ Étudions maintenant les cas (4) et (5) :
 
W 2 = x ∈ Ω : x n  m 0 + u 1– α /2 ---------- où u 1– α / 2 est le quantile
n H 0 : θ  θ0
d’ordre 1 – α /2 de la loi N (0, 1), lu dans une table statistique.
On peut montrer que ce test n’est pas UPP. Il n’existe pas de test contre
UPP pour ce type d’hypothèses, car le choix de couper le test de H 1 : θ > θ0
niveau α en deux tests de niveau α /2 est arbitaire. Il n’y a pas de
choix optimal pour le découpage du risque α en α 1 + α 2 qui per- ou H 0 : θ  θ0
mette d’obtenir un test uniformément le plus puissant parmi tous
contre
les tests.
H 1 : θ < θ0
On va construire, sur un exemple numérique, deux tests de
même niveau et de même puissance mais de régions de rejet
au niveau α.
différentes.
Pour étudier ce type de tests, il faut introduire une nouvelle
■ Exemple numérique
notion qui concerne les familles de lois de probabilité à rapport de
Une machine produit des pièces circulaires. Du fait des imper- vraisemblance monotone (en abrégé, RVM).
fections du processus de fabrication, le diamètre d’une pièce donnée
correspond à la réalisation d’une variable aléatoire distribuée selon
une loi normale de moyenne m et d’écart-type 0,02 mm. Pour qu’une Définition 5
pièce soit utilisable, son diamètre doit être égal à 23,65 mm. On Soit X une v.a. de loi de probabilité P θ , θ ∈ Θ. La loi P θ est dite
admet que les diamètres des pièces produites sont indépendants les RVM s’il existe une statistique T : Ω →  telle que le rapport des
uns des autres. Afin de vérifier si la machine est bien réglée, vraisemblances :
c’est-à-dire si m = 23,65 mm, on mesure le diamètre de 10 pièces et L ( x 1 , ..., x n , θ ′ )
on obtient une moyenne de 23,661 mm. On veut effectuer le test -, θ′ > θ
-----------------------------------------------
H 0 : m = 23,65 contre H 1 : m ≠ 23,65 pour une erreur de première L ( x 1 , ..., x n , θ )
espèce α = 0,1. On calculera la puissance de ce test pour m = 23,63
et m = 23,67. soit une fonction croissante de T.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
AF 170 − 8 © Techniques de l’Ingénieur, traité Sciences fondamentales

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
____________________________________________________________________________________________________________ STATISTIQUE INFÉRENTIELLE

Explicitons cette notion sur un exemple. Considérons un 3.3.1 Comparaison de deux échantillons gaussiens
n-échantillon (X 1 , ..., X n ) de loi normale N (m, 1). Le rapport des indépendants
vraisemblances est donné par :
2
n
Considérons une v.a. X de loi N ( m X , σ X ) et une v.a. Y de loi
L ( x 1 , ..., x n , m′ )
-------------------------------------------------
L ( x 1 , ..., x n , m )  1
- = exp – ------ ∑  ( x i – m′ ) 2 – ( x i – m ) 2 
2
i=1
 2
N ( m Y , σ Y ). Notons X n la moyenne empirique et S X la variance
∗2

empirique sans biais de l’échantillon (X 1 , ..., X n ) de X et Y m la


∗2
que l’on peut écrire de la façon suivante : moyenne empirique et S Y la variance empirique sans biais de
l’échantillon (Y 1 , ..., Y m ) de Y. On peut se reporter à l’article
L ( x 1 , ..., x n , m′ )
   
m 2 – m′ 2 ( m′ – m )T [AF 168] [2] pour la définition de ces statistiques. On suppose que
-------------------------------------------------- = exp n --------------------------- exp -------------------------------- les deux échantillons sont indépendants entre eux.
L ( x 1 , ..., x n , m ) 2 2

n
3.3.1.1 Test de l’égalité des variances
avec T ( x 1 , ..., x n ) = ∑ xi . On se place dans le cas où m X et m Y sont inconnues. On veut
i=1 tester les hypothèses suivantes, au niveau α :
Le rapport de vraisemblance est une fonction croissante de T, 2 2
H0 : σX = σY
pour m′ > m et ainsi, la loi N (m, 1) est à RVM.
contre
Pour cette famille de lois, on peut construire un test UPP pour les
cas (4) et (5) grâce à un théorème de Lehman, que nous donnons H1 : σX
2
≠ σ 2Y
sans démonstration.
D’après le paragraphe 2.4 de l’article [AF 168] [2], la v.a.
∗2 2
SX σY
Théorème de Lehman ------------
- ---------
- suit une loi de Fisher F (n – 1, m – 1).
∗2 2
Soit X une v.a. de loi P θ à RVM en T. Alors, il existe un test UPP SY σX
de niveau α pour le cas (4) (respectivement pour le cas (5)) défini Le problème de test au niveau α peut se réécrire, en considérant
par la région de rejet W = (x ∈ Ω : T ( x )  K ), (respectivement ∗2 2
SX σX
W = (x ∈ Ω : T ( x )  K )). ∗2
- et θ = ---------
la v.a. F = ------------ 2
- de la manière suivante :
SY σy

H0 : θ = 1
■ Il existe un résultat du même type pour le cas (6) :
contre
H 0 : θ  θ 1 ou θ  θ 2 H1 : θ ≠1
contre
On est ainsi ramené au cas (2) du paragraphe 3.2.1 qui donne
H 1 : θ1 < θ < θ2 comme région de rejet :

W = ( ƒ  F α 1 ou ƒ  F 1– α 2 )
Théorème
avec F α quantile d’ordre α,
Soit X une v.a. de loi P θ à RVM en T. Alors, il existe un test UPP
de niveau α pour ce test défini par la région de rejet W = (x ∈ Ω : α = α 1 + α 2 de la loi de Fisher F (n – 1, m – 1).
K 1  T ( x )  K 2 ).
3.3.1.2 Test de l’égalité des espérances, variances connues
On suppose maintenant les variances connues. On veut tester
les hypothèses suivantes, au niveau α :
3.3 Tests de comparaison de paramètres
H 0 : mX = mY
Comme on l’a vu dans l’exemple du paragraphe 1 concernant la contre
fabrication de pièces, il est fréquent d’avoir à comparer entre elles H 1 : mX ≠ mY
des caractéristiques de deux variables aléatoires X et Y. Pour cela,
on considère un échantillon de X de taille n et un échantillon de Y
de taille m. Pour donner la démarche générale des tests de D’après le paragraphe 2.1 de l’article [AF 168] [2], la v.a.
comparaison, nous allons, dans un premier temps, nous limiter à X n – Y m – ( mX – mY )
l’étude d’échantillons gaussiens (de loi normale) indépendants ------------------------------------------------------------
- suit une loi normale N (0, 1).
2 2
entre eux. On désire comparer l’espérance et la variance de X et Y. σX σY
Dans un deuxième temps, nous généraliserons ces résultats au cas ---------- + ----------
n m
de deux échantillons indépendants entre eux et de grande taille, de
v.a. de loi de probabilité quelconque. Si les tailles des deux échan- Le problème de test au niveau α peut se réécrire, en considérant
tillons ne sont pas suffisamment grandes, ces techniques ne sont la v.a. Z n = X n – Y m et θ = m X – m Y de la manière suivante :
plus adaptées. Une alternative, dans ce cas, sera étudiée dans le
H0 : θ = 0
paragraphe 4 concernant les tests non paramétriques. Pour finir,
nous étudierons le cas apparié, c’est-à-dire quand les deux échan- contre
tillons de taille n, (X 1 , ..., X n ) et (Y 1 , ..., Y n ), ne sont pas indé-
pendants entre eux. On se limitera au cas gaussien. H1 : θ ≠0

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Sciences fondamentales AF 170 − 9

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
STATISTIQUE INFÉRENTIELLE _____________________________________________________________________________________________________________

On est ramené au cas (2) du paragraphe 3.2.1 qui donne comme caractéristique, suit une loi binomiale B (n, p X ) (resp. B (m, pY )).
région de rejet : On souhaite tester si les proportions pX et pY sont égales.
Le problème de test au niveau α peut donc s’écrire :
 
2 2 2 2
σX σY σX σY
W = z n  –u 1– α /2 ---------- + ---------- ou z n  u 1– α /2 ---------- + ----------
n m n m H 0 : pX = pY

avec u 1–α /2 quantile d’ordre 1 – α /2 de la loi N (0, 1). contre


H 1 : pX ≠ pY
3.3.1.3 Test de l’égalité des espérances, variances
inconnues O n p e u t r é é c r i r e c e t e s t , e n c o n s i d é r a n t l a v. a .
n m
1 1
Pour pouvoir construire ce test, il faut supposer que les varian- Z n = -------
n ∑ Xi – -------
m ∑ i
- Y et θ = p X – p Y de la manière suivante :
ces sont égales pour obtenir la loi de la statistique de test. Cette i =1 i =1
condition revient à supposer que l’on a, au préalable, effectué le H0 : θ = 0
test d’égalité des variances et que l’on a retenu l’hypothèse H 0 :
2 2 contre
σX = σY .
2 2 H1 : θ ≠0
Notons σ 2 = σ X = σ Y la valeur commune et inconnue des
variances. On est ramené au cas (2) du paragraphe 3.2.1. De plus, comme
n, m  30, par le théorème de la limite centrale (se reporter à
On peut montrer qu’un estimateur sans biais de σ2 meilleur que
∗2 ∗2
S X et S Y est donné par : Z n – ( mX – mY )
l’article [AF 166] [3]), la v.a. --------------------------------------------------------------------------------- suit
pX ( 1 – pX ) pY ( 1 – pY )
∗2 ∗2 --------------------------------- + ---------------------------------
( n – 1 )S X + ( m – 1 )S Y n m
S 2 = -------------------------------------------------------------------
- approximativement une loi N (0, 1). On en déduit la région de
n+m–2
rejet :
D’après les paragraphes 2.2 et 2.3 de l’article [AF 168] [2], la v.a.


zn
S2 W = --------------------------------------------------------------------------------  – u 1– α /2
- s u i t u n e l o i d u χ 2 ( n + m – 2 ) e t l a v. a .
( n + m – 2 ) --------- pX ( 1 – pX ) pY ( 1 – pY )
σ2 --------------------------------- + ---------------------------------
n m
X n – Y m – ( mX – mY )


-------------------------------------------------------------- suit une loi de Student St (n + m – 2). zn
1 1 ou ---------------------------------------------------------------------------------  u 1– α /2
S ------ + --------
n m pX ( 1 – pX ) pY ( 1 – pY )
---------------------------------- + -------------------------------- -
Le problème de test au niveau α peut se réécrire, en considérant n m
la v.a. Z n = X n – Y m et θ = m X – m Y de la manière suivante :
avec u 1–α /2 quantile d’ordre 1 – α /2 de la loi N (0, 1).
H0 : θ = 0
Sous H 0 : p X = p Y = p, on estime la valeur commune p par
contre n m

H1 : θ ≠0 ^
∑ Xi + ∑ Yi
i=1 i=1
P = ----------------------------------
- et on remplace dans la région de rejet W, p X et
On est encore ramené au cas (2) du paragraphe 3.2.1 qui donne n+m
^
comme région de rejet : p Y par p . On obtient finalement comme région de rejet :

W = z n
n
1
m
1
n
1
m
1
 u 1– α /2 s ------ + -------- ou z n  u 1– α /2 s ------ + --------  W = z n
^
n
1
m
1
 – u 1– α /2 p ( 1 – p ) ------ + -------- ou
^
 
avec u 1–α /2 quantile d’ordre 1 – α /2 de la loi St (n + m – 2).
 
1 1
z n  u 1– α /2 p ( 1 – p ) ------ + --------
^ ^
n m
3.3.2 Comparaison de deux proportions
pour des échantillons indépendants 3.3.3 Cas apparié
de grande taille
On dit que deux échantillons de taille n sont appariés s’ils sont
On considère deux variables X et Y. On tire un échantillon de constitués de deux observations de la même variable sur les
taille n de X et un échantillon de taille m de Y. On suppose que les mêmes individus. Par exemple, pour vérifier l’efficacité d’un médi-
deux échantillons sont indépendants entre eux et que n, m  30 . cament, on fait des mesures sur un échantillon d’individus avant et
On note X i (resp. Y i ) la v.a. qui vaut 1 si le i e individu interrogé après traitement. On dispose donc de deux échantillons de taille n
notés (X 1 , X 2 , ..., Xn ) et (Y 1 , Y 2 , ..., Yn ). La v.a. X, représentant la
dans le premier échantillon (resp. dans le deuxième échantillon) 2
première mesure, est supposée de loi N ( m X , σ X ) et la v.a. Y,
présente une certaine caractéristique, que l’on souhaite étudier, 2
représentant la deuxième mesure, est supposée de loi N ( m Y , σ Y ).
avec la probabilité ou proportion p X (resp. avec la probabilité p Y )
Les (X i ) sont donc indépendantes entre elles ainsi que les (Y i ).
et 0 sinon, avec la probabilité 1 – p X (resp. avec la probabilité Mais X i et Y i ne sont pas indépendantes. On suppose, de plus,
1 – p Y ). En se reportant à l’article [AF 166] [3], on peut voir que la pour des raisons techniques que l’on verra ci-après, que le vecteur
v.a. X i (resp. Y i ) suit une loi de Bernoulli Be (p X ) (resp. Be (p Y )). La (X i , Y i )i=1,...,n est gaussien.
n m

 
Pour tout i = 1, ..., n, on pose Z i = X i – Y i . Les Z i sont indépen-
v.a. ∑ Xi resp. ∑ Y i , représentant le nombre d’individus dans le dantes entre elles du fait que (X i , Y i ) est un vecteur gaussien et de
i=1 i=1 2 2
premier échantillon (resp. dans le deuxième échantillon) ayant la même loi normale N ( m X – m Y , σ X + σ Y ) (se reporter à l’article

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
AF 170 − 10 © Techniques de l’Ingénieur, traité Sciences fondamentales

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
____________________________________________________________________________________________________________ STATISTIQUE INFÉRENTIELLE

[AF 166] [4]). L’hypothèse d’indépendance des Z i est indispensable 3.4.2 Degré de signification
pour construire le test suivant.
On a vu précédemment le rôle fondamental du niveau de test α.
On veut tester s’il y a eu un changement en moyenne entre X et Pour expliquer la notion de degré de signification, plaçons-nous
Y, ce qui revient à tester m Z = m X – m Y = 0 à partir de l’échantillon dans le cas du test sur l’espérance d’une loi normale N (m, σ 2), σ
différence (Z 1 , Z 2 , ..., Z n ). connu. On veut tester, au niveau α, les hypothèses suivantes :
Le problème de test au niveau α peut donc s’écrire :
H 0 : mZ = 0 H0 : m = m0
contre contre (m 0 > m 1)
H 1 : mZ ≠0 H1 : m = m1

On est ramené au cas (2) du paragraphe 3.2.1 qui donne comme On a vu, au paragraphe 3.1 la forme de la région de rejet :
région de rejet :

∈ Ω : xn
z 
W = (x  K)
s Z* s Z*
W = n  – u 1– α /2 ----------- ou z n  u 1– α /2 -----------
n n
La constante K est calculée grâce au niveau α = P H 0 ( X n  K ).
avec u 1–α /2 quantile d’ordre 1 – α /2 de la loi N (0, 1),
Si l’observation x n est inférieure ou égale à K, on rejette H 0 , sinon
zn réalisation de la moyenne empirique,
∗2 on ne rejette pas H 0 . On voit que plus α est petit, plus la région de
sZ réalisation de la variance empirique sans biais de rejet diminue et on a donc moins tendance à rejeter H 0 . Ainsi, il
l’échantillon (Z 1 , Z 2 , ..., Z n ).
existe α1 pour lequel on ne rejette pas H 0 et α 2 > α 1 pour lequel
on rejette H 0 . Cette remarque met en évidence l’existence d’un
niveau de test critique, appelé degré de signification, compris
3.4 Remarques entre α 1 et α 2 , à partir duquel on rejette toujours H 0 . Comme c’est
l’observation x n qui permet de conclure au rejet ou non-rejet de
H 0 , il suffit de prendre comme seuil K, cette observation.
3.4.1 Lien entre tests d’hypothèses bilatérales
et intervalles de confiance
Définition
Reprenons l’exemple du paragraphe 3.2.1 pour expliquer ce lien.
Considérons un n-échantillon (X 1 , ..., X n ) de loi normale N (m, σ 2), Le degré de signification est défini par P H 0 ( X n  x n ) .
σ connu. On veut tester les hypothèses suivantes au niveau α :
H 0 : m = m0 On rejette H 0 au niveau α dès que α est supérieur ou égal au
degré de signification.
contre
H1 : m ≠ m0 Ce degré de signification a une grande importance car il permet
de savoir s’il est raisonnable de rejeter ou non H 0 , plutôt que de
La région de rejet est donnée par : fixer α à l’avance et, de plus, c’est cette valeur qui est donnée par
la majorité des logiciels de statistiques (sous le nom de p-value).
σ σ Si le degré de signification est grand, il vaut mieux rejeter H 0 ,
∈ Ω : xn
W = x
  m 0 – u 1– α /2 ----------- ou x n  m 0 + u 1– α /2 -----------
n n  sinon on ne rejettera pas H 0 .

avec u 1–α /2 quantile d’ordre 1 – α /2 de la loi N (0, 1). Exemple numérique : reprenons l’exemple du paragraphe 3.1.2.1
On rejette donc, au risque α, l’hypothèse H 0 : m = m 0 cas (1) : la région de rejet est de la forme W = ( x ∈ Ω : xn  K ).
Donc, le degré de signification est donné par :
σ σ

si x n  m 0 – u 1– α /2 ----------- ou x n  m 0 + u 1– α /2 -----------
n n  
X n – 80 79,1 – 80

P 80 ( X n  79,1 ) = P 80 10 ----------------------  10 --------------------------- = 0,344. On
7 7
σ
ce qui est équivalent à la condition  m 0  x n – u 1– α /2 ----------- ou
n
rejette donc H 0 dès que α  0,344 . Il est donc raisonnable de ne pas
rejeter H 0 .
σ
m 0  x n + u 1– α /2 ----------- .
n 
σ σ
L’intervalle  x n – u 1– α /2 ----------
n n 
- , x n + u 1– α /2 ----------- est la fourchette

d’estimation au niveau de confiance 1 – α de l’espérance m d’une 4. Quelques tests


loi normale N (m, σ 2), σ connu, définie au paragraphe 3.2.2 de
l’article [AF 168] [2].
non paramétriques
Il existe donc un lien entre test d’hypothèses bilatérales et inter-
valle de confiance. Ce lien est facile à comprendre. La signification Un test non paramétrique est un test qui porte sur des échan-
de l’intervalle de confiance est que l’on a (1 – α )% de chances de tillons de variables aléatoires dont la loi de probabilité est incon-
dire vrai lorsque l’on affirme que m appartient à cet intervalle. Si nue.
m 0 n’appartient pas à cet intervalle, il est peu probable que
m = m 0 . On a même (1 – α )% de chances de dire vrai lorsque l’on Il en existe beaucoup. Nous nous limiterons ici aux tests les plus
affirme que m ≠ m 0 . Ce qui permet de conclure le test. usuels.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Sciences fondamentales AF 170 − 11

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
STATISTIQUE INFÉRENTIELLE _____________________________________________________________________________________________________________

m
4.1 Tests d’ajustement La loi de Z est fonction de m – 1 paramètres car ∑ pi = 1.
i=1
4.1.1 Tests du  2
np 
 -----------------------
N i – np i
Il faut ensuite montrer que le vecteur aléatoire suit
Après étude d’un échantillon prélevé dans une population, on i
est amené à faire le choix d’un modèle théorique. La nature de la approximativement une loi normale centrée, réduite, multidimen-
distribution est, selon les cas, supposée normale ou binomiale... sionnelle et l’on peut en déduire que T n suit approximativement
Nous avons fait des hypothèses de ce type dans le paragraphe por-
une loi χ 2 (m – 1).
tant sur les tests paramétriques. Il est nécessaire de tester la légi-
timité de ce choix. Le principe du test du χ 2 consiste à construire Intuitivement, si X suit la loi P 0 , T n doit être « petit ». Cela
un échantillon « idéal » à partir du modèle théorique de même conduit à choisir une région de rejet au niveau α de la forme :
taille que l’échantillon prélevé et comparer les deux en s’assurant
que la valeur de l’écart obtenu reste dans les limites compatibles W = (x ∈ Ω , tn  K)
avec les fluctuations d’échantillonnage (se reporter au paragraphe
1.3 de l’article [AF 168] référence [2]). avec K quantile d’ordre 1 – α de la loi du χ 2 (m – 1),
tn réalisation de Tn .
4.1.1.1 Test d’ajustement à une loi donnée
complètement spécifiée La complexité de l’hypothèse alternative fait qu’il est impossible
On est ici dans un cadre « non paramétrique » où Θ est de calculer de manière générale la puissance d’un tel test. On ne
l’ensemble de toutes les probabilités sur un espace donné Ω fini ou peut donc pas montrer que ces tests sont UPP. Mais, ces tests sont
dénombrable, ou Ω =  d . Plus précisément, on considère un raisonnables pour bien des aspects et sont universellement
n-échantillon (X 1 , ..., X n ) de loi P sur Ω. Cette loi est décrite par m employés. ♦
modalités. Remarque
On veut tester au niveau α :
La condition restrictive np i  5 a une signification intuitive : si
H 0 : P = P 0 , loi donnée np i est faible, la contribution de la modalité i à la valeur de Tn peut
être grande et fausser le résultat. Si, dans une classe, cette
contre condition n’est pas vérifiée, il faut la regrouper avec la classe sui-
H1 : P ≠ P0 vante ou précédente, suivant le contexte, pour pouvoir appliquer le
théorème.
On suppose que l’on possède le nombre de réalisations n i de la
m Illustrons sur un exemple simple ce test.
v.a. N i , i = 1, ..., m des m modalités de X, au cours de n = ∑ ni Exemple : on lance un dé 450 fois et on enregistre le nombre de
i=1
expériences de même nature et indépendantes. C’est-à-dire que fois où chacune des faces apparaît :
l’on possède les effectifs observés d’un échantillon de n individus Face 1 2 3 4 5 6
dont l’espace d’observations est divisé en m catégories. ni 62 50 76 68 111 83
Notons p 1 , ..., p m les probabilités de chaque éventualité de 1 à Peut-on, au niveau α = 5 %, rejeter l’hypothèse que le dé est bien
m, calculées à partir de la loi donnée P 0 , parfaitement spécifiée équilibré ?
m Cela revient à tester :
et ∑ pi = 1.
1 1 1 1 1 1
i=1
Le problème est de décider si les observations n 1 , n 2 , ..., n m
6 6 6 6 6 6 
H 0 : P = P 0 = ------ , ------ , ------ , ------ , ------ , ------ 
sont compatibles avec l’hypothèse H 0 que les probabilités sont contre
issues de p 1 , p 2 , ..., p m , c’est-à-dire de vérifier si les n i sont H1 : P ≠ P0
« significativement » proches de np i , au sens de la distance du
khi-deux définie ci-après. On construit le tableau des effectifs théoriques en calculant np i avec
On appelle distance du khi-deux entre la loi théorique et la loi p i = 1/6, i = 1, ..., 6 :
empirique observée, la statistique : Face 1 2 3 4 5 6
m
( N i – np i ) 2 np i 75 75 75 75 75 75
Tn = ∑ -------------------------------
np i
- Les conditions d’application du test sont vérifiées : n  30 et
i=1 np i  5 . Sous H 0 , la v.a. T n suit une loi de χ 2 (5).
La région de rejet est donnée par :
Théorème de Pearson
Sous l’hypothèse nulle, la v.a. Tn suit approximativement une W = (x ∈ Ω , tn  K ) (1)
loi χ 2 (m – 1) dès que n  30 et np i  5 , i = 1, ..., m. où K = 11,07 est lue dans une table de loi de χ2 (5), donnée dans
l’article [Form. AF 169] référence [2].
Éléments de démonstration ♦ On calcule la réalisation de T n sur l’échantillon et on obtient la valeur
Nous donnerons seulement les étapes de démonstration. On ( 62 – 75 ) 2 ( 50 – 75 ) 2 ( 76 – 75 ) 2 ( 68 – 75 ) 2 ( 111 – 75 ) 2
pourra se reporter au livre de Tassi [5] pour plus de détails. t n = ---------------------------------- + ---------------------------------- + ---------------------------------- + ---------------------------------- + --------------------------------------
75 75 75 75 75
Posons Z = (N 1 , N 2 , ..., N m ). On peut montrer que, sous H 0 , Z
( 83 – 75 ) 2
suit une loi multinomiale M (p 1 , p 2 , ..., p m ) de loi de probabilité : + ----------------------------------- = 18,134 .
75
n! n n n
Comme t n  11,07 , on est dans la région de rejet. On rejette donc
P ( N 1 = n 1 , N 2 = n 2 , ..., N m = n m ) = -------------------------------------- p 1 1 p 2 2 ... p mm
n 1 ! n 2 !... n m ! au risque 0,05, l’hypothèse que le dé est équilibré.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
AF 170 − 12 © Techniques de l’Ingénieur, traité Sciences fondamentales

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
____________________________________________________________________________________________________________ STATISTIQUE INFÉRENTIELLE

4.1.1.2 Test d’ajustement à une loi dont certains paramètres 4.1.1.3 Autre utilisation : test d’indépendance
ont été estimés
Le test du χ 2 est très souvent employé dans le problème
Dans le test précédent, la loi de référence est parfaitement suivant : on considère une population dont les éléments possèdent
connue. En pratique, tous les paramètres de la loi théorique ne deux caractères X et Y. On se demande si ces deux caractères peu-
^
sont pas connus, il faut en estimer un certain nombre. Notons p i vent être considérés comme indépendants.
l’estimation de p i théorique. En reprenant les notations précéden-
Évidemment, ce test n’entre pas dans le cadre des tests d’ajus-
tes, on appelle distance du khi-deux entre la loi théorique, dont les
tement mais l’importance de son utilisation dans la pratique justifie
paramètres inconnus ont été estimés, et la loi empirique observée,
pleinement sa place dans cet article. De plus, ce test permet de
la statistique :
donner une justification théorique du critère d’indépendance intro-
m
( N i – np i ) 2
^ duit dans le paragraphe 4.3 de [AF 167] [1], dont on reprend les
Tn = ∑ ------------------------------
np
^
- notations.
i=1 i
On considère un échantillon de taille n sur lequel on étudie deux
La loi de T n est donnée par le théorème suivant. caractères statistiques X et Y. On suppose que la variable X
(resp. Y ) peut prendre k modalités (resp.  modalités), notées E 1 ,
..., E k (resp. F 1, ..., F  ). On note n ij le nombre d’observations pos-
Théorème sédant le caractère X avec la modalité E i et le caractère Y avec la
Supposons que le nombre de paramètres à estimer soit égal modalité F j . On peut représenter ces données dans un tableau de
à k. Sous l’hypothèse nulle, la v.a. T n suit approximativement contingence :
une loi χ 2 (m – k – 1) dès que n  30 et np i  5 , i = 1, ..., m.
X/Y F1 ... Fj ... F
Donnons un exemple simple de ce test.
E1 n 11 ... n 1j ... n 1
Exemple : on étudie l’arrivée de clients à un guichet, pendant la
durée de temps unitaire d’une minute. On fait 1 000 mesures. Peut-on ... ... ... ... ... ...
supposer que le nombre d’arrivées par minute suit une loi de Poisson ?
Ei ni1 ... n ij ... n i
Soit X la v.a. comptant le nombre d’arrivées par minute. On veut tes-
ter, au niveau 5 % : ... ... ... ... ... ...
H 0 : X suit une loi de Poisson de paramètre λ
Ek n k1 ... n kj ... n k
contre
H 1 : X ne suit pas une loi de Poisson de paramètre λ
Notons p i. = P [X ∈ E i ], p .j = P [Y ∈ F j ] et p ij = P [X ∈ E i , Y ∈ F j ].
où le paramètre λ > 0 est inconnu.
L’indépendance de X et Y s’exprime par la propriété p ij = p i. p .j ,
La répartition observée des arrivées est la suivante :
∀i = 1, ..., k, j = 1, ...,  .
X 0 1 2 3 4 5
Effectif n i 676 262 51 8 3 0 Les probabilités p i. et p .j étant inconnues, on peut les estimer sur
l’échantillon par :
D’après l’article [AF 168], on peut montrer qu’un bon estimateur de λ
^ n i. ^ n .j
est la moyenne empirique X n . Sur l’échantillon observé, l’estimation p i. = --------- et p .j = --------- respectivement
^ 1 n n
de λ vaudra donc λ = --------------- (0 × 676 + 1 × 262 + 2 × 51 + 3 × 8 + 4
1000  k  k
× 3 + 5 × 0) = 0,4. avec n i. = ∑ nij , n .j = ∑ nij et n = ∑ ∑ nij où n i. (resp. n .j ) repré-
On construit le tableau des effectifs théoriques en calculant la proba- j=1 i=1 j=1 i=1
0,4 x sente le nombre d’individus ayant la modalité E i (resp. la
bilité de la loi P (0, 4) par P (X = x ) = e –0,4 ---------------- :
x! modalité F j ).
X 0 1 2 3 4 5
On note N ij la v.a. qui, à un échantillon de taille n, associe le
^
pi 0,6703 0,2681 0,0536 0,0072 0,0007 0,0001 nombre n ij , N i. la v.a. qui, à un échantillon de taille n, associe le
^ nombre n i. et N .j la v.a. qui, à un échantillon de taille n, associe le
Effectif np i 670,3 268,1 53,6 7,2 0,7 0,1 nombre n .j .
Pour que les conditions d’application du test soient vérifiées,
On veut tester au niveau α :
c’est-à-dire : n  30 et np i  5 , il faut regrouper les trois dernières
classes. On ajoute donc les effectifs de ces trois classes. H 0 : X et Y sont indépendantes ⇔ P X,Y = P X ⊗ P Y
On considère donc le tableau suivant : contre
X 0 1 2 3,4,5
Effectif n i observé 676 262 51 11
H 1 : X et Y ne sont pas indépendantes ⇔ P X,Y ≠ PX ⊗ PY
^
Effectif np i théorique 670,3 268,1 53,6 8 Le problème est de décider si les effectifs observés n ij sont
La v.a. X a finalement 4 modalités et on a estimé un paramètre ; on compatibles avec l’hypothèse H 0 sous laquelle les variables X et Y
sait donc, en appliquant le théorème précédent, que sous H 0 , la v.a. T n sont indépendantes, c’est-à-dire que chaque effectif théorique np ij
suit une loi de χ 2 (4 – 1 – 1). est égal à np i. p .j . En remplaçant les p i. et p .j par leurs estimateurs,
La région de rejet est donnée par W = (x ∈ Ω, t n  K ) où K = 5,99 n i. n .j
cette condition d’indépendance est donnée par np ij = ---------------- - . Il
est lue dans une table de loi de χ 2 (2) (cf. [Form. AF 169]). n
On calcule la valeur de T n sur l’échantillon et on obtient t n = 1,44. faut donc vérifier si les n ij sont « significativement » proches de
Comme t n < 5,99, on n’est pas dans la région de rejet et, donc, on n i. n .j
----------------
- , au sens de la distance au khi-deux définie ci-dessous.
accepte au niveau 0,05 l’hypothèse de l’ajustement par une loi P (0, 4). n

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Sciences fondamentales AF 170 − 13

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
STATISTIQUE INFÉRENTIELLE _____________________________________________________________________________________________________________

On appelle distance du khi-deux entre le tableau observé et le cédures classiques de la statistique, comme on a pu le voir dans
tableau théorique sous H 0 , la statistique : les paragraphes précédents. C’est pour cette raison qu’un grand
nombre de tests de normalité se sont développés à côté des tests
n n 2
k   Nij – ---------------
n 
i. .j
- généraux précédemment étudiés. On peut en citer quelques-uns :
droite de Henry, test de Shapiro-Wilk... Pour plus de détails
Tn = ∑ ∑ ----------------------------------------
n i. n .j
-
concernant ces tests, on pourra se reporter au livre de Tassi [5].
i=1 j=1 -----------------
n ■ Fonction de répartition et hypothèses du test
On considère un n-échantillon (X 1 , ..., X n ) de loi P sur Ω. On
Théorème définit la fonction de répartition de X par F ( x ) = P ( X  x ) . On
Sous l’hypothèse nulle, la v.a. T n suit approximativement une désire ajuster la loi P inconnue à une loi spécifiée P 0 , de fonction
de répartition F 0 . Ce qui revient à tester au niveau α :
loi χ 2 ((k – 1) (  – 1)) dès que n  30 et que les effectifs théo-
riques sont supérieurs ou égaux à 5. H 0 : F = F0
contre
Intuitivement, si X et Y sont indépendants, T n doit être « petit ». H1 : F ≠ F0
Cela conduit à choisir une région de rejet, au niveau α de la forme :
W = (x ∈ Ω, tn  K ) Pour construire ce test, on considère la fonction de répartition
n
1
avec K quantile d’ordre 1 – α de la loi du χ 2 ((k – 1) (  – 1)). empirique définie, pour x ∈ , par ƒ n ( x ) = ------ ∑ 1 –∞,x  ( x i ) . On
n
Donnons un exemple simple de ce test. i=1
n
1
Exemple : une enquête a été réalisée auprès d’un échantillon de peut facilement vérifier que F n ( x ) = ------ ∑ 1 –∞,x  ( X i ) est un esti-
n
250 personnes au sujet de l’abaissement à 16 ans du droit de vote. Les i=1
réponses ont été classées suivant le niveau d’instruction des individus : mateur sans biais de F (x ) et qu’il converge presque sûrement
vers F (x ). On va donc construire les statistiques de test grâce à cet
X/Y pour contre n i.
estimateur. On rejettera H 0 si les fonctions F n et F 0 sont
BEP 10 15 25
« significativement » éloignées, dans un sens précisé ci-après. Il y
BAC 21 84 105
a plusieurs façons de mesurer l’écart entre F et F 0 , qui donnent
Universitaire 20 100 120
lieu à différentes statistiques de tests :
n .j 51 199 250
— statistique de Kolmogorov-Smirnov :
Peut-on au niveau α = 1 %, accepter l’hypothèse d’une liaison entre
l’opinion d’une personne et son niveau d’instruction ? Kn = n sup x ∈  F n (x ) – F 0 ( x ) ;
On construit le tableau des effectifs théoriques : — statistique de Cramer-von Mises :


X/Y pour contre +∞
BEP 5,1 19,9 CV M n = n ( F n (x ) – F 0 ( x ) ) 2 dF 0 ( x ).
BAC 21,42 83,58 –∞

Universitaire 24,48 95,52 On peut montrer que, sous H 0 , ces statistiques de test
convergent en loi vers des lois de probabilité indépendantes de F 0 ,
Par exemple, le nombre 5,1 a été obtenu en calculant
d’expressions complexes mais tabulées.
n 1. n .1 25 × 51
- = ----------------------.
---------------------- Intuitivement, si F = F 0 , K n et CV M n doivent être « petites ».
n 250
Cela conduit à choisir une région de rejet, au niveau α , de la
Les conditions d’application du théorème sont vérifiées. Les v.a. X
forme :
et Y ont respectivement 2 et 3 modalités. En appliquant le théorème
précédent, sous H 0 , la v.a. T n suit une loi χ 2 ((2 – 1) (3 – 1)). W = (x ∈ Ω , kn  K ) ou W = ( x ∈ Ω , CV m n  L )
La région de rejet est donnée par : avec K et L quantiles d’ordre 1 – α lus dans les tables associées aux
W = (x ∈ Ω, tn  K ) lois limites.
où K = 9,21 est lu dans une table de loi χ 2 (2) (cf. [Form. AF 169]).
On calcule la valeur de T n sur l’échantillon et on obtient t n = 7. 4.2 Tests non paramétriques
Comme t n < 9,21 n’est pas dans la région de rejet, on ne rejette pas au de comparaison de lois
niveau 0,01 l’hypothèse d’une liaison entre X et Y.
On va considérer ici des tests de comparaison de lois, dans le
cas où les lois à comparer sont inconnues. Nous allons exposer
4.1.2 Tests basés sur la fonction de répartition trois tests usuels de ce type dans ce paragraphe. On pourra trouver
empirique une littérature abondante concernant ce sujet dans le livre de
Lecoutre-Tassi [4]. Ces tests sont assez faciles à mettre en œuvre,
Il existe évidemment beaucoup d’autres tests d’ajustement que d’où leur popularité mais ils existent peu de résultats concernant
nous n’exposerons pas ici, du fait de la spécificité de chacun. leur puissance.
L’important est de savoir qu’il en existe d’autres et de pouvoir y
On suppose qu’on a deux échantillons indépendants entre eux
accéder en cas de besoin.
(X 1 , ..., X m ) et (Y 1 , ..., Y n ), de fonctions de répartition
Certains sont basés sur la comparaison de la fonction de respectives F X et F Y . On désire savoir si les v.a. X et Y ont même
répartition théorique et de la fonction de répartition observée. loi, sans faire d’hypothèses sur leur loi. On veut donc tester au
Nous allons étudier, dans ce paragraphe, les deux les plus utilisés niveau α :
dans la pratique : le test de Kolmogorov-Smirnov et le test de H 0 : FX = FY
Cramer-von Mises.
contre
Il existe un grand nombre de tests spécifiques à l’ajustement à
la loi normale, du fait du rôle important de cette loi dans les pro- H 1 : FX ≠ FY

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
AF 170 − 14 © Techniques de l’Ingénieur, traité Sciences fondamentales

Dossier délivré pour


DOCUMENTATION
19/09/2008
Dossier délivré pour
DOCUMENTATION
19/09/2008
____________________________________________________________________________________________________________ STATISTIQUE INFÉRENTIELLE

■ Test de Kolmogorov-Smirnov On peut montrer que, sous H 0 , la v.a. Z suit une certaine loi pour
C’est une généralisation du test de Kolmogorov-Smirnov pour un laquelle il existe une table statistique. Pour des grands échan-
échantillon, étudié dans le paragraphe précédent. Pour construire ce tillons, on utilise une approximation de la loi de Z par la loi
test, on considère les fonctions de répartition empiriques de X et Y, nm
Z – -----------
X Y 2
notées respectivement F m ( x ) et F n ( x ). On suppose que les deux normale : on peut montrer que, sous H 0 , la v.a. --------------------------------------------------
échantillons sont de grande taille. Si les deux échantillons pro- nm ( n + m + 1 )
-------------------------------------------
viennent de la même loi, ils ont la même fonction de répartition et 12
suit approximativement une loi N (0, 1).
leurs fonctions de répartition empiriques doivent être proches. On
va donc construire la statistique de test grâce à ces estimateurs. On nm
X Y Intuitivement, si F X = F Y , la différence Z – ------------ doit être
rejettera H 0 si les fonctions F m et F n sont « significativement » 2
éloignées, dans le sens suivant : statistique de Kolmogorov- « petite ». Cela conduit à choisir une région de rejet, au niveau α
de la forme :
mn X Y
Smirnov : K m,n = ------------------ sup x ∈  F m (x ) – F n ( x ) .
m+n nm

 
Z – ------------
On peut montrer que, sous H 0 , cette statistique de test converge W = x ∈ Ω, 2
--------------------------------------------------  u 1– α /2
en loi vers la même loi de probabilité que la loi limite obtenue nm ( n + m + 1 )
--------------------------------------------
pour K n au paragraphe précédent. 12
Intuitivement, si F X = F Y , K m,n doit être « petite ». Cela conduit
à choisir une région de rejet, au niveau α de la forme : avec u 1–α /2 quantile d’ordre 1 – α /2 lu dans la table N (0, 1) dans le
cas des grands échantillons.
W = (x ∈ Ω, k m,n  K )
■ Test de Wilcoxon
avec K quantile d’ordre 1 – α lu dans la table associée à la loi limite.
Une autre façon de procéder est de ranger les n + m éléments
■ Test de Mann-Whitney (x 1 , ..., x m , y 1 , ..., y n ) par ordre croissant et on note R i le rang de
Le principe de ce test est le suivant : si X et Y sont indépendan- x i , i = 1, ..., m parmi les n + m valeurs.
1
tes et de même loi alors P ( X  Y ) = P ( Y  X ) = ------ . Comme les m
2
1
échantillons sont indépendants, on a alors, ∀i, j, P ( X i  Y j ) = ------.
On considère la v.a. R = ∑ Ri .
i=1
2
Notons Z le nombre de couples (i, j ) tels que X i  Y j parmi On peut montrer que la statistique de test de Mann-Whitney Z
les nm couples possibles. Donc, la réalisation de Z doit être proche m ( m + 2n + 1 )
est égale à -------------------------------------------- – R et ainsi les tests de Wilcoxon et
nm 2
de ----------- , sous l’hypothèse H 0 : F X = F Y . Mann-Whitney sont équivalents. Seule la procédure change.
2

Références bibliographiques

Dans les Techniques de l’Ingénieur [3] MÉLÉARD (S.). – Probabilités. [AF 166] (2002). [5] TASSI (P.). – Méthodes statistiques. Economica
Traité Sciences fondamentales (1989).

Autres ouvrages de référence


[1] CHÈZE (N.). – Statistique descriptive. Trai-
tement des données [AF 167] (2002). [4] LECOUTRE (J.-P.) et TASSI (P.). – Statistique
[2] CHÈZE (N.). – Statistique inférentielle I : Esti- non paramétrique et robustesse. Economica,
mation [AF 168] [Form. AF 169] (2003). Paris (1987).

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Sciences fondamentales AF 170 − 15

Dossier délivré pour


DOCUMENTATION
19/09/2008