Académique Documents
Professionnel Documents
Culture Documents
Q. Leclère – GM4IP-MSP
I) Principe des tests d’hypothèses:
Un test d’hypothèse est une procédure standardisée permettant de valider ou rejeter objectivement ou
automatiquement une affirmation faite sur une ou plusieurs populations statistiques.
Les tests d’hypothèse sont à la base des processus décisionnels utilisés notamment en production, et de manière
générale en Maitrise Statistique des Procédés.
L’hypothèse nulle H0 sera la réponse affirmative à cette question. C’est l’hypothèse qu’on souhaite confirmer ou
infirmer avec la mise en place du test.
H0 : « = 0 » pour le test de conformité
H0 : « 1 = 2 » pour le test de comparaison.
L’hypothèse alternative H1 pourra prendre plusieurs formes suivant le contexte.
H1 : « 0 » , « > 0 » ou « < 0 » pour le test de conformité
H1 : « 1 2 » ou « 1 > 2 » pour le test de comparaison.
Risques associés :
Le risque est la probabilité de rejeter H0 alors qu’elle est vraie : = p(V IC |H0)
On parle de risque de 1ere espèce, ou de risque « fournisseur » (c’est le risque pour un fournisseur de
se voir refuser une livraison alors qu’elle est conforme au cahier des charges)
Le risque est la probabilité d’accepter H0 alors qu’H1 est vraie : = p(V IC |H1)
On parle de risque de 2nde espèce, ou de risque « client » (c’est le risque pour un client d’accepter une livraison
alors qu’elle n’est pas conforme au cahier des charges)
Si le risque est connu car imposé, est généralement inconnu car dépendant des paramètres réels de population
Exemple : Contrôle de conformité de l’espérance d’une population gaussienne au standard 0 avec connu.
On a donc H0: « =0 ».
Pour l’exemple, on formule l’hypothèse alternative H1: « >0 ». C’est un choix approprié si l’on souhaite
détecter plus spécifiquement un dépassement de seuil 0.
m − μ0
Le test sera réalisé sur la variable d’observation V : V= = N(0 ; 1)
σ/ n
On cherchera une valeur maximale admissible pour V, notée Vmax, telle que p(V> Vmax)=
On aura donc ici Vmax = 𝐹𝑁−10;1 (1 − 𝛼)
m−μ0
Etape 2 (prélèvement) : on prélève l’échantillon de taille n, on évalue Vobs= σ/ pour cet échantillon
n
Les test d’hypothèses seront généralement ramenés à la comparaison de la variable d’observation à une valeur
max.
On définira la valeur-p, pour un échantillonnage donné, comme la probabilité que la variable observée ait été
supérieure à sa valeur toujours sous l’hypothèse H0.
fV(x) sachant H0
valeurp = p(V>Vobs|H0)
0 Vmax x
Vobs
Dans le but de simplifier le plus possible le test, on fait en sorte que quelle que soit H1, le RC soit comparé à une
valeur maximale admissible notée RCmax. Pour cela, le RC prendra les formes suivantes :
μ0 − m le RCmax est dépassé si m est
H1=« <0 » : RC = 𝑅𝐶𝑚𝑎𝑥 = 𝐹𝐿−1 1 − 𝛼
e/ n significativement inférieure à 𝜇0
a) Pour des populations gaussiennes ayant pour variance connues 𝝈𝟐𝟏 et 𝝈𝟐𝟐 , on a
où n1, n2 sont les tailles d’échantillons
m1 = N(μ1; σ12 /𝑛1 ) m2 = N(μ2; σ22 /𝑛2 )
prélevés dans les populations 1 et 2
σ12 σ22 m1 − m2
En admettant H0 , on a m1 − m2 = N 0; + , soit = N 0 ;1
𝑛1 𝑛2 2 2
σ1 /𝑛1 + σ2 /𝑛2
b) Pour des populations gaussiennes de variances inconnues, mais en admettant σ12 = σ22
m2 − m1
Sous l’hypothèse H0, on admettra le résultat = Tn1+n2−2
sp . 1/n1 + 1/n2
… où sp² est la variance pondérée, c’est la variance obtenue en moyennant sc1² et sc2² :
(𝑛1 − 1)𝑠𝑐12 + (𝑛2 − 1)𝑠𝑐2²
𝑠𝑝2 =
𝑛1 + 𝑛2 − 2
c) Pour des populations de lois inconnues avec échantillons de grande taille, on aura, en application du TCL :
m1 − m2
≈ N 0 ;1
s𝑐12 /𝑛1 + sc22 /𝑛2
Dans les trois cas a,b et c, on pourra écrire, de manière générique :
Pour les différentes options de l’hypothèse alternative, on définira le Rapport Critique suivant :
m1 − m2
H1=« 21 » : RC = Le RCmax est dépassé si les moyennes
𝑅𝐶𝑚𝑎𝑥 = 𝐹𝐿−1 1 − 𝛼ൗ2
𝑒12 /𝑛1 + e22 /𝑛2 sont significativement différentes
Pour définir un rapport critique, il faut remplacer π par une estimation ponctuelle qui peut être faite en
considérant P la proportion dans les deux échantillons réunis : P=(n1P1+n2P2)/(n1+n2)
Selon l’hypothèse H1, on aura finalement
P1 − P2 −1
RCmax = FN 1 − αൗ2
H1=« 2 1 » : RC =
(n1 + n2)
P 1−P n1n2
P2 − P1 −1
RCmax = FN 1−α
H1=« 2> 1 » : RC =
(n1 + n2)
P 1−P n1n2
On a vu au chapitre 3, en admettant H0, pour un échantillon de taille n prélevé dans une population gaussienne, que
ns²
= χ2n−1
σ 0²
ns²
On va donc s’intéresser à la variable d’observation χ2obs = σ0²
. Sous l’hypothèse H0, les IC de χ2obs seront
définis par [kmin kmax] comme suit :
kmin kmax
2
𝑠𝑐1 De cette manière, seule la borne supérieure doit être
H1: « 1² 2² », 𝐹𝑐 = avec toujours
2
𝑠𝑐2 sc1²>sc2² testée : 𝐹𝑐𝑚𝑎𝑥 = 𝐹F−1
𝑛 −1,𝑛 −1
(1 − 𝛼/2)
1 2
Pour l’hypothèse alternative H1: « 2² > 1² », on ne testera que la borne supérieure
2
𝑠𝑐2
H1 : « 2² > 1² » 𝐹𝑐 = avec les populations 1 et 2
2
𝑠𝑐1 définies par le sens de H1 𝐹𝑐𝑚𝑎𝑥 = 𝐹F−1
𝑛 −1,𝑛 −1
(1 − 𝛼)
2 1
NB : la loi de Fisher étant à deux paramètres, on ne peut fournir des tables comme pour Student ou khi2.
Les tables de la loi de Fisher permettent seulement d’obtenir pour une valeur 𝛼 donnée les valeurs Fcmax en
fonction de paramètres n1-1 et n2-1 en entêtes de lignes et colonnes
V) Comparaison de plusieurs échantillons décrits par une variable qualitative
• Une variable qualitative prend des valeurs discrètes (par exemple, admis/redouble/exclu, ou bien choix du produit A
/ choix du produit B). Ce test est utile quand on segmente une population en plusieurs groupes (par exemple, sexe de
l'acheteur) sur lesquels on mesure des variables qualitatives. Si on divise les effectifs par l'effectif total, on obtient le
tableau des fréquences.
fij=Nij/N
Fréquences
niveau 1 niveau 2 … niveau m marginales
groupe 1 f11 f12 f1m f1. des groupes
Fréquences groupe 2 f21 f22 … … f2. 𝑓𝑗. = σ𝑖 𝑓𝑖𝑗
marginales des … … … … … …
niveaux de la VA groupe n fn1 fn2 … fnm fm.
𝑓. 𝑖 = σ𝑗 𝑓𝑖𝑗 f.1 f.2 … f.m 1
tableau des fréquences
• On définit d² la distance entre fréquences observées fij et fréquence prédites à partir des fréquences marginales fi.f.j
𝑛 𝑚
(𝑓𝑖𝑗 − 𝑓𝑖. 𝑓. 𝑗)²
𝑑2 = 𝑁
𝑓𝑖. 𝑓. 𝑗
𝑖=1 𝑗=1
On admet que d² suit une loi de Khi2 à (n-1)(m-1) ddl sous l’hypothèse H0 que les groupes ne sont pas différenciés par
la VA.