Académique Documents
Professionnel Documents
Culture Documents
Le test le plus couramment utilisé, pour tester l’association entre deux variables
nominales, est celui du khi-deux (X2). Il a pour objet de tester l’indépendance des
variables dans un tableau croisé en comparant la distribution observée (𝑉𝑉𝑜𝑜 ) sur
l’échantillon à une distribution théorique (𝑉𝑉𝑡𝑡 ) qui correspond à l’hypothèse que l’on
veut tester.
1. Test de Khi-deux
(𝑉𝑉𝑜𝑜 −𝑉𝑉𝑡𝑡 )2
X2 = ∑𝑛𝑛𝑖𝑖=1
𝑉𝑉𝑡𝑡
La loi du khi-deux (Karl Pearson 1900) suit une distribution asymétrique dont la
forme dépend du nombre de degré de liberté. Le nombre de degré de liberté varie en
fonction du nombre de modalités des variables comparées et se calcule de la manière
suivante : ddl = n – 1 × p – 1 (Avec n : modalités de la 1ère variable et p : modalités de la
2ème variable). On rejettera l’hypothèse nulle (pas d’association entre les variables) si le
X2 calculé est supérieur à la valeur de référence du X2 se trouvant dans la table de khi-
deux pour n degrés de liberté (lignes) et pour un α (niveau de précision donné en
colonnes).
Conditions d’application de X2 :
- Aucune case du tableau de contingence n’a une espérance E(Aij) < 1
- Moins de 20% de cases ont une espérance E(Aij) < 5
Pour les tableaux deux lignes, deux colonnes, il est préférable d’utiliser le test de
Fisher. Par ailleurs lorsque les cellules sont inférieures à 5, il faut procéder à des
regroupements. Ajoutons qu’il est préférable de travailler directement sur les effectifs
plutôt que sur des fréquences ou des pourcentages.
𝑛𝑛1 (𝑛𝑛1 + 1)
𝑈𝑈1 = 𝑛𝑛1 𝑛𝑛2 + − 𝑅𝑅1
2
𝑛𝑛2 (𝑛𝑛2 + 1)
𝑈𝑈2 = 𝑛𝑛1 𝑛𝑛2 + − 𝑅𝑅2
2
𝑈𝑈 = 𝑚𝑚𝑚𝑚𝑚𝑚{𝑈𝑈1 ; 𝑈𝑈2}
𝐾𝐾
12 𝑆𝑆𝑗𝑗2
𝐾𝐾𝐾𝐾 = �� � − 3(𝑛𝑛 + 1)
𝑛𝑛(𝑛𝑛 + 1) 𝑛𝑛𝑗𝑗
𝑗𝑗=1
Avec :
S correspond à la somme des rangs
n est le nombre d’observations global
nj est le nombre d’observations par sous échantillon (j = 1 – K)
K est le nombre de modalités.