Vous êtes sur la page 1sur 8

MODULE 6 : Deux variables sont-elles liées ?

Nous avons vu précédemment comment composer un tableau de contingence, permettant de visualiser l’interaction entre deux variables. A
priori, vous savez même comment lire ce genre de tableaux, non pas uniquement en comparant ligne par ligne ou colonne par colonne, mais
bien en vérifiant si le comportement de chaque cellule est conforme à celui de l’ensemble de l’échantillon. Mais avant de lire un tableau, il est
intéressant de savoir si, en toute rigueur, la distribution de chacune des variables qui y est représentée est due au hasard ou non. Si c’est le cas,
il n’y aura pas d’interaction entre les variables. Plus exactement, il y a des risques qu’une interprétation ne soit pas possible avec une assez
grande fiabilité. Il existe différents tests permettant de s’assurer de cette fiabilité et de l’interaction entre deux variables, sans même avoir à
regarder le tableau dans son ensemble. Le plus célèbre de ces tests porte le nom de « Khi2 ». Il permet de tester l’interaction de deux ou trois
variables dans un tableau et donc de savoir s’il vaut la peine d’être étudié ou bien s’il faut essayer de le recomposer différemment. Cela est très
pratique lorsqu’il y a beaucoup de tableaux à analyser dans une enquête. Imaginez en effet que vous posiez 50 questions dans une enquête.
Ces 50 questions débouchent sur un nombre supérieur de variables. Disons 70. Si vous croisez ces 70 variables entre elles (ce qui,
reconnaissons-le, n’aurait pas toujours du sens), vous obtiendriez 70x70=4900 tableaux ! Supprimons tous ceux qui n’auraient aucun sens.
Vous auriez tout de même plusieurs centaines de tableaux dignes d’intérêt. Pour commencer à les trier et à organiser votre travail le test du
khi2 est précieux. On l’assorti généralement d’un autre test, le test de Cramer, qui permet quant à lui de connaître l’intensité d’une relation
entre les variables d’un tableau croisé.
Pour faire simple, disons que le test du Khi2 permet de savoir si des variables agissent les unes sur les autres, et que le test de Cramer permet
de mesurer l’intensité de ces effets.
Regardons cela dans le détail.

1. Le khi2 et la mesure des écarts à l’indépendance.


Pour comprendre le test du khi2, il faut imaginer ce qui se passerait dans un tableau de contingence… s’il ne s’y passait rien. Si les deux
variables qui y sont exposées étaient totalement indépendantes l’une de l’autre. Valider le test du khi2 revient à « écarter l’hypothèse de
l’indépendance entre les variables ».
Examinons cela avec un exemple.

1
TABLEAU 1 – tris croisé sentiment de bonheur/niveau de revenus en effectifs – situation observée


Reprenons notre tableau croisé exposant la relation entre niveau de revenus et sentiment de bonheur. Ce premier tableau correspond à la
situation observée dans notre enquête.
A quoi ressemblerait ce tableau si rien ne se passait. Pour le savoir, il faut composer un tableau dit « de situation à l’indépendance ». La plupart
des logiciels de traitements statistiques vous proposent de le faire, mais il est assez aisé de le faire soi-même. Faisons cela, car cela permet de
bien comprendre la logique du calcul du khi2.
Si la variable « niveau de revenus en 3 » n’agissait pas sur la variable « niveau de bonheur », on devrait observer une distribution de cette
dernière analogue dans chacune des lignes de revenus.

2
Prenons la ligne « Jusqu’à 1900 euros ». Nous avons 271 individus à répartir dans les 4 colonnes de la variable « sentiments de bonheur ».
Comme nous avons 188 individus au total qui se déclarent « très heureux », pour connaître la répartition probable d’en avoir parmi ceux qui
gagnent 1900 euros, il faut appliquer la formule mathématique suivante : 188 * 271 / 826. Cela nous donne un effectif de 62. En toute logiques,
nous devrions avoir 62 individus se déclarant très heureux parmi ceux qui gagnent jusqu’à 1900 euros, au lieu de 44 individus observés.
Appliquons cette logique sur l’ensemble du tableau.

3
TABLEAU 2 – tris croisé sentiment de bonheur/niveau de revenus en effectifs – situation à l’indépendance


On observe des bien des écarts en situation observée et situation à l’indépendance au sein de chacune des cellules. Le test du khi2 est une
mesure de l’ensemble de ces écarts. Afin de mesurer aussi bien les écarts positifs que négatifs, on élève tous ces écarts au carré.



4
TABLEAU 3 – tris croisé sentiment de bonheur/niveau de revenus en effectifs – écarts à l’indépendance élevés au carré

5
Enfin, on rapporte cette différence à l’effectif théorique (celui qui correspond l’indépendance) de chaque cellule en le divisant. Le tableau
obtenu s’appelle « tableau des contributions absolues »

TABLEAU 4 – tris croisé sentiment de bonheur/niveau de revenus en effectifs – contributions absolues

6

Le khi2 correspond à l’addition de tous ces écarts à l’indépendance élevés au carré et divisés par l’effectif théorique. Autrement dit, le khi2 est
la somme de toutes les cellules de notre tableau. Mettez sur pause, sortez votre calculatrice et additionnez : vous obtiendrez le chiffre de 69.
Ce chiffre correspond au « khi2 calculé », soit à la somme des contributions absolues.

7
Je vous indique la formule du khi2 pour plus de clarté, même si tous les logiciels de traitements statistiques vous permettent de le produire en
un quart de secondes.

Vous aimerez peut-être aussi