Vous êtes sur la page 1sur 17

Bio 2041

Les tests khi-carré

Pierre Legendre & Daniel Borcard, Université de Montréal


Référence: Scherrer (2007), sections 15.1.1, 16.2.1, 17.3.1

I - Introduction

Objet de l’étude
• Un tableau de fréquences (tableau de contingence) comportant de 2 à k
lignes et de 2 à g colonnes. Notation: Scherrer tableau 15.1.

Plusieurs applications
• Comparer plusieurs groupes indépendants décrits par une variable
qualitative: équivalent qualitatif de l’ANOVA.
• Mesurer la liaison entre deux variables qualitatives: équivalent
qualitatif de la corrélation.
• Estimer la conformité entre une distribution observée et une
distribution théorique.

Points à surveiller
• Calcul des degrés de liberté dans chaque cas.
• Conditions d’application. Que faire en dehors de ces limites?
Les tests khi-carré 2

II - Comparer plusieurs groupes indépendants/var. qualitative

Référence: Scherrer (2007), section 15.1.1

1 – La statistique-test khi-carré de Pearson


Considérons d’abord un cas simple, celui de trois groupes indépendants.
Pour chaque objet (élément) observé, on note s’il possède, ou non, une
certaine caractéristique C (possède: +C; ne possède pas: –C).

fréq. abs. Groupe 1 Groupe 2 Groupe 3


+C a11 a12 a13
–C a21 a22 a23
Somme n1 n2 n3

Relations élémentaires: ni = a1i + a2i; a1i = ni – a2i; a2i = ni – a1i


Les a1i et les a2i sont les fréquences absolues observées Aij.
Transformons les fréquences en proportions:
pi = a1i/ni; a1i = nipi qi = a2i/ni = 1 – pi; a2i = niqi

fréq. rel. Groupe 1 Groupe 2 Groupe 3


+C p1 p2 p3
–C q1 q2 q3
Somme 1 1 1

Question: Considérant les proportions {pi, qi}, est-il possible que les
trois groupes (i = 1 … 3) proviennent de la même population statistique?
— Même question qu’en ANOVA.
Les tests khi-carré 3

Principe du test statistique


• H0: les groupes proviennent de la même population statistique.
• Calculer les espérances, i.e., les valeurs attendues E(Aij) sous H0.
• Mesurer les écarts entre fréquences observées (Aij) et espérancesE(Aij).
• Tester, à l’aide d’une statistique-test khi-carré, si ces écarts sont assez
petits pour être imputables aux variations (“erreurs”) d’échantillonnage.

Élaboration de la statistique-test khi-carré de Pearson: Pour une variable


C à deux classes (+C, –C), le raisonnement est basé sur la loi binomiale.
Pour une variable qualitative à k classes, le même raisonnement est fondé
cette fois sur la loi multinomiale. Dans les deux cas, on obtient la
statistique-test khi-carré (X2) de Pearson:
2 2
2
k g [ A ij – E ( A ij ) ] k g ( O ij – E ij )
X = ∑ ∑ ---------------------------------------- =
E ( A ij ) ∑ ∑ -----------------------------
E ij
Eq. 15.2
i=1 j=1 i=1 j=1

où k est le nombre de lignes et g est le nombre de colonnes du tableau de


contingence initial. La notation Oij et Eij est utilisée dans de nombreux
autres ouvrages. Scherrer (p. 587) montre que cette statistique X2 est une
somme de variables normales centrées réduites (z) au carré.
Il y a k × g termes dans cette somme. Attention: ces termes ne sont pas
tous indépendants les uns des autres.
[Il existe une autre formule pour la statistique-test khi-carré. Elle porte le
nom de statistique G dans Sokal & Rohlf, 1981 ainsi que dans Scherrer,
section 15.1.3; statistique G 2 dans les logiciels BMDP et StatView 4; et
statistique khi-carré de Wilks dans Legendre & Legendre, 1984 et 1998.]
Les tests khi-carré 4

2 – Comparaison de g groupes indépendants


1. Données: Considérons g groupes (colonnes). Pour chaque objet
(élément), on a noté la valeur d’une variable qualitative comportant k
états (catégories de classement). Le tableau de contingence suivant
contient les fréquences absolues observées aij :

Groupes
États de
classement 1 2 (j) g Σ
1 a11 a12 … a1g m1
2 a21 a22 … a2g m2
3 a31 a32 … a3g m3
(i) : : aij : (mi)
k ak1 ak2 … akg mk
Σ n1 n2 (nj) ng n

Évidemment, n = Σ aij = Σ nj = Σ mi .
2. Hypothèses:
• H0: ρ = 0, où ρ désigne le paramètre X2 de la population. Autrement dit,
les g groupes constituent un groupe homogène. Ils peuvent provenir de la
même population statistique.
• H1: ρ > 0. Les g groupes ne constituent pas un ensemble homogène.

2
2
k g [ a ij – E ( A ij ) ]
3. Statistique-test: X = ∑ ∑ ---------------------------------------
E ( A ij )
(éq. 15.2)
i=1 j=1
Les tests khi-carré 5

4. Calcul de l’espérance E(Aij) de chaque case:


La valeur attendue dans chaque case, sous l’hypothèse nulle, se calcule
par nj × mi/n. Voici pourquoi.
• Si H0 est vraie, les g groupes proviennent de la même population
statistique. Les valeurs aij de chaque colonne sont alors des fluctuations
aléatoires autour de valeurs communes à toutes les colonnes, décrivant
l’importance des k états du critère de classement.
• La meilleure estimation disponible de l’importance des k états du
critère de classement est donnée par les sommes des différentes lignes,
mi , ou encore par leurs proportions pi = mi/n.
• Si les différentes colonnes avaient toutes la même fréquence dans
l’étude (i.e., si tous les nj étaient égaux), il suffirait de multiplier les mi
par 1/g pour obtenir l’espérance de chaque case.
• Puisque les colonnes n’ont pas toutes la même importance nj , on doit
plutôt multiplier mi par le rapport nj/n qui mesure l’importance de la
colonne j, pour obtenir l’espérance E(Aij) de chaque case.
• Les E(Aij) sont les meilleures estimations disponibles des valeurs que
l’on devrait rencontrer dans chaque case si H0 est vraie. ∑ E ( A ij ) = n .

5. Comportement de la statistique-test:
• S’il n’y a aucune différence entre les valeurs observées aij et les
espérances E(Aij), la statistique-test X2 est égale à zéro.
• Si H0 et vraie, les valeurs prises par la statistique X2 obéissent à une loi
de χ2. En effet, la statistique X2 est une somme de termes obéissant
chacun à une loi de z au carré (Scherrer p. 587, éq. 15.1). Voir le point 7
(page suivante) pour le calcul des degrés de liberté de cette loi de χ2.
Les tests khi-carré 6

• Si H1 est vraie, la valeur de X2 sera d’autant plus grande que les aij
seront plus différents des espérances E(Aij). Plus cette différence
augmente, plus le numérateur de la statistique-test augmente, que la
différence soit positive ou négative; le dénominateur, lui, demeure
inchangé. On fera donc un test unilatéral.

6. Règle de décision: Si X2 ≥ χ 2α ( ν ) , on rejette H0 avec un risque


d’erreur de type I égal à α (Scherrer: tableau 15.2 p. 591).

7. Calcul des degrés de liberté:

• Le nombre de degrés de liberté associés à une statistique est le nombre


de ses composantes indépendantes, i.e. le nombre des composantes de
base utilisées dans le calcul de la statistique moins le nombre de relations
(paramètres) qui lient celles-ci.

• Les composantes de base qui entrent dans le calcul de la statistique-test


X2 sont les rapports [aij – E(Aij)]2/E(Aij). Il y en a (k × g).
• Quels sont les paramètres qu’il a fallu estimer à partir des données
avant de pouvoir calculer les espérances E(Aij)?

Exemple:
Les tests khi-carré 7

Groupes
États de
classement 1 2 3 4 Σ
1 3 4 5 6 18
2 7 8 9 10 34
3 11 12 13 14 50
Σ 21 24 27 30 102
Pour calculer les espérances E(Aij) = mi × nj /n, il faut connaître les
sommes de lignes mi, les sommes de colonnes nj et la somme globale n.
Supposons que nous avons commencé par calculer les sommes des
colonnes (valeurs soulignées). Cela fait 4 paramètres. À partir de ces
valeurs, nous pouvons calculer la somme totale du tableau, n, sans
recourir de nouveau aux données.
Calculons ensuite la somme de la première et de la seconde ligne
(valeurs soulignées). Puisque nous connaissons n, nous pouvons calculer
la troisième somme: 102 – 18 – 34 = 50. Il n’a donc fallu calculer que
deux paramètres à partir des données pour obtenir les sommes de lignes.
Total des paramètres qu’il a fallu estimer à partir des données avant de
pouvoir calculer les espérances E(Aij): 4 + 2 = 6.
Dans tous les cas de tableaux de contingence à deux dimensions, il
faudra avoir estimé un nombre de paramètres égal à (k + g – 1) avant de
pouvoir calculer les espérances E(Aij).
• Le nombre de degrés de liberté associé à la statistique X2 est donc
d.l. = (k × g) – (k + g – 1) = (k – 1) (g – 1)
Les tests khi-carré 8

3 – Exemple
• Reprenons une partie des données de l’exemple 15.2 de Scherrer. Dans
le tableau ci-dessous, les valeurs observées aij sont comparées aux
espérances E(Aij) de chaque case. De plus, chaque case contient une
2
[ a ij – E ( A ij ) ]
statistique de contribution au X2: Stat = ---------------------------------------
E ( A ij )

La somme de ces valeurs “Stat” donne la statistique X2 globale.

Bassins hydrographiques

Pollution Rhin-Meuse Adour-Garonne


Rhône-
Médit.-Corse
Σ
Présence de (a11 = 8) > (a12 = 6) > (a13 = 11) < 25
salmonelles (E(A11) = 5,435) (E(A12) = 4,348) (E(A13) = 15,217) 25
Stat = 1,211 Stat = 0,628 Stat = 1,169
Absence de (a21 = 2) < (a22 = 2) < (a23 = 17) > 21
salmonelles (E(A21) = 4,565) (E(A22) = 3,652) (E(A23) = 12,783) 21
Stat = 1,441 Stat = 0,747 Stat = 1,391
Σ 10 8 28 46

• La statistique X2 = 6,588 est supérieure à la valeur critique


χ 20,05 ( ν = 2 ) = 5,99. On rejette donc H0 au seuil α = 0,05. La probabilité
d’obtenir de tels écarts sous H0 est en fait de 0,0371 (calcul R:
pchisq(6.588,df=2,lower.tail=F)).

• On en conclut que les trois régions hydrographiques diffèrent quant à la


proportion des prélèvements pollués par les salmonelles.
Les tests khi-carré 9

Langage R: fonction chisq.test. On fournit soit deux vecteurs, soit un


tableau de contingence. On peut demander un test par permutation.

III - Liaison entre deux variables qualitatives

Référence: Scherrer (2007), section 17.3.1

1 – L’équivalent qualitatif de la corrélation


• Dans l’exemple ci-dessus, on pourrait considérer que les g groupes
forment en fait les états d’un second critère de classement, donc une
variable qualitative “Région hydrographique”. Le tableau de contingence
proviendrait alors d’un tableau de données du type suivant, où chaque
élément (prélèvement d’eau) est qualifié par deux variables qualitatives.

Région
Prélèvement Salmonelle hydrographique
1 oui Rhin-Meuse
2 non Rhin-Meuse
3 non Adour-Garonne
4 oui Adour-Garonne
5 oui Adour-Garonne
6 non Rhône-Méd.-Corse
7 oui Rhône-Méd.-Corse
: : :
46 oui Rhône-Méd.-Corse
On a vu à la section 3.4.2.1 (Scherrer p. 153) comment former un tableau
de contingence à partir de telles données.
Les tests khi-carré 10

• Dans ce nouveau contexte, les hypothèse du test que nous avons réalisé
ci-dessus pourrait être exprimées comme suit:
H0: φ = 0. Les deux variables qualitatives sont indépendantes l’une de
l’autre. φ (phi) désigne le paramètre X2 de la population, mais cette fois il
prend le sens d’une corrélation généralisée aux variables qualitatives.
H1: φ > 0. Les deux variables qualitatives sont liées.
Si elle est présente, la liaison s’exprimera par des valeurs observées aij
nettement plus grandes ou plus petites que les espérances
correspondantes E(Aij), ce qui augmentera la valeur de la statistique X2.
• Conceptuellement, le test X2 devient l’équivalent du r de Pearson ou du
τ de Kendall, à cette différence qu’il est calculé ici pour des variables
qualitatives. Les règles de décision sont les mêmes que pour le test χ2
présenté plus haut.
• Dans les cas où les deux variables à comparer sont binaires, on parle
d’un coefficient de corrélation de point (Scherrer section 17.3.1). La
formule à employer pour le calcul de la statistique X2 est alors différente.
Voir ci-dessous, section 5 (Tableaux 2 × 2), pour le calcul.
Caractéristiques du test et règles de décision: Scherrer tableau 17.20, p.
675-676.
⇒ Comparaison d’une variable qualitative à une variable quantitative ou
semi-quantitative: nous disposons de deux instruments pour tester une
hypothèse de type “corrélation” entre ces variables.
• On peut diviser la variable (semi-)quantitative en classes et construire
un tableau de contingence croisant les deux variables. On utilise alors un
test khi-carré pour tester H0 .
Les tests khi-carré 11

• Une autre solution consiste à réaliser une ANOVA, avec la variable


quantitative comme variable dépendante et la variable qualitative comme
critère classification. On utilise ici un test F pour tester H0 . Pour une
variable semi-quantitative (plutôt que quantitative), l’équivalent non-
paramétrique est le test de Kruskal-Wallis.

2 – Recherche de la correspondance
• Si on a rejeté H0, quelles sont les cases du tableau de contingence
responsables de cette relation?
• Dans le tableau de contingence de l’exemple, les cases dont la valeur
observée aij est la plus différente de l’espérance E(Aij) sont celles qui
contribuent le plus à la statistique X2. D’ailleurs, la contribution (“Stat”)
de chaque case à la statistique globale a été calculée (fournie par
StatView 4); elle est inscrite dans le tableau.
• Il est légitime de rechercher ces cases les plus importantes seulement si,
comme dans l’exemple présent, la statistique X2 globale est significative.
• Dans cet exemple, on voit que les principales contributions à la
statistique globale sont dues à
- dans la région Rhin-Meuse: un nombre de prélèvements plus faible que
l’espérance, montrant une absence de salmonelles;
- dans la région Rhône-Méditerranée-Corse: un nombre de prélèvements
plus élevé que l’espérance, montrant une absence de salmonelles.
On en conclut que la région Rhône-Méditerranée-Corse est moins
polluée que l’ensemble des bassins étudiés dans ce tableau, alors que la
région Rhin-Meuse l’est davantage.
Les tests khi-carré 12

3 – Autre exemple
• Interaction entre deux crevettes observés en laboratoire (Dingle, 1972).

2ème sortie motrice unitaire (SMU)


1ère SMU Attaque Fuite Menace Σ
(a11 = 10) < (a12 = 24) > (a13 = 7) < 41
Attaque (E(A11) = 18,673) (E(A12) = 12,990) (E(A13) = 9,337) 41
Stat = 4,029 Stat = 9,332 Stat = 0,585
(a21 = 28) > (a22 = 3) < (a23 = 12) > 43
Fuite (E(A21) = 19,584 (E(A22) = 13,624) (E(A23) = 9,792) 43
Stat = 3,617 Stat = 8,284 Stat = 0,498
(a31 = 8) > (a32 = 5) < (a33 = 4) > 17
Menace (E(A31) = 7,743) (E(A32) = 5,386) (E(A33) = 3,871) 17
Stat = 0,009 Stat = 0,028 Stat = 0,004
Σ 46 32 23 101

• La statistique X2 = 26,384 est supérieure à la valeur critique


2
χ 0,05 = 9,49. On rejette donc H0 au seuil α = 0,05. La probabilité
( ν = 4)
d’obtenir de tels écarts sous H0 est en fait inférieure à 0,0001.
• Les cases qui contribuent le plus fortement à la statistique X2 globale
permettent de faire l’interprétation suivante du tableau:
- a12 >> E(A12): le plus souvent, une attaque provoque la fuite de
l’adversaire. Il est plutôt improbable qu’une attaque provoque une
attaque: a11 < E(A11).
- a21 > E(A21): la fuite provoque souvent l’attaque de l’adversaire. Il est
très improbable qu’une fuite provoque une fuite: a22 << E(A22).
Les tests khi-carré 13

4 – Conditions d’application du test khi-carré


Référence: Scherrer (2007), section 15.1.1.4
• Comparer deux variables qualitatives, ou encore une var. qualitative
avec des var. quantitatives ou semi-quantitatives divisées en classes.
• Indépendance des observations.
• Il faut disposer des fréquences observées elles-mêmes et non des
fréquences relatives. Cependant, si les données viennent sous la forme de
fréquences relatives ou de pourcentages et si on connaît également les
totaux marginaux, on peut reconstruire le tableau de contingence
(tableau de fréquences absolues) et réaliser le test X2.
• Le test est fondé sur la distribution binomiale ou multinomiale. Il n’est
valide que si les espérances E(Aij) de chaque case ne sont pas trop
petites. Cochran (1954) et Siegel (1956) proposent les règles suivantes:
lorsque n est faible et d.l. > 1, on peut utiliser ce test si
(a) aucune case du tableau de contingence n’a une espérance E(Aij) < 1;
(b) moins de 20% des cases du tableau ont une espérance E(Aij) < 5.
Selon Roscoe & Byars (1971) et Zar (1999: 505), il suffit que n/(k×g) ≥ 6
pour un test au niveau α = 5%, ou n/(kx g) ≥ 10 au niveau α = 1%, ce qui
est moins restrictif que la règle (b) de Cochran.
Si une des règles ci-dessus est violée, il faut regrouper des lignes ou des
colonnes du tableau de façon à augmenter les espérances, pour autant
qu’il y ait un fondement logique pour effectuer ces regroupements.
• Lorsque n est faible: (1) corriger la statistique G (ou X2 de Wilks) pour
obtenir une meilleure approximation de la distribution de χ2 . C’est la
correction de Williams (1976) décrite par Scherrer (2007: 597) et Sokal
& Rohlf (1981: 737, 745). (2) Ou encore, réaliser le test par permutation.
Les tests khi-carré 14

5 – Tableaux 2 × 2
La formule générale du X2 de Pearson conduit à une formule simplifiée
de calcul pour le cas des tableaux 2 × 2. Représentons par a, b, c et d les
fréquences absolues des quatre cases d’un tel tableau:

Σ
Variable 2
Variable 1 1 2
1 a b a+b
2 c d c+d
Σ a+c b+d n = a+b+c+d
La formule

 n 2
n  ad – bc – --- 
2 2
X = ----------------------------------------------------------------------------- , ν = (2–1) (2–1) = 1
( a + b) ( c + d ) ( a + c) ( b + d )
peut être employée
• si n > 40
• ou si n ≥ 24 (n/4 ≥ 6) pour un test au niveau α = 5%, ou n ≥ 40
(n/4 ≥ 10) pour un test au niveau α = 1% (Roscoe & Byars 1971).
La soustraction de la valeur n/2 est la “correction de continuité de Yates”.
Si n/4 est inférieur à la règle de Roscoe & Byars (1971):
• réaliser le test khi-carré par permutation;
• ou encore, réaliser le test par la méthode exacte de Fisher (1934) pour
tableaux 2 × 2 (Scherrer, section 15.1.2; Sokal & Rohlf, 1981, p. 740).
C’est le premier test par permutation à avoir été décrit dans la littérature
statistique.
Les tests khi-carré 15

IV - Conformité entre distributions observée et théorique


Référence: Scherrer (2007), sections 16.1 et 16.2.1

Objectif: Déterminer dans quelle mesure les données observées sont


conformes à une théorie ou à une loi prédisant la forme de la distribution
de fréquence.
Exemple: Les résultats de croisements génétiques sont-ils mendéliens?
Exemple: Les données observées obéissent-elles à une loi binomiale? à
une loi de Poisson? à une loi normale?
• Différence avec les tests X2 des sections précédentes: il n’y a ici qu’une
seule variable observée. On compare sa distribution à une distribution
théorique connue à travers l’hypothèse biologique.

1. Fréquences théoriques: Les fréquences théoriques, auxquelles on


compare les fréquences observées, sont calculées comme suit:
Distribution de prob. théorique × effectif n = fréquences théoriques E(Ai)

Exemple – Considérons un effectif de n = 200 drosophiles. Pour tester un


rapport de ségrégation 1-2-1 de deux allèles, l’un dominant et l’autre
récessif, la distribution attendue des phénotypes est 3/4 pour le
phénotype dominant et 1/4 pour le phénotype récessif. On calcule les
fréquences théoriques comme suit:

Distr. attendue Fréquences Fréquences


des phénotypes Effectif total n théoriques observées (ex.)
3/4 200 mouches E(A1) = 150 a1 = 162
1/4 200 mouches E(A1) = 50 a2 = 38
∑ = n = 200
Les tests khi-carré 16

2. Statistique pour le test de conformité:


2
2
k [ ai – E ( Ai) ]
X = ∑ ------------------------------------
E ( Ai)
i=1

3. Calcul des degrés de liberté:

• Le principe est toujours le même: le nombre de degrés de liberté est le


nombre de composantes indépendantes, i.e. le nombre (k) des
composantes de base utilisées dans le calcul de la statistique moins le
nombre (c) de relations (paramètres) qui lient celles-ci: ν = k– c.

• Les composantes de base qui entrent dans le calcul de la statistique-test


X2 sont les rapports [aij – E(Aij)]2/E(Aij ). Leur nombre est égal au
nombre (k) de lignes du tableau.

• Le nombre de paramètres (c) qu’il a fallu estimer pour ajuster la


distribution théorique aux données varie selon la loi de distribution. Les
cas les plus courants sont les suivants:
- Pour la loi binomiale B (n, p): dans le cas le plus général, il faut estimer
deux paramètres à partir des données pour pouvoir ajuster la distribution
théorique à la distribution observée: (1) l’effectif n et (2) la probabilité p
d’un des deux événements. Donc c = 2 et, par conséquent, ν = k– 2.
- Loi binomiale: si la probabilité p est fournie par l’hypothèse
biologique, il n’est pas nécessaire de l’estimer à partir des données et
ν = k – 1. Exemple: rapport des sexes 1:1; ex. génétique page précédente.
- Pour la loi de Poisson P (µ): c = 2 car il faut estimer (1) l’effectif n et
(2) la moyenne µ à partir des données, sauf si celle-ci est fournie par
l’hypothèse biologique. Donc, ν = k– 2 dans le cas le plus général.
Les tests khi-carré 17

- Pour la loi normale N (µ, σ): c = 3 dans le cas le plus général, car il faut
estimer (1) l’effectif n, (2) la moyenne µ et (3) l’écart type σ à partir des
données. Donc, ν = k – 3.
- Loi normale: si la moyenne µ et/ou l’écart type σ sont fournis par
l’hypothèse biologique, cela diminue d’autant la valeur de c.
⇒ Loi de Poisson et loi normale: Il existe de meilleurs tests de
conformité que le test khi-carré. Il s’agit du test de Kolmogorov-Smirnov
et du test de Shapiro-Wilk (Legendre & Legendre, 1984, section 4.9;
1998, section 4.7; Sokal & Rohlf, 1981 ou 1995). Le test de Shapiro-
Wilk est disponible dans le langage R (fonction shapiro.test ).
4. Conditions d’application: Les mêmes que pour le test X2 entre deux
variables qualitatives.
5. Exemples: Voir Scherrer, p. 634-635.

Références additionnelles
Cochran, W. G. 1954. Some methods for strengthening the common χ2
test. Biometrics 10: 417-451.
Dingle, H. 1972. Aggressive behavior in stomatopods and the use of
information theory in the analysis of animal communication.
Pp. 126-156 in: H. E. Winn & B. L. Olla, editors. Behavior of
marine animals – Current perspectives in research. Vol. 1:
Invertebrates. Plenum Press, New York.
Fisher, R. A. 1934. Statistical methods for research workers, 5th ed.
Oliver & Boyd, Edinburgh.