Vous êtes sur la page 1sur 18

UCO NIORT

LICENCE ECONOMIE
L2 SEMESTRE 4 STATISTIQUES
CHAPITRE 5
LE TEST D’INDEPENDANCE DU CHI-DEUX

Eric DELATTRE
erdelattre@gmail.com

2022-2023

Eric DELATTRE erdelattre@gmail.com 1/18


Plan

1 Le tableau de contingence

2 Le test du Chi-Deux

Eric DELATTRE erdelattre@gmail.com 2/18


Bibliographie

Statistique pour économistes et gestionnaires. 2ème édition. Brigitte


Tribout. Pearson. 2013.
Statistiques pour l’économie et la gestion. D.R. Anderson, D.J.
Sweeney, T.A. Williams, J.D. Camm et J.J. Cochran. 5ème Edition. De
Boeck. 2015.

Eric DELATTRE erdelattre@gmail.com 3/18


Le tableau de contingence

Le tableau de contingence permet de représenter la relation statistique


entre deux variables X et Y .
Si on considère X, on dispose, pour n individus statistiques, des
réalisations x1 , x2 , . . . xn .
On considère une partition PX , constituée des I classes CiX (i = 1, I)
Chacuns des n individus appartient à une et une seule classe CiX
On a |CiX | = ni. et
P
ni. = n
i=1,I

L’individu k appartient à CiX si bi < xk ≤ bi+1 (k = 1, n)


Pour les n individus, on dispose également des réalisations y1 , y2 , . . . yn .
On considère une partition PY , constituée des J classes CjY (j = 1, J)
Chacun des n individus appartient à une et une seule classe CjY
On a |CjY | = n.j et
P
n.j = n
j=1,J

L’individu k appartient à CjY si dj < yk ≤ dj+1 (k = 1, n)

Eric DELATTRE erdelattre@gmail.com 4/18


Le tableau de contingence

On considère maintenant la partition P XY constituée des IJ classes


XY
Cij (i = 1, I; j = 1, J)
XY
L’individu k appartient à Cij si bi < xk ≤ bi+1 et si dj < yk ≤ dj+1
(k = 1, n) c’est à dire si l’individu k appartient à CiX et à CjY .
XY P P
On a |Cij | = nij et nij = n
i=1,I j=1,J

On donne, pour exemple, le tableau de contingence associé à la


consommation de tabac par sexe, pour un échantillon de taille n = 100
(tableau 1).

0 cigarette 1 à 10 cigarettes 11 cigarettes et +


par jour par jour par jour
Hommes n11 = 20 n12 = 12 n13 = 10 n1. = 42
Femmes n21 = 36 n22 = 12 n23 = 10 n2. = 58
n.1 = 56 n.2 = 24 n.3 = 20 n.. = n = 100

Table 1 – Tableau de contingence : Sexe*consommation de tabac

Eric DELATTRE erdelattre@gmail.com 5/18


Le tableau de contingence

Il y a donc 20 hommes qui consomment 0 cigarette par jour, sur un


total de 42 hommes.
Les effectifs n.j (j = 1, 3) sont appelés effectifs marginaux en colonne.
Les effectifs ni. (i = 1, 2) sont appelés effectifs marginaux en ligne.
On donne, tableau 2, un deuxième exemple entre le sexe et les accidents
de voiture

0 accident 1 et +
par an par an
Hommes n11 = 20 n12 = 20 n1. = 40
Femmes n21 = 30 n22 = 30 n2. = 60
n.1 = 50 n.2 = 50 n.. = n = 100

Table 2 – Tableau de contingence : Sexe*accidents de voiture

Eric DELATTRE erdelattre@gmail.com 6/18


Le test du Chi-Deux

Dans le tableau 2, dans la population totale (H + F ), la proportion


d’individus avec 0 accident est nn.1 = 1/2.
Chez les hommes, : la proportion d’individus avec 0 accident est
n11
n1.
= 1/2
Chez les femmes, : la proportion d’individus avec 0 accident est
n21
n2.
= 1/2.
On a donc
n.1 n11 n21
= = (1)
n n1. n2.
Si on regarde les populations avec 1 accident et plus :
n.2
Proportion dans population totale : n
= 1/2
n12
Proportion chez les hommes : n1.
= 1/2
n22
Proportion chez les femmes : n2.
= 1/2.
On a donc
n.2 n12 n22
= = (2)
n n1. n2.
Cela signifie (équations 1 et 2) que le fait d’avoir un certain nombre
d’accidents n’est pas relié au sexe.

Eric DELATTRE erdelattre@gmail.com 7/18


Le test du Chi-Deux

On peut raisonner dans l’autre sens


n1.
La proportion d’hommes dans la population totale n
= 2/5 :
n11
La proportion d’hommes avec 0 accident est n.1
= 2/5
n12
La proportion d’hommes avec 1 accident et plus est n.2
= 2/5.
On a donc
n1. n11 n12
= = (3)
n n.1 n.2
n2.
La proportion de femmes dans la population totale : n
= 3/5
n21
Proportion de femmes avec 0 accident : n.1
= 3/5
n22
Proportion de femmes avec 1 accident et plus : n.2
= 3/5.
On a donc
n2. n21 n22
= = (4)
n n.1 n.2
Cela signifie (équations 3 et 4) que le sexe n’est pas relié au nombre
d’accidents.

Eric DELATTRE erdelattre@gmail.com 8/18


Le test du Chi-Deux

On a donc montré que conditionnellement au sexe, la probabilité d’avoir


un certain nombre d’accidents est la même que la probabilité de ce
même nombre d’accidents
On a également montré que conditionnellement au nombre d’accidents,
la probabilité d’avoir un homme est la même que la probabilité d’avoir
un homme.
En d’autres termes, on a montré que le sexe et le nombre d’accidents de
voitures sont deux variables indépendantes.

Eric DELATTRE erdelattre@gmail.com 9/18


Le test du Chi-Deux

Le test d’indépendance du Chi-deux est contruit autour des propriétés


que l’on vient de mettre en évidence (équations 1, 2, 3 et 4).
Si je calcule, par exemple, la proportion f11 d’hommes avec 0 accident
dans la population totale :
n11
f11 = n
n1. ∗n.1
Avec l’équation 1 ou l’équation 3, on a : n11 = n
n1. ∗n.1
Ainsi f11 = n2
La proportion d’hommes avec 0 accident est égale au produit de la
proportion d’hommes avec la proportion d’individus avec 0 accident.
En d’autres termes
p(Homme ∩ accident = 0) = p(Homme) ∗ p(accident = 0)
On retrouve ici la définition de l’indépendance entre A et B :
p(A ∩ B) = p(A) ∗ p(B)

Eric DELATTRE erdelattre@gmail.com 10/18


Le test du Chi-Deux

ni. ∗n.j
On peut montrer ici que fij = n2
∀i = 1, 2 ∀j = 1, 2
De manière générale, en cas d’indépendance (absolue), on aura
ni. ∗ n.j
fij = ∀i = 1, I ∀j = 1, J (5)
n2
ni. ∗ n.j
⇔ nij = ∀i = 1, I ∀j = 1, J (6)
n
C’est cette propriété que l’on va utiliser pour construire le test
d’indépendance du Chi-deux, en comparant effectifs qui doivent être
vérifiés en cas d’indépendances :
ni. ∗n.j
n̂ij = n
∀i = 1, I ∀j = 1, J
avec ceux réellement observés : nij ∀i = 1, I ∀j = 1, J
On définit pour cela la distance du Chi-Deux :
X X (nij − n̂ij )2
χ2 = (7)
i=1,I j=1,J
n̂ij

Eric DELATTRE erdelattre@gmail.com 11/18


Le test du Chi-Deux

Alors, si les variables X et Y sont indépendantes et si


n̂ij > 5 = ∀i = 1, I ∀j = 1, J alors
χ2 suit approximativement une loi du Chi-deux à (I − 1) ∗ (J − 1) d.d.l.
Formulation du test :
Étape 1 : formulation du test.

H0 A et B indépendantes
H1 A et B non indépendantes

Étape 2 : choix du seuil du test, le risque de première espèce.


On prend α = 0.05
Étape 3 : Donner la statistique du test et sa loi sous H0 .
P P (nij −n̂ij )2
Sous H0 : χ2 = n̂ij
suit un Chi-deux à
i=1,I j=1,J
(I − 1) ∗ (J − 1) d.d.l.

Eric DELATTRE erdelattre@gmail.com 12/18


Le test du Chi-Deux

Étape 4 : Règle de décision et région critique.


On a ici un test unilatéral. Sous H0 , la réalisation de la variable χ2 doit
être faible.
La région critique est de la forme [kα ; ∞] (figure 5)
Avec kα , le quantile 1 − α d’une loi de Chi-deux à (I − 1) ∗ (J − 1) d.d.l.
Étape 5 : Calcul de la statistique du test.
Étape 6 : Décision.

Eric DELATTRE erdelattre@gmail.com 13/18


Le test du Chi-Deux

H0

α

Figure 1 – Test du Chi-Deux et région critique

Eric DELATTRE erdelattre@gmail.com 14/18


Le test du Chi-Deux

Exemple

Á partir des données du tableau 1, tester l’hypothèse d’indépendance


entre sexe et consommation de tabac.
Étape 1 : formulation du test.

H0 Sexe et consommation de tabac sont indépendantes
H1 Sexe et consommation de tabac ne sont pas indépendantes

Étape 2 : choix du seuil du test, le risque de première espèce.


On prend α = 0.05
Étape 3 : Donner la statistique du test et sa loi sous H0 .
P P (nij −n̂ij )2
Sous H0 : χ2 = n̂ij
suit un Chi-deux à 2 d.d.l.
i=1,2j=1,3

Eric DELATTRE erdelattre@gmail.com 15/18


Le test du Chi-Deux

Étape 4 : Règle de décision et région critique.


La région critique est [kα ; ∞]
Avec kα , le quantile 0.95 d’une loi de Chi-deux à 2 d.d.l.
Avec kα = 5.99
Étape 5 : Calcul de la statistique du test.

0 cigarette 1 à 10 cigarettes 11 cigarettes et +


par jour par jour par jour
Hommes n11 = 20 n12 = 12 n13 = 10 n1. = 42
n̂11 = 23.52 n̂12 = 10.08 n̂13 = 8.4
Femmes n21 = 36 n22 = 12 n23 = 10 n2. = 58
n̂21 = 32.48 n̂22 = 13.92 n̂23 = 11.6
n.1 = 56 n.2 = 24 n.3 = 20 n.. = n = 100

Table 3 – Calcul du chi-deux : Sexe*consommation de tabac

χ2 =
(20−23.52)2 2 2 2 2 2
23.52
+ (12−10.08)
10.08
+ (10−8.4)
8.4
+ (36−32.48)
32.48
+ (12−13.92)
13.92
+ (10−11.6)
11.6
2
χ = 2.064
On ne rejette pas H0

Eric DELATTRE erdelattre@gmail.com 16/18


Le test du Chi-Deux

n/α 0.05 0.1 0.25 0.5 0.75 0.9 0.95 0.975 0.99 0.995
1 0.00 0.02 0.10 0.45 1.32 2.71 3.84 5.02 6.63 7.88
2 0.10 0.21 0.58 1.39 2.77 4.61 5.99 7.38 9.21 10.60
3 0.35 0.58 1.21 2.37 4.11 6.25 7.81 9.35 11.34 12.84
4 0.71 1.06 1.92 3.36 5.39 7.78 9.49 11.14 13.28 14.86
5 1.15 1.61 2.67 4.35 6.63 9.24 11.07 12.83 15.09 16.75
6 1.64 2.20 3.45 5.35 7.84 10.64 12.59 14.45 16.81 18.55
7 2.17 2.83 4.25 6.35 9.04 12.02 14.07 16.01 18.48 20.28
8 2.73 3.49 5.07 7.34 10.22 13.36 15.51 17.53 20.09 21.95
9 3.33 4.17 5.90 8.34 11.39 14.68 16.92 19.02 21.67 23.59
10 3.94 4.87 6.74 9.34 12.55 15.99 18.31 20.48 23.21 25.19
11 4.57 5.58 7.58 10.34 13.70 17.28 19.68 21.92 24.72 26.76
12 5.23 6.30 8.44 11.34 14.85 18.55 21.03 23.34 26.22 28.30
13 5.89 7.04 9.30 12.34 15.98 19.81 22.36 24.74 27.69 29.82
14 6.57 7.79 10.17 13.34 17.12 21.06 23.68 26.12 29.14 31.32
15 7.26 8.55 11.04 14.34 18.25 22.31 25.00 27.49 30.58 32.80
16 7.96 9.31 11.91 15.34 19.37 23.54 26.30 28.85 32.00 34.27
17 8.67 10.09 12.79 16.34 20.49 24.77 27.59 30.19 33.41 35.72
18 9.39 10.86 13.68 17.34 21.60 25.99 28.87 31.53 34.81 37.16
19 10.12 11.65 14.56 18.34 22.72 27.20 30.14 32.85 36.19 38.58
20 10.85 12.44 15.45 19.34 23.83 28.41 31.41 34.17 37.57 40.00
21 11.59 13.24 16.34 20.34 24.93 29.62 32.67 35.48 38.93 41.40
22 12.34 14.04 17.24 21.34 26.04 30.81 33.92 36.78 40.29 42.80
23 13.09 14.85 18.14 22.34 27.14 32.01 35.17 38.08 41.64 44.18
24 13.85 15.66 19.04 23.34 28.24 33.20 36.42 39.36 42.98 45.56
25 14.61 16.47 19.94 24.34 29.34 34.38 37.65 40.65 44.31 46.93

Table 4 – Table du χ2 : P rob(χ2n ≤ c) = α

Eric DELATTRE erdelattre@gmail.com 17/18


Le test du Chi-Deux

n/α 0.05 0.1 0.25 0.5 0.75 0.9 0.95 0.975 0.99 0.995
26 15.38 17.29 20.84 25.34 30.43 35.56 38.89 41.92 45.64 48.29
27 16.15 18.11 21.75 26.34 31.53 36.74 40.11 43.19 46.96 49.64
28 16.93 18.94 22.66 27.34 32.62 37.92 41.34 44.46 48.28 50.99
29 17.71 19.77 23.57 28.34 33.71 39.09 42.56 45.72 49.59 52.34
30 18.49 20.60 24.48 29.34 34.80 40.26 43.77 46.98 50.89 53.67
31 19.28 21.43 25.39 30.34 35.89 41.42 44.99 48.23 52.19 55.00
32 20.07 22.27 26.30 31.34 36.97 42.58 46.19 49.48 53.49 56.33
33 20.87 23.11 27.22 32.34 38.06 43.75 47.40 50.73 54.78 57.65
34 21.66 23.95 28.14 33.34 39.14 44.90 48.60 51.97 56.06 58.96
35 22.47 24.80 29.05 34.34 40.22 46.06 49.80 53.20 57.34 60.27
36 23.27 25.64 29.97 35.34 41.30 47.21 51.00 54.44 58.62 61.58
37 24.07 26.49 30.89 36.34 42.38 48.36 52.19 55.67 59.89 62.88
38 24.88 27.34 31.81 37.34 43.46 49.51 53.38 56.90 61.16 64.18
39 25.70 28.20 32.74 38.34 44.54 50.66 54.57 58.12 62.43 65.48
40 26.51 29.05 33.66 39.34 45.62 51.81 55.76 59.34 63.69 66.77
41 27.33 29.91 34.58 40.34 46.69 52.95 56.94 60.56 64.95 68.05
42 28.14 30.77 35.51 41.34 47.77 54.09 58.12 61.78 66.21 69.34
43 28.96 31.63 36.44 42.34 48.84 55.23 59.30 62.99 67.46 70.62
44 29.79 32.49 37.36 43.34 49.91 56.37 60.48 64.20 68.71 71.89
45 30.61 33.35 38.29 44.34 50.98 57.51 61.66 65.41 69.96 73.17
46 31.44 34.22 39.22 45.34 52.06 58.64 62.83 66.62 71.20 74.44
47 32.27 35.08 40.15 46.34 53.13 59.77 64.00 67.82 72.44 75.70
48 33.10 35.95 41.08 47.34 54.20 60.91 65.17 69.02 73.68 76.97
49 33.93 36.82 42.01 48.33 55.27 62.04 66.34 70.22 74.92 78.23
50 34.76 37.69 42.94 49.33 56.33 63.17 67.50 71.42 76.15 79.49

Table 5 – Table du χ2 : P rob(χ2n ≤ c) = α

Eric DELATTRE erdelattre@gmail.com 18/18

Vous aimerez peut-être aussi