Académique Documents
Professionnel Documents
Culture Documents
Test du khi-deux
Un exemple
Mise en situation : L’entreprise MG a besoin de savoir si la fiabilité des composantes
qu’elle utilise est liée au fournisseur qui l’approvisionne. En effet, s’il existe une relation,
cela signifie qu’elle doit porter attention au choix du fournisseur.
Les données nécessaires pour répondre à cette question se présentent sous la forme
d’un tableau de contingence :
Fournisseur
Total
A B C
Oui 15 20 40 75
Défectueuse?
Non 485 480 460 1425
Total 500 500 500 1500
Ce tableau est appelé tableau des effectifs observé, puisqu’il présente ce que l’on
observe dans les données collectées.
Fournisseur
Total
A B C
Oui 25 25 25 75
Défectueuse?
Non 475 475 475 1425
Total 500 500 500 1500
Comme le nombre d’observations est ici le même pour chacun des trois
fournisseurs, on peut affirmer que si l’hypothèse d’indépendance entre le
fournisseur et le fait qu’une composante est défectueuse ou non était vraie, alors le
nombre de pièces défectueuses serait ________________ pour les trois
fournisseurs. Cette affirmation est cohérente avec le tableau ci-haut.
Exemple de calcul :
La probabilité qu’une composante choisie au hasard soit défectueuse et
provienne du fournisseur A est calculée de la manière suivante :
P ( composante défectueuse ET fournisseur A )
¿ P ( composante défectueuse ) × P ( fournisseur A )
75 500 1 compléter
¿ × =
1500 1500 60
Cas général
Le test du khi-deux
On utilise le test du khi-deux pour déterminer s’Il existe une relation entre les variables
X et Y . Les hypothèses confrontées sont :
La statistique du test mesure la distance entre les effectifs observés et les effectifs
espérés sous H 0. On s’appuie pour notre part sur le seuil expérimental, calculé à l’aide
d’un logiciel, pour déterminer si cette distance est trop grande pour que H 0 soit
vraisemblable.
Décision :
Le coefficient de Cramer
L’intensité de la relation entre deux variables de type qualitative peut être mesurée à
l’aide du coefficient de Cramer. Il peut être calculé à l’aide du gabarit Excel.
Il varie de 0 à 1 :
0 1
Pas de relation entre Plus la valeur du coefficient augmente, plus l’association entre les
les deux variables variables est forte.
Exercices
Les exercices suivants nécessitent l’utilisation du gabarit Excel Test du khi2. Assurez-vous
d’avoir visionné la capsule vidéo associée à ce gabarit avant de compléter les exercices.
1. Existe-t-il un lien entre le fait d’aimer magasiner et d’être une fille ou un garçon?
Vous disposez des données d’un échantillon :
Aime
Tableau de
magasiner Total
contingence
Oui Non
Fille 30 20 50
Sexe
Garçon 10 40 50
Total 40 60 100
Moment du jour
Journée Soirée ou nuit Total
Crédit 174 125 299
Mode de Paypa 93 80 173
paiement l
Total 267 205 472
4. Un sondage réalisé auprès des étudiants du cours 1-620 à l’automne 2015 nous
donne les résultats :
Laquelle des phrases suivantes décrit le mieux votre atti-
tude face au cours de statistique 1-620-15 ?
46
41
30 31
Croyez-vous qu’il existe une relation entre le genre de l’étudiant et l’attitude qu’il a face
à son cours de statistique (1-620-15) si on observe la répartition suivante :
Q1 : sexe
Répartition des résultats selon le genre de l’étudiant Féminin Masculi
n Total
La statistique m’intimide. Ça me stresse de suivre ce 22 8 30
cours.
Quel ennui, mais bon, je n’ai pas le choix. 17 14 31
Je suis intéressé(e) par le cours, mais, je crains qu’il ne 35 11 46
soit difficile.
Je crois que ce sera intéressant. Ce type de cours me 15 26 41
plaît habituellement.
Super ! Le sujet m’intéresse vraiment beaucoup. 1 7 8
Total 90 66 156
Peut-on conclure que la raison de l’insatisfation des clients est indépendante de l’hôtel
fréquenté?
Solutions
1.
a) Le tableau des effectifs espérés est le suivant :
Aime
Tableau de
magasiner Total
contingence
Oui Non
Fille 20 30 50
Sexe
Garçon 20 30 50
Total 40 60 100
Calcul pour l’effectif espéré de la case fille-aime magasiner :
50 × 40/100=20 .
Les autres calculs sont similaires.
b) Les hypothèses du test sont :
H 0: le sexe est indépendant de l’attribut d’aimer magasiner
H 1: le sexe est lié à l’attribut d’aimer magasiner
L’échantillon est grand (n=100) et tous les effectifs espérés sont supérieurs à 5
(voir la partie a).
À l’aide du gabarit, on trouve que le seuil expérimental est 0.000045. Celui-ci est
inférieur à 0.01.
Au niveau de signification 1%, les données montrent une dépendance entre le
fait d’aimer magasiner et le genre.
2. Un tableau croisé dynamique effectué sur l’ensemble de données fournit les
résultats de l’échantillon aléatoire:
Préférence en matière de bière
Légère Normale Brune Total
Homme 20 40 20 80
Sexe
Femme 30 30 10 70
Total 50 70 30 150
Hypothèses :
H 0 : Les variables genre et préférence en matière de bière sont indépendantes
H 1 : Les variables sont dépendantes
Niveau de signification du test α : α = 5%
Conditions : n>30 ET tous les effectifs espérés > 5
Conclusion : Le fichier EXCEL « Test du khi-deux » fournit le seuil expérimental
On rejette
Seuil expérimental = 0.0468 ≤ α ⇒
H0
Au niveau de signification α =5%, les données observées nous permettent de rejeter
l’hypothèse nulle. Il semble donc qu’il y ait une relation entre le fait d’être un
homme ou une femme et la préférence en matière de bière. Ainsi, vous pourriez
suggérer à la brasserie Alber d’adapter ses publicités. Toutefois, comme les budgets
de publicité sont dispendieux et que le seuil expérimental s’avère très près du
niveau α, il pourrait être judicieux de recommander à la compagnie de collecter un
nouvel échantillon pour valider les résultats.
3. Le test d’indépendance du khi-deux nous permet de répondre à la question.
H 0 : Les variables « mode de paiement » et « moment du jour » sont
indépendantes
H 1 : Les variables sont dépendantes
Il faut par exemple regrouper les deux dernières catégories pour satisfaire les
exigences (toutes les valeurs espérées doivent être supérieures à 5). Il est en effet
possible d’effectuer ce regroupement sans modifier le sens de l’interprétation. En effet,
les catégories « Je crois que ce sera intéressant » et « Le sujet m’intéresse vraiment
beaucoup » peuvent avoir une interprétation similaire quant à l’attitude face au cours
1620. Le tableau devient donc :