Académique Documents
Professionnel Documents
Culture Documents
BOULAHOUAL ADIL
Résumé : Khi-deux
Les descriptions faites sur les variables soulèvent toute une série de questions sur leurs relations, qui devront être mises en lumière en les
rapprochant deux à deux dans des analyses bi-variées.
Les tris croisés, qui ont pour objet de rassembler dans un tableau unique les distributions de fréquences ou d'effectifs de deux ou plusieurs
variables, sont en général complétés par des mesures d'association qui permettent de démontrer la signification statistique d’association
observée entre ces variables.
Le test très simple du khi-deux pour vérifier l'association de deux variables qualitatives constitue une bonne introduction.
1- Principe du test
Le principe est de comparer la distribution observée (Oij), c'est-à-dire les effectifs que l'on peut lire dans le tableau croisé, à une
distribution théorique (Tij) qui correspond à l'hypothèse selon laquelle les deux variables sont indépendantes. Normalement, si les
variables étaient indépendantes, l'effectif observé ne devrait dépendre que des effectifs marginaux, c'est-à-dire de l'effectif total de chaque
modalité. Autrement, nous cherchons à vérifier si l'association des deux variables est suffisamment forte pour que l'hypothèse de leur
indépendance puisse être rejetée.
2- Procédure du test
Nous posons l’hypothèse nulle :
r
2
c O
ij Tij
2
N.B : La loi du 2 suit une distribution asymétrique dont la forme dépend du nombre de degrés de liberté n. Le nombre de degrés de liberté
varie en fonction du nombre de modalités des variables et se calcule de la manière suivante: (r-1)(c -1).
Il est important de noter aussi que ce test est assez sensible à la taille de l'échantillon, à la taille du tableau croisé et que, normalement,
chaque case du tableau devrait avoir un effectif théorique au moins égal à cinq(5).
Procédures sous SPSS : Analyse – Statistiques descriptives – Tableaux croisés – Chi-deux – Poursuivre – Ok.
Règle : Si la signification du test est inférieure au seuil choisi nous rejetons l’hypothèse nulle et nous confirmons l’existence d’association
entre les variables étudiées.
2
BOULAHOUAL ADIL
0,50 V 0,69 Relation forte
0,30 V 0,49 Relation modérée
0,10 V 0,29 Relation faible
0,01 V 0,09 Relation très faible
3- Indicateurs mesurant la force de l'association V = 0,00 Relation nulle
- Dans le cas particulier des tableaux carrés 2 x 2 (2 lignes et 2 colonnes), qui comparent deux variables à deux modalités, il est
recommandé d'appliquer une correction au 2 , ou d'utiliser le coefficient phi ( ).
- Le coefficient de contingence (C) peut être appliqué pour des mesures d'association sans contrainte de taille de tableau.
- Nous pouvons mesurer la force de la relation entre les deux variables par le biais de l’indice V de Cramer ;
- Le coefficient d'association prédictive (lambda) permet de mesurer dans quelle proportion une variable qualitative indépendante
influence une variable qualitative dépendante. C'est donc une mesure dissymétrique qui - contrairement aux précédentes - a pour objet
une force de prédiction.
2 2 2
C V
n 2 n n( L 1)
Exercice d’application
Vérifier l’existence d’association entre le genre et a possession de carte de fidélité et mesurer la force de cette association
sachant que 25% (400/1600) des clients possèdent une carte de fidélité.
Possède une carte fidélité Ne possède pas de carte fidélité Total Au seuil de 5% et à un degré de liberté
2
T : 250* O : 220 T : 750* O : 780 1000 de 1, tabulée est égale à 0,004
2
220 250 780 750 180 150 420 450
2
2
2
2
12,8
250 750 150 450
3
BOULAHOUAL ADIL
Tests du Khi-deux
Valeur ddl Signification asymptotique (bilatérale) Signification exacte (bilatérale) Signification exacte (unilatérale) La signification du test de Khi-Deux
Khi-deux de Pearson 12,800a 1 ,000
est inférieure au seuil classique 5%
b
nous pouvons confirmer l’existence
d’association significative entre les
Correction pour la continuité 12,377 1 ,000