Vous êtes sur la page 1sur 3

1

BOULAHOUAL ADIL
Résumé : Khi-deux
Les descriptions faites sur les variables soulèvent toute une série de questions sur leurs relations, qui devront être mises en lumière en les
rapprochant deux à deux dans des analyses bi-variées.
Les tris croisés, qui ont pour objet de rassembler dans un tableau unique les distributions de fréquences ou d'effectifs de deux ou plusieurs
variables, sont en général complétés par des mesures d'association qui permettent de démontrer la signification statistique d’association
observée entre ces variables.
Le test très simple du khi-deux pour vérifier l'association de deux variables qualitatives constitue une bonne introduction.
1- Principe du test
Le principe est de comparer la distribution observée (Oij), c'est-à-dire les effectifs que l'on peut lire dans le tableau croisé, à une
distribution théorique (Tij) qui correspond à l'hypothèse selon laquelle les deux variables sont indépendantes. Normalement, si les
variables étaient indépendantes, l'effectif observé ne devrait dépendre que des effectifs marginaux, c'est-à-dire de l'effectif total de chaque
modalité. Autrement, nous cherchons à vérifier si l'association des deux variables est suffisamment forte pour que l'hypothèse de leur
indépendance puisse être rejetée.
2- Procédure du test
Nous posons l’hypothèse nulle :
r
  
2
c O
ij  Tij 
2

H0 : Il n’y a pas de relation entre les deux variables. i 1 j 1 Tij


H1 : Il existe une relation statistiquement significative entre les deux variables.
2 2
Nous rejetons l’hypothèse nulle (on conclut que la relation existe) si :  >  0,05 [(r-1)(c-1)]
Où:
i = numéro de la ligne;

Test d’association : Test de Khi-Deux


j = numéro de la colonne;
r = nombre de lignes, c'est-à-dire le nombre de modalités de la variable présentée en lignes;
c = nombre de colonnes, c'est-à-dire le nombre de modalités de la variable présentée en colonnes.

N.B : La loi du 2 suit une distribution asymétrique dont la forme dépend du nombre de degrés de liberté n. Le nombre de degrés de liberté
varie en fonction du nombre de modalités des variables et se calcule de la manière suivante: (r-1)(c -1).
Il est important de noter aussi que ce test est assez sensible à la taille de l'échantillon, à la taille du tableau croisé et que, normalement,
chaque case du tableau devrait avoir un effectif théorique au moins égal à cinq(5).
Procédures sous SPSS : Analyse – Statistiques descriptives – Tableaux croisés – Chi-deux – Poursuivre – Ok.
Règle : Si la signification du test est inférieure au seuil choisi nous rejetons l’hypothèse nulle et nous confirmons l’existence d’association
entre les variables étudiées.
2

V  0,70 Relation très forte

BOULAHOUAL ADIL
0,50  V  0,69 Relation forte
0,30  V  0,49 Relation modérée
0,10  V  0,29 Relation faible
0,01  V  0,09 Relation très faible
3- Indicateurs mesurant la force de l'association V = 0,00 Relation nulle
- Dans le cas particulier des tableaux carrés 2 x 2 (2 lignes et 2 colonnes), qui comparent deux variables à deux modalités, il est
recommandé d'appliquer une correction au 2 , ou d'utiliser le coefficient phi (  ).
- Le coefficient de contingence (C) peut être appliqué pour des mesures d'association sans contrainte de taille de tableau.
- Nous pouvons mesurer la force de la relation entre les deux variables par le biais de l’indice V de Cramer ;
- Le coefficient d'association prédictive (lambda) permet de mesurer dans quelle proportion une variable qualitative indépendante
influence une variable qualitative dépendante. C'est donc une mesure dissymétrique qui - contrairement aux précédentes - a pour objet
une force de prédiction.
2 2 2
  C V 
n 2  n n( L  1)

Exercice d’application
Vérifier l’existence d’association entre le genre et a possession de carte de fidélité et mesurer la force de cette association
sachant que 25% (400/1600) des clients possèdent une carte de fidélité.


Possède une carte fidélité Ne possède pas de carte fidélité Total Au seuil de 5% et à un degré de liberté
2
T : 250* O : 220 T : 750* O : 780 1000 de 1,  tabulée est égale à 0,004

Test d’association : Test de Khi-Deux


Hommes 2 > 20,05 [(r-1)(c-1)]
T: 150* O : 180 T: 450* O: 420 600 12,8 > 0,004
Femmes
Conclusion: Les deux variables sont
400 1200 1600
TOTAL significativement associées

 2

220  250  780  750  180  150  420  450 
2

2

2

2
 12,8
250 750 150 450
3

BOULAHOUAL ADIL
Tests du Khi-deux

Valeur ddl Signification asymptotique (bilatérale) Signification exacte (bilatérale) Signification exacte (unilatérale) La signification du test de Khi-Deux
Khi-deux de Pearson 12,800a 1 ,000
est inférieure au seuil classique 5%
b
nous pouvons confirmer l’existence
d’association significative entre les
Correction pour la continuité 12,377 1 ,000

Rapport de vraisemblance 12,619 1 ,000 deux variables étudiées.


Test exact de Fisher ,000 ,000

Nombre d'observations valides 1600


a. 0 cellules (0,0%) ont un effectif théorique inférieur à 5. L'effectif théorique minimum est de 150,00.
b. Calculé uniquement pour un tableau 2x2

La valeur du test symétrique de


Mesures directionnelles
Lambda est de « 0,000 » qui veut dire
l’association entre le genre est la
a
Valeur Erreur standard asymptotique T approximé Sig.approximée

Symétrique . ,000 ,000 .


b
.
b possession d’une carte fidélité est
b b
presque inexistante.
Lambda Sexe dépendant ,000 ,000 . .
La statistique Lambda est égale à
Nominal par Nominal Possession dépendant ,000 ,000 .
b
.
b
« 0,000 » dans le cas ou la variable
Sexe dépendant ,008 ,005 ,000
c sexe est considérée comme
Tau de Goodman et Kruskal
c
dépendante et lorsque la possession
est considérée comme dépendante
Possession dépendant ,008 ,005 ,000
a. L'hypothèse nulle n'est pas considérée.
b. Calcul impossible /: l'erreur standard asymptotique est égale à zéro. aussi.
c. Basé sur une approximation du Khi-deux

Test d’association : Test de Khi-Deux


Mesures symétriques

Valeur Signification Les tests de Phi, de V de cramer, et du


approximée coefficient de contingence viennent
Phi . ,089 ,000 appuyer le constat de la très faible
Nominal par Nominal V de Cramer ,089 ,000
association entre le genre et la
possession de carte de fidélité.
Coefficient de contingence ,089 ,000

Nombre d'observations valides 1600


a. L'hypothèse nulle n'est pas considérée.
b. Utilisation de l'erreur standard asymptotique dans l'hypothèse nulle.

Vous aimerez peut-être aussi