Vous êtes sur la page 1sur 10

b1 - Etude de relation entre deux variables qualitatives

b11. Les tableaux de contingence

Il s’agit de traiter simultanément les réponses à deux questions. On obtient alors des tableaux
d’effectifs (tableaux de contingence) qui rendent compte du comptage des réponses
simultanées apportées à deux questions.
Un tableau de contingence est donc une manière efficace de résumer la relation entre deux
variables qualitatives X et Y. Un tableau de contingence a la structure suivante

On peut parfaitement croiser les deux variables qualitatives Sexe et Formateur


-> Analyse / statistiques descriptives / Tableaux croisés / glissez la variable indépendante
dans la cellule « Ligne » et la variable dépendante dans la cello « Colonne » / cliquez sur
Cellules et cochez les 2 pourcentages (ligne et total) et cliquez sur poursuivre / en bas,
cochez « afficher les graphiques à barres en cluster » / OK
Output de SPSS VIEWER

Interprétation
• 78,6% des hommes ont suivi des cours avec John
• 75% des femmes ont suivi des cours avec Jane

On peut donc émettre l’hypothèse suivante: Les salariés hommes ont une
certaine préférence pour des formateurs de sexe masculin alors que les
salariés femmes préfèrent suivre des cours avec des formatrices. Pour
vérifier cette hypothèse on doit effectuer un test d’hypothèse

b12. Le test d’indépendance de Khi-deux

Pour mesurer l’indépendance des variables, il faut utiliser des tests d’hypothèses. Les
tests d’hypothèses nous aident à interpréter les données et à prendre des décisions. Ces
tests nous permettent de déterminer si les relations entre deux variables données
sont dues au hasard ou sont réellement significatives. Dans l’analyse bivariée, les
tests statistiques à effectuer varient selon la nature des variables.

Pour l’étude de la relation entre 2 variables qualitatives, le khi-carré (ou khi deux) est
le test le plus utilisé. Le khi-carré est d’abord et avant tout destiné à l’examen de la
relation entre deux variables qualitatives, nominales ou ordinales. C’est un test
d’indépendance.
Rappel : Dans une recherche, nous avons les données suivantes :

TABLEAU DE CONTINGENCE

Nous avons dans ce tableau une variable indépendante (les répondants ont vu la
publicité du forfait-voyage dans le dernier mois : oui/non) et une variable dépendante
(les répondants ont acheté le forfait-voyage : oui/non).

Étape 1: Formulation des hypothèses


Khi deux est un test d’indépendance. Ainsi, il y a deux hypothèses
- L’hypothèse Nulle (H0) présume qu’il n’y a pas de relation entre les variables (les
deux variables sont indépendantes).
- L’hypothèse H1, au contraire, affirme qu’il y a une relation entre les deux variables.
Les résultats du test de Khi deux permettront de trancher entre ces deux hypothèses et
d’en tirer les conséquences pour l’interprétation des données.
Dans notre cas, nous pouvons formuler deux hypothèses (test d’hypothèses):
1. l’hypothèse H0 : la publicité n’a aucune influence sur l’achat du forfait-voyage
2. l’hypothèse H1 : la publicité a une influence sur l’achat du forfait voyage.

Étape 2: Déterminer le seuil de signification α


α indique la probabilité que le test nous révèle qu’il existe un lien entre les deux
variables alors que dans les faits ce lien n’existe pas. Par exemple, on peut accepter un
risque de 5% donc α=5%

Étape 3: Produire le tableau de contingence et calculer les effectifs


théoriques
Le test du khi-carré fonctionne essentiellement dans la comparaison entre un effectif
observé et un effectif théorique. L’effectif théorique correspond à l’effectif qu’on
aurait s’il n’y avait pas de lien entre les variables. La formule générale est la
suivante :

Avec : Fréquence théorique = (Total de la colonne) *(Total de la ligne) / Grand total

example : 63,3 = 95 * 200 / 300

Étape 4: Vérifier les conditions d’applicabilité du test

- L’échantillon >=30 (OUI)


- Tous les effectifs théoriques >= 5 (OUI)

Étape 5 : Nous calculons le nombre de degrés de liberté

v = (Nombre de lignes – 1) (Nombre de colonnes – 1) = (2-1)*(2-1) = 1


Étape 4: Consulter la table du khi-carré: Celle-ci nous donne les valeurs critiques
en fonction du seuil de signification et du nombre de degré de liberté. Avec un nombre
de degrés de liberté égale à 1 et un seuil de signification égale à 5%, la valeur critique
de khi carré sera égale à 3,84

Étape 5: Décision

- si la valeur de Khi-deux dépasse le seuil critique, on doit rejeter l’hypothèse Ho et par


conséquent accepter l’hypothèse H1 celle qui affirme qu’il y a un lien entre les variables
- si la valeur de Khi-deux est en dessous du seuil critique, on doit accepter l’hypothèse Ho
et par conséquent rejeter l’hypothèse H1 celle qui affirme qu’il y a un lien entre les
variables
Dans notre cas, khi-carré = 19,2 > 3,84 et se trouve dans la zone de rejet de Ho

Interprétation : Au seuil de signification de 5%, on peut affirmer qu’il existe un


lien entre le fait de voir la publicité et d’acheter le pack voyage

Application (enquête satisfaction)

Pour notre exemple portant sur la satisfaction des salariés à l’égard de la formation en
anglais. Rappelons que 78,6% des hommes ont suivi des cours avec John et que 75%
des femmes ont suivi des cours avec Jane. L’étude du tableau de contingence laisse
DONC supposer l’existence d’un lien entre le Sexe des participant et le choix du
formateur (Jane ou John).

Procédure SPSS pour le calcul de Khi-carré

-> Pour ce faire allez au menu Analyser / statistique descriptive / Tableaux croisés
/ Placez la variable SEXE en « lignes » et « formateur » en Colonnes / Cliquez sur
Statistiques / cochez la case Khi-carré / cliquez sur cellules et cochez effectifs
observés et attendus ainsi que résidus non standardisés
OUTPUT dans SPSS VIEWER

La valeur de khi carré est égale à 8,571 avec 1 degré de liberté. Avec 8,571 > 3,84.
cette valeur se trouve dans la zone de rejet de Ho

Conclusion : Au seuil de signification de 5%, on peut affirmer qu’il existe un lien


entre le sexe du participant et le formateur

NB: Sur SPSS, la règle de décision du test se base sur un niveau de signification
statistique, soit la valeur p.

- Si p < 0,05: on rejette H0 et on confirme H1 (il y a un lien entre les deux variables).
- Si p > 0,05: on retient l’hypothèse nulle et on rejette H1 (absence de lien entre les
deux variables)

Dans notre exemple: Le niveau de signification (valeur p) = 0,003 < 0,05 =>
rejeter l’hypothèse Ho et conclure qu’il y a un lien entre le sexe du formateur et le
choix du formateur
b13. Mesurera la force de la relation entre deux variables qualitatives (les mesures
d’association)

Si on affirme qu’une relation existe entre deux variables, on peut donc déterminer la
force de ce lien en utilisant des coefficients de contingence. Nous allons maintenant
étudier deux tests (les plus utilisés) : le Phi et V de Cramer et le coefficient de
contingence.

Le Phi

C’est une Mesure dérivé du Chi-deux. C’est une mesure d’association


entre deux variables dichotomiques (Il est utilisable dans le cas de
tableaux 2x2) (NB: n est la taille de l’échantillon)

Le V de cramer

Le V de Cramer est la mesure d’association la plus populaire


basée sur une variation du Chi deux. Ce coefficient est un
équivalent du coefficient φ utilisable dans le
cas de tables dépassant le format 2 × 2. Il varie
de 0 à 1.

Dans notre exemple (enquête satisfaction), nous avons un tableau


2*2, La mesure d’association qu’on va utiliser est le Coefficient
Phi. = racine carré de 8,571/30 = 0,534

Cela indique l’existence d’une relation forte entre le sexe du


participant et celui du formateur (0,4<0,534<0,8)

Application sur SPSS

La procédure SPSS qui permet de le produire ce résultat est la suivante :


Analyser / statistique descriptive / tableaux Croisés / Sexe en lignes et formateur
en colonnes/cliquez sur statistiques / cochez Phi et V de Cramer
OUTPUT DE SPSS

Conclusion : Les résultats (Khi-carré de 8,571 au seuil de signification de 5%)


montrent qu’il existe une relation statistiquement significative (p<0,005) entre le
sexe du participant et le choix du formateur. Cette relation est Forte comme en
témoigne le coef. Phi de 0,535
Le coefficient de contingence de Pearson (C)

Le test de contingence nous donne une mesure de l’intensité de la


relation entre deux variables qualitatives quand les tableaux de
contingences contiennent plusieurs lignes et plusieurs colonnes (trois
ou plus) et quand la taille de l’échantillon est relativement grande. Le
C est basé sur le Chi-2 et ne tient pas compte de la contrainte de taille
de tableau. Sa valeur oscille entre 0 et 1. Sa formule de calcul est la
suivante :
avec n = taille de l’échantillon
Interprétation : La relation est:
• parfaite si la valeur de C = 1
• très forte si C se situe entre 0,8 et 1
• forte si C se situe entre 0,5 et 0,8.
• d'intensité moyenne si C se situe entre 0,2 et 0,5.
• faible si C se situe entre 0 et 0.2.
• nulle si C = 0

Vous aimerez peut-être aussi