Vous êtes sur la page 1sur 7

Glossaire de statistique descriptive

Le test dindpendance du Khi-carr de PEARSON Dernire mise jour le 23 mars 2010 Le test dindpendance du khi-carr (lcriture anglaise est chi-square ) a t dvelopp par Karl PEARSON (1857-1936). Lexpression test du khi-carr recouvre plusieurs tests statistiques 1 , trois tests principalement : le test dajustement ou dadquation, qui compare globalement la distribution observe dans un chantillon statistique une distribution thorique, celle du khi-carr. Le test d'indpendance du khi-carr qui permet de contrler l'indpendance de deux caractres dans une population donne. le test d'homognit du khi-carr qui teste si des chantillons sont issus d'une mme population.

Le test qui nous intresse ici est uniquement le test dindpendance du khi-carr. Ce test sert apprcier lexistence ou non dune relation entre deux caractres au sein dune population, lorsque ces caractres sont qualitatifs o lorsquun caractre est quantitatif et lautre qualitatif, ou bien encore lorsque les deux caractres sont quantitatifs mais que les valeurs ont t regroupes. noter que ce test permet de contrler lexistence dune dpendance mais en aucun cas le sens de cette dpendance (sauf dans certains cas particuliers o lexistence dune relation implique une causalit univoque comme dans lexemple ci-aprs o le sexe peut avoir une influence sur le choix dune certaine matire mais o il est impossible que le choix dune certaine matire ait une influence sur le sexe). noter enfin que les diffrents tests du khi-carr ne doivent pas tre confondus avec la distribution thorique du khi-carr, dont les valeurs tabules servent seulement valider ces diffrents tests. Voyons comment ce test peut-tre utilis dans le cas dune distribution deux caractres 2. Le premier caractre, dsign par X, pourra tre un caractre quantitatif ou qualitatif, comprenant des catgories (ou des classes) (issues gnralement dun regroupement des valeurs dun caractre quantitatif ou des modalits dun caractre non quantitatif). On aura ainsi les classes A1, , AL Le second caractre, dsign par Y, pourra tre un caractre quantitatif ou qualitatif, comprenant des catgories (ou des classes) (issues gnralement dun regroupement des valeurs dun caractre quantitatif ou des modalits dun caractre non quantitatif). On aura ainsi les classes B1, , BC.

Une prsentation synthtique des diffrents tests est donne dans Wikipdia (voir larticle Test du khi-2 ) Pour une trs bonne explication de la faon deffectuer un test dindpendance du khi-2 (ou chi-2), voir Charles McCREERY The CHI-SQUARE test : A test of Association Between Categorical Variables . Sur internet : http://www.celiagreen.com/charlesmccreery/statistics/chisquare.pdf. Voir aussi les explications trs claires donnes sur BibMath dont nous nous sommes inspirs ci-aprs : http://www.bibmath.net/dico/index.php3?action=affiche&quoi=./c/chideuxtest.html .
2

www.economie-cours.fr

Glossaire de statistique descriptive


Dans ces conditions, leffectif n de la population se distribue dans un tableau crois 3 :

O ni,j reprsente leffectif qui appartient simultanment la catgorie Ai de la dimension X et la catgorie Bj de la dimension Y. Li reprsente la somme des effectifs appartenant la catgorie Ai de la dimension X. Cest donc une distribution conditionnelle (voir le chapitre 2). Cj reprsente la somme des effectifs de la catgorie Bj. Cest donc aussi une distribution conditionnelle.

Appel Contingency table en anglais et abusivement traduit en franais par lexpression Tableau de contingence

www.economie-cours.fr

Glossaire de statistique descriptive


Exemple : Sexe et prfrence pour un cours au sein dune filire conomie Soit le tableau ci-dessous, qui donne les rsultats dune enqute hypothtique effectue auprs de 400 tudiants, sur leurs prfrences en matire de cours. On leur a demand : Parmi ces 4 matires : HPE, Droit, Micro et Macro, laquelle prfrez-vous ? (Il tait interdit de rpondre : aucune ).

Dans cet exemple, le caractre Y est le sexe et comprend deux modalits ( H et F ). Le caractre X est la matire, qui comprend 4 modalits ( HPE , Droit Micro et Macro ). On remarquera que les catgories des caractres X et Y ne sont pas issues dun regroupement, mais quil sagit simplement des modalits brutes de chacun des deux caractres tudis. Pour savoir si le sexe a une influence significative sur le choix des matires, nous allons faire un test du khi-carr. On remarque que le droit et la micro sont davantage prfrs par la population masculine tandis que HPE et macro semblent ne pas tre prfrs plus par la population masculine que par la population fminine. Le test du khi carr va apporter une information supplmentaire. Il va permettre de dire si les diffrences de prfrences pour les diverses matires qui sont attribues au sexe sont le fait du hasard du tirage ou si elles sont relles. Elles peuvent en effet tre dues au hasard de lchantillon. Ce que le test va nous dire cest dans quelle mesure la diffrence est indpendante de lchantillon choisi (et donc se retrouverait en gnral si lon prenait nimporte quel autre chantillon). Pour cela on doit calculer lexpression suivante, que nous appellerons, faute dune expression plus approprie, le khi-carr calcul 4 :

Avec :

Une fois que lon connat le khi-carr calcul, il reste le comparer avec la valeur khi-carr issue de la distribution du khi-carr (voir le tableau ci-aprs).

Pour obtenir directement le khi-2 calcul, voir le calculateur en ligne (trs pratique pour vrifier ses rsultats) : http://www.seuret.com/biostat/chi.php

www.economie-cours.fr

Glossaire de statistique descriptive

www.economie-cours.fr

Glossaire de statistique descriptive


Pour trouver cette valeur dans le tableau, nous devons prendre en compte deux informations supplmentaires : Le nombre de degrs de libert qui se calcule ainsi : Degrs de libert = {(Nb de catgories [ou modalits ou valeurs] de X) 1} x {(Nb de catgories [ou modalits ou valeurs] de Y) 1} Ici, il y a 4 modalits pour X (les 4 matires) et 2 modalits pour Y (les deux sexes). Donc, le nombre de degrs de libert est gal : (4 - 1) x (2 1) = 3 x 1 = 3. Ensuite, nous devons choisir la probabilit de fiabilit du test : 5% de chances de se tromper, 1% ou 1 pour 1000. Nous allons choisir 5%, soit P = 0,05.

Nous avons donc 3 degrs de libert et une probabilit de fiabilit du test de P=0,05. Par consquent, nous voyons dans la table que le khi-carr thorique est gal :

Il nous reste maintenant comparer le khi carr thorique issu de la table (7,82) avec le khi-carr calcul (34,11 environ) :

La rgle est la suivante : Si le khi-carr calcul est infrieur au khi-carr thorique : indpendance Si le khi-carr calcul est suprieur au khi-carr thorique : dpendance

Etant donn que le chi-carr calcul est suprieur au khi carr thorique, nous pouvons conclure que le sexe a une influence sur le choix de la matire. Notre observation initiale sur la base de lchantillon est donc probablement vraie lextrieur de lchantillon (avec cependant 5% de chances de nous tromper).

www.economie-cours.fr

Glossaire de statistique descriptive


Degrs de libert

P=0,05

P=0,01

P=0,001

Degrs de libert

P=0,05

P=0,01

P=0,001

Source de la table : http://www.apprendre-en-ligne.net/random/tablekhi2.html

www.economie-cours.fr

Glossaire de statistique descriptive


Etapes du test dindpendance du khi-carr Pour rsumer, les principales tapes du test dindpendance du Khi-carr sont : 1) Si ce nest pas dj fait, distribuer la population statistique dans un tableau deux caractre o les modalits et/ou les valeurs sont regroupes par catgories. 2) Calculer le khi-carr dans lhypothse dindpendance des deux caractres :

3) Calculer le nombre de degrs de libert par la formule : (Nombre de lignes -1) x (Nombre de colonnes 1) 4) Dfinir une probabilit derreur (en pratique 5%, 1% ou 1 pour mille) 5) Utiliser le nombre de degrs de libert et la probabilit derreur pour dterminer le khi-carr thorique partir de la table fournie. 6) comparer la valeur khi-carr calcule avec la valeur khi-carre thorique (issue de la table) et appliquer la rgle suivante : Si le khi-carr calcul est infrieur au khi-carr thorique : indpendance Si le khi-carr calcul est suprieur au khi-carr thorique : dpendance Voir aussi : Estimation d'une fonction de demande par la mthode MCO Coefficient de dtermination Estimation d'une fonction de demande par la mthode MCO Estimation de la loi d'OKUN par la mthode MCO

www.economie-cours.fr

Vous aimerez peut-être aussi