Vous êtes sur la page 1sur 6

Hatim BENYOUSSEF

2007-2008

Les traitements lmentaires

Les analyses
bivaries
Hatim BENYOUSSEF

INTRODUCTION
Les analyses bivaries concernent le traitement de
deux variables
Elles ont pour objet de mettre en vidence les
relations ventuelles qui existent entre deux variables
analyses simultanment
Dans la plupart des cas, l analyste cherchera
expliquer une des deux variables (dite expliquer)
l aide de l autre (dite explicative)

ANALYSES BIVARIEES -- Hatim BENYOUSSEF

Analyse de donnes - Analyses bivariees

Hatim BENYOUSSEF

2007-2008

Exemples
Le fait de changer un conditionnement a-t-il un effet
sur le niveau des ventes d un produit donn? Le
conditionnement joue ici le rle de variable
explicative et le niveau des ventes, de variable
expliquer
Le fait de possder un four micro-ondes dpend-il
de l ge ou de la taille de la famille? La possession
ou non du four micro-ondes est la variable
expliquer, l ge ou la taille de la famille sont des
variables explicatives
ANALYSES BIVARIEES -- Hatim BENYOUSSEF

Traitement des tris croiss


et nature des donnes
1. Prsentation des tris croiss
 dans la mesure o une question peut relever fondamentalement
de trois niveaux de mesures diffrents (mtrique, nominale ou
ordinale), on comptera neuf types de croisements possibles entre
les questions Qi et Qj

2. Analyse des tris croiss


 les principaux tests correspondant aux plus frquents croisements
dans lanalyse bivarie seront prsents

ANALYSES BIVARIEES -- Hatim BENYOUSSEF

Analyse de donnes - Analyses bivariees

Hatim BENYOUSSEF

2007-2008

Prsentation des tris


croiss
Qi quantitatif x Qj quantitatif : tude des relations entre
deux sries de n chiffres sil y a n questionnaires
 Exemple : dans le questionnaire FAT, tude des relations
entre le nombre de vols effectus (Q1) et la taille de
lentreprise (Q11)

Qi nominal x Qj nominal : croisement le plus frquent


qui se traduit par la formation dun tableau de
contingence o, en ligne figure les modalits de la
variable expliquer et en colonnes celles de la variable
explicative
Exemple : croisement entre la question 5 sur lobjet du
voyage et la question 6: le fait de voyager pour affaires
ou pour raisons de loisirs implique-t-elle un statut
d abonn ou non
ANALYSES BIVARIEES -- Hatim BENYOUSSEF

Prsentation des tris


croiss
Qi ordinal x Qj ordinal : mise en correspondance de deux
classements au niveau de chaque niveau interrog ou sur
lensemble de lchantillon
 Exemple : croisement entre la question 4 et un classement a
priori correspondant aux prfrences de la direction de la
compagnie

Qi quantitatif x Qj nominal : correspondant un tri--plat


de la variable quantitative pour chacune des modalits de
la variable nominale qui joue le rle de variable explicative
 Exemple : croisement entre la question 1 et la question 9 :
lappartenance une classe dge influence-t-elle le nombre
annuel de vols de la personne interroge
ANALYSES BIVARIEES -- Hatim BENYOUSSEF

Analyse de donnes - Analyses bivariees

Hatim BENYOUSSEF

2007-2008

Prsentation des tris


croiss
Qi ordinal x Qj nominal : reprage des rangs donns la
question Qi pour diffrents classes de la question Qj
nominale explicative
 Exemple : croisement entre la question 4 et la question 8 : le
fait de relever dun statut familial donn entrane-t-il des
prfrences particulires au sujet des projets damliorations
des prestations de la compagnie?

ANALYSES BIVARIEES -- Hatim BENYOUSSEF

Analyse des tris croiss


Qi Nominal

Ordinal

Quantitatif

Qj
Nominal
Ordinal

Test du Khi-Deux
Test de KolgomorovSmirnov
Test de comparaison
de frquences

Test de Kruskal-Wallis Test F (ANOVA)


Test de Wilcoxon du
rang et du signe
Test de comparaison
Test de Wilcoxon de la de moyennes
somme des rangs
Corrlation des rangs
de Spearman
Test de Kendall

Quantitatif

Coefficient de
corrlation de Pearson
Test de comparaison
de moyennes

ANALYSES BIVARIEES -- Hatim BENYOUSSEF

Analyse de donnes - Analyses bivariees

Hatim BENYOUSSEF

2007-2008

Le test de comparaison
des moyennes

C est la statistique classique lorsque deux populations sont concernes.


Lanalyste dispose des donnes suivantes :
deux populations A et B respectivement d effectifs NA et NB
la moyenne de la variable tudie est X A dans la population A et X B
dans la population B
la variance de la variable analyse est sA pour A et sB pour B

Dans la mesure o lon estime que XA et XB suivent une loi normale,


respectivement de moyenne A et B et dcart-type A et B, on montre que
la diffrence D = X A X B suit galement une loi normale de moyenne (A B) et dcart-type D avec :
D = [
A / NA + B / NB]1/2 [sA / NA + sB / NB]1/2

ANALYSES BIVARIEES -- Hatim BENYOUSSEF

Le test de comparaison
des moyennes

Lintervalle de confiance de la diffrence de moyenne est donn par :


A - B = X A - X B z/2. [sA/ N A + sB/ NB]1/2

Lhypothse nulle Ho correspond au cas o la diffrence D = A - B


des moyennes est nulle. Sous Ho la variable rduite devient :
z = ( X A - X B ) / [sA / N A + sB / NB]1/2

La valeur z ainsi calcule doit tre compare avec la valeur lue dans
la table normale pour le seuil de confiance dsir et compte tenu du
caractre unilatral ou bilatral du test

Pour un test bilatral par exemple, Ho sera rejet au seuil de


confiance de 5% si |z| > 1,96. Pour des petits chantillons (NA et NB
< 30), on utilisera le test t de Student

Quand plus de deux populations sont concernes, on aura recours


au test F de Fischer (ce test sera abord dans la partie traitant de
lANOVA)
ANALYSES BIVARIEES -- Hatim BENYOUSSEF

Analyse de donnes - Analyses bivariees

10

Hatim BENYOUSSEF

2007-2008

Exemple
Dans le cadre de ltude FAT, le croisement de la
question 1 (nombre de vols par an) et de la
question 5 (motifs du voyage) fait apparatre les
rsultats suivants :
voyages pour affaires (A) : NA = 155 ; nombre de vols moyens
X A = 10 avec sA = 64
voyages pour loisirs (B) : NB = 75 ; X B = 3 avec sB = 25

Testez si le motif du dplacement entrane des


diffrences de nombres de vols au seuil de
confiance de 5%
ANALYSES BIVARIEES -- Hatim BENYOUSSEF

11

Rponse
Ho : quelque soit le motif du dplacement, le nombre moyen de vols
est le mme
ou Ho : A = B
Lcart-type des diffrences de moyenne D est donn par :
D = [sA / NA + sB / NB]1/2
Donc D = [64 / 155 + 25 / 75]1/2 = 0,86
Sous Ho, z = ( X A -X B ) / D
donc z = (10 - 3) / 0,86 = 8,14
Lhypothse nulle pour laquelle il nexiste pas de diffrence de nombre
de vols selon le motif de dplacement peut tre rejete puisque
8,14 > 1,96.
Conclusion : au seuil de confiance de 5%, le motif du dplacement
influence significativement le nombre de vols.
ANALYSES BIVARIEES -- Hatim BENYOUSSEF

Analyse de donnes - Analyses bivariees

12