Vous êtes sur la page 1sur 12

LES

TRAITEMENTS
ÉLÉMENTAIRES
Les analyses bivariées

Hatim BENYOUSSEF
INTRODUCTION
◦ Les analyses bivariées concernent le traitement simultané de
deux variables
◦ Elles ont pour objet de mettre en évidence les relations
éventuelles qui existent entre deux variables analysées
simultanément
◦ Dans la plupart des cas, l’analyste cherchera à expliquer une
des deux variables (dite «à expliquer») à l’aide de l’autre
(dite «explicative»)
Exemples
◦ Le fait de changer un conditionnement a-t-il un effet sur le
niveau des ventes d ’un produit donné? Le
conditionnement joue ici le rôle de variable explicative et
le niveau des ventes, de variable à expliquer
◦ Le fait de posséder un four à micro-ondes dépend-il de
l’âge ou de la taille de la famille? La possession ou non du
four à micro-ondes est la variable à expliquer, l’âge ou la
taille de la famille sont des variables explicatives
Traitement des tris croisés et nature
des données
1. Présentation des tris croisés
 dans la mesure où une question peut relever
fondamentalement de trois niveaux de mesures différents
(métrique, nominale ou ordinale), on comptera neuf types
de croisements possibles entre les questions Qi et Qj

2. Analyse des tris croisés


 les principaux tests correspondant aux plus fréquents
croisements dans l’analyse bivariée seront présentés
Présentation des tris croisés
◦ Qi quantitatif x Qj quantitatif : étude des relations entre deux
séries de n chiffres s’il y a n questionnaires
 Exemple : dans le questionnaire FAT, étude des relations entre le nombre de vols effectués (Q1) et
la taille de l’entreprise (Q11)

◦ Qi nominal x Qj nominal : croisement le plus fréquent qui se


traduit par la formation d’un tableau de contingence où, en ligne
figure les modalités de la variable à expliquer et en colonnes
celles de la variable explicative
Exemple : croisement entre la question 5 sur l’objet du voyage et
la question 6: le fait de voyager pour affaires ou pour raisons de
loisirs implique-t-elle un statut d ’abonné ou non
Présentation des tris croisés
◦ Qi ordinal x Qj ordinal : mise en correspondance de deux
classements au niveau de chaque niveau interrogé ou sur
l’ensemble de l’échantillon
 Exemple : croisement entre la question 4 et un classement a priori correspondant aux préférences de
la direction de la compagnie

◦ Qi quantitatif x Qj nominal : correspondant à un tri-à-plat de la


variable quantitative pour chacune des modalités de la variable
nominale qui joue le rôle de variable explicative
 Exemple : croisement entre la question 1 et la question 9 : l’appartenance à une classe d’âge
influence-t-elle le nombre annuel de vols de la personne interrogée
Présentation des tris croisés
◦ Qi ordinal x Qj nominal : repérage des rangs donnés à la question
Qi pour différentes classes de la question Qj nominale explicative
 Exemple : croisement entre la question 4 et la question 8 : le fait de relever d’un statut familial donné
entraîne-t-il des préférences particulières au sujet des projets d’améliorations des prestations de la
compagnie?
Analyse des tris croisés

Qi (à expl.) Nominal Ordinal Quantitatif


Qj (expl.)
Test du Khi-Deux Test de Kruskal-Wallis Test F (ANOVA)
Nominal Test de Kolgomorov- Test de Wilcoxon du
Smirnov rang et du signe Test de comparaison
Test de comparaison Test de Wilcoxon de la de moyennes
de fréquences somme des rangs
Corrélation des rangs
Ordinal de Spearman

Test de Kendall
Coefficient de
Quantitatif corrélation de Pearson

Test de comparaison
de moyennes
Le test de comparaison des
moyennes
◦ C ’est la statistique classique lorsque deux populations sont concernées. L’analyste
dispose des données suivantes :
◦ deux populations A et B respectivement d ’effectifs nA et nB
◦ la moyenne de la variable étudiée est dans la population A et dans la
population B
◦ la variance de la variable analysée est sA² pour A et sB² pour B

◦ Dans la mesure où l’on estime que XA et XB suivent une loi normale, respectivement
de moyenne A et B et d’écart-type A et B, on montre que la différence
suit également une loi normale de moyenne (A - B) et d’écart-type D avec :

D = [A² / NA + B² / NB]1/2  [sA² / nA + sB² / nB]1/2


Le test de comparaison des
moyennes
◦ L’intervalle de confiance de la différence de moyenne est donné par :  -  =
A B -
 z/2. [sA²/ nA + sB²/ nB]1/2

◦ L’hypothèse nulle Ho correspond au cas où la différence D = A - B des moyennes est


nulle. Sous Ho la variable réduite devient :
z=( - ) / [sA² / nA + sB² / nB]1/2

◦ La valeur z ainsi calculée doit être comparée avec la valeur lue dans la table normale
pour le seuil de confiance désiré et compte tenu du caractère unilatéral ou bilatéral du
test

◦ Pour un test bilatéral par exemple, Ho sera rejeté au seuil de confiance de 5% si |z| >
1,96. Pour des petits échantillons (nA et nB < 30), on utilisera le test t de Student

◦ Quand plus de deux populations sont concernées, on aura recours au test F de Fischer
(ce test sera abordé dans la partie traitant de l’ANOVA)
Exemple
Dans le cadre de l’étude FAT, le croisement de la question 1 (nombre de vols par an) et
de la question 5 (motifs du voyage) fait apparaître les résultats suivants :
◦ voyages pour affaires (A) : nA = 155 ; nombre de vols moyens = 10 avec sA² = 64
◦ voyages pour loisirs (B) : nB = 75 ; = 3 avec sB² = 25

Testez si le motif du déplacement entraîne des différences


de nombres de vols au seuil de 5%
Réponse
Ho : « quelque soit le motif du déplacement, le nombre moyen de vols est le même »
ou Ho : A = B
L’écart-type des différences de moyenne D est donné par : D = [sA² /
nA + sB² / nB]1/2
Donc D = [64 / 155 + 25 / 75]1/2 = 0,86
Sous Ho, z = ( - ) / D
donc z = (10 - 3) / 0,86 = 8,14
L’hypothèse nulle pour laquelle il n’existe pas de différence de nombre de vols selon
le motif de déplacement peut être rejetée puisque 8,14 > 1,96.
Conclusion : au seuil de 5%, le motif du déplacement influence significativement le
nombre de vols.

Vous aimerez peut-être aussi