Académique Documents
Professionnel Documents
Culture Documents
2017 ANOVA
à 1 facteur
Analyse de variance
( One-way ANOVA)
variable indépendante
ANOVA variable dépendante
GROUPE 1
GROUPE 2
GROUPE 3 Y
GROUPE… (Quantitative)
X
(Qualitative, catégorielle)
HYPOTHESES
L’hypothèse nulle
H0: µ1 = µ2 = µ3 =µ...
Les moyennes de la population sont égales.
L’hypothèse alternative
H1: µ1 ≠ µ2 ≠ µ3 ≠
µ…
Au moins une moyenne est différente . C’est-à-dire
qu’au moins une moyenne n’est pas égale aux autres .
La variable dépendante est une variable numérique ou
quantitative. La variable indépendante est appelée aussi
facteur. C’est une variable catégorielle ( discrète, qualitative
or nominale). Exemple le sexe, statut professionnel. On utilise
l’ANOVA quand notre test d’analyse comporte plus de 2 groupes
(variable indépendante ) et que la variable dépendante est
quantitative.
En termes plus simples, ANOVA vise à comparer des
moyennes sur plusieurs échantillons afin de déterminer s'il
existe des preuves que les moyennes des échantillons
associées sont significativement différentes. ANOVA est un test
paramétrique ( la moyenne, l’écart-type)
Conditions d’utilisation
• Les groupes sont indépendants et aléatoirement tirés de leur population
respective (il n’y a ni relation entre les observations à l’intérieur d’un groupe, ni relation entre
les observations entre les groupes).
• Il n'y a pas de relation entre les sujets ou mesures de chaque échantillon. Cela
signifie que les sujets ou les mesures du 1er échantillon ne peuvent pas être aussi
dans le 2ème échantillon ou le 3ème et ainsi de suite.
• Les échantillons doivent suivent une loi normale ( une normalité parfaite n’est exigée)
• Si les échantillons sont modérés ou de grande taille, une violation de la normalité
peut donner des valeurs de signification assez précises.
• Les données de la variable dépendante présentent des variances
identiques (recours au test de Levene surtout si le la taille des groupes n’est pas
identique). Si le test est significatif sig. < 0,05 , on doit faire, donc, appel au test
Brown-Forsythe ou le Welch Robust F..
• Lorsque la normalité, l’homogénéité des variances ne sont pas respectées, on
peut utiliser le test non paramétrique de Kruskal-Wallis.
QU’EST CE QUE L’ANOVA PEUT
NOUS DIRE
Le rejet de H0 signifie qu’il y a une grande
probabilité qu’au moins il y a une différence entre
les groupes. L’analyse Post Hoc est nécessaire pour
nous indiquer ou se situe la différence entre la ou
les moyens.
Exemple 1
Variable indépendante (qualitative):
Niveau social (à 3 niveaux)
Classe supérieure
Classe moyenne
Classe inférieure
Variable dépendante ( quantitative)
Satisfaction des services hôteliers
Exemple 2
Variable indépendante (qualitative):
le niveau de formation
BEM
BAC
Ingénieur
Variable dépendante ( quantitative)
Le salaire
Identification le facteur (la variable indépendante ) et on
sélectionne les données
Test de normalité
Test d’homogénéité des variances (homoscédasticité)
ANOVA
On pose les hypothèses:
Question de recherche
Existe-il de différence dans les salaires des métiers de
menuisier, plombier et électricien dans l’exercice de leur
fonction ?
H0 H1
L’hypothèse nulle
L’hypothèse alternative
les moyennes des salaires des différents Au moins une moyenne des salaires des
métiers sont égales.
différents métiers n’est pas égale aux
autres.
Ici, nous avons 3 niveaux (ou groupes)
µ1 ≠ µ2 ≠ µ3
Plombier ------ µ1
Menuisier ------ µ1
Ou µ1 ≠ µ2
Electricien ---- µ3 Ou µ2 ≠ µ3
µ1 = µ2 = µ3 Ou µ1 ≠ µ3
Affichage des données
Cocher
Turkey pour les comparaisons multiples
Niveau de signification : 0.05
Puis « Poursuivre » et OK
TRAITEMENT ET INTERPRÉTATION 1
On obtient le résumé des actions et 6 tableaux
Si l’hypothèse de l’homogénéité
des variances est confirmée alors
les tests de Welch et Brown-
Forsythe deviennent inutiles, on
passe donc directement au tableau
ANOVA .
Tableau ANOVA 3
Un autre moyen pour comparer les moyennes est l’utilisation du diagramme des moyennes.
Il nous donne une idée très claire sur la différence des moyennes des salaires. Cependant,
il ne faut pas se fier à ce graphe avant de consulter d’abord, le tableau des statistiques
descriptives, puis la comparaison des moyens,
Ceci fait, nous pouvons dire que la salaire moyenne du métier d’électricien est le plus élevé
alors que celui du plombier est le moins rémunérant.
TAILLE D’EFFET (EFFECT SIZE)
6
Une taille d'effet est une mesure de la force
de l'effet observé d'une variable sur une autre
Dans le cadre de l'ANOVA, les conventions
de grandeurs de la taille de l'effet f sont
f=0,1, l'effet est faible.
• f=0,25, l'effet est modéré.
• f=0,4, l'effet est fort.
• Dans notre cas, taille d’effet=0.6, donc
c’est un effet fort.
Taille d’effet =Somme des carrés ( Inter-groupes) / Total
(voir tableau ANOVA)
RÉSULTATS FINAUX
Il est important de présenter certains résultats dans le rapport scientifique à soumettre pour une éventuelle
évaluation.
A l’issue de cette analyse ANOVA à 1 facteur, nous pouvons dire que l’hypothèse
nulle «les moyennes des salaires des différents métiers sont égales » est rejetée.
Donc, l’hypothèse alternative est retenue “la différence entre les moyennes des
salaires est significative”:
F(2,27)=21.00, p=0.000
La différence entre les moyennes des salaire est forte selon la convention de
Cohen (1988) au sujet de l’interprétation de la taille d’effet: taille d’effet=0.6.
La variable indépendante est à trois niveaux:
ANOVA à 1 facteur
2017