ANOVA

Non : HADDAD
Prénom : HAJAR
CNE : 1412526471
Master : Système d’information d’aide à la décision en
management.
Statistique appliquée
Les ANALYSES DE VARIANCE ou ANOVA
Définition et démarche générale

Les analyses de variance ou analyses factorielles sont des techniques permettant de
savoir si une ou plusieurs variables dépendantes (appelées aussi variables
endogènes ou variables à expliquer) disposées dans différentes lignes d’un tableau
sont en relation avec une ou plusieurs variables dites indépendantes (ou variables
exogènes ou variables explicatives) disposées dans différentes colonnes d’un
tableau.
Rappel : qu’est-ce que la variance :
C’est la somme des carrés des écarts par rapport à la moyenne / nombre de degrés de
liberté = SCE/ddl (ceci lorsque le nombre d’individus composant l’échantillon est
réduit ; sinon, utiliser N’=N). La variance est le carré de l’écart-type.
La variance d’un échantillon peut se calculer manuellement, ou à l’aide d’Excel
Avec une seule variable dépendante (à expliquer), et une ou plusieurs variables

explicatives discrètes (dites aussi catégorielles, qualitatives, nominales, de
classification = ne pouvant donc prendre qu'un nombre limité de valeurs
comme le sexe, la catégorie socio-professionnelle, etc...) on utilise l'analyse de
variance. On appelle facteurs les variables explicatives. L'analyse consiste à
tester si les différences de variation dans chaque groupe (ou échantillon)
défini par les modalités des variables explicatives s'écartent de manière
significative de la valeur 0.
Analyse de variance: un facteur
L'analyse de variance à un facteur (one-way analysis of variance) va consister à
chercher le rapport entre la variance entre les groupes (V. inter-groupe) et la
variance à l'intérieur des groupes (V. intra-groupe).
1. Manuellement, on calcule :
a) la variance totale par rapport à la moyenne globale des n mesures ;
b) la variance intra-groupes (celle qui n'est pas liée aux conditions

expérimentales).
2. Par différence [a-b] on obtient la variance inter-groupes (qui est liée aux
différences de conditions expérimentales).
Variance totale = Variance inter-groupe + Variance

intra-groupe
[SCE à la moyenne générale] = [SCE factorielle] + [SCE résiduelle]
=
3. On calcule le rapport :
F = variance inter-groupes/variance intra-groupes ou résidu.
[Attention : ce F n’a rien à voir avec le F du test de vérification de l’homogénéité

des variances]
Solution manuelle
On veut savoir si la quantité de nitrates varie d'une station à l'autre le long d'une
rivière. Pour cela, on prélève en 10 points (n=10) chaque fois une certaine quantité
d'eau dans 3 stations différentes (k=3).
Nitrates Station 1 Station 2 Station 3

50,00 162,00 120,00
52,00 350,00 120,00 n
123,00 125,00 122,00 10
100,00 320,00 221,00
200,00 112,00 253,00
250,00 200,00 141,00
220,00 40,00 182,00 k
220,00 162,00 175,00 3
300,00 160,00 160,00
220,00 250,00 214,00
T1 T2 T3 total : G
sommes 1735,00 1881,00 1708,00 5324,00
moyennes 173,50 188,10 170,80 177,47
 (x2) 368033,00 +435257,00 +311560,00 =
1114850,00
Somme des carrés des écarts (SCE) entre traitements (inter- 1732,47
groupe) = ou =(moyjmoyXn
Sommes des carrés des écarts (SCE) expérimentales (erreur 168285
exp) ou résidu (intra-groupe)  - ou = X-

moyT)2)
erreur = 67010,50 81440,90 19833,60 168285,00
Somme totale des carrés des écarts = -

170017,47
ou (X-moyX)2
D’où :
Variance inter-groupes = SCE inter-groupes/ddl = 1732,47/2 = 866,23
Variance intra-groupes = SCE intra-groupes/ddl = 168285/27 = 6232,78
Calcul de F = Variance inter-groupes / Variance intra-groupes = 0,14
Solution avec Excel :

Cet outil effectue une analyse simple de variance sur les données de plusieurs
échantillons. L'analyse teste l'hypothèse selon laquelle chaque échantillon provient de
la même distribution de probabilité sous-jacente par rapport à l'hypothèse contraire
selon laquelle les distributions de probabilité ne sont pas les mêmes pour les
échantillons
Analyse de variance : Boîte de dialogue un facteur
Plage d’entrée Tapez la référence des cellules de la plage de données que vous
souhaitez analyser. Cette référence doit être constituée de deux ou plusieurs plages
adjacentes de données disposées en colonnes ou lignes.
Groupées par Pour indiquer si les données contenues dans la plage d’entrée sont
disposées dans des lignes ou des colonnes, cliquez sur Lignes ou Colonnes.
Intitulés en première ligne/Intitulés en première colonne Si la première ligne

de votre plage d’entrée contient des étiquettes, activez la case à cocher Intitulés en
première ligne. Si les étiquettes se trouvent dans la première colonne de votre plage
d’entrée, activez la case à cocher Intitulés en première colonne. Cette case à cocher
est désactivée si la plage d’entrée n’a aucune étiquette. Microsoft Office Excel génère
les étiquettes de données appropriées pour la table de sortie.
Seuil de signification Entrez le seuil à partir duquel calculer les valeurs critiques
du test f. Le seuil de signification est lié à la probabilité que puisse être commise une
erreur de type I (c’est-à-dire le risque pris de rejeter une hypothèse vraie).
Plage de sortie Tapez la référence de la cellule supérieure gauche de la table de

résultats. Excel détermine automatiquement la taille de la zone de résultats et affiche
un message si cette table risque de remplacer des données existantes ou de s’étendre
au-delà des limites de la feuille de calcul.
Insérer une nouvelle feuille Sélectionnez cette option pour insérer une nouvelle
feuille de calcul dans le classeur en cours et coller les résultats à partir de la cellule A1
de la nouvelle feuille de calcul. Pour attribuer un nom à cette nouvelle feuille de
calcul, tapez un nom dans la zone.
Créer un nouveau classeur Cliquez sur cette option pour créer un classeur et
coller les résultats dans une nouvelle feuille de calcul du nouveau classeur.
Exemple 1:
Analyse de variance à un facteur ANOVA :

On veut savoir si la quantité de nitrates varie d'une station à l'autre le long d'une
rivière. Pour cela, on prélève en 10 points (n=10) chaque fois une certaine quantité
d'eau dans 3 stations différentes (k=3).
Station 1 Station 2 Station 2

50 162 120
52 350 120
123 125 122
100 320 221
200 112 253
250 200 141
220 40 182
220 162 175
300 160 160
220 250 214
ANALYSE DE VARIANCE
Degré de Moyenne des
Source des variations Somme des carrés liberté carrés F Probabilité Valeur critique pour F
Entre Groupes 1732,466667 2 866,2333333 0,138980301 0,870863715 3,354130829
A l'intérieur des groupes 168285 27 6232,777778
Total 170017,4667 29
Conclusion du test statistique : La valeur de P étant largement supérieure au seuil

de signification 0,05, on conserve donc l’hypothèse nulle (pas de différence
significative entre les échantillons).
Conclusion de l’expérience : pour cette série de mesures, on peut donc conclure

que les taux de nitrates des trois stations ne diffèrent pas significativement ou que
ces 3 stations ne diffèrent pas significativement par leur taux de nitrates avec un
seuil de signification (risque d’erreur) de 5%.
Exemple 2:
Exemple : un chercheur veut savoir si la musique peut jouer sur l’apprentissage… Pour cela, notre chercheur
fait apprendre des listes de mots à 4 groupes d’étudiants qui entendent des styles de musiques nettement
différents : de l’opéra, du flamenco, du piano classique, et du free-jazz…On note le nombre de mots mémorisés
après apprentissage…
opéra flamenco piano jazz

13 15 12 16
15 12 13 12
13 12 10 13
14 15 12 14
15 14 14 10
10 11 12 11
16 15 16 15
14 15 15 12
15 14 12 12
13 15 16
14 17
Procédure : dans « Utilitaire d’analyse », cliquez « analyse de variance : un facteur », et comparez

(en précisant colonnes, ou lignes) ces résultats en faisant OK.
Résultats : on trouve sur Excel ce tableau :
Analyse de variance: un facteur
RAPPORT DÉTAILLÉ
Groupes Nombre d'échantillons Somme Moyenne Variance
Colonne 1 11 152 13,8181818 2,56363636
Colonne 2 10 138 13,8 2,4

Colonne 3 9 116 12,8888889 3,36111111
Colonne 4 11 148 13,4545455 5,27272727
ANALYSE DE VARIANCE
Source des variations Somme des carrés Degré de liberté Moyenne des carrés F Probabilité
Entre Groupes 5,39137719 3 1,79712573 0,52418075 0,66836743
A l'intérieur des groupes 126,852525 37 3,42844663
Total 132,243902 40
Vous constatez que dans notre expérience, la musique ne semble pas affecter l’apprentissage,
car les moyennes sont très proches, et l’analyse de variance (F=0,524) n’est pas
significative…(p = .669)
Explication et calcul de cette analyse de la variance entre groupes, pour un facteur :
F = MC « entre » / MC « inter » : soit le rapport entre la moyenne des carrés entre les groupes, et la
moyenne des carrés à l’intérieur des groupes
Moyenne des carrés « entre groupes » = (somme des carrés / degré de liberté) entre les
groupes
Moyenne des carrés « à l’intérieur » = (somme des carrés / degré de liberté) à l’intérieur des groupes
Analyse de variance: deux facteurs avec répétition d'expérience
Cet outil d'analyse est utile lorsque les données peuvent être classées selon deux
dimensions différentes. On peut travailler sur des données non regroupées et
classées.
ANOVA : Deux facteurs avec la boîte de dialogue réplication
Lignes par échantillon Tapez le nombre de lignes contenues dans chaque

échantillon. Chaque échantillon doit contenir le même nombre de lignes, dans la
mesure où chaque ligne représente une réplication des données.

résultats. Microsoft Office Excel détermine automatiquement la taille de la zone de
résultats et affiche un message si cette table risque de remplacer des données
existantes ou de s’étendre au-delà des limites de la feuille de calcul.
Exemple :
36 futurs policiers, hommes ou femmes, ont tous passé des tests psychologiques avant de
commencer leur stage. Après le première semaine d’effort, ils doivent décider s’ils arrêtent ou
continuent leur stage. Exactement la moitié du groupe (hommes et femmes) décident d’arrêt.
Nous avons donc 4 groupes équilibrés de 9 personnes, et le psychologue veut savoir si la décision
est liée : 1er : au sexe, 2ème : à l’anxiété (en utilisant les résultats du test d’anxiété).
arrêt poursuite
hommes 12 19
19 18
25 15
21 18
18 17
22 15
12 14
20 17
18 14
femmes 21 21
20 12
14 14
15 16
21 14
21 10
18 15
20 10
18 8
ANALYSE DE VARIANCE
Somme des Degré de
Source des variations carrés liberté Moyenne des carrés F Probabilité Valeur critique pour F
Échantillon 18,77777778 1 18,77777778 1,69636136 0,20206088 4,149097409
Colonnes 128,4444444 1 128,4444444 11,6035132 0,0017919 4,149097409
Interaction 21,77777778 1 21,77777778 1,96737767 0,17035434 4,149097409
A l'intérieur du groupe 354,2222222 32 11,06944444
Total 523,2222222 35
 Somme des carrés par échantillon :
=SOMME.CARRES.ECARTS (plage)-SOMME.CARRES.ECARTS (échantillon d’arrêt

par hommes)-SOMME.CARRES.ECARTS (échantillon d’arrêt par femmes).
 Somme des carrés par colonnes :
=SOMME.CARRES.ECARTS (plage)-SOMME.CARRES.ECARTS (échantillon

d’arrêt)-SOMME.CARRES.ECARTS (échantillon de poursuite).
 Somme des carrés par interaction :
=SOMME.CARRES.ECARTS (plage)-SOMME.CARRES.ECARTS (échantillon d’arrêt

par hommes; échantillon de poursuite par femmes)-SOMME.CARRES.ECARTS
(échantillon de poursuite par hommes; échantillon d’arrêt par femmes)
 Somme des carrés à l'intérieur du groupe :
=SOMME.CARRES.ECARTS (échantillon d’arrêt par hommes)

+SOMME.CARRES.ECARTS (échantillon d’arrêt par femmes)
+SOMME.CARRES.ECARTS (échantillon de poursuite par hommes)
+SOMME.CARRES.ECARTS (échantillon de poursuite par femmes)
 Somme des carrés TOTAL :
=SOMME.CARRES.ECARTS ( Total des échantillons)

 Degré de liberté par échantillon :
=NBVAL (première ligne)-1
 Degré de liberté par colonnes :
=NBVAL(deuxième ligne)-1
 Degré de liberté par interaction :
=Degré de liberté par échantillon * Degré de liberté par colonnes
 Degré de liberté à l’intérieur du groupe :
=degré de liberté total- Degré de liberté par échantillon - Degré de liberté par
colonnes - Degré de liberté par interaction
 Degré de liberté total :
=NB (Total des échantillons)-1
 Moyenne des carrés par échantillon :
=SCE par échantillon / ddl
 Moyenne des carrés par colonnes :
=SCE par colonnes / ddl
 Moyenne des carrés par interaction :
= SCE par interaction / ddl
 Moyenne des carrés à l’intérieur du groupe :
=SCE à l’intérieur du groupe / ddl
 Calcul de F par échantillon :
= Variance par échantillon/ variance à l’intérieur du groupe
 Calcul de F par colonnes :

= Variance par colonnes / variance à l’intérieur du groupe
 Calcul de F par interaction
= Variance par interaction / variance à l’intérieur du groupe
 Calcul de probabilité par échantillon :
=LOI.F( Fisher par échantillon ; ddl par échantillon ; ddl total)
 Calcul de probabilité par colonnes :
= LOI.F( Fisher par colonnes ; ddl par colonnes ; ddl total)
 Calcul de probabilité par interaction :
= LOI.F( Fisher par interaction; ddl par interaction ; ddl total)
 Valeur critique pour F :
= INVERSE.LOI.F( seuil de signification ; ddl ; ddl à l’intérieur de groupe)
Conclusion du test statistique Dans cet exemple, on constate donc que le facteur
« décision » est dépendant au niveau d’anxiété. Par contre les autres facteurs
ne sont pas significatifs : il n’y a pas de différence entre les deux sexes…
En général : calcul mathématique.

Trois tests F sont proposées dans ce cas : le F de l’effet principal du facteur A
(ici, le facteur « sexe »), le F de l’effet principal du facteur B (facteur
« décision »), et le F de l’interaction A x B.
FA = MC « A » / MC « intérieur »
FB = MC « B » / MC « intérieur »
FAxB = MC « A x B » / MC « intérieur »
Avec Moyenne de carrés « intérieur » = (somme des carrés / degré de liberté)

des variations à l’intérieur du groupe. Notons que sous Excel, les 3 moyennes
de carrés MC « A », MC « B » et MC « A x B » sont appelés respectivement
« échantillon », « colonnes », et « interaction »
Analyse de variance: deux facteurs sans répétition d'expérience :
Cet outil d'analyse est utile lorsque les données peuvent être organisées en lignes
(ou en colonnes) ou bien les mesures de chaque facteur peuvent être croisées dans
un tableau :
ANOVA : Deux facteurs sans boîte de dialogue réplication
Intitulé présent Cette case à cocher est désactivée si votre plage d’entrée n’a
aucune étiquette. Microsoft Office Excel génère les étiquettes de données
appropriées pour la table de sortie.

résultats. Excel détermine automatiquement la taille de la zone de résultats et affiche
un message si cette table risque de remplacer des données existantes ou de s’étendre
au-delà des limites de la feuille de calcul.
Exemple :
11 sujets ont des troubles du sommeil importants, et acceptent de tester 3
traitements pharmacologiques différents. Chaque individu va utiliser un
médicament durant une semaine. On comptabilise le nombre d’heures de
sommeil, par nuit :
sujets Médicament 1 Médicament 2 Médicament 3
1 2 0 3
2 4 1 4
3 2 1 3
4 2 2 4
5 1 0 1
6 3 2 5
7 4 2 11
8 4 2 10
9 10 3 9
10 8 6 14
11 2 2 5
Procédure : dans « Utilitaire d’analyse », cliquez «analyse de variance : deux
facteurs, sans répétition d’expérience », et comparez…
Tableau affiché :
Analyse de variance: deux facteurs sans répétition d'expérience
RAPPORT Nombre
DÉTAILLÉ d'échantillons Somme Moyenne Variance
1,6666666
Ligne 1 4 6 1,5 7
Ligne 2 4 11 2,75 2,25
0,9166666
Ligne 3 4 9 2,25 7
1,3333333
Ligne 4 4 12 3 3
4,9166666
Ligne 5 4 7 1,75 7
3,3333333
Ligne 6 4 16 4 3
15,333333
Ligne 7 4 24 6 3
13,333333
Ligne 8 4 24 6 3
Ligne 9 4 31 7,75 10,25
11,666666
Ligne 10 4 38 9,5 7
Ligne 11 4 20 5 18
Colonne 1 11 66 6 11
7,7636363
Colonne 2 11 42 3,81818182 6
2,6909090
Colonne 3 11 21 1,90909091 9
16,618181
Colonne 4 11 69 6,27272727 8
ANALYSE DE VARIANCE
Source des Degré deMoyenne des Valeur critique pour

variations Somme des carrés liberté carrés F Probabilité F
7,3152709
Lignes 270 10 27 4 9,8046E-06 2,16457963
12,487684
Colonnes 138,272727 3 46,0909091 7 1,7977E-05 2,92227753
Erreur 110,727273 30 3,69090909
Total 519 43
Conclusion du test statistique Vous constatez qu’il y a bien une différences entre
les 3 médicaments et le F et très significatif (12,48)… (et à mon avis, le
médicament 2 était probablement un placebo !)
En général : calcul mathématique.

F= MC « traitement » / MC « erreur »
Dans cette situation « pairée », il y a trois calculs de sommes des carrés : la SC

« sujets »(= « lignes »), la SC « traitements » (= « colonnes »), et la SC
« interactions » (= « erreurs » dans l’interaction sujets x traitements)
Moyenne des carrés « traitement » = (somme des carrés / degré de liberté) des
traitements
Moyenne des carrés « erreur » = (somme des carrés / degré de liberté) des
erreurs
Analyse de corrélation :
Les fonctions de feuille de calcul COEFFICIENT.CORRELATION et PEARSON servent

toutes les deux à calculer le coefficient de corrélation entre deux variables de mesure
lorsque les mesures pour chaque variable sont observées pour chaque sujet N (les
sujets pour lesquels il manque une observation sont ignorés dans l'analyse). L'outil
d'analyse Corrélation est particulièrement utile lorsqu'il y a plus de deux variables de
mesure pour chacun des sujets N. Il fournit une table de sortie, une matrice de
corrélation, affichant la valeur de COEFFICIENT.CORRELATION (ou PEARSON)
appliquée à chaque paire possible de variables de mesure.
Le coefficient de corrélation, comme la covariance, permet de savoir dans quelle

mesure deux variables numériques « varient ensemble ». Contrairement à la
covariance, le coefficient de corrélation est échelonné de façon à ce que sa valeur ne
soit pas dépendante des unités dans lesquelles sont exprimées les deux variables
numériques. (Prenons l’exemple de deux variables numériques qui sont le poids et la
hauteur. La valeur du coefficient de corrélation ne change pas si le poids exprimé en
livres est converti en kilogrammes.) La valeur du coefficient de corrélation doit être
comprise entre -1 et +1 inclus.
Vous pouvez utiliser l’outil d’analyse de corrélation pour étudier chaque paire de
variables numériques et déterminer si elles corrèlent — c’est-à-dire, si les valeurs
élevées d’une variable ont tendance à suivre les valeurs élevées de l’autre variable (on
parle de corrélation positive), si les valeurs faibles d’une variable ont tendance à
suivre les valeurs élevées de l’autre variable (on parle de corrélation négative) ou bien
enfin, si les valeurs des deux variables ne sont pas liées (corrélation proche de 0
(zéro)).
Boîte de dialogue corrélation
Groupées par Pour indiquer si les données contenues dans la plage d’entrée sont
disposées dans des lignes ou des colonnes, cliquez sur Lignes ou Colonnes.
Intitulés en première ligne/Intitulés en première colonne Si la première ligne

de votre plage d’entrée contient des étiquettes, activez la case à cocher Intitulés en
première ligne. Si les étiquettes se trouvent dans la première colonne de votre plage
d’entrée, activez la case à cocher Intitulés en première colonne. Cette case à cocher
est désactivée si la plage d’entrée n’a aucune étiquette. Microsoft Office Excel génère
les étiquettes de données appropriées pour la table de sortie.

sortie. Excel remplit la moitié seulement de la table car la corrélation entre deux
plages de données est indépendante de l’ordre dans lequel les plages sont traitées.
Les cellules de la table de sortie contenant des lignes et des colonnes avec des
coordonnées de ligne et de colonne correspondantes contiennent la valeur 1, car
chaque jeu de données corrèle exactement avec lui-même.
Manuellement en calcul :
Un test souvent cité, le coefficient alpha de Cronbach, est un indicateur très utilisé
de la fiabilité et de la « cohérence interne » des échelles, qui est fondée sur la
corrélation moyenne des éléments. Il est présumé que les éléments sont en
corrélation parce qu’ils visent à mesurer un concept commun.
Ce coefficient est défini comme le pourcentage total de la variance réelle parmi la

variance observée d’une mesure. Il est calculé selon la formule suivante :
 k 
  ² 
k  i 1
i 
 1  
k 1   ² 
échelle
 
 
Dans cette équation, k est le nombre d’items, i est un item, ²i est la variance de
l’item et ²échelle est la variance des scores obtenus.
(Notons qu’on trouve parfois une forme alternative de calcul du coefficient alpha :
kr
 
1  r ( k  1)
où k est le nombre d’items de l’échelle et ř la corrélation inter-items moyenne).
Application du test de Cronbach:
Exemple :
nous avons décidé de construire un questionnaire concernant les facteurs stressants
en milieu hospitalier.
Nous voulons vérifier la fiabilité de ce questionnaire formé par 4 questions

(« items »), en le proposant à 11 infirmières.
Les sujets (« répondants ») indiquent leur choix grâce à une échelle ( 1 à 6)….
Résultats :
répondants ITEM 1 ITEM 2 ITEM 3 ITEM 4 SCORE (total)
1 2 3 2 4 11
2 1 2 1 3 7
3 2 2 1 3 8
4 3 3 2 4 12
5 2 2 1 5 10
6 2 3 2 5 12
7 1 2 1 3 7
8 2 3 1 3 9
9 3 4 2 6 15
10 3 3 2 6 14
11 2 2 2 5 11
Variances : 0,49 0,45 0,27 1,41 7,07
(Vous pouvez sans difficulté calculer ces variances pour chaque colonne dans
«l’utilitaire d’analyse » (par exemple avec « analyse de variance à 1 facteur », ou
encore dans « statistiques descriptives »...)
Variances
Variance des 4 items
0,49090909
0,45454545
0,27272727
Somme des variances
1,41818182
2,63636364
Variance des
scores obtenus
7,07272727
Rappel de la formule : α = ( k/k-1) . (1-(Σvar.k/ var.t))
Ce qui donne, sous Excel : =(4/3) * (1-(2,636 / 7,072))= 0,836
Et dans notre cas, l’alpha de Cronbach indique une fiabilité suffisante (supérieur à
.80)
Le coefficient alpha de Cronbach qui se rapproche de la valeur 1 dénote une cohérence

parfaite entre les éléments. Le niveau suggéré de fiabilité est typiquement de 0,80 ou
supérieur; toutefois, cela peut varier selon le type de données.
kr
Autre procédure : si vous préférez l’autre formule (   ), il faut alors
1  r (k  1)
utiliser le test de corrélation de Pearson dans « utilitaire d’analyse ».
On calcule l’analyse de corrélation sur Excel avec la fonction :
=COEFFICIENT.CORRELATION
Exemple :
Le coefficient de corrélation entre colonne 1 et colonne 1
= COEFFICIENT.CORRELATION (matrice colonne 1 ; matrice colonne 1)
Résultat
Colonne 1 Colonne 2 Colonne 3 Colonne 4
Colonne 1 1
Colonne 2 0,71206533 1
Colonne 3 0,67082039 0,61967734 1
Colonne 4 0,68640647 0,50952467 0,70164642 1
Vous devez ensuite calculer la somme des corrélations (en valeur absolu, car des
corrélations peuvent être négatives !), puis vous calculez la moyenne.
Dans notre cas, nous trouvons une somme = 3,900. Donc ř = 3,9/6=0,65.
Calcul : = (0,65*4/(1+(0,65*3)). Donc α = 0,881
Autre méthode :
Les tests de corrélation : ou la « force » d’une liaison entre deux, ou plusieurs

séries de données.
1. Le test « r » de Bravais-Pearson
Formule : r   (x - m )(y - m )
i x i y
 (x - m )²  (y - m ) ²
i x x i y
(avec xi= valeurs échantillon 1, yi= valeurs échantillon 2, et m= moyenne

échantillon)
On peut calculer très facilement le « r » de Bravais-Pearson sous Excel:
Procédure 1: dans « Utilitaire d’analyse », cliquez « analyse de corrélation »…

Non seulement vous aurez un tableau dans lequel se trouve la corrélation, mais
vous pouvez également calculer plusieurs corrélations en fonction des séries
d’observations testées… (cf coefficient de corrélation partielle entre X et Z pour
y1z1, y1z2, y3z2, etc… )
Analyse de covariance :
Les outils Corrélation et Covariance peuvent être appliqués au même cas

lorsque vous observez N variables de mesure différentes chez un groupe
d'individus. Ces outils fournissent chacun leur propre table de sortie, leur
matrice, pour montrer, respectivement, le coefficient de corrélation ou la
covariance entre chaque paire de variables de mesure. La différence est que les
coefficients de corrélation sont mis à l'échelle pour rester compris entre -1 et
+1, alors que les covariances correspondantes ne le sont pas. Le coefficient de
corrélation et la covariance sont des mesures du niveau de « variation
conjointe » de deux variables.
L’outil de covariance calcule la valeur de la fonction COVAR pour chaque paire

de variables numériques. (L’utilisation directe de la fonction COVAR à la place
de l’outil de covariance est un choix raisonnable lorsqu’il n’existe que deux
variables numériques, c’est-à-dire, lorsque N=2.) L’entrée dans la diagonale de
la table de résultats de l’outil de covariance sur la ligne i, colonne i correspond
à la covariance de la i-ème variable numérique avec elle-même. Il s’agit
simplement de la variance non corrigée pour cette variable, telle que calculée
par la fonction VARP.
Vous pouvez utiliser l’outil d’analyse de covariance pour étudier chaque paire
de variables numériques et déterminer si elles corrèlent — c’est-à-dire, si les
valeurs élevées d’une variable ont tendance à suivre les valeurs élevées de
l’autre variable (on parle de corrélation positive), si les valeurs faibles d’une
variable ont tendance à suivre les valeurs élevées de l’autre variable (on parle
de corrélation négative) ou bien enfin, si les valeurs des deux variables ne sont
pas liées (corrélation proche de 0 (zéro)).
Boîte de dialogue covariance
Plage d’entrée Tapez la référence des cellules de la plage de données que

vous souhaitez analyser. Cette référence doit être constituée de deux ou
plusieurs plages adjacentes de données disposées en colonnes ou lignes.
Groupées par Pour indiquer si les données contenues dans la plage

d’entrée sont disposées en lignes ou en colonnes, cliquez
sur Lignes ou Colonnes.
Intitulés en première ligne/Intitulés en première colonne Si la première

ligne de votre plage d’entrée contient des étiquettes, activez la case à
cocher Intitulés en première ligne. Si les étiquettes se trouvent dans la
première colonne de votre plage d’entrée, activez la case à cocher Intitulés en
première colonne. Cette case à cocher est désactivée si la plage d’entrée n’a
Plage de sortie Tapez la référence de la cellule supérieure gauche de la

table de sortie. Excel remplit la moitié seulement de la table, car la covariance
entre deux plages de données est indépendante de l’ordre dans lequel les
plages sont traitées. La diagonale du tableau contient la variance de chaque
plage.
Insérer une nouvelle feuille Sélectionnez cette option pour insérer une
nouvelle feuille de calcul dans le classeur en cours et coller les résultats à partir
de la cellule A1 de la nouvelle feuille de calcul. Pour attribuer un nom à cette
nouvelle feuille de calcul, tapez un nom dans la zone.
Créer un nouveau classeur Cliquez sur cette option pour créer un classeur
et coller les résultats dans une nouvelle feuille de calcul du nouveau classeur.
Exemple :
Sujets ont des troubles du sommeil importants, et acceptent de tester 3

sommeil, par nuit :
1 2 0 3
2 4 1 4
3 2 1 3
4 2 2 4
5 1 0 1
6 3 2 5
7 4 2 11
8 4 2 10
9 10 3 9
10 8 6 14
Analyse de covariance

sujets 10
Médicament 1 4,272727273 7,05785124
Médicament 2 3,454545455 3,074380165 2,446280992
Médicament 3 8,181818182 7,685950413 5,115702479 15,10743802
11 2 2 5
On calcule l’analyse de covariance sur Excel avec la fonction :
=COVARIANCE
Exemple :
La covariance entre colonne 1 et colonne 1
= COVARIANCE (matrice colonne 1 ; matrice colonne 1)

Statistiques descriptives
Cet outil d'analyse génère un rapport de statistiques à une seule variable pour
les données contenues dans la plage d'entrée, fournissant ainsi des
informations sur la tendance centrale et la dispersion de vos données.
Boîte de dialogue Statistiques descriptive
Plage d’entrée Tapez la référence des cellules de la plage de données que

vous souhaitez analyser. Cette référence doit être constituée de deux ou
plusieurs plages adjacentes de données disposées en colonnes ou lignes.
Groupées par Pour indiquer si les données contenues dans la plage

d’entrée sont disposées dans des lignes ou des colonnes, cliquez
sur Lignes ou Colonnes.
Intitulés en première ligne/Intitulés en première colonne Si la première

ligne de votre plage d’entrée contient des étiquettes, activez la case à
cocher Intitulés en première ligne. Si les étiquettes se trouvent dans la
première colonne de votre plage d’entrée, activez la case à cocher Intitulés en
première colonne. Cette case à cocher est désactivée si la plage d’entrée n’a
Niveau de confiance pour la moyenne Activez cette case à cocher si vous

souhaitez inclure une ligne dans la table de sortie pour le niveau de confiance
de la moyenne. Dans la zone, tapez le niveau de confiance voulu. Par exemple,
la valeur 95 % calcule le niveau de confiance de la moyenne au seuil significatif
de 5 %.
K ème maximal Activez cette case à cocher si vous souhaitez inclure une
ligne dans la table de sortie pour la ke plus grande valeur de chaque plage de
données. Dans la zone, tapez le nombre à utiliser pour k. Si k est égal à 1, cette
ligne contient la valeur maximale de la série de données.
K ème minimal Activez cette case à cocher si vous souhaitez inclure une
ligne dans la table de sortie pour la ke plus petite valeur de chaque plage de
données. Dans la zone, tapez le nombre à utiliser pour k. Si k est égal à 1, cette
ligne contient la valeur minimale de la série de données.
Plage de sortie Tapez la référence de la cellule située dans le coin

supérieur gauche de la table de sortie. Cet outil génère deux colonnes
d’informations pour chaque série de données. La colonne de gauche contient
les étiquettes statistiques et la colonne de droite, les statistiques. Microsoft
Excel écrit une table contenant deux colonnes de statistiques pour chaque
colonne ou ligne de la plage d’entrée, selon l’option que vous avez
sélectionnée sous Groupées par.
Insérer une nouvelle feuille Sélectionnez cette option pour insérer une
nouvelle feuille de calcul dans le classeur en cours et coller les résultats à partir
de la cellule A1 de la nouvelle feuille de calcul. Pour attribuer un nom à cette
nouvelle feuille de calcul, tapez un nom dans la zone.
Créer un nouveau classeur Cliquez sur cette option pour créer un classeur
et coller les résultats dans une nouvelle feuille de calcul du nouveau classeur.
Rapport détaillé Activez cette case à cocher si vous souhaitez qu’Excel

génère un champ pour chacune des statistiques suivantes dans la table de
sortie : Moyenne, Écart-type (de la moyenne), Médiane, Mode, Écart type,
Variance, Kurtosis, Asymétrie, Plage, Minimum, Maximum, Somme, Nombre,
Plus grande valeur (#), Plus petite valeur (#) et Niveau de confiance.
Exemple :
Sujets ont des troubles du sommeil importants, et acceptent de tester 3
sommeil, par nuit :
1 2 0 3
2 4 1 4
3 2 1 3
4 2 2 4
5 1 0 1
6 3 2 5
7 4 2 11
8 4 2 10
9 10 3 9
10 8 6 14
11 2 2 5
Médicament 1 Médicament 2 Médicament 3
Moyenne 3,81818182 Moyenne 1,909090909 Moyenne

Erreur-type 0,84011019 Erreur-type 0,494598928 Erreur-type
Médiane 3 Médiane 2 Médiane
Mode 2 Mode 2 Mode
Écart-type 2,78633027 Écart-type 1,640399065 Écart-type
Variance de l'échantillon 7,76363636 Variance de l'échantillon 2,690909091 Variance de l'échantillon
Kurstosis (Coefficient Kurstosis (Coefficient
d'aplatissement) 1,53169088 d'aplatissement) 3,667671049 Kurstosis (Coefficient d'aplatissement
Coefficient d'asymétrie 1,48264819 Coefficient d'asymétrie 1,504797535 Coefficient d'asymétrie
Plage 9 Plage 6 Plage
Minimum 1 Minimum 0 Minimum
Maximum 10 Maximum 6 Maximum
Somme 42 Somme 21 Somme
Nombre d'échantillons 11 Nombre d'échantillons 11 Nombre d'échantillons
Maximum(1) 10 Maximum(1) 6 Maximum(1)
Minimum(1) 1 Minimum(1) 0 Minimum(1)
Niveau de confiance(95,0%) 1,87188214 Niveau de confiance(95,0%) 1,102035087 Niveau de confiance(95,0%)
Calcules sur Excel :

 Pour calculer la moyenne on utilise la fonction =MOYENNE
 Pour calculer erreur type c’est =écart type/ racine( nombre d’échantillon)
 Pour calculer la médiane on utilise la fonction =MEDIANE
 Pour calculer le mode on utilise la fonction =MODE
 Pour calculer écart type on utilise la fonction =ECARTTYPE
 Pour calculer la variance de l’échantillon on utilise la fonction de =VAR
 Pour calculer Kurstosis (Coefficient d'aplatissement) on utilise la fonction
de =KURTOSIS
 Pour calculer le coefficient d’asymétrie on utilise la fonction de =
COEFFICIENT.ASYMETRIE
 Pour calculer la min on utilise la fonction de =MIN
 Pour calculer le max on utilise la fonction de =MAX
 Pour calculer la somme on utilise la fonction de =somme
 Pour calculer le nombre d’échantillon on utilise la fonction =NB
Lissage exponentiel
L’outil d’analyse Exponential Smoothing (lissage exponentiel) calcule une valeur qui
est basée sur la prévision établie pour une période précédente. Cette valeur est
ajustée en fonction de l’erreur de cette prévision précédente. L’outil utilise la
constante de lissage a, dont l’ordre de grandeur détermine la puissance avec laquelle
les prévisions répondent aux erreurs de la prévision précédente.
Remarque : Une constante de lissage comprise entre 0,2 et 0,3 est acceptable. De
telles valeurs indiquent que la prévision actuelle doit être corrigée de 20 à 30 pour
cent pour tenir compte de l'erreur commise dans la prévision précédente. Des
constantes plus élevées donnent une réponse plus rapide, mais peuvent générer des
prévisions inégales. Des constantes plus petites peuvent résulter en de longs
décalages entre les valeurs de prévision et les valeurs réelles.
Boîte de dialogue Lissage exponentiel
souhaitez analyser. Cette plage doit contenir une seule colonne ou une seule ligne
avec quatre cellules de données ou plus.
Paramètres de lissage Tapez le facteur d’ajustement que vous souhaitez utiliser

comme constante de lissage exponentiel. Le facteur d’ajustement est un facteur
correcteur qui minimise l’instabilité des données rassemblées auprès d’une
population. Le facteur d’ajustement par défaut est 0,3.
Remarque : Une constante de lissage comprise entre 0,2 et 0,3 est acceptable. De
telles valeurs indiquent que la prévision actuelle doit être corrigée de 20 à 30 pour
cent pour tenir compte de l'erreur commise dans la prévision précédente. Des
constantes plus élevées donnent une réponse plus rapide, mais peuvent générer des
prévisions inégales. Des constantes plus petites peuvent résulter en de longs
décalages entre les valeurs de prévision et les valeurs réelles.
Intitulé présent Sélectionnez cette option si la première ligne et la première

colonne de la plage d’entrée contiennent des étiquettes. Désactivez cette case à
cocher si votre plage d’entrée n’a aucune étiquette. Microsoft Office Excel génère les
étiquettes de données appropriées pour la table de sortie.

sortie. Si vous activez la case à cocher Écart-type, Excel génère un tableau de
résultats à deux colonnes avec les valeurs des écarts-type dans la colonne de droite.
Si les valeurs historiques sont insuffisantes pour réaliser une prévision ou calculer un
écart-type, Excel renvoie la valeur d’erreur #N/A.
Remarque : Dans la mesure où la plage de sortie doit se trouver dans la même feuille
de calcul que les données utilisées dans la plage d'entrée, les options Insérer une
nouvelle feuille et Créer un nouveau classeur ne sont pas disponibles.
Représentation graphique Activez cette case à cocher si vous souhaitez générer

un graphique incorporé pour les valeurs réelles et prévisionnelles dans la table de
sortie.
Écart-type Activez cette case à cocher pour inclure une colonne qui contient les
valeurs d’écart-type dans la table de sortie. Désactivez-la pour générer une table de
sortie d’une seule colonne sans valeur d’écart-type.

ANOVA

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

ANOVA

Transféré par

Droits d'auteur :

Formats disponibles

Non : HADDAD

Définition et démarche générale

Rappel : qu’est-ce que la variance :

La variance d’un échantillon peut se calculer manuellement, ou à l’aide d’Excel

Avec une seule variable dépendante (à expliquer), et une ou plusieurs variables

a) la variance totale par rapport à la moyenne globale des n mesures ;

b) la variance intra-groupes (celle qui n'est pas liée aux conditions

Variance totale = Variance inter-groupe + Variance

F = variance inter-groupes/variance intra-groupes ou résidu.

[Attention : ce F n’a rien à voir avec le F du test de vérification de l’homogénéité

Nitrates Station 1 Station 2 Station 3

exp) ou résidu (intra-groupe)  - ou = X-

Somme totale des carrés des écarts = -

Variance inter-groupes = SCE inter-groupes/ddl = 1732,47/2 = 866,23

Variance intra-groupes = SCE intra-groupes/ddl = 168285/27 = 6232,78

Calcul de F = Variance inter-groupes / Variance intra-groupes = 0,14

Solution avec Excel :

Analyse de variance : Boîte de dialogue un facteur

Intitulés en première ligne/Intitulés en première colonne Si la première ligne

Plage de sortie Tapez la référence de la cellule supérieure gauche de la table de

Analyse de variance à un facteur ANOVA :

Station 1 Station 2 Station 2

Conclusion du test statistique : La valeur de P étant largement supérieure au seuil

Conclusion de l’expérience : pour cette série de mesures, on peut donc conclure

opéra flamenco piano jazz

Procédure : dans « Utilitaire d’analyse », cliquez « analyse de variance : un facteur », et comparez

Résultats : on trouve sur Excel ce tableau :

Analyse de variance: un facteur

Groupes Nombre d'échantillons Somme Moyenne Variance

Colonne 1 11 152 13,8181818 2,56363636

Colonne 2 10 138 13,8 2,4

Colonne 4 11 148 13,4545455 5,27272727

Entre Groupes 5,39137719 3 1,79712573 0,52418075 0,66836743

A l'intérieur des groupes 126,852525 37 3,42844663

Explication et calcul de cette analyse de la variance entre groupes, pour un facteur :

Solution avec Excel :

ANOVA : Deux facteurs avec la boîte de dialogue réplication

Lignes par échantillon Tapez le nombre de lignes contenues dans chaque

Plage de sortie Tapez la référence de la cellule supérieure gauche de la table de

 Somme des carrés par échantillon :

=SOMME.CARRES.ECARTS (plage)-SOMME.CARRES.ECARTS (échantillon d’arrêt

 Somme des carrés par colonnes :

=SOMME.CARRES.ECARTS (plage)-SOMME.CARRES.ECARTS (échantillon

 Somme des carrés par interaction :

=SOMME.CARRES.ECARTS (plage)-SOMME.CARRES.ECARTS (échantillon d’arrêt

 Somme des carrés à l'intérieur du groupe :

=SOMME.CARRES.ECARTS (échantillon d’arrêt par hommes)

 Somme des carrés TOTAL :

=SOMME.CARRES.ECARTS ( Total des échantillons)

=NBVAL (première ligne)-1

 Degré de liberté par colonnes :

 Degré de liberté par interaction :

=Degré de liberté par échantillon * Degré de liberté par colonnes

 Degré de liberté à l’intérieur du groupe :

 Degré de liberté total :

=NB (Total des échantillons)-1

 Moyenne des carrés par échantillon :

=SCE par échantillon / ddl

 Moyenne des carrés par colonnes :

=SCE par colonnes / ddl

 Moyenne des carrés par interaction :

= SCE par interaction / ddl

 Moyenne des carrés à l’intérieur du groupe :

Calcul : = (0,654/(1+(0,653)). Donc α = 0,881