Académique Documents
Professionnel Documents
Culture Documents
Prénom : HAJAR
CNE : 1412526471
Master : Système d’information d’aide à la décision en
management.
Statistique appliquée
Les ANALYSES DE VARIANCE ou ANOVA
C’est la somme des carrés des écarts par rapport à la moyenne / nombre de degrés de
liberté = SCE/ddl (ceci lorsque le nombre d’individus composant l’échantillon est
réduit ; sinon, utiliser N’=N). La variance est le carré de l’écart-type.
1. Manuellement, on calcule :
2. Par différence [a-b] on obtient la variance inter-groupes (qui est liée aux
différences de conditions expérimentales).
3. On calcule le rapport :
Somme des carrés des écarts (SCE) entre traitements (inter- 1732,47
groupe) = ou =(moyjmoyXn
Sommes des carrés des écarts (SCE) expérimentales (erreur 168285
D’où :
Plage d’entrée Tapez la référence des cellules de la plage de données que vous
souhaitez analyser. Cette référence doit être constituée de deux ou plusieurs plages
adjacentes de données disposées en colonnes ou lignes.
Groupées par Pour indiquer si les données contenues dans la plage d’entrée sont
disposées dans des lignes ou des colonnes, cliquez sur Lignes ou Colonnes.
Insérer une nouvelle feuille Sélectionnez cette option pour insérer une nouvelle
feuille de calcul dans le classeur en cours et coller les résultats à partir de la cellule A1
de la nouvelle feuille de calcul. Pour attribuer un nom à cette nouvelle feuille de
calcul, tapez un nom dans la zone.
Créer un nouveau classeur Cliquez sur cette option pour créer un classeur et
coller les résultats dans une nouvelle feuille de calcul du nouveau classeur.
Exemple 1:
ANALYSE DE VARIANCE
Degré de Moyenne des
Source des variations Somme des carrés liberté carrés F Probabilité Valeur critique pour F
Entre Groupes 1732,466667 2 866,2333333 0,138980301 0,870863715 3,354130829
A l'intérieur des groupes 168285 27 6232,777778
Total 170017,4667 29
Exemple 2:
Exemple : un chercheur veut savoir si la musique peut jouer sur l’apprentissage… Pour cela, notre chercheur
fait apprendre des listes de mots à 4 groupes d’étudiants qui entendent des styles de musiques nettement
différents : de l’opéra, du flamenco, du piano classique, et du free-jazz…On note le nombre de mots mémorisés
après apprentissage…
RAPPORT DÉTAILLÉ
ANALYSE DE VARIANCE
Source des variations Somme des carrés Degré de liberté Moyenne des carrés F Probabilité
Total 132,243902 40
Vous constatez que dans notre expérience, la musique ne semble pas affecter l’apprentissage,
car les moyennes sont très proches, et l’analyse de variance (F=0,524) n’est pas
significative…(p = .669)
F = MC « entre » / MC « inter » : soit le rapport entre la moyenne des carrés entre les groupes, et la
moyenne des carrés à l’intérieur des groupes
Moyenne des carrés « entre groupes » = (somme des carrés / degré de liberté) entre les
groupes
Moyenne des carrés « à l’intérieur » = (somme des carrés / degré de liberté) à l’intérieur des groupes
Analyse de variance: deux facteurs avec répétition d'expérience
Cet outil d'analyse est utile lorsque les données peuvent être classées selon deux
dimensions différentes. On peut travailler sur des données non regroupées et
classées.
Plage d’entrée Tapez la référence des cellules de la plage de données que vous
souhaitez analyser. Cette référence doit être constituée de deux ou plusieurs plages
adjacentes de données disposées en colonnes ou lignes.
Seuil de signification Entrez le seuil à partir duquel calculer les valeurs critiques
du test f. Le seuil de signification est lié à la probabilité que puisse être commise une
erreur de type I (c’est-à-dire le risque pris de rejeter une hypothèse vraie).
Insérer une nouvelle feuille Sélectionnez cette option pour insérer une nouvelle
feuille de calcul dans le classeur en cours et coller les résultats à partir de la cellule A1
de la nouvelle feuille de calcul. Pour attribuer un nom à cette nouvelle feuille de
calcul, tapez un nom dans la zone.
Créer un nouveau classeur Cliquez sur cette option pour créer un classeur et
coller les résultats dans une nouvelle feuille de calcul du nouveau classeur.
Exemple :
36 futurs policiers, hommes ou femmes, ont tous passé des tests psychologiques avant de
commencer leur stage. Après le première semaine d’effort, ils doivent décider s’ils arrêtent ou
continuent leur stage. Exactement la moitié du groupe (hommes et femmes) décident d’arrêt.
Nous avons donc 4 groupes équilibrés de 9 personnes, et le psychologue veut savoir si la décision
est liée : 1er : au sexe, 2ème : à l’anxiété (en utilisant les résultats du test d’anxiété).
arrêt poursuite
hommes 12 19
19 18
25 15
21 18
18 17
22 15
12 14
20 17
18 14
femmes 21 21
20 12
14 14
15 16
21 14
21 10
18 15
20 10
18 8
ANALYSE DE VARIANCE
Somme des Degré de
Source des variations carrés liberté Moyenne des carrés F Probabilité Valeur critique pour F
Échantillon 18,77777778 1 18,77777778 1,69636136 0,20206088 4,149097409
Colonnes 128,4444444 1 128,4444444 11,6035132 0,0017919 4,149097409
Interaction 21,77777778 1 21,77777778 1,96737767 0,17035434 4,149097409
A l'intérieur du groupe 354,2222222 32 11,06944444
Total 523,2222222 35
=NBVAL(deuxième ligne)-1
=degré de liberté total- Degré de liberté par échantillon - Degré de liberté par
colonnes - Degré de liberté par interaction
Conclusion du test statistique Dans cet exemple, on constate donc que le facteur
« décision » est dépendant au niveau d’anxiété. Par contre les autres facteurs
ne sont pas significatifs : il n’y a pas de différence entre les deux sexes…
FA = MC « A » / MC « intérieur »
FB = MC « B » / MC « intérieur »
FAxB = MC « A x B » / MC « intérieur »
Cet outil d'analyse est utile lorsque les données peuvent être organisées en lignes
(ou en colonnes) ou bien les mesures de chaque facteur peuvent être croisées dans
un tableau :
Plage d’entrée Tapez la référence des cellules de la plage de données que vous
souhaitez analyser. Cette référence doit être constituée de deux ou plusieurs plages
adjacentes de données disposées en colonnes ou lignes.
Intitulé présent Cette case à cocher est désactivée si votre plage d’entrée n’a
aucune étiquette. Microsoft Office Excel génère les étiquettes de données
appropriées pour la table de sortie.
Seuil de signification Entrez le seuil à partir duquel calculer les valeurs critiques
du test f. Le seuil de signification est lié à la probabilité que puisse être commise une
erreur de type I (c’est-à-dire le risque pris de rejeter une hypothèse vraie).
Insérer une nouvelle feuille Sélectionnez cette option pour insérer une nouvelle
feuille de calcul dans le classeur en cours et coller les résultats à partir de la cellule A1
de la nouvelle feuille de calcul. Pour attribuer un nom à cette nouvelle feuille de
calcul, tapez un nom dans la zone.
Créer un nouveau classeur Cliquez sur cette option pour créer un classeur et
coller les résultats dans une nouvelle feuille de calcul du nouveau classeur.
Exemple :
11 sujets ont des troubles du sommeil importants, et acceptent de tester 3
traitements pharmacologiques différents. Chaque individu va utiliser un
médicament durant une semaine. On comptabilise le nombre d’heures de
sommeil, par nuit :
1 2 0 3
2 4 1 4
3 2 1 3
4 2 2 4
5 1 0 1
6 3 2 5
7 4 2 11
8 4 2 10
9 10 3 9
10 8 6 14
11 2 2 5
Procédure : dans « Utilitaire d’analyse », cliquez «analyse de variance : deux
facteurs, sans répétition d’expérience », et comparez…
Tableau affiché :
Analyse de variance: deux facteurs sans répétition d'expérience
RAPPORT Nombre
DÉTAILLÉ d'échantillons Somme Moyenne Variance
1,6666666
Ligne 1 4 6 1,5 7
0,9166666
Ligne 3 4 9 2,25 7
1,3333333
Ligne 4 4 12 3 3
4,9166666
Ligne 5 4 7 1,75 7
3,3333333
Ligne 6 4 16 4 3
15,333333
Ligne 7 4 24 6 3
13,333333
Ligne 8 4 24 6 3
11,666666
Ligne 10 4 38 9,5 7
Ligne 11 4 20 5 18
Colonne 1 11 66 6 11
7,7636363
Colonne 2 11 42 3,81818182 6
2,6909090
Colonne 3 11 21 1,90909091 9
16,618181
Colonne 4 11 69 6,27272727 8
ANALYSE DE VARIANCE
7,3152709
Lignes 270 10 27 4 9,8046E-06 2,16457963
12,487684
Colonnes 138,272727 3 46,0909091 7 1,7977E-05 2,92227753
Total 519 43
Conclusion du test statistique Vous constatez qu’il y a bien une différences entre
les 3 médicaments et le F et très significatif (12,48)… (et à mon avis, le
médicament 2 était probablement un placebo !)
Moyenne des carrés « erreur » = (somme des carrés / degré de liberté) des
erreurs
Analyse de corrélation :
Vous pouvez utiliser l’outil d’analyse de corrélation pour étudier chaque paire de
variables numériques et déterminer si elles corrèlent — c’est-à-dire, si les valeurs
élevées d’une variable ont tendance à suivre les valeurs élevées de l’autre variable (on
parle de corrélation positive), si les valeurs faibles d’une variable ont tendance à
suivre les valeurs élevées de l’autre variable (on parle de corrélation négative) ou bien
enfin, si les valeurs des deux variables ne sont pas liées (corrélation proche de 0
(zéro)).
Plage d’entrée Tapez la référence des cellules de la plage de données que vous
souhaitez analyser. Cette référence doit être constituée de deux ou plusieurs plages
adjacentes de données disposées en colonnes ou lignes.
Groupées par Pour indiquer si les données contenues dans la plage d’entrée sont
disposées dans des lignes ou des colonnes, cliquez sur Lignes ou Colonnes.
Insérer une nouvelle feuille Sélectionnez cette option pour insérer une nouvelle
feuille de calcul dans le classeur en cours et coller les résultats à partir de la cellule A1
de la nouvelle feuille de calcul. Pour attribuer un nom à cette nouvelle feuille de
calcul, tapez un nom dans la zone.
Créer un nouveau classeur Cliquez sur cette option pour créer un classeur et
coller les résultats dans une nouvelle feuille de calcul du nouveau classeur.
Manuellement en calcul :
Un test souvent cité, le coefficient alpha de Cronbach, est un indicateur très utilisé
de la fiabilité et de la « cohérence interne » des échelles, qui est fondée sur la
corrélation moyenne des éléments. Il est présumé que les éléments sont en
corrélation parce qu’ils visent à mesurer un concept commun.
Dans cette équation, k est le nombre d’items, i est un item, ²i est la variance de
l’item et ²échelle est la variance des scores obtenus.
(Notons qu’on trouve parfois une forme alternative de calcul du coefficient alpha :
kr
1 r ( k 1)
Exemple :
nous avons décidé de construire un questionnaire concernant les facteurs stressants
en milieu hospitalier.
Les sujets (« répondants ») indiquent leur choix grâce à une échelle ( 1 à 6)….
Résultats :
1 2 3 2 4 11
2 1 2 1 3 7
3 2 2 1 3 8
4 3 3 2 4 12
5 2 2 1 5 10
6 2 3 2 5 12
7 1 2 1 3 7
8 2 3 1 3 9
9 3 4 2 6 15
10 3 3 2 6 14
11 2 2 2 5 11
(Vous pouvez sans difficulté calculer ces variances pour chaque colonne dans
«l’utilitaire d’analyse » (par exemple avec « analyse de variance à 1 facteur », ou
encore dans « statistiques descriptives »...)
Variances
Variance des 4 items
0,49090909
0,45454545
0,27272727
Somme des variances
1,41818182
2,63636364
Variance des
scores obtenus
7,07272727
Et dans notre cas, l’alpha de Cronbach indique une fiabilité suffisante (supérieur à
.80)
=COEFFICIENT.CORRELATION
Exemple :
Résultat
Colonne 1 Colonne 2 Colonne 3 Colonne 4
Colonne 1 1
Colonne 2 0,71206533 1
Vous devez ensuite calculer la somme des corrélations (en valeur absolu, car des
corrélations peuvent être négatives !), puis vous calculez la moyenne.
Dans notre cas, nous trouvons une somme = 3,900. Donc ř = 3,9/6=0,65.
Autre méthode :
Formule : r (x - m )(y - m )
i x i y
(x - m )² (y - m ) ²
i x x i y
Analyse de covariance :
Vous pouvez utiliser l’outil d’analyse de covariance pour étudier chaque paire
de variables numériques et déterminer si elles corrèlent — c’est-à-dire, si les
valeurs élevées d’une variable ont tendance à suivre les valeurs élevées de
l’autre variable (on parle de corrélation positive), si les valeurs faibles d’une
variable ont tendance à suivre les valeurs élevées de l’autre variable (on parle
de corrélation négative) ou bien enfin, si les valeurs des deux variables ne sont
pas liées (corrélation proche de 0 (zéro)).
Insérer une nouvelle feuille Sélectionnez cette option pour insérer une
nouvelle feuille de calcul dans le classeur en cours et coller les résultats à partir
de la cellule A1 de la nouvelle feuille de calcul. Pour attribuer un nom à cette
nouvelle feuille de calcul, tapez un nom dans la zone.
Créer un nouveau classeur Cliquez sur cette option pour créer un classeur
et coller les résultats dans une nouvelle feuille de calcul du nouveau classeur.
Exemple :
1 2 0 3
2 4 1 4
3 2 1 3
4 2 2 4
5 1 0 1
6 3 2 5
7 4 2 11
8 4 2 10
9 10 3 9
10 8 6 14
Analyse de covariance
=COVARIANCE
Exemple :
K ème maximal Activez cette case à cocher si vous souhaitez inclure une
ligne dans la table de sortie pour la ke plus grande valeur de chaque plage de
données. Dans la zone, tapez le nombre à utiliser pour k. Si k est égal à 1, cette
ligne contient la valeur maximale de la série de données.
K ème minimal Activez cette case à cocher si vous souhaitez inclure une
ligne dans la table de sortie pour la ke plus petite valeur de chaque plage de
données. Dans la zone, tapez le nombre à utiliser pour k. Si k est égal à 1, cette
ligne contient la valeur minimale de la série de données.
Insérer une nouvelle feuille Sélectionnez cette option pour insérer une
nouvelle feuille de calcul dans le classeur en cours et coller les résultats à partir
de la cellule A1 de la nouvelle feuille de calcul. Pour attribuer un nom à cette
nouvelle feuille de calcul, tapez un nom dans la zone.
Créer un nouveau classeur Cliquez sur cette option pour créer un classeur
et coller les résultats dans une nouvelle feuille de calcul du nouveau classeur.
Exemple :
Sujets ont des troubles du sommeil importants, et acceptent de tester 3
traitements pharmacologiques différents. Chaque individu va utiliser un
médicament durant une semaine. On comptabilise le nombre d’heures de
sommeil, par nuit :
sujets Médicament 1 Médicament 2 Médicament 3
1 2 0 3
2 4 1 4
3 2 1 3
4 2 2 4
5 1 0 1
6 3 2 5
7 4 2 11
8 4 2 10
9 10 3 9
10 8 6 14
11 2 2 5
Lissage exponentiel
L’outil d’analyse Exponential Smoothing (lissage exponentiel) calcule une valeur qui
est basée sur la prévision établie pour une période précédente. Cette valeur est
ajustée en fonction de l’erreur de cette prévision précédente. L’outil utilise la
constante de lissage a, dont l’ordre de grandeur détermine la puissance avec laquelle
les prévisions répondent aux erreurs de la prévision précédente.
Remarque : Une constante de lissage comprise entre 0,2 et 0,3 est acceptable. De
telles valeurs indiquent que la prévision actuelle doit être corrigée de 20 à 30 pour
cent pour tenir compte de l'erreur commise dans la prévision précédente. Des
constantes plus élevées donnent une réponse plus rapide, mais peuvent générer des
prévisions inégales. Des constantes plus petites peuvent résulter en de longs
décalages entre les valeurs de prévision et les valeurs réelles.
Plage d’entrée Tapez la référence des cellules de la plage de données que vous
souhaitez analyser. Cette plage doit contenir une seule colonne ou une seule ligne
avec quatre cellules de données ou plus.
Remarque : Une constante de lissage comprise entre 0,2 et 0,3 est acceptable. De
telles valeurs indiquent que la prévision actuelle doit être corrigée de 20 à 30 pour
cent pour tenir compte de l'erreur commise dans la prévision précédente. Des
constantes plus élevées donnent une réponse plus rapide, mais peuvent générer des
prévisions inégales. Des constantes plus petites peuvent résulter en de longs
décalages entre les valeurs de prévision et les valeurs réelles.
Remarque : Dans la mesure où la plage de sortie doit se trouver dans la même feuille
de calcul que les données utilisées dans la plage d'entrée, les options Insérer une
nouvelle feuille et Créer un nouveau classeur ne sont pas disponibles.
Écart-type Activez cette case à cocher pour inclure une colonne qui contient les
valeurs d’écart-type dans la table de sortie. Désactivez-la pour générer une table de
sortie d’une seule colonne sans valeur d’écart-type.