Académique Documents
Professionnel Documents
Culture Documents
HECM
MASTER 1
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
Email : durandlokossou@gmail.com
2020-2021
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
SOMMAIRE
CHAPITRE 1. INTRODUCTION __________________________________________________________ 4
1.1 Fichiers d'exemple _________________________________________________________________ 4
1.2 Ouverture d'un fichier de données ___________________________________________________ 4
1.3 Création de graphiques _____________________________________________________________ 9
CHAPITRE 2. LECTURE DES DONNEES __________________________________________________ 11
2.1 Structure de base d'un fichier de données IBM SPSS Statistics _________________________ 11
2.2 Lecture des fichiers de données IBM SPSS Statistics __________________________________ 11
2.3 Lecture des données Excel __________________________________________________________ 12
2.4 Lecture de données à partir d'un fichier texte _________________________________________ 15
CHAPITRE 3. UTILISATION DE L'EDITEUR DE DONNEES_________________________________ 19
3.1 Saisie de données numériques ______________________________________________________ 19
3.2 Saisie de données chaîne _______________________________________________________ 21
3.3 Définition de données _____________________________________________________________ 22
CHAPITRE 4. EXAMEN DES STATISTIQUES RECAPITULATIVES POUR ____________________ 27
CHAQUE VARIABLE ___________________________________________________________________ 27
4.1 Niveau de mesure _________________________________________________________________ 27
4.2 Mesures récapitulatives pour données catégorielles ___________________________________ 27
4.3 Graphiques pour données catégorielles ______________________________________________ 29
4.4 Mesures récapitulatives pour variables d'échelle ______________________________________ 29
4.5 Histogrammes pour variables d'échelle ______________________________________________ 30
CHAPITRE 5. CREATION ET MODIFICATION DE GRAPHIQUES ___________________________ 32
5.1 Définition des variables et des statistiques ___________________________________________ 33
5.2 Ajout de texte _____________________________________________________________________ 34
CHAPITRE 6 UTILISATION DE LA SORTIE ______________________________________________ 37
6.1 Utilisation du visualiseur __________________________________________________________ 37
6.2 Utilisation de l'éditeur de tableau croisé dynamique __________________________________ 38
CHAPITRE 7 : LES TESTS D’HYPOTHÈSE _________________________________________________ 39
1.1 Principe d’un test d’hypothèse __________________________________________________ 39
7.2 Définition des concepts utiles a l’élaboration des tests d’hypothèse____________________ 39
CHAPITRE 8 : TEST DE CORRÉLATION __________________________________________________ 42
8.1 Rappel théorique _________________________________________________________________ 42
8.2 Hypothèses du test de corrélation ___________________________________________________ 42
8.3 Interprétation du coefficient de corrélation de Pearson ________________________________ 42
8.4 Procédure SPSS pour le test de corrélation ___________________________________________ 43
Page | 2
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
Page | 3
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 1. INTRODUCTION
CHAPITRE 1. INTRODUCTION
Le présent cours est inspiré du guide d’utilisation de SPSS 24. Il est conçu pour vous apporter
une aide étape par étape. Tous les fichiers mentionnés dans les exemples sont installés avec
l'application pour vous permettre de suivre la démonstration tout en effectuant les mêmes
analyses et en obtenant les mêmes résultats que ceux qui apparaissent ici.
Page | 4
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 1. INTRODUCTION
Par défaut, les valeurs de données réelles sont affichées. Pour afficher les libellés :
Vous pouvez également utiliser le bouton Libellés de valeurs dans la barre d'outils en faisant :
Des libellés de valeurs descriptifs s'affichent pour faciliter l'interprétation des réponses.
Page | 5
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 1. INTRODUCTION
Page | 6
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 1. INTRODUCTION
Une icône à côté de chaque variable fournit des informations sur le type de données et le
niveau de mesure.
Si le libellé et/ou le nom de la variable apparaît tronqué dans la liste, le libellé ou le nom
complet est affiché lorsque vous placez le curseur dessus.
Dans la boîte de dialogue, choisissez les variables à analyser dans la liste source à gauche et
faites-les glisser dans la liste des variables à droite. Le bouton OK, qui exécute l'analyse, est
désactivé jusqu'à ce qu'une variable soit placée dans la liste Variable(s).
2. Cliquez sur Sexe [gender] dans la liste des variables source, puis faites glisser la variable
dans la liste cible Variable(s).
3. Cliquez sur Catégorie de revenus en milliers [incat] dans la liste source, puis faites-la
glisser vers la liste cible.
Page | 7
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 1. INTRODUCTION
1.
Figure 6 : Variables sélectionnées pour l'analyse
Page | 8
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 1. INTRODUCTION
Figure 8 : Boîte de dialogue Générateur de graphiques avec des zones d'insertion complétées
Page | 9
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 1. INTRODUCTION
4. Faites glisser l'icône Bâtons juxtaposés sur le canevas, qui est la zone étendue au-dessus
de la galerie.
5. Faites défiler la liste Variables et cliquez avec le bouton droit de la souris sur Service
sans fil [WiFi] et sélectionnez Nominales comme niveau de mesure.
6. Faites glisser la variable Service sans fil [WiFi] dans l'axe des X.
7. Cliquez avec le bouton droit de la souris sur Possède un agenda électronique [pda] et
sélectionnez Nominales comme niveau de mesure.
8. Faites glisser la variable Possède un agenda électronique [pda] dans la zone d'insertion de
cluster dans le coin supérieur droit du canevas.
9. Cliquez sur OK pour créer le graphique.
Le graphique à barres est affiché dans le visualiseur. Le graphique indique que la proportion
de personnes possédant un agenda électronique est plus importante chez les personnes
utilisant un service de téléphonie sans fil.
Vous pouvez modifier les graphiques et les tableaux en double-cliquant dessus dans le
panneau de contenu de la fenêtre visualiseur et vous pouvez copier-coller vos résultats dans
d'autres applications.
Page | 10
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 2. LECTURE DES DONNEES
Les données peuvent être saisies directement ou importées à partir de sources différentes. Ce
chapitre traite des processus de lecture de données stockées dans les fichiers de données IBM
SPSS Statistics, dans des applications de feuilles de calcul telles que Microsoft Excel, dans les
applications de base de données telles que Microsoft Access et dans des fichiers texte.
Les fichiers de données IBM SPSS Statistics sont organisés par observations (lignes) et par
variables (colonnes). Dans ce fichier de données, les observations représentent des répondants
dans le cadre d'une enquête. Les variables représentent des réponses à chaque question posée au
cours de l'enquête.
Les fichiers de données IBM SPSS Statistics, portant l'extension de fichier .sav, contiennent les
données que vous avez enregistrées.
Page | 11
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 2. LECTURE DES DONNEES
Vous constatez que certaines valeurs de chaîne de Sexe sont précédées par des espaces. Certaines
des valeurs de Situationfamiliale sont affichées sous forme de points (.).
Page | 12
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 2. LECTURE DES DONNEES
4. Vérifiez que l'option Lire les noms de variable à partir de la première ligne de données
est sélectionnée. Les en-têtes de colonne qui ne sont pas conformes aux règles de
dénomination de variables sont convertis en noms de variable valides. Les en-têtes de
colonne d'origine sont enregistrés en tant que libellés de variable.
5. Sélectionnez Retirer les espaces au début des valeurs de type chaîne.
6. Désélectionnez Pourcentage de valeurs qui détermine le type de données.
Page | 13
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 2. LECTURE DES DONNEES
7.
La valeur de chaîne "no answer" figure maintenant dans les cellules identifiées comme valeurs
système manquantes. S'il n'y a pas de paramètre de pourcentage de valeur est si la colonne
contient plusieurs types de données, la variable est lue comme une chaîne. Toutes les valeurs sont
conservées, mais les valeurs numériques sont traitées comme des chaînes.
Page | 14
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 2. LECTURE DES DONNEES
Les fichiers texte représentent une autre source commune de données. De nombreux tableurs et
bases de données peuvent enregistrer leur contenu dans l'un des nombreux formats de fichier
texte. Les fichiers délimités par une virgule ou une tabulation se rapportent aux lignes de données
utilisant des virgules ou des tabulations pour indiquer chaque variable. Dans cet exemple, les
données sont délimitées par des tabulations.
Page | 15
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 2. LECTURE DES DONNEES
5. A l'étape 2 de l'assistant, sélectionnez Délimité pour indiquer que le format du fichier est
structuré.
6. Sélectionnez Oui pour indiquer que des noms de variable figurent en haut du fichier.
7. Cliquez sur Suivant pour continuer.
8. A l'étape 3, saisissez 2 pour le numéro de la ligne à partir de laquelle commence la
première. observation de données (compte tenu que les noms de variable se trouvent sur
la première ligne).
9. Conservez les valeurs par défaut des autres champs de cette étape et cliquez sur Suivant
pour continuer.
L'aperçu des données à l'étape 4 permet de vérifier que le fichier peut être lu correctement.
10. Sélectionnez Tabulation et décochez les autres options de délimiteur. Barre d’espace est
sélectionné par défaut car le fichier contient des espaces. Pour ce fichier, les espaces font
partie des valeurs de données, et non des délimiteurs. Vous devez désélectionner Espace
pour lire le fichier correctement.
11. Sélectionnez Retirer les espaces au début des valeurs de type chaîne. Les espaces situés
au début des valeurs de chaîne affectent la manière dont les chaînes sont évaluées dans
Page | 16
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 2. LECTURE DES DONNEES
les expressions. Dans ce fichier, certaines valeurs de Sexe sont précédées d'espaces qui ne
font pas partie de la valeur. Si vous ne les retirez pas, la valeur " f" est traitée comme autre
chose que "f".
Page | 17
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 2. LECTURE DES DONNEES
La variable Status contient à la fois des valeurs de chaîne et des valeurs numériques.
Moins de cinq pourcent des valeurs sont des chaînes. Avec la valeur de 95 % pour le paramètre
Pourcentage de valeurs qui détermine le format de données automatique, la variable est traitée
comme une valeur numérique, et les valeurs de chaîne sont définies comme Valeur système
manquante. Si aucun format de données n'atteint ce pourcentage, la variable est traitée comme
une chaîne. Si vous remplacez cette valeur par 100, toutes les valeurs sont conservées, mais toutes
les valeurs numériques sont traitées comme des chaînes.
Page | 18
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 3. UTILISATION DE L'EDITEUR DE DONNEES
Cette fenêtre affiche le contenu du fichier de données actif. Les informations contenues dans
l'éditeur de données se composent de variables et d'observations.
Dans Vue de données, les colonnes représentent des variables et les lignes des
observations.
Dans la vue de variable, chaque ligne est une variable et chaque colonne est un attribut
associé à cette variable.
Les variables sont utilisées pour représenter les différents types de données que vous avez
rassemblées. Une analogie courante est celle de l'enquête. La réponse à chaque question d'une
enquête est équivalente à une variable. Il existe de nombreux types de variable : nombres,
caractères, monnaies et dates.
Les données peuvent être saisies dans l'éditeur de données, qui peut s'avérer utile pour traiter les
fichiers de données peu volumineux ou pour apporter de légères modifications à des fichiers de
données plus volumineux.
Page | 19
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 3. UTILISATION DE L'EDITEUR DE DONNEES
Si vous ne saisissez pas de noms de variable, des noms uniques sont automatiquement créés.
Cependant, ces noms ne sont pas descriptifs et ne sont pas recommandés pour les fichiers de
données volumineux.
5. Cliquez sur l'onglet Vue de données pour continuer à saisir des données.
Les noms saisis dans la vue de variable sont à présent les en-têtes des trois premières colonnes
dans Vue de données. Commencez à saisir des données dans la première ligne, en commençant
par la première colonne.
Page | 20
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 3. UTILISATION DE L'EDITEUR DE DONNEES
11. Les colonnes âge et marital affichent actuellement un séparateur décimal alors que les
valeurs sont des entiers. Pour masquer le séparateur décimal de ces variables :
13. Cliquez sur l'onglet Vue de variable en bas de la fenêtre de l'éditeur de données.
14. Dans la colonne Décimales de la ligne âge, saisissez 0 pour masquer la décimale.
15. Dans la colonne Décimales de la ligne marital, saisissez 0 pour masquer la décimale.
Des données non numériques, telles que des chaînes de texte, peuvent également être saisies dans
l'éditeur de données.
Page | 21
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 3. UTILISATION DE L'EDITEUR DE DONNEES
Outre les données, vous pouvez aussi définir des libellés de variables descriptifs et des libellés de
valeurs pour les noms de variables et les valeurs de données. Ces libellés descriptifs sont utilisés dans
les rapports statistiques et les graphiques.
Dans le fichier de données actuel, la variable income est définie comme étant un type numérique.
Page | 22
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 3. UTILISATION DE L'EDITEUR DE DONNEES
1. Cliquez sur la cellule Type de la ligne income, puis sur le bouton à droite de la cellule pour
ouvrir la boîte de dialogue Type de variable.
2. Sélectionnez Dollar.
Page | 23
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 3. UTILISATION DE L'EDITEUR DE DONNEES
En ce qui concerne les données numériques, les champs de données vides ou contenant des entrées
non valides sont convertis en données manquantes par défaut, signalées par une virgule (Windows
français) ou un point (Windows anglais).
La raison pour laquelle une valeur est manquante peut être importante pour votre analyse. Par
exemple, vous pouvez juger utile de distinguer les personnes qui ont refusé de répondre à une
question de celles qui n'ont pas répondu car cette question ne les concernait pas.
Page | 24
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 3. UTILISATION DE L'EDITEUR DE DONNEES
15.
16.
Figure 23 : Boîte de dialogue Valeurs manquantes
5. Cliquez sur OK pour enregistrer vos modifications et revenir dans l'éditeur de données.
Page | 25
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 3. UTILISATION DE L'EDITEUR DE DONNEES
Page | 26
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
CHAPITRE 4. EXAMEN DES STATISTIQUES
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
RECAPITULATIVES POUR CHAQUE VARIABLE
La présente section traite des mesures récapitulatives simples et de la façon dont le niveau de mesure
d'une variable influence le type de statistiques devant être utilisé. Nous utiliserons le fichier de
données demo.sav.
Différentes mesures récapitulatives sont adaptées à différents types de données, selon le niveau de
mesure :
Nominales : Données ayant un nombre limité de valeurs ou de catégories distinctes (par exemple,
sexe ou situation de famille). Elles sont parfois également qualifiées de données qualitatives. Les
variables catégorielles peuvent être des données chaîne (alphanumérique) ou des variables
numériques qui utilisent des codes chiffrés pour représenter les catégories (par exemple, 0 = Célibataire
et 1 = Marié). Il existe deux types essentiels de données catégorielles :
Nominal : Données catégorielles dont les catégories n'ont aucun ordre inhérent. Par exemple,
une catégorie d'emploi de type ventes n'est pas supérieure ou inférieure à une catégorie
d'emploi de type marketing ou étude.
Ordinal : Données catégorielles dont les catégories possèdent un ordre significatif, mais pour
lesquelles il n'existe aucune distance mesurable entre les catégories. Par exemple, les valeurs
élevée, moyenne et faible, mais il est impossible de calculer la "distance" entre ces valeurs.
Echelle : Données mesurées sur une échelle d'intervalle ou de rapport, où les valeurs de données
indiquent à la fois l'ordre des valeurs et la distance qui les sépare. Par exemple, un salaire de 580 000
FCFA est supérieur à un salaire de 420 200 FCFA et la distance entre les deux valeurs est de 159 800
FCFA. Ces données sont aussi appelées données quantitatives ou données continues.
La procédure Fréquences produit des tables de fréquences qui affichent le nombre et le pourcentage
d'observations pour chaque valeur observée d'une variable.
Page | 27
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
CHAPITRE 4. EXAMEN DES STATISTIQUES
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
RECAPITULATIVES POUR CHAQUE VARIABLE
Les tables de fréquences révèlent que seuls 20,4 % des personnes possèdent un agenda électronique,
mais que la quasi-totalité possèdent une télévision (99,0 %)
Page | 28
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
CHAPITRE 4. EXAMEN DES STATISTIQUES
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
RECAPITULATIVES POUR CHAQUE VARIABLE
Vous pouvez afficher graphiquement les informations dans une table de fréquences avec un
graphique à barres ou un graphique circulaire.
1. Ouvrez à nouveau la boîte de dialogue Fréquences. (Les deux variables doivent toujours être
sélectionnées.)
Vous pouvez utiliser le bouton Rappeler boîte de dialogue de la barre d'outils pour revenir rapidement aux
dernières procédures utilisées.
De nombreuses mesures récapitulatives sont disponibles pour les variables d'échelle, dont :
Mesures de la tendance centrale : Les mesures les plus courantes de la tendance centrale sont
la moyenne (moyenne arithmétique) et la médiane (valeur au-dessus ou au-dessous de
laquelle se trouve la moitié des observations).
Page | 29
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
CHAPITRE 4. EXAMEN DES STATISTIQUES
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
RECAPITULATIVES POUR CHAQUE VARIABLE
Dans cet exemple, la différence entre la moyenne et la médiane est importante. La moyenne est plus
importante que la médiane de quasiment 25 000, ce qui indique que les valeurs ne sont pas distribuées
normalement. Vous pouvez vérifier visuellement la distribution grâce à un histogramme.
Page | 30
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
CHAPITRE 4. EXAMEN DES STATISTIQUES
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
RECAPITULATIVES POUR CHAQUE VARIABLE
Figure 29 : Histogramme
La grande majorité des observations est regroupée au bas de l'échelle, la plupart se trouvant au-
dessous de 100 000. Quelques observations, cependant, se trouvent dans la plage 500 000 et au-delà
(elles sont si peu nombreuses que vous devez modifier l'histogramme pour les voir). Ces valeurs très
élevées pour quelques observations seulement ont un effet significatif sur la moyenne mais peu
d'effet, voire aucun, sur la médiane ; cela signifie que, dans cet exemple, la médiane est un meilleur
indicateur de la tendance centrale.
Page | 31
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
CHAPITRE 5. CREATION ET MODIFICATION DE
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
GRAPHIQUE
Dans ce chapitre, nous allons créer et modifier des graphiques à barres. Vous pouvez appliquer les
principes à n'importe quel type de graphique.
Pour illustrer les notions de base de la création de graphiques, nous allons créer un graphique à barres revenu
moyen pour plusieurs niveaux de satisfaction professionnelle. Cet exemple utilise le fichier de données demo.sav.
Page | 32
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
CHAPITRE 5. CREATION ET MODIFICATION DE
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
GRAPHIQUE
Le niveau de mesure d'une variable est important dans le Générateur de graphiques. Vous allez
utiliser la variable Satisfaction professionnelle de l'axe des X. Cependant, l'icône (qui ressemble à une
règle) à côté de la variable indique que son niveau de mesure est défini en tant que variable d'échelle.
Pour créer le graphique correct, vous devez utiliser un niveau de mesure catégoriel. Plutôt que de
revenir et de modifier le niveau de mesure dans la vue de variable, vous pouvez le modifier
temporairement dans le Générateur de graphiques.
1. Cliquez avec le bouton droit de la souris sur Satisfaction professionnelle dans la liste Variables
et choisissez Ordinal. Ordinal correspond à un niveau de mesure approprié car les catégories
dans Satisfaction professionnelle peuvent être ordonnées par niveau de satisfaction. Notez que
l'icône change une fois le niveau de mesure modifié.
2. Faites glisser Satisfaction professionnelle de la liste Variables dans la zone d'insertion de l'axe
des X. La zone d'insertion de l'axe des Y prend par défaut la statistique Effectif. Si vous
souhaitez utiliser une autre statistique (comme pourcentage ou moyenne), vous pouvez
facilement en changer. Vous n'utiliserez aucune de ces statistiques dans cet exemple, mais
nous allons revoir le processus au cas où vous devez changer cette statistique plus tard.
3. Cliquez sur Propriété des éléments pour afficher la fenêtre Propriété des éléments.
Page | 33
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
CHAPITRE 5. CREATION ET MODIFICATION DE
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
GRAPHIQUE
Vous pouvez également ajouter des titres et des notes de bas de page au graphique.
Page | 34
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
CHAPITRE 5. CREATION ET MODIFICATION DE
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
GRAPHIQUE
3. Dans la fenêtre Propriété des éléments, sélectionnez Titre 1 dans Modifier les propriétés de
liste.
4. Dans la zone de texte Personnalisé, saisissez Revenu par satisfaction professionnelle. Il s'agit
du texte que le titre affichera.
5. Cliquez sur Appliquer pour enregistrer le texte. Bien que le texte ne soit pas affiché dans le
Générateur de graphiques, il apparaît lorsque vous générez le graphique.
Page | 35
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
CHAPITRE 5. CREATION ET MODIFICATION DE
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
GRAPHIQUE
Le graphique à barres indique que les répondants les plus satisfaits de leurs travaux ont tendance à
avoir des revenus plus élevés.
Page | 36
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
CHAPITRE 6. UTILISATION DE LA SORTIE
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
Les résultats des procédures statistiques apparaissent dans le visualiseur. En fonction des choix
effectués lors de l'exécution de la procédure, ces sorties peuvent prendre la forme d'un texte, ou de
tableaux, de graphiques ou de graphiques statistiques. Cette section utilise les fichiers viewertut.spv
et demo.sav.
Figure 34 : Visualiseur
La fenêtre du visualiseur est divisée en deux panneaux. Le panneau de légende contient la légende
de toutes les informations stockées dans le visualiseur. Le panneau de contenu comporte les tableaux
statistiques, les graphiques et les textes.
A l'aide des barres de défilement horizontale et verticale, parcourez-le contenu de la fenêtre. Pour
faciliter la navigation, cliquez sur un élément dans le panneau de légende pour l'afficher dans le
panneau de contenu.
1. Cliquez sur la bordure droite du panneau de légende et faites-la glisser pour modifier sa
largeur. Dans le panneau de légende, lorsqu'une icône en regard d'un élément représente un
livre ouvert, cela indique qu'il est actuellement visible dans le visualiseur, même s'il n'est pas
visible dans le panneau de contenu.
2. Pour masquer un tableau ou un graphique, double-cliquez sur l'icône du livre dans le panneau
de légende.
Page | 37
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
CHAPITRE 6. UTILISATION DE LA SORTIE
STATISTIQUE COMPUTATIONNELLE AVEC SPSS
L'icône représente maintenant un livre fermé, ce qui signifie que les informations associées
sont masquées.
3. Pour que la sortie apparaisse à nouveau, double-cliquez sur l'icône du livre fermé. Vous
pouvez également masquer toutes les sorties d'une procédure statistique donnée ou
l'intégralité des sorties dans le visualiseur.
4. Cliquez sur la case comportant le signe moins (-), à gauche de la procédure dont vous
souhaitez masquer les résultats, ou cochez la case située en regard de l'élément figurant tout
en haut du panneau de légende pour masquer la totalité des sorties. L'arborescence de la
légende est réduite, indiquant visuellement que les résultats sont masqués. Vous pouvez
également modifier l'ordre de l'affichage des sorties.
5. Dans le panneau de légende, cliquez sur les éléments à déplacer. 6. Faites glisser les éléments
sélectionnés vers un nouvel emplacement de la légende.
De nombreux termes statistiques sont affichés dans la sortie. Vous pouvez directement accéder aux
définitions de ces termes dans le visualiseur.
1. Activez le tableau croisé (double-cliquez dessus) Possède un agenda électronique * Sexe * Internet.
2. Cliquez avec le bouton droit de la souris sur Effectif théorique et choisissez Qu'est-ce que c'est
? dans le menu contextuel. La définition apparaît dans une fenêtre contextuelle.
Page | 38
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 7 : LES TESTS D’HYPOTHÈSE
17. On étudie une population dont les éléments possèdent un caractère (mesurable ou qualitatif)
et dont la valeur du paramètre relative au caractère étudié est inconnue.
18. Une hypothèse est formulée sur la valeur du paramètre : cette formulation résulte de
considérations théoriques, pratiques ou encore elle est simplement basée sur un
pressentiment.
19. On veut porter un jugement sur la base des résultats d’un échantillon prélevé de cette
population.
Il est bien évident que la statistique (c’est-à-dire la variable d’échantillonnage) servant d’estimateur
au paramètre de la population ne prendra pas une valeur rigoureusement égale à la valeur théorique
proposée dans l’hypothèse. Cette variable aléatoire comporte des fluctuations d’échantillonnage qui
sont régies par des distributions connues.
Pour décider si l’hypothèse formulée est supportée ou non par les observations, il faut une
méthode qui permettra de conclure si l’écart observé entre la valeur de la statistique obtenue dans
l’échantillon et celle du paramètre spécifiée dans l’hypothèse est trop important pour être
uniquement imputable au hasard de l’échantillonnage.
La construction d’un test d’hypothèse consiste en fait à déterminer entre quelles valeurs peut varier la variable
aléatoire, en supposant l’hypothèse vraie, sur la seule considération du hasard de l’échantillonnage.
Hypothèse statistique
Une hypothèse statistique est un énoncé (une affirmation) concernant les caractéristiques (valeurs
des paramètres, forme de la distribution des observations) d’une population.
Test d’hypothèse
Un test d’hypothèse (ou test statistique) est une démarche qui a pour but de fournir une règle de
décision permettant, sur la base de résultats d’échantillon, de faire un choix entre deux hypothèses
statistiques.
Page | 39
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 7 : LES TESTS D’HYPOTHÈSE
L’hypothèse selon laquelle on fixe à priori un paramètre de la population à une valeur particulière
s’appelle l’hypothèse nulle et est notée H0. N’importe quelle autre hypothèse qui diffère de
l’hypothèse H0 s’appelle l’hypothèse alternative (ou contre-hypothèse) et est notée H1.
C’est l’hypothèse nulle qui est soumise au test et toute la démarche du test s’effectue en considérant
cette hypothèse comme vraie.
Sur la distribution d’échantillonnage correspondra aussi une région complémentaire, dite région
d’acceptation de H0 (ou région de non-rejet) de probabilité 1 .
Supposons que nous affirmions que la valeur d’un paramètre d’une population est égale à la valeur
0 . On s’intéresse au changement possible du paramètre dans l’une ou l’autre direction (soit 0
soit 0 ). On effectue un test bilatéral.
H1 : 0
On peut schématiser les régions de rejet et de non-rejet de H0 comme suit :
Page | 40
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 7 : LES TESTS D’HYPOTHÈSE
Remarque : Si on s’intéresse au changement du paramètre dans une seule direction, on opte pour un
test unilatéral, en choisissant comme hypothèse H1 soit 0 soit 0 . La région critique est alors
localisée uniquement à droite ou uniquement à gauche de la région d’acceptation.
Dans un souci de simplification, nous nous intéresserons dans ce cours essentiellement aux tests
bilatéraux.
Page | 41
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 8 : TEST DE CORRÉLATION
Cette section traite de la question suivante : Comment peut-on tester l’hypothèse nulle de l’absence
de relation linéaire entre deux variables continues ?
Par exemple, nous pouvons être intéressés à savoir si le nombre d'heures d'étude est associé au
rendement scolaire.
associées positivement (r > 0) : plus le nombre d'heures d'étude augmente, plus le rendement
augmente;
associées négativement (r < 0 ) : plus le nombre d'heures d'étude augmente, plus le rendement
diminue;
non associées (r = 0) : le nombre d'heures d'études n'a aucune influence sur le rendement.
La corrélation est une quantification de la relation linéaire entre des variables continues. Le calcul du
coefficient de corrélation de Pearson repose sur le calcul de la covariance entre deux variables
continues. Le coefficient de corrélation est en fait la standardisation de la covariance. Cette
standardisation permet d'obtenir une valeur qui variera toujours entre -1 et +1, peu importe l'échelle
de mesure des variables mises en relation.
H0 : les deux variables ne sont pas associées, qu'il n'y a pas de relation entre ces dernières (r =
0).
H1 : il existe une relation linéaire entre les deux variables.
Pour être interprété, le coefficient de corrélation doit être significatif (la valeur de p [la p-value] doit
être plus petite que 0,05). Si le coefficient est non significatif, on considère qu'il est semblable à r = 0.
Par contre, lorsqu'il est significatif, le coefficient de corrélation donne deux informations importantes
:
Page | 42
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 8 : TEST DE CORRÉLATION
Le sens de la relation linéaire entre les deux variables : Le coefficient de corrélation, qui présente
finalement la covariance standardisée, varie entre - 1 et 1. Un coefficient de 1 indique une corrélation
positive parfaite entre les deux variables. À l'inverse, un coefficient de - 1 indique une corrélation
négative parfaite: lorsque la variable x augmente, la variable y diminue dans la même proportion.
Dans les deux cas, les points tombent parfaitement sur la droite. Un coefficient de 0 indique qu'il n'y
a aucune relation entre les deux variables. Ainsi, la variation de l'une n'est aucunement associée à la
variation de l'autre.
La force de la relation linéaire entre les deux variables : Plus la valeur du coefficient est proche de +
1 ou de - 1, plus les deux variables sont associées fortement. Au contraire, plus le coefficient est près
de 0, moins les variables partagent de covariance et donc, moins l'association est forte. On peut
qualifier la force de cette relation avec les balises de Cohen concernant la taille d'effet.
Page | 43
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 8 : TEST DE CORRÉLATION
2. Dans la boite de dialogue principale, vous insérez, à l'aide de la flèche , les variables
continues à tester dans la boite Variable. Vous pouvez évaluer la relation entre deux ou
plusieurs variables continues à la fois. Puisque vous vous intéressez aux relations simples,
vous n'insérez que deux variables.
Dans cet exemple nous utiliserons la base de données demo.sav pour calculer la corrélation entre les
variables Prix du véhicule principal (car) et Revenu du foyer en milliers ($)
Page | 44
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 8 : TEST DE CORRÉLATION
Le tableau de corrélation est assez simple à interpréter. Il s'agit d'un tableau croisé entre les variables
mises en relation.
Nous pouvons voir dans chaque case présentant le croisement de deux variables la valeur du
coefficient accompagné d'astérisques si la corrélation est significative, le degré de signification qui y
est associé et le nombre d'observations qui ont été croisées.
Puisque la corrélation est une mesure symétrique, on constate que le coefficient est le même pour
l'association entre le Prix du véhicule principal (car) et Revenu du foyer en milliers ($) et pour l'association
entre Revenu du foyer en milliers ($) et le Prix du véhicule principal (car).
Corrélations
Revenu du foyer Price of primary
en milliers ($) vehicle
Revenu du foyer en milliers ($) Corrélation de Pearson 1 ,792**
Sig. (bilatérale) ,000
N 6400 6400
Price of primary vehicle Corrélation de Pearson ,792** 1
Sig. (bilatérale) ,000
N 6400 6400
**. La corrélation est significative au niveau 0.01 (bilatéral).
Tableau 1 : Résultat de corrélation entre le Prix du véhicule principal (car) et Revenu du foyer en milliers ($)
Nous remarquoins que la corrélation est significative, nous pouvons donc rejeter l'hypothèse nulle
d'absence de relation entre le Prix du véhicule principal (car) et Revenu du foyer en milliers ($). Ceci signifie
que la probabilité d'obtenir un coefficient de cette taille dans une population où ces deux variables ne
sont pas reliées est de moins de 5 %. Nous acceptons l'hypothèse alternative: il existe une relation
linéaire positive (puisque le coefficient est positif) entre les deux variables.
Le coefficient de corrélation significatif nous donne deux informations que l'on doit interpréter:
le sens de la relation entre les variables : Comme le coefficient est positif, plus le Prix du
véhicule principal est élevé, plus Revenu du foyer en milliers ($) augmente.
la force de la relation (la taille d'effet) : En examinant la valeur du coefficient (r = 0,792), nous
pouvons dire que l'effet de la relation entre ces deux variables est de grande taille et que
l'association est forte.
Page | 45
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
Dans cette section, nous allons voir comment tester l'hypothèse nulle à partir de deux moyennes
provenant de deux échantillons (ou sous-groupes) indépendants. Nous allons en fait estimer si deux
moyennes populationnelles sont égales en nous basant sur le résultat de la comparaison entre ces
deux échantillons. La technique employée s'appelle Test t pour échantillons indépendants
(Independent sample t test).
On utilise cette technique pour comparer DEUX groupes, créés par une variable catégorielle, en
fonction de leur moyenne à une mesure (variable continue).
Il n'y a pas de différence entre les moyennes des deux groupes dans la population. En d'autres termes,
la différence entre les deux moyennes dans la population est de 0. On sous-entend ici que les deux
groupes proviennent de la même population.
Lorsque le degré de signification est petit (p-value < 0,05), nous pouvons rejeter l'hypothèse nulle et
conclure que les deux moyennes ne proviennent pas de la même population.
Page | 46
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
Il est possible d'aller apprécier l'importance ou la magnitude de la différence de moyennes entre les
deux groupes grâce au calcul de l'indice eta-carré (η2).
1. Pour faire un test t pour deux moyennes indépendantes, allez dans le menu Analyse,
choisissez Comparer les moyennes, puis Test T pour échantillons indépendants.
Page | 47
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
2. Ensuite, vous insérez la ou les variables continues dans la boite Variable(s) à tester. Vous
pouvez, en effet, comparer les groupes pour plus d'une variable à la fois. SPSS réalisera le
test pour chaque variable.
3. Vous choisissez aussi la variable de groupe. Lorsque vous la placerez dans la boite Critère
4. Vous devez définir les valeurs de la variable qui représenteront les deux groupes dans une
nouvelle boite de dialogue. Vous pouvez choisir des valeurs spécifiques en les insérant
dans la boite Groupe 1 et Groupe 2 (si vous ne connaissez pas les valeurs de la variable,
regardez dans l'onglet Affichage des variables, elles seront indiquées dans la
colonne Valeurs).
5. Si vous avez une variable catégorielle à plus de deux niveaux, vous pouvez choisir un
point de césure. Ceux qui auront répondu, par exemple, 1 et 2 à la question seront dans le
groupe 1 et ceux qui auront répondu 3 ou 4 seront dans le groupe 2. Vous fixez à ce
moment le point de césure à 2. Vous pouvez également utiliser le point de césure avec une
variable continue. Ce dernier créera deux groupes indépendants.
Page | 48
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
Figure 38 : Boîte de dialogue de définition des groupes pour un test de comparaison de moyenne sur echantillons indépendants
Le premier tableau montre un résumé des statistiques descriptives pour les deux groupes. Il indique
le nombre de participants (N) ainsi que la moyenne et l'écart-type de chaque groupe pour le Revenu.
Dans la dernière colonne, SPSS affiche l'erreur standard moyenne, qui est, en fait, l'erreur-type.
Statistiques de groupe
Sexe N Moyenne Ecart type Moyenne erreur standard
Revenu du foyer en milliers ($) Femme 3179 68,7798 75,73510 1,34323
Homme 3221 70,1608 81,56216 1,43712
Tableau 2 : Statistique descriptive du test de comparaison de moyenne de Revenu entre les hommes et les femmes.
Page | 49
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
Nous voyons encore une fois que les 3179 Femmes (x = 68,7798) ont tendance à avoir un revenu faible
par rapport aux 3221 Hommes (x = 70,1608).
Page | 50
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
Le deuxième tableau contient les résultats du test. Il indique si la différence entre les moyennes des deux groupes est assez importante pour ne pas
être due au hasard.
Hypothèse de variances inégales -,702 6374,362 ,483 -1,38101 1,96713 -5,23725 2,47522
Si la p-value < 0,05 alors il faut lire les résultats du Test t pour égalité des moyennes dans la partie en vert du tableau.
Si le p-value est superieur ou égale à 5% alors il faut lire les résultats du Test t pour égalité des moyennes dans la partie en jaune du tableau.
Les résultats montrent deux valeurs de t possibles. La première ligne de résultats concerne la situation où les variances des deux groupes sont égales
(la différence entre les variances est de zéro) et la seconde ligne concerne la situation où les variances des deux groupes sont inégales.
En fait, une des prémisses de l’utilisation du test t pour échantillons indépendants porte sur la nécessité de l’égalité des variances lors du calcul de
l’erreur-type des différences de moyenne.
Le premier test effectué par SPSS est donc le test d’égalité des variances de Levene. Si ce test est significatif, on doit rejeter l’hypothèse nulle de
l’égalité des variances et corriger le calcul de t en utilisant les variances individuelles des deux groupes (correction de Welch) plutôt que la
variance combinée (pooled-variance).
Page | 51
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
Dans l'exemple, on voit que le test d'homogénéité des variances n’est significatif pas (p-value > 0,05). Nous n’avons donc pas suffisamment de
preuve pour rejeter l'hypothèse nulle : les variances ne sont pas significativement différentes, la prémisse d'égalité est respectée. Nous devons donc
lire première ligne en jaune. Dans le cas contraire, nous aurions interprété la deuxième ligne en vert.
Nous pouvons maintenant passer au résultat du test t proprement dit. On remarque que la valeur t, de la 1er ligne est de -0,702 et que le degré de
signification est plus grande que 0,0005 (p-value). On ne peut donc pas rejeter l’hypothèse nulle selon laquelle la différence de moyenne observée
entre les deux groupes (-1,38101 milliers ($)) est compatible avec la différence populationnelle de 0.
Page | 52
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
Dans cette section, nous allons voir comment tester l’hypothèse nulle lorsque plus de deux moyennes
sont confrontées. Le but sera toujours le même : vérifier l’hypothèse nulle que les moyennes des
groupes proviennent d’une même population. Pour ce faire, nous allons utiliser l'analyse de variance
univariée (ANOVA)
Cette technique permet de comparer les moyennes de trois groupes ou plus, créés par une variable
catégorielle.
L'hypothèse alternative est qu'il y a une différence entre les moyennes, c'est-à-dire qu'au moins une
des moyennes est différente des autres.
Tout comme pour les autres tests d’hypothèse, il faut s’assurer de respecter certaines prémisses avant
de procéder à l’analyse proprement dite :
Si la taille des groupes est très inégale, la prémisse d’égalité des variances doit être vérifiée
systématiquement. Si le test est significatif, il est possible d’utiliser d’autres procédures disponibles
dans le menu ANOVA : Test Brown-Forsythe ou le Welch Robust F.
Il est aussi possible d’utiliser les tests de comparaisons multiples qui ne demandent pas la prémisse
d’égalité des variances.
Nous savons que même si la moyenne de la variable testée dans la population était la même pour les
différents groupes formés par la variable catégorielle, nous n'aurions pas la même valeur de moyenne
pour les différents échantillons puisque la moyenne d'un échantillon varie toujours. Des échantillons
différents d'une même population produisent des moyennes et des écart-types différents.
Nous devons donc tester si ces différences sont attribuables à la variabilité naturelle de la moyenne
entre différents échantillons d’une même population ou bien s'il y a une raison de croire qu’il existe
un ou des groupes qui se distinguent réellement de la moyenne populationnelle.
Dans l'analyse de variance, nous allons diviser la variabilité en deux parties : la variabilité dans un
groupe autour de la moyenne de chaque groupe, appelée variabilité intra-groupes (within-group) et la
variabilité entre les moyennes des groupes, appelée variabilité inter-groupes (between-groups).
La statistique F produite par l'ANOVA est le rapport entre la variabilité inter et intra-groupes. Elle
permet de déterminer s'il existe une différence significative entre les groupes. Comme la variabilité
inter-groupes est le numérateur de ce rapport, plus les moyennes sont éloignées les unes des autres,
plus la valeur F est élevée.
Tout comme la valeur t pour le test T, il faut comparer la valeur F obtenue à la distribution F. Le degré
de signification va dépendre de trois facteurs : la valeur F et les deux degrés de liberté (inter et intra-
groupes).
10.5 La distribution F
À l’image de la distribution normale et de la distribution t, la distribution F est calculée
mathématiquement. Elle est utilisée lorsque l’on veut tester une hypothèse concernant la variance
d’une population.
Le théorème central limite ne fonctionne pas avec la variance, la distribution des variances n’étant pas
normale.
Page | 54
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
La distribution F représente le rapport entre les deux indices de variabilité et est indexée par deux
degrés de liberté (inter et intra-groupes).
Ces tests sont appelés post-hoc ou tests a posteriori. Ils indiquent quels groupes se distinguent.
Pourquoi ne pas faire une série de tests t pour comparer chaque groupe entre eux ?
Parce qu’il y aurait plusieurs comparaisons pairées à effectuer ! Lorsque l’on effectue plusieurs tests
de comparaisons sur les mêmes moyennes, on augmente les probabilités de trouver un résultat
significatif uniquement par la chance même si les moyennes sont identiques dans la population. Ceci
est ce qu’on appelle le problème des comparaisons multiples.
Pour y remédier, on utilise souvent une correction basée sur le nombre de comparaisons à effectuer.
Plus il y a de comparaisons, plus le seuil de signification minimal devra être bas. Idéalement, on ne
devrait observer que les comparaisons qui sont d’intérêt.
La correction de Bonferonni est l'une des plus simples, car elle ajuste le degré de signification en
divisant 0,05 par le nombre de comparaisons à effectuer.
En extrayant la racine carrée de ce rapport, on obtient la valeur de R (r) qui s’interprète de la manière
suivante :
Page | 55
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
4. L'analyse de variance se trouve aussi dans le menu Analyse, Comparer les moyennes. Vous
devez choisir ANOVA à 1 facteur.
2. Dans la fenêtre ANOVA, vous insérez la ou les variables continues à tester dans la boite Liste
Variables dépendants. Comme pour le test t, SPSS produira une analyse par variable
continue.
3. Vous insérez la variable de groupe dans la boite Critère.
Le bouton
L'analyse de contraste est utilisée lorsque le chercheur a une hypothèse de départ à vérifier et qu'il
sait déjà quels groupes doivent se distinguer.
Page | 56
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
Le bouton
Il est également possible de réaliser des tests de comparaisons multiples qui préciseront où se situent
les différences lorsque le chercheur n'a pas d'hypothèse de départ quant à ces dernières. L'option Post
Hoc fournit plusieurs choix de tests complémentaires.
Page | 57
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
Le premier encadré offre différents tests à réaliser si la prémisse d'homogénéité des variances est
respectée. Il serait fastidieux de décrire l'ensemble de ces tests. Nous n'allons donc que présenter les
plus fréquemment utilisés.
Bonferroni : utilise le test t pour comparer les moyennes des groupes deux à deux et ajuste le degré
de signification en divisant 0,05 par le nombre de comparaisons à effectuer, donc il diminue le risque
de commettre une erreur de type I.
Tukey : compare les groupes deux à deux à partir d'une distribution t standardisée et ajuste le degré
de signification pour le risque d'erreur. Il est plus puissant que le test Bonferroni sur de grands
échantillons.
Scheffe : réalise simultanément toutes les comparaisons de moyennes deux à deux à partir de la
distribution F. Il peut être utilisé pour examiner toutes les combinaisons linéaires possibles des
moyennes de groupe, pas seulement les comparaisons deux à deux. Il est moins puissant que le test
Tukey.
Le deuxième encadré offre des tests de comparaisons multiples lorsque la prémisse d'homogénéité
des variances n'est pas respectée.
Tamhane's T2 : ce test est très conservateur (faible probabilité de commettre une erreur de type I).
Dunnett's T3 et C : ces deux tests font une correction sévère pour réduire le risque d'erreur de type I.
Games-Howell : assure la plus grande puissance statistique, mais le risque de commettre une erreur
de type I est plus élevée lorsque l'échantillon est petit. Ce test est aussi précis lorsque les groupes sont
inégaux.
Le Niveau de signification : vous pouvez indiquer le seuil de signification que vous voulez. Par
défaut, ce seuil est fixé à 0,05, comme pour les autres tests.
Le bouton
Ce bouton vous offre différentes possibilités par rapport aux statistiques, aux graphiques et aux
valeurs manquantes.
Page | 58
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
L'encadré Statistiques
Caractéristiques : SPSS calcule le nombre de cas, la moyenne, l'écart type, l'erreur- type de la
moyenne, les valeurs minimales et maximales et l'intervalle de confiance pour chacune des variables
dépendantes.
Effets fixes et aléatoires : affiche l'écart-type, l'erreur-type et l'intervalle de confiance pour les effets
fixes du modèle ainsi que l'écart-type, l'intervalle de confiance et la variance inter-composante pour
les effets aléatoires du modèle.
Test d'homogénéité de variance : utilise la statistique de Levene pour évaluer si les variances sont
égales.
Welch : évalue également l'égalité de la moyenne des groupes, mais à partir de la statistique Welch.
Cette statistique est également préférée à la statistique F lorsque les variances sont inégales.
Diagramme des moyennes : il faut cocher cette option lorsque l'on désire obtenir un graphique qui
compare les moyennes pour chacun des groupes.
Page | 59
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
Ce type de graphique permet de positionner les moyennes des groupes ainsi que l’intervalle de
confiance à l’intérieur duquel nous sommes à 95 % certains que la vraie moyenne populationnelle se
situe.
Il n'est pas disponible dans les options de l'ANOVA, mais est très utile pour examiner la distribution
de la variable dépendante pour les différents groupes.
3. Vous choisissez ensuite ce que vous désirez que les données représentent :
Récapitulatifs pour groupes d'observations : les points illustrent la moyenne de la variable
continue pour chaque valeur de la variable catégorielle. C'est l'option par défaut.
Récapitulatifs pour variables distinctes : les points montrent la moyenne de chaque variable
continue choisie.
Page | 60
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
6. Dans l'encadré Les bâtons représentent, vous pouvez choisir ce que vous voulez que les barres
de chaque côté de la moyenne représentent. Dans notre cas, nous conservons l'option par défaut, c'est-
à-dire l'intervalle de confiance. Vous auriez également pu choisir d'illustrer l'erreur standard de la
moyenne ou l'écart-type.
8. Vous pouvez aussi réaliser le graphique en ajoutant une variable catégorielle en colonnes ou en
lignes. Vous obtiendrez alors deux graphiques un à côté de l'autre ou un par-dessus l'autre.
9. Comme pour les autres graphiques, vous pouvez reproduire la mise en forme d'un graphique
précédent en cochant Utiliser les spécifications du diagramme de.
10. Vous pouvez aussi ajouter un titre et un sous-titre à votre graphique ou une note au bas de celui-
ci grâce au bouton .
Page | 61
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286
STATISTIQUE COMPUTATIONNELLE AVEC SPSS CHAPITRE 9 : TEST T POUR ÉCHANTILLONS INDÉPENDANTS
11. Enfin, le bouton vous permet de représenter ou non les valeurs manquantes. Il s'agit
de la même option que vous trouvez dans le diagramme à secteurs décrit dans la section Stat
descriptives.
Page | 62
Enseignant : LOKOSSOU Durand
Ingénieur Statisticien Economiste
+229 96867286