Vous êtes sur la page 1sur 14

COURS SPSS - TRAVAUX PRATIQUE

I. Présentation du logiciel SPSS

1) Définition et Fonction de SPSS


SPSS: Statistical Package for the Social Sciences
Fonctions : Saisir données, les organiser, les transformer, les présenter sous forme résumée (tableaux,
graphiques,…), les analyser (calculs tests régression)
SPSS ne fait qu’exécuter les commandes, le choix des commandes appropriées et l’interprétation
des résultats incombent à l’opérateur
2) Schéma de fonctionnement de SPSS

3) Les fenêtres de SPSS


a) L’Editeur de données/Data Editor :
C’est la 1 ère fenêtre qui apparaît au début de chaque session SPSS. Il permet de gérer, créer, éditer
et manipuler les données et les variables ;
Le fichier Editeur de données est reconnaissable par son icône et son extension «.SAV » ;
Il se compose principalement d’une barre de titre, d’un menu de fonctions, d’une barre d’outils et
d’une matrice de données ou d’informations ;
Il se subdivise en deux onglets ou vues en cliquant dans le coin inférieur gauche de l’éditeur (Barre
d’état) : l’affiche des données (Data view) et l’affichage des variables (Variable view).

L’Editeur de données/Data Editor :


Affichage des données/Data view

1
Chaque ligne représente un cas (observation). Ex: un individu ou un répondant à un questionnaire ;
Chaque colonne représente une variable. Ex: une question du questionnaire ;
Chaque cellule (intersection de ligne et colonne) contient la valeur (réponse) d’une variable (question)
pour un cas (individu) ;
Dans cette vue, les données peuvent être numérique ou alphanumérique ;
La grille de données n’est pas dynamique (impossible d’insérer formules de calcul) ni (impossible
d’insérer formules de calcul) ni relationnelle (liens impossibles entre cellules)
Ordre des données/variables peut être changé
Possibilité de copier, coller ou effacer des cellules des cas ou des variables de la grille cellules, des cas
ou des variables de la grille.

L’Editeur de données/Data Editor :


Affichage des Variables/Variable view

Vue des variables fournit une description des caractéristiques des variables de la grille ;
Les variables se retrouvent en ligne ;
Les colonnes décrivent les caractéristiques des variables.

Nom Nom de la variable (maximum 8 caractères)


Type de données acceptées par la variables (nombres, caractères, date, etc…)
Type
Nombre maximal de caractères retenus pour la donnée à saisir
Largeur
Nombre de chiffre après la virgule pour les données numériques
Décimales
Etiquette explicitant la variable
Etiquettes
Permet de définir les étiquettes des valeurs (exp : 0 « féminin » 1« masculin » )
Valeurs
Permet de définir les valeurs considérées comme manquantes
Manquant
Largeur de la colonne dans la présentation de la variable
Colonnes
Position (gauche, centre, droite) de la variable dans la colonne
Aligner
Echelle, ordinale ou nominale
Mesure

2
b) L’Editeur de résultats/Output

La fenêtre de résultats, reçoit tous les résultats des commandes mises en œuvre : sélection selon un
critère particulier, tableaux statistiques, tableaux croisés, résultats d'une régression multiple ou d'une analyse de
données, etc. Les éventuels messages d'erreur apparaissent également dans cette fenêtre. Ces fichiers
portent l'extension .spo et sont au format texte.
b) L’Editeur de syntaxe/Syntax Editor

La fenêtre de syntaxe, permet d’enregistrer ou d’écrire des programmes d’exécution sur les variables. Les
commandes s’inscrivent dans cette fenêtre de deux manières. D’une part, à la suite d’une sélection de boîtes de
dialogue, il est possible de « COLLER » la syntaxe sous-jacente. D’autre part, une fenêtre de syntaxe peut
être ouverte afin d’y faire figurer les commandes à exécuter. Plusieurs fenêtres de syntaxe peuvent être ouvertes
à la fois. Ces fichiers portent l'extension .sps

3
En résumé on a :

Types de
Extension Les fenêtres associées
Fichiers
L’éditeur de données affiche le contenu de la base de données. Vous
Fichier de pouvez créer de nouvelles bases de données ou modifier une base
*.SAV existante dans l’éditeur des données. Les lignes de l’éditeur de données
données
correspondent aux individus, les colonnes représentent chacune des
variables de l’étude et les cellules contiennent les valeurs.
L’éditeur de syntaxe permet d’écrire des programmes d’exécution sur les
variables. Les commandes s’inscrivent dans cette fenêtre de deux manières.
Fichier de D’une part, à la suite d’une sélection de boîtes de dialogue, il est possible
*.SPS
syntaxe de « COLLER » la syntaxe sous-jacente. D’autre part, une fenêtre de
syntaxe peut être ouverte afin d’y faire figurer les commandes à exécuter.
Plusieurs fenêtres de syntaxe peuvent être ouvertes à la fois.

Fic hier de L’éditeur de résultats affiche tous les résultats des statistiques demandées
résultats *.SPO sur les variables. Les résultats peuvent être enregistrés pour une
utilisation future et d’autres fenêtres de résultats peuvent être
simultanément ouvertes

4) Les menus de SPSS


SPSS Windows offre la possibilité de réaliser de nombreuses opérations et analyses statistiques en utilisant
l'interface de boîtes de dialogue.

La barre de menu de SPSS

Le menu "Fichier", outre les fonctions standards à toutes les applications Windows, permet d'afficher les
informations sur les fichiers de données et d'importer les dictionnaires de données. De plus, il gère l'importation
et l'exportation des fichiers de données sous les divers formats proposés par SPSS Windows (ASCII, DBAS E,
EXCEL…).
Le menu "Edition", comme pour toutes les applications Windows, est consacré aux opérations éditoriales
(copier, coller, recherche de texte ou de données, etc. La modification des paramètres de travail s'effectue à ce
niveau par boîte de dialogue "options": ouverture automatique d'une nouvelle fenêtre de syntaxe au lancement
de SPSS Windows, format par défaut des nouvelles variables et des symboles monétaires, ordre d'affichage
des variables dans les boîtes de dialogue, options de calcul, aspect par défaut des graphiques, format des
résultats (bordures des tableaux, etc.), taille des pages de résultats, messages systèmes affichés dans la fenêtre
de résultats.
Le menu "Données" est consacré à la gestion et la transformation des fichiers de données. Ses options
permettent, entre autres, de fusionner des fichiers, de trier, de pondérer et d'agréger des données, de créer

4
des variables, de définir des étiquettes, de sélectionner des sous-groupes et de séparer un fichier.

Le menu "Transformer" regroupe les options relatives à la transformation et la manipulation des


variables : recodage, transformation et création de variables à partir de calculs, de fonctions
mathématiques et d'expressions logiques fondées sur des variables existantes, comptage des occurrences.
Le menu "Analyse" comporte la liste de toutes les analyses statistiques disponibles. Elles sont en effet
fonction des modules installés. Par exemple, la figure 4 indique le chemin pour effectuer une analyse de
variance par le menu.

Le menu "Graphes" commande la création de tous les graphiques proposés par SPSS Windows
(diagrammes en barres, courbes, nuage de points, etc.).

Le menu "Utilitaires" contrôle l'affichage de la liste des variables du fichier de travail, du choix entre
l'affichage des labels ou des valeurs dans la fenêtre de données et de l'impression des informations sur le
fichier actif dans la fenêtre de résultats. La désignation des fenêtres et la définition de groupes de
variables 2 s'effectuent à ce niveau. Un index contenant une brève description des commandes du langage
SPSS est également disponible.
Le contenu des menus "Fenêtre" et "Aide" est standard.

5) La barre de boutons et la barre d'état


SPSS Windows dispose d'une barre dont les boutons constituent des raccourcis pour des opérations
courantes. En outre, la barre d'état affiche des informations sur le fichier actif.

 La barre de boutons a l'aspect suivant :

 La barre d'état affiche des informations sur les opérations en cours suivantes et a l’aspect suivant :

L'état courant du processeur est affiché. Si une commande est en cours d'exécution, le processeur indique
son nom et le numéro d'observation en cours de traitement.
Par
exemp
le :
 L'état du filtre si une sélection a été effectuée.
 La pondération lorsque les données sont pondérées par une variable.
 La division d'un fichier en sous-groupe selon un critère.

5
II. La gestion des fichiers de données
1) Transformation d'un fichier de données
Les données et les variables d’un fichier de données ont souvent besoin d’être transformées pour être adaptées
à certaines situations ou problématiques d’analyse ;

Les transformations peuvent prendre de multiples formes (insertion, recodage, fusions, restrictions, spécifications,
…) ;

Les transformations peuvent être effectuées à l’aide de la procédure par commandes de la page de syntaxe ou de
la méthode interactive avec les menus « Transformer » ou « Données ».

a) Création d’une variable par insertion

Afficher la fenêtre « Affichage des variables » de l’éditeur de données


Sélectionner (en cliquant) la variable ou la ligne devant suivre la nouvelle variable à créer
Cliquer sur « Edition » puis « Insérer une variable »
Une ligne de variable est ainsi créée
Définir les caractéristiques de la nouvelle variable

La rubrique « Insérer les variables » du menu contextuel (clic sur bouton droit de souris à partir du numéro d’ordre
d’une variable) permet aussi d’insérer une nouvelle variable au-dessus de celle sur laquelle le clic droit a été
effectué
L’insertion d’une variable peut aussi se faire verticalement à partir de la fenêtre « Affichage des données » de
l’éditeur de données.

b) Création d’une nouvelle variable à partir d’une variable


existante
Il est possible de créer de nouvelles variables à partir de variables existantes grâce aux rubriques « Calculer », «
Compter » ou « Recoder » du menu « Transformer ».

Il est aussi possible de créer une nouvelle variable à partir de la syntaxe

Ouvrir ou créer une page de syntaxe


• Structure de la commande de syntaxe :
• Nom de la commande « Compute »
• Nom de la nouvelle variable
• Signe égal ( = )
• Nom de la variable mère
• Point ( . )
• Instruction d’exécution « Execute »
• Point ( . )
• Exemple d’écriture de commande :
Compute v2 = v1.
Execute.

6
• Après écriture de la commande, la sélectionner et la faire exécuter.

• Définir les caractéristiques de la nouvelle variable.

• Pour la création d’une variable à partir de variables existantes, des opérations arithmétiques ( + ,
- , * , / ) ou d’autres fonctions inscrites dans SPSS peuvent être utilisées

• Exemple de cas d’utilisation d’opérations arithmétiques ou de fonctions:


– Soit v1 dans le fichier : Age actuel des enquêtés
– Soit v2 dans le fichier : Durée de mariage des enquêtés
– Créer la variable v3 : Age des enquêtés au moment du mariage

• Exemple d’écriture de commande d’utilisation d’opérations arithmétiques ou de


fonctions:
Compute v3 = v1 – v2.
Execute.
c) Changement du nom variable
d) Changement de position d’une variable
e) Suppression d’une variable
f) Procédure d’insertion d’une observation
g) Changement de position d’une observation
h) Suppression d’une observation
i) Labellisation d’une variable et des valeurs
Labelliser une variable c’est attribué une étiquette (nom explicite) à cette variable ;
Labelliser les valeurs d’une variable c’est attribué une étiquette aux modalités de cette
variable.
Deux méthodes à savoir : la méthode interactive et la méthode de syntaxe
Exple :
Variable labels v1 "Niveau d’instruction".
Execute.

value labels v1 0 "Aucune instruction" 1 "Primaire" 2 "Secondaire" 3 "Supérieur".


Execute.
j) Recodage des modalités d’une variable
Recoder une variable, c’est modifier la façon dont les valeurs et les modalités sont notées
C’est une opération d’affection de nouveaux codes aux modalités ou de regroupement de
catégories distinctes
Le recodage répond à un souci de changement de la structure d’une variable pour satisfaire certaines
analyses ou résorber un problème donnée (pléthore de modalités, faiblesse d’effectifs, …).
On peut recoder une variable en créant une nouvelle variable ou en modifiant la variable elle-même.
recode v1 (0=1) (1=2) (2=2) (3=2).
Execute.
recode v1 (0=1) (1=2) (2=2) (3=2) INTO v1rec.
Execute.

7
2) La restructuration des fichiers
Pour les besoins d’analyses spécifiques, il est parfois nécessaire de remanier ou restructurer les données d’un ou
plusieurs fichiers afin d’obtenir une configuration adaptée aux objectifs à atteindre. Pour cela, il est souvent
nécessaire de :

Trier les observations


Sélectionner les observations
Fragmenter ou scinder des fichiers
Pondérer des fichiers
Tout comme pour la transformation des données, il faut prendre des précautions pendant la
restructuration des fichiers de données:
– Après avoir corrigé les erreurs dans un fichier, veiller à toujours garder une copie des données brutes
– Effectuer les restructurations sur un fichier de travail (copie) et le fichier original.

a) Tri des observations d’un fichier


Le tri est une fonction qui permet Dans le menu, le tri s’obtient à partir du menu « Données »
d’ordonner (de façon croissante ou dans la rubrique « Trier les observations » qui donne la boîte
décroissante) une grille de données
selon une ou plusieurs variables de tri. de dialogue suivante :
Il est ainsi possible de constater
comment se compose des sous-
groupes du fichier choisis en fonction de
certaines variables. La structure de
syntaxe du tri d’un fichier selon une
variable est:
– Nom de la commande « SORT CASES BY »
– Nom de la variable (Ex. v1, age, region)
– Spécification de l’ordre de tri « A » pour
Croissant « D » pour Décroissant
– Point ( . )
• Exemples d’écriture de tri :
SORT CASES BY v024 (A).

SORT CASES BY v024 (D).

• Après écriture de la commande, la


sélectionner et la faire exécuter

b) Sélection des observations d’un fichier


La sélection est une fonction qui permet restreindre le fichier de données à un sous-groupe de cas.
Seuls les cas satisfaisant la condition dans la commande sont retenus pour les analyses
subséquentes.
Dans le menu, la sélection des observations s’effectue à partir du menu « Données » dans la rubrique «
Sélectionner des observations » qui donne la boîte de dialogue suivante :

c) Sélection des variables

8
d) Sélection des variables d’un fichier
La procédure « Définir des groupes de variables » permet de créer une liste préférentielle de variables à faire
figurer dans les boîtes de dialogue pour les opérations de transformation et d’analyse.
Dans le menu, la sélection des variables se fait à partir du menu « Outils » dans la rubrique « Définir des groupes
» qui donne la boîte de dialogue 1. La seconde boîte de dialogue permet d’activer la liste préférentielle de variables
à partir de la rubrique « Utiliser les groupes ».

e) Fragmenter un fichier de données


Fragmenter un fichier de données vous permet de scinder Dans le menu, la fragmentation d’un fichier de
ce fichier en plusieurs groupes, en fonction des valeurs données se fait à partir du menu « Données
d'une ou plusieurs variables de regroupement. C'est à dire » dans la rubrique « Scinder un fichier ».
qu'on peut analyser séparément des sous- groupes de • L'option «Comparer les groupes» donne un
l'échantillon afin de les comparer. Par exemple le milieu de tableau commun pour les sous-groupes et
résidence (Urbain 1, urbain 2) le sexe (Homme 1, Femme l'option «séparer les résultats par groupes
2), la religion (Chrétienne 1, Musulmane 2, Autre 3) » donne des tableaux séparés pour les sous-
groupes.
Si vous sélectionnez plusieurs variables de regroupement, les • Si la fragmentation est activée, SPSS
observations sont regroupées pour chaque variable au sein inscrit une information (Séparer fichier
des modalités de la variable précédente dans la liste des actif) dans la barre des tâches, dans le
coin droit en bas.
variables de regroupement.

9
f) Pondération d’un fichier de données
La Pondération est une opération pour rééquilibrer les Dans le menu, la pondération d’un fichier de données
échantillons de fichiers de données obtenus à partir de se fait à partir du menu « Données » dans la rubrique
collecte de données sur une base de sondage. « Pondérer les observations ».
• La structure de syntaxe de pondération d’un fichier
est:
– Nom de la commande «WEIGHT BY»
– Nom de la variable – Point ( . )
• Exemples d’écriture de pondération :
WEIGHT BY v005 .
• Si la pondération est activée, SPSS inscrit une
information (Pondération activée) dans la barre des
tâches, dans le coin droit en bas.

g) Fusion des fichiers


Les données ou les variables à traiter ou à analyser sont souvent réparties dans des fichiers différents.
Nécessité de les combiner dans un seul fichier

⇒ Fusion des fichiers


Deux façons de fusions des fichiers existent :
Fusion des observations (fusion de fichiers non parallèles) : les variables des fichiers sont les mêmes,
mais les observations (cas, individus) différents
Fusion des variables (fusion de fichiers parallèles) : les observations sont identiques, mais
les variables sont différentes
Le fichier dans lequel sont importés les observations ou variables est appelé « Fichier principal »
Le fichier à partir duquel sont importés les observations ou variables est appelé « Fichier de
consultation »
La fusion des fichiers requièrent que les variables ou les observations soient ordonnées de la même manière
dans les différents fichiers

Fusion des observations de deux fichiers


Prérequis : Deux bases de données (Base01 et Base02)
Les mêmes variables dans les deux bases (Base01 :15 Variables et Base02 :15 Variables)
Observations différentes dans les deux bases (Base01 :150 Cas et Base02 :45 Cas)

Le schéma de fusion est le suivant :

Ouvrir les deux fichiers et vérifier que le nombre, les noms, l’ordre et les paramètres (nature, longueur,…) des
variables sont similaires
• Ouvrir ensuite le fichier principal seul

• Sélectionner les options « Fusionner les fichiers » « Ajouter des observations » du Menu « Données »

10
• Dans la boîte de dialogue qui apparaît, ouvrir le fichier de consultation

• Une autre boîte de dialogue pour la fusion des cas apparaît


• Vérifier le contenu de la boîte et valider si Ok
• Enregistrer le fichier principal sous un autre nom
Ce nouveau fichier contient dorénavant les observations cumulées du fichier principal et du fichier de
consultation (195 pour l’exemple) pour le même nombre de variables (15 pour l’exemple)

Fusion des variables de deux fichiers


Prérequis : Deux bases de données (Base01 et Base02)
Variables différentes dans les deux bases (Base01 :10 Variables et Base02 :5 Variables)
Les mêmes observations dans les deux bases (Base01 :150 Cas et Base02 :150 Cas)

Le schéma de fusion est le suivant :

Ouvrir les deux fichiers et vérifier qu’ils ont une variable commune qui servira de clé d’appariement
• Trier les deux fichiers en fonction de la clé d’appariement dans le même ordre – Enregistrer et
Fermer.
• Ouvrir ensuite le fichier principal seul

• Sélectionner les options « Fusionner les fichiers » « Ajouter des variables » du Menu « Données »

• Dans la boîte de dialogue qui apparaît, ouvrir le fichier de consultation

• Une autre boîte de dialogue pour la fusion des variables apparaît

• Vérifier le contenu des variables exclues et des variables du nouveau fichier de travail
« Variables exclues » liste des variables du fichier de consultation qui figurent déjà dans le fichier principal

• « Nouveau fichier de travail» liste cumulée des variables du fichier principal et du fichier de consultation

• Cocher la case d’appariement des observations et choisir l’option d’appariement

• Choisir la clé d’appariement parmi les « Variables exclues » et la faire venir dans la lucarne clé d’appariement
grâce à la flèche

• Valider le processus avec « Ok »

11
Un message de vérification que les deux fichiers sont triés dans le même ordre en fonction de la clé
d’appariement apparaît

• Si le tri n’avait été effectué, cliquer sur « Annuler » pour reprendre le processus en triant

• Si le tri avait été effectué, SPSS procède à la fusion des variables des deux fichiers

• Les variables du fichier de consultation apparaissent en dessous de celles du fichier principal


• Enregistrer le fichier principal sous un autre nom
Ce nouveau fichier contient dorénavant les variables cumulées du fichier principal et du fichier de
consultation (15 pour l’exemple) pour le même nombre d’observations (150 pour l’exemple).
Remarque :
Les tables de consultation
Une table de consultation est un fichier dont les observations peuvent être appliquées à plusieurs
observations d'un autre fichier : par exemple, un fichier avec des informations au niveau du ménage
est une table de consultation que l'on peut fusionner avec un fichier contenant des données sur les
individus de ces ménages. Pour fusionner un fichier et une table de consultation par l'option "Fusionner
des fichiers selon les variables" du menu "Données". Au niveau de la boîte de dialogue (figure 8), il suffit
d'indiquer que le fichier externe (ou de travail) est une table de consultation.

h) Agrégation des données d’un fichier


L’Agrégation est une opération qui permet d’attribuer les valeurs d’une observation (cas) donnée à
d’autres observations appartenant au même sous-groupe.
Exemples:
– Attribuer le niveau de vie d’un ménage à l’ensemble des membres du ménage
– Attribuer le sexe du chef de ménage à l’ensemble des membres du ménage
– Affecter le nombre total d’enfants d’un certain âge de chaque ménage à l’ensemble des membres du
ménage.
Selon les cas d’agrégation, l’opérateur doit rechercher les variables, la bonne combinaison de formules et de
démarches pour atteindre les résultats escomptés.

12
L’Agrégation des données se fait à partir du menu « Données » dans la rubrique « Agréger »
Cette rubrique permet d’obtenir les fenêtres suivantes:

Exemple : la moyenne d’âge selon le statut matrimoniale

i) Procédure de lecture d’un fichier en format texte


Le transfert sous SPSS de fichier format texte (*.txt) se fait avec l’aide de l’assistant de lecture du format texte
Cet assistant est activé par la rubrique « Lire les données texte… » du menu « Fichier », après avoir choisi
le fichier Texte à transférer

Il permet le transfert de fichiers Texte de divers formats :


• Fichier délimité par des tabulations
• Fichier délimité par des espaces
• Fichier délimité par des virgules
• Fichier délimité par un caractère prédéfini
• Fichier à champs fixes
Le transfert des fichiers format Texte se fait en six étapes correspondant à des fenêtres d’opérations et
d’options à spécifier.

3) Traitement des valeurs manquantes


Les raisons qui peuvent conduire à l’apparition de valeurs manquantes dans la base de données sont diverses.
L’opérateur de saisie peut sauter des variables pourtant bien renseignées. Des variables peuvent aussi ne pas
être renseignées sur le questionnaire et restées non détectées à la fois par le personnel de terrain et par
l’opérateur de saisie. Certains questionnaires peuvent contenir des données manquantes, soit parce que la
personne interrogée n’a pas répondu à la question, soit parce que l’enquêteur n’a pas posé la question ou
a oublié de reporter la réponse.
Les remplacements de données manquantes se font par plusieurs méthodes. Il existe des méthodes
standard d’imputation proposées par SPSS (moyenne de la série, moyenne des points voisins,
médiane des points voisins, interpolation linéaire et tendance linéaire au point). Il revient à l’utilisateur
de faire preuve d’imagination pour affiner les imputations en ayant recours à des combinaisons (scission

13
du fichier, tri des observations suivant des critères).

14

Vous aimerez peut-être aussi