Vous êtes sur la page 1sur 147

SPSS

(Statistical Package for the Social Sciences)


(Statistical Product and Service Solutions)

Said El Hassani
SPSS
(Statistical Package for the Social Sciences)
(Statistical Product and Service Solutions)

Cours préparé par : Said El Hassani

Said El Hassani
Said El Hassani
Plan du Cours

Introduction
Vocabulaire de Base et Gestion des Fichiers de Données
Présentation des Fenêtres SPSS
Saisie des Données
Importation des Données
Manipulation des Données
Plusieurs Fonctionnalités seront présentées
Quelques Analyses Statistiques
Statistique Descriptive
Exploration des Données
Tableau de Fréquence
Tableaux Croisés
Modification et Exportation des Résultats

Cours SPSS Said El Hassani


Plan du Cours

Introduction
Vocabulaire de Base / Gestion des Fichiers de Données
Présentation des Fenêtres SPSS
Saisie des Données
Importation des Données
Manipulation des Données
Plusieurs Fonctionnalités seront présentées
Quelques Analyses Statistiques
Statistique Descriptive
Exploration des Données
Tableau de Fréquence
Tableaux Croisés
Modification et Exportation des Résultats

Said El Hassani
Introduction
Qu'est-ce que SPSS

SPSS : signifie « Statistical Package for the Social Sciences » ou « Statistical Product
and Service Solutions »

Objectif : Offrir un outil logiciel permettant de réaliser un large éventail d’analyses


statistiques habituellement utilisées en sciences humaines et sociales.
Décrire les données
Vérifier des hypothèses statistiques

Logiciel très complet : Nous ne verrons qu'une faible partie de ses possibilités.

Vocation Commerciale :
Il est couteux
On lui préfère parfois d’autres logiciels comme
«R» : Logiciel Libre

« XSLSTAT » : Logiciel Commercial


« S-Plus » : Logiciel Commercial
Cours SPSS Said El Hassani
Introduction
Historique de SPSS

Première Version en 1968

Initialement nommé :
« Statistical Package for the Social Sciences »,
puis modifié à : «Statistical Product and Service Solutions »

SPSS est aussi le nom de la société (SPSS Inc.).

En 2009, la compagnie est rachetée par IBM pour 1,2 milliard de Dollars

Versions :
SPSS 1 - 1968
SPSSx release 2 – 1983
……..
C’est un logiciel Mature
IBM SPSS Statistics 20.0 Août 2011
IBM SPSS Statistics 21.0 Août 2012
IBM SPSS Statistics 22.0 Août 2013
Cours SPSS Said El Hassani
Introduction
Pourquoi donner un cours SPSS
Vous serez amené des fois à manipuler des données statistiques
Ou confronté a des données statistiques
Se familiariser avec un outils de traitement statistique
Capable de décrire des données statistique extraites de l’exercice de vos
tâches professionnelle

Nous laisserons les fondements théoriques mathématiques au second plan


Nous nous intéresseront à la dimension méthodologique et technique de l’analyse
des données

Nous verrons donc comment :


Coder des données issus d’un questionnaire ou d’un entretien
Comment extraire des informations descriptives
Comment les résumer graphiquement

Cours SPSS Said El Hassani


Plan du Cours

Introduction
Vocabulaire de Base / Gestion des Fichiers de Données
Présentation des Fenêtres SPSS
Saisie des Données
Importation des Données
Manipulation des Données
Plusieurs Fonctionnalités seront présentées
Quelques Analyses Statistiques
Statistique Descriptive
Exploration des Données
Tableau de Fréquence
Tableaux Croisés
Modification et Exportation des Résultats

Said El Hassani
Vocabulaire de Base / Gestion des Fichiers de Données

Logique SPSS
Avant de prendre en main SPSS, il est important d’en comprendre la logique :

Dans un tableau type Excel, les données et les graphiques sont dans une même
feuille :

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Logique SPSS
Dans SPSS :

Les données et les résultats restent constamment séparés


Les données sont enregistrées dans des fichiers .sav
Les résultats sont disponibles dans des fichiers .spv ou .spo
Pour interagir avec les données comme pour les transformer ou en extraire des
résultats, dans des fichiers .sps on utilise une syntaxe (des lignes de code). Ce
code est stocké
Il y’a aussi les scripts : ensemble de lignes de code exécutable, il sont stockés
dans des fichiers .sbs

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Logique SPSS
Données Résultats

Syntaxe Syntaxe
.spv
.sav
.spo

Syntaxe Script

.sps .sbs
Cours SPSS Said El Hassani
Vocabulaire de Base / Gestion des Fichiers de Données

Logique SPSS
Syntaxe SPSS:

C’est un langage spécifique à SPSS

Tous ce que l’on peut faire interactivement par menu est généré par le moteur
SPSS comme syntaxe

On n’utilisera pas ce langage  


GET
FILE='C:\Exploitation\Cours Fac Salé\SPSS\Exemples\Ventes_Voitures.sav'.
DATASET NAME Ensemble_de_données1 WINDOW=FRONT.
COMPUTE Classe_Consommation=Consommation / 1.5.
VARIABLE LABELS Classe_Consommation 'Classe Consommation'.
EXECUTE.
SUMMARIZE
/TABLES=Prix BY Modele
/FORMAT=VALIDLIST NOCASENUM TOTAL LIMIT=100
/TITLE='Récapitulatif des observations'
/MISSING=VARIABLE
/CELLS=COUNT MEAN MEDIAN GMEDIAN SUM MAX STDDEV VAR.

Cours SPSS Said El Hassani


Plan du Cours

Introduction
Vocabulaire de Base / Gestion des Fichiers de Données
Présentation des Fenêtres SPSS
Saisie des Données
Importation des Données
Manipulation des Données
Plusieurs Fonctionnalités seront présentées
Quelques Analyses Statistiques
Statistique Descriptive
Exploration des Données
Tableau de Fréquence
Tableaux Croisés
Modification et Exportation des Résultats

Said El Hassani
Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS


Avant de parler de saisie des données, nous devons parler des variables
Qu’est ce qu’une variable dans le sens SPSS

En plus d’être essentielle en statistique, une variable est au cœur de toute recherche
scientifique

Nous allons dans cette partie :

Présenter le vocabulaire propre aux variables


Distinguer entre les variables quantitative et qualitatives
Distinguer entre les variables quantitative, nominales et ordinales

Passer à la pratique  

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Définition d’une Variable

Définition d’une Variable

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Définition d’une Variable


Une variable est la propriété d’un événement ou d’un objet pouvant prendre
plusieurs valeurs  
Je n’ai pas compris : Soyons concret :
Genre : 1 : Femme
0 : Homme
Vous organisez Evénement
Satisfaction :
Sur une échelle
croissante de 1 à 5
Vous recevez Participants

Vous voulez savoir Âge Genre Satisfaction

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Définition d’une Variable


Evénement
Si on s’intéresse aux colonnes
Les colonnes sont nos
variables  
Participants

Âge Genre Satisfaction


Âge Genre Satisfaction 21 1 3
25 0 3
36 1 2
Si on s’intéresse aux lignes 26 1 4

En lisant une ligne, on reconstitue 48 1 1


le profil d’un événement ou d’un 18 0 4
individu
Une fois les résultats consignés, nous
obtenons la matrice suivante

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Définition d’une Variable


Une ligne est une observation
Une colonne est une variable

Âge Genre Satisfaction


21 1 3
25 0 3
36 1 2
Si on s’intéresse aux cases 26 1 4
48 1 1
18 0 4

Chaque case ne doit contenir qu’une seule donnée Appelée : Score de la variable

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Définition d’une Variable


Une ligne est une observation
Une colonne est une variable
Une case représente le score d’une variable pour une observation donnée

Satisfaction
Les scores possibles pour une variables sont Score 3
appelés ses : Modalités
Les types des modalités définissent les types Score 3
de s Variables Score 2
Score 4
Score 1
Score 4

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Définition d’une Variable


Une ligne est une observation
Une colonne est une variable
Une case représente le score d’une variable pour une observation donnée

Revenons à notre matrice : Âge Genre Satisfaction


Pour La variable « Âge » : Le signifiant est le 21 1 3
signifié : On dit que la variable est « Quantitative » 25 0 3

Pour les variables « Genre » et « Satisfaction » : 36 1 2


Le signifiant n’est pas le signifié : On dit que se 26 1 4
sont des variables « Qualitative(s) »
48 1 1
18 0 4

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Définition d’une Variable


Une ligne est une observation
Une colonne est une variable
Une case représente le score d’une variable pour une observation donnée

Revenons à notre matrice : Âge Genre Satisfaction


Pour vous donner un moyen de différencier 21 1 3
entre une variable Quantitative et une autre 25 0 3
Qualitative :
Essayons de sommer les scores des variables : 36 1 2
26 1 4
La somme des âges fait sens  Variable
Quantitative 48 1 1
La somme des genres et des satisfactions ne fait 18 0 4
pas sens  Variable Qualitative
∑ 174 4 17

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Définition d’une Variable


Concernant les variables Qualitatives:
Nous devons faire une dernière distinction selon que la variable présente une
forme d’ordre ou pas:
Variable Genre Variable Satisfaction
Âge Genre Satisfaction
Deux catégories : Une échelle croissante
Femme et Homme. Ne de 1 à 5. Présente un 21 1 3
présente pas d’ordre ordre 25 0 3
1 : Femme 5 : Très satisfait 36 1 2
0 : Homme 4 : Plutôt satisfait
3 : Satisfait 26 1 4
2 : Indifférent 48 1 1
1 : Déteste
18 0 4

La variable « Genre » ne présente pas d’ordre  elle est dite « Nominale »


La variable « Satisfaction » présente un Ordre  elle est dite « Ordinale »
Cours SPSS Said El Hassani
Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Saisie des Données

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Trois étapes sont essentielles à la saisie des données :

1. Définition des noms des variables de la matrice de données


2. Saisie proprement dite des données
3. Modification (s'il y a lieu) des propriétés des variables

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Les analyses se font à partir des données saisies

La qualité des analyses statistiques est fonction de


la dextérité du choix des variables et de la qualité
des données saisies.

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Au lancement du logiciel, on a
l’écran suivant
On peut choisir entre autres :
soit ouvrir une source de données
existante, soit saisir des données
nouvelles
Dans notre cas, on choisit de
saisir des données nouvelles

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Fenêtre d’affichage des données

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Fenêtre d’affichage des variables

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Tout ensemble de données SPSS comporte deux vues complémentaires


accessibles via leurs onglets

Une vue des données « Affichage des données »

Une vue pour la description des variables : « Affichage des Variables »

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données


Interface Utilisateur de SPSS
(a compléter)

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

L’affichage des données est très proche d’une feuille d’un tableur classique

Les variables sont placées en colonnes


Les observations sont placées en lignes

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Chaque variable est caractérisée par un ensemble d’informations


Nous allons dans la suite donner la liste et la signification de chacune de
ces informations

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Chaque variable est décrite par les caractéristiques suivantes :

Nom
Type
Longueur
Décimales
Etiquette
Valeurs
Manquants
Colonne
Alignement
Mesure
Role

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Caractéristiques des variables

Caractéristique Explication
C’est le nom de la variable. Il est unique. Il a généralement le sens
Nom de l’information qu’il porte (Ex: Age, Genre, datenaiss pour Date de
naissance, etc.). Le nom est le code de la variable.
Le type de la variable, il peut être Numérique, Chaine, Date,
Type Monétaire, ou autres ( Voir dans la pratique). Le type est
généralement lié aussi au sens de la variable.
C’est l’espace alloué à la variable par SPSS pour le stockage. Par
Longueur exemple, une variable de type Chaine et de longueur 10 ne peut
stocker que des chaines de 10 caractères.
Le nombre de décimales après la "virgule" (exemple : pour 3,4  1;
Décimales
pour 3  0

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Caractéristiques des variables

Caractéristique Explication
Un label descriptif pour la variable (exemple : « Âge du répondant »
pour la variable « Age »). L’étiquette de la variable peut être
Etiquette différente du nom de la variable. Elle peut être plus longue que le
nom de la variable. L’étiquette, et non le nom de la variable, suivra la
variable dans les sorties ( outputs).
Pour affecter des étiquettes descriptives de valeur pour chaque
valeur d'une variable. Cela est utile si votre fichier de données utilise
Valeurs
des codes numériques pour représenter des modalités non
numériques (par exemple, les codes 1 et 0 pour homme et femme)
Cette caractéristique donne sens aux valeurs manquantes. Elle sera
Manquants
présentée dans la suite de ce cours.
Colonnes La largeur de la colonne pour la variable en question.
Cours SPSS Said El Hassani
Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Caractéristiques des variables

Caractéristique Explication

Alignement L’alignement de la valeur de la variable : Droite, Gauche ou Centre.

Cette caractéristique donne la nature de la variable : Quantitative (ou


Echelle), Nominale ou Ordinale.
Echelles : pour les variables dont les valeurs sont quantitatives
continues et discrètes (exemple: nombre de livres empruntés, prix,
âge salaire, ...etc.)
Mesure Nominales : pour les variables dont les valeurs sont qualitatives
(situation familiale, sexe, etc.)
Ordinales pour les variables dont les valeurs sont qualitatives mais il
y’a un ordre hiérarchique entre les observations (niveau d’études,
qualité d'un travail, ...)

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Passons à la pratique

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Passons à la pratique
Essayons de créer un fichier de données qui répond à l’exemple précédent :

Les variables suivantes :

« Age » : Numérique
« Genre » : Chaine de longueur 1
« Satisfaction : Numérique

Ne pas se soucier des caractéristiques «Manquants » et « Valeurs »


On expliquera ces notions ultérieurement.

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

L’écran de description des variables devrais ressembler à ceci .

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Et l’écran de saisie devrais ressembler à ceci .

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Notion de valeurs Manquantes


L'option « Valeurs manquantes » permet de définir les valeurs de données
spécifiées comme valeurs manquantes spécifiées par l'utilisateur.
Par exemple, vous pouvez faire la distinction entre les données manquantes
parce qu'une personne interrogée a refusé de répondre et les données
manquantes parce que la question ne s'appliquait pas au répondant.
Les valeurs des données définies comme valeurs utilisateur manquantes
sont repérées par un indicateur en vue d'un traitement spécial et sont exclues
de la plupart des calculs.

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Notion de valeurs Manquantes


Les données manquantes ou non valides sont trop fréquentes pour être
ignorées.
Les personnes interrogées peuvent refuser de répondre à certaines
questions, ne pas connaître la réponse…..
L’absence d’une donnée est considérée automatiquement comme une
valeur manquante systémique
Les valeurs manquantes sont exclues des analyses et des opérations de
calcul
Il est conseillé de symboliser les valeurs manquantes par autre chose que le
vide

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données


Notion de valeurs Manquantes

Sur la variable «Âge», si on clique sur le champs « Manquants» de la


grille de visualisation des variables  On obtient la boite de dialogue
suivante
Cours SPSS Said El Hassani
Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Notion de valeurs Manquantes


La fenêtre vous donne trois choix:
Ou vous n’avez aucune valeur
manquante,
Ou vous avez jusqu'à trois valeurs
manquantes distinctes ( c’est ce que signifie
le mot « discrètes »)
Ou vous considérez comme manquantes
toutes les valeurs qui tombent dans l’étendu
entre deux nombres, avec la possibilité
d’avoir une valeur manquante distincte
additionnelle ( seulement dans le cas
d’une variable numérique)

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Notion de valeurs Manquantes


Remarque:
Les champs de données vides
sont gérés de la manière suivante: ils
sont convertis en données
manquantes par défaut, et signalées
par un point .
Lors des statistiques de
fréquence, SPSS donne
l’information sur les valeurs
manquantes

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Notion de valeurs Manquantes


Il faut donner une valeur significative à une valeur manquante
Par exemple, on peut attribuer le nombre 999 à la valeur manquante d’un
Âge.

Pratiquons cela sur notre exemple :


Donnons la valeur 999 à une valeur manquante de la variable « Âge »
C’est une variable discrète

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Notion de valeurs Manquantes


Valeurs manquantes des variables chaîne :

Les valeurs manquantes des variables chaine sont gérées de la même


façon que celles des valeurs numériques. Contrairement aux valeurs
numériques, les champs vides pour les variables chaînes ne sont pas
désignés comme données manquantes par défaut. Ils sont interprétés
comme des chaînes de caractères vides.

Contrairement aux variables numériques, on ne peut pas introduire


des plages de valeurs comme valeurs manquantes.

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Valeurs
Dans le cas ou la variable est de type nominale ou ordinale, elle stockée
sous forme de code
Exemple : Variable Genre Variable Satisfaction
1 : Femme 5 : Très satisfait
0 : Homme 4 : Plutôt satisfait
3 : Satisfait
2 : Indifférent
1 : Déteste

Il faut indiquer à SPSS cette codification ou la correspondance des codes


aux valeurs

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données / Valeurs

En cliquant sur le champs « Valeurs » de la grille de visualisation des


variables  On obtient la boite de dialogue suivante

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données / Valeurs

En cliquant sur le bouton « Ajouter» pour ajouter une correspondance


«Code»  «Valeur»

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Saisie des données sous SPSS / Saisie des Données

Fin du chapitre
Faire des TP sur les exemples fournis
Définir les variables
Variable quantitative
Variable nominale
Variable ordinale
Définir des listes de valeurs
Définir les valeurs manquantes d’une variable
Saisir des données
Sauvegarder les résultats

Cours SPSS Said El Hassani


Plan du Cours

Introduction
Vocabulaire de Base / Gestion des Fichiers de Données
Présentation des Fenêtres SPSS
Saisie des Données
Importation des Données
Manipulation des Données
Plusieurs Fonctionnalités seront présentées
Quelques Analyses Statistiques
Statistique Descriptive
Exploration des Données
Tableau de Fréquence
Tableaux Croisés
Modification et Exportation des Résultats

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Comme tout logiciel ouvert, SPSS dispose d’un certain nombre de


possibilités d’échange avec l’extérieur :
Importation des données
Exportation des données

L’importation des données consiste à rapatrier des données externes à


SPSS vers un fichier .sav pour qu’ils puissent être traité par ce dernier
Puisque les données sont externes à SPSS, il faut lui indiquer de quelle
manière il va faire l’import des données

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Fichier .sav
de SPSS Import des données
Différents types de
fichiers

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Parmi les formats de données acceptées par SPSS:


Les tableurs Lotus et Excel (*.xls);
Les bases de données dBase (*.dbf);
Les fichiers (*.txt et *.dat);
Les fichiers de données SYSTAT (*.syd et *.sys);
Les fichiers de données sous forme SPSS (*.sav);
Les fichiers STATA (*.dta);
Les fichiers SAS.
Etc.

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Comme exemple, nous allons importer un fichier Excel

Mais d’abord, il faut constituer le fichier Excel suivant :

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Aller sur « Fichier » puis « Lire Données externes »

On choisit le type de fichier « Excel »

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Il faut spécifier à SPSS comment il va importer les données

Si les en-têtes de colonne ne sont pas conformes aux règles de


dénomination de variable SPSS, ils sont convertis en noms de variable
valides et les en-têtes de colonne d'origine sont enregistrés comme
étiquettes de variable

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Importation des fichiers de Texte :

Les conditions sont les suivantes :


Chaque ligne correspond à une observation
Chaque colonne correspond à une variable
Les colonnes sont
Soit délimitées par des délimiteurs (Espace, Tabulation, Virgule,
Point virgule, ou autre délimiteur spécifié lors de l’import)
Soit des champs fixes

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Dérouler l’action d’import sur le fichier « ImportText.txt »

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Dérouler l’action d’import sur le fichier « ImportText.txt »

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Dérouler l’action d’import sur le fichier « ImportText.txt »

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Dérouler l’action d’import sur le fichier « ImportText.txt »

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Dérouler l’action d’import sur le fichier « ImportText.txt »

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Dérouler l’action d’import sur le fichier « ImportText.txt »

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Dérouler l’action d’import sur le fichier « ImportText.txt »

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Dérouler l’action d’import sur le fichier « ImportText.txt »

Cours SPSS Said El Hassani


Vocabulaire de Base / Gestion des Fichiers de Données

Importation des Données sous SPSS

Fin Chapitre sur la saisie et l’importation des données



Cours SPSS Said El Hassani


Plan du Cours

Introduction
Vocabulaire de Base / Gestion des Fichiers de Données
Présentation des Fenêtres SPSS
Saisie des Données
Importation des Données
Manipulation des Données
Plusieurs Fonctionnalités seront présentées
Quelques Analyses Statistiques
Statistique Descriptive
Exploration des Données
Tableau de Fréquence
Tableaux Croisés
Modification et Exportation des Résultats

Cours SPSS Said El Hassani


Manipulation des Données

Rappel

Dans les chapitres précédents, nous avons vu :

Le vocabulaire de SPSS
Le système de fenêtre de SPSS
Comment créer un fichier de données
Comment créer des variables et leur donner des caractéristiques
Comment importer des données

Une fois constituées, les données peuvent être manipulées

Cours SPSS Said El Hassani


Manipulation des Données

Que veux dire manipuler les données :

Il arrive parfois ou les enquêtes sur le terrain génèrent beaucoup de variables,


et énormément de données
L’analyste est amené parfois à n’étudier qu’une partie des données, voir créer
d’autres données à partir des données initiales ou recoder d’autres variables
Il se peut aussi qu’il soit amener à modifier ou pondérer des données par
d’autres données , ou à catégoriser des variables pour faciliter l’analyse.
Il peut aussi fusionner des données, scinder ou trier d’autres
Et bien d’autres manipulation ………………..

SPSS, en bon logiciel d’analyse statistique, Offre une multitude


de possibilités qui permettent de manipuler ainsi les données

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités qui seront présentées


Insérer une observation Sélectionner des observations
Insérer une variable Compter les occurrences des valeurs
Identifier les observations dupliquées Pondérer des observations
Identifier les observations inhabituelles Calculer des variables
Trier les observations Recodage des variables
Masquer/Afficher une variable Création de variables
Fusionner des fichiers Recodage automatique
Scinder un fichier Remplacer des valeurs manquantes
Transposer
Agréger

Cours SPSS Said El Hassani


Manipulation des Données
Représentation schématique des menus de SPSS
Menu Principal

Fichier Edition Affichage Données Transformer Analyse Graphes Utilitaires

Copier/Couper/C
Nouveau
oller

Ouvrir Insérer Variable Divers Divers


Divers
opérations pour opérations pour Menus pour la
opérations Menu des
la manipulation la Génération des
d’analyse des Utilitaires
des données et transformation Graphes
données
Insérer des variables des données
Fermer
Observation

Sauvegarder Etc.

Sauvegarder sou

Etc.

Cours SPSS Said El Hassani Said El Hassani


Manipulation des Données
Représentation schématique des menus de SPSS

Cours SPSS Said El Hassani Said El Hassani


Manipulation des Données
Représentation schématique des menus de SPSS

Cours SPSS Said El Hassani Said El Hassani


Manipulation des Données
Représentation schématique des menus de SPSS

Cours SPSS Said El Hassani Said El Hassani


Manipulation des Données

Fonctionnalités :

Insérer une observation

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Insérer une observation
Besoin/Explication :
Il arrive des fois ou l’on veut insérer une observation dans un endroit précis
d’un fichier (ex : Troisième ligne, avant dernière ligne, etc.)
Comment faire :
La feuille de saisie des données étant activée, et une ligne de données étant
sélectionnée, vous pouvez insérer une observation juste après la ligne
sélectionnée en activant le menu « Edition »  « Insérer les Observations.. » ou
bien avec le menu contextuel du bouton droit.
SPSS insère alors une nouvelle observation vide qu’il faudra renseigner
Après insertion de la ligne, toute les cellules (c’est-à-dire les scores) sont vides

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Insérer une variable

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Insérer une variable
Besoin/Explication :
Il arrive des fois ou l’on veut insérer une variable dans une colonne précise (ex :
Première colonne, avant dernière colonne, etc.)
Comment faire :
L’insertion d’une variable revient à insérer une ligne dans le volet d’affichage
des variables
La feuille de saisie des données étant activée et le volet d’affichage des
variables étant activé aussi, vous pouvez insérer une variable juste après la ligne
sélectionnée en activant le menu « Edition »  « Insérer une Variable.. » ou bien
avec le menu contextuel du bouton droit.
SPSS insère alors une nouvelle variable qu’il faudra compléter (modifier les
caractéristiques de la variable)

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Trier les observations

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Trier les observations
Besoin/Explication :
Cette fonctionnalité permet de trier les observations (lignes) de l'ensemble de
données actif en fonction des valeurs d'une ou plusieurs variables de tri. Vous
pouvez trier les observations par ordre croissant ou décroissant.

Comment faire :
Le tri des observations pas par l’activation du menu « Données »  « Trier les
observations » . La fenêtre suivante apparait pour renseigner les champs de tri et
la nature du tri.

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Trier des observations

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Sélectionner des observations

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Sélectionner des observations
Besoin/Explication :

Il est fréquent de vouloir sélectionner ou d’isoler un groupe d’observations


pour une analyse particulière

La fonction « Sélectionner des observations » est parmi les opérations les plus
utilisées dans une analyse statistiques de données..

Comment faire : Sélectionner des observations

Ouvrir le fichier « «selection_test.sav » a partir de votre CD des exemples.


Activer le menu « Données »  « Sélectionner des Observations»
La boite de dialogue suivante est affichée  il faut la renseigner

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Sélectionner des observations

Sélectionner « Selon
une condition logique

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Sélectionner des observations

Sélectionner « Selon
une condition logique
Pour une condition de
sélection  Cliquer sur
«le bouton « Si… » 
boite de dialogue de
condition

Remarquez les autres options de sélection


Cours SPSS Said El Hassani
Manipulation des Données
Fonctionnalité : Sélectionner des observations

Sélectionner « Selon
une condition logique
Pour une condition de
sélection  Cliquer sur
«le bouton « Si… » 
boite de dialogue de
condition
Positionner la
condition, Ici :
«Consommation <=25 »

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Sélectionner des observations

Remarquer la création d’une nouvelle variable


Remarquer aussi les hachures sur le côté gauche de la fenêtre

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Masquer / Afficher des variables

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Masquer / Afficher des Variables
Besoin/Explication :
Il est possible de ne sélectionner qu’un certain nombre de variables à afficher.

Comment faire :
La fenêtre d’affichage des variables étant activée. On peut personnaliser
l’affichage des variables en activant le menu « Affichage»  «Personnaliser
l’affichage des variables ». La fenêtre suivante apparait où il est possible de cocher
les variables visibles et décocher les variables non visibles.
On peut aussi rétablir les valeurs d’affichage par défaut

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Masquer / Afficher des Variables

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Identifier les observations dupliquées

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Identifier les observations dupliquées
Besoin/Explication :
Les données peuvent comprendre des observations « dupliquées » pour les
raisons suivantes :
La même observation est saisie plusieurs fois par erreur.
Plusieurs observations partagent la même valeur d’un identifiant
principal, mais ont des valeurs d’identifiant secondaire différentes (par
exemple, les membres d'une famille qui vivent tous dans la même
maison).
Plusieurs observations représentent la même observation, mais les
valeurs des variables autres que celles qui identifient l'observation sont
différentes (par exemple, plusieurs achats effectués par la même
personne ou la même société pour des produits différents ou à des
heures différentes).
L'identification des observations dupliquées vous permet de définir la variable
duplicate suivant vos besoins et de contrôler la détermination automatique des
observations principales par rapport aux observations dupliquées
Cours SPSS Said El Hassani
Manipulation des Données
Fonctionnalité : Identifier les observations dupliquées
Comment faire :
L’identification des observations dupliquées passe par l’activation du menu
«Donnée »  « Identifier les Observations Dupliquées ». A l’activation de ce
menu, la fenêtre suivante apparait pour renseigner :
Les variables sur lesquelles SPSS se basera pour juger si une
observation est dupliquée ou non
La nature et les variables de tri du résultat
Autres informations (voir fenêtre)
À la fin de l’analyse, le résultat est affiché dans la fenêtre des résultats.

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Identifier les observations dupliquées

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Identifier les observations inhabituelles

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Identifier les observations inhabituelles
Besoin/Explication :
La procédure de détection des observations inhabituelles ( on dit aussi des
anomalies) vise à repérer les observations inhabituelles en se basant sur les écarts
par rapport aux normes de leurs groupes. La procédure est destinée à détecter
rapidement les observations inhabituelles afin de vérifier les données à l'étape
d'analyse exploratoire des données, avant d'effectuer toute sorte d'analyse
inférentielle de ces mêmes données

Comment faire :
L’identification des observations inhabituelle peut être activée directement par
le menu « Données »  « Identifier les Observations Inhabituelles ». La fenêtre
suivante alors apparait pour renseigner quelques détails pour le calcul des groupes
et des écarts dans le groupe.
La variable d’analyse
Autres informations
Le résultat est affiché dans la fenêtre de sortie (des résultats)
Cours SPSS Said El Hassani
Manipulation des Données
Fonctionnalité : Identifier les observations inhabituelles

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Fusionner des fichiers

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Fusionner des fichiers
Besoin/Explication :
Les données peuvent être distribuées dans plusieurs fichiers différents, on peut
être amener à vouloir les fusionner dans un seul fichier :
Pour fusionner deux fichiers, deux cas peuvent se présenter :
Les variables sont les mêmes, mais les observations sont différentes : on
parle dans ce cas d’ajout d’observations
Les observations sont les mêmes, mais les variables sont différentes : on
parle dans ce cas d’ajout de variables

Fichier données de SPSS

Fichier données de SPSS


Fichier données de SPSS

Fusion de fichier
Cours SPSS Said El Hassani
Manipulation des Données
Fonctionnalité : Fusionner des fichiers
Besoin/Explication :
Fusion par ajout d’observation :

Si les données sont contenues dans deux ou plusieurs fichiers distincts (par
exemple : les fichiers proviennent de plusieurs enquêteurs différents), il est
possible de regrouper tous ces fichiers séparés en un seul grâce à la fonction
fusionner des fichiers de la rubriques données. Choisissez:

Fusion par ajout de variables :

Si on dispose de deux fichiers contenant les mêmes sujets, mais avec des
variables différentes (par exemple, deux expériences différentes avec le même
groupe de sujets) avec pour but de fusionner ces expériences dans un même
fichier.

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Fusionner des fichiers

Variable 1 Variable 2 X1 X2 Variable 1 Variable 2 Y1 Y2


A 10 aa A D 40 X1 Y1
B 20 bb B E 50 X2 Y2
C 30 cc C F 60 X3 Y3

Fusion par Ajout d’observations

Variable 1 Variable 2 X1 X2 Y1 Y2
A 10 aa A
B 20 bb B
C 30 cc C
D 40 X1 Y1
E 50 X2 Y2
F 60 X3 Y3
Cours SPSS Said El Hassani
Manipulation des Données
Fonctionnalité : Fusionner des fichiers

ID Variable 1 Variable 2 ID Variable 3 Variable 4


001 A 10 001 D 40
002 B 20 002 E 50
003 C 30 003 F 60

Fusion par Ajout de variables

ID Variable 1 Variable 2 Variable 3 Variable 4


001 A 10 D 40
002 B 20 E 50
003 C 30 F 60

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Fusionner des fichiers

Comment faire : fusion par ajout d’observations


Pratiquer sur l’exemple «merge_o1.sav » et « merge_o2.sav »
Ouvrir le fichier « merge_o1.sav »
Activer le menu

Rechercher le fichier à fusionner (c’est-à-dire « merge_o2.sav »)


Renseigner la boite de dialogue suivante :

Variables non communes

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Fusionner des fichiers

Comment faire : fusion par ajout de variables


Pratiquer sur l’exemple «merge_v1.sav » et « merge_v2.sav »
Ouvrir le fichier « merge_v1.sav »
Activer le menu

Rechercher le fichier à fusionner (c’est-à-dire « merge_v2.sav »)


Renseigner la boite de dialogue suivante :

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Fusionner des fichiers

Comment faire : fusion par ajout de variables


Les observations doivent être placées dans le même ordre dans les deux
fichiers de données (utiliser trier les observations pour les deux fichiers).

Les observations qui n'ont pas de correspondance dans les clés d'appariement
sont inclus dans le fichier fusionné et elles sont fusionnées avec les observations
de l'autre fichier.

Les observations sans correspondance contiennent des valeurs uniquement


pour les variables du fichier duquel elles sont issues. Les variables de l'autre fichier
contiennent la valeur manquante par défaut.

Les variables qui viendront s’ajouter au fichier courant (fichier de données


ouvert) devront porter des noms différents, sinon elles seront exclues.

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Fusionner des fichiers

Comment faire : fusion par ajout de variables


boite de dialogue

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Fusionner des fichiers

Comment faire : fusion par ajout de variables


boite de dialogue

Cocher « Apparier les observations …. »

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Fusionner des fichiers

Comment faire : fusion par ajout de variables


boite de dialogue

Cocher « Apparier les observations …. »

Sélectionner la variable « CIN »


Comme Clé d’appariement

Cliquer sur « Ok »

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Fusionner des fichiers

Comment faire : fusion par ajout de variables


le résultat

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Scinder un fichier

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Scinder un Fichier
Besoin/Explication :
La fonction scinder un fichier sert à fragmenter un fichier de données en
groupes et en sous groupes selon une ou plusieurs variables de regroupement.

Elle prépare le fichier en vue d’effectuer des procédures et des analyses qui
seront exécutées à l’intérieur de chacun de ces sous-groupes.

La manière avec laquelle on scinde un fichier influera sur la manière avec


laquelle les résultats des analyses seront présentés.

La fragmentation du fichier est logique seulement, elle ne va pas produire


plusieurs fichiers

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Scinder un Fichier
Besoin/Explication :

V1 V2 V3 V1 V2 V3
A 001 320 A 001 320
Groupe 1
A 002 125 A 002 125
B 006 214 B 006 214
B 008 214 B 008 214
Groupe 2
B 004 025 B 004 025
B 005 256 B 005 256
Scinder un fichier
C 006 214 C 006 214 Groupe 3
selon la variable V1
D 001 236 D 001 236
Groupe 4
D 010 452 D 010 452

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Scinder un Fichier
Besoin/Explication :

On peut scinder un fichier selon HUIT variable maximum


Comment faire : Scinder un fichier

Ouvrir le fichier « «scinder_test.sav » a partir de votre CD des exemples


Activer le menu « Données »  « Scinder un Fichier »
La boite de dialogue suivante est affichée  il faut la renseigner

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Scinder un Fichier
Comment faire : Scinder un fichier

Influe sur la
présentation
des résultats
Nous verrons lors de l’analyse des données comment
les résultats seront présentés

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Transposer

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Transposer
Besoin/Explication :

La transposition permet de créer un nouveau fichier dans lequel les lignes et les
Comment
colonnes du faire
fichier: initial sont inversées pour que les observations (lignes)
N,;n;, des variables (colonnes), et vice versa. Transposer génère
deviennent
automatiquement de nouveaux noms pour les variables, et affiche une liste de ces
nouveaux noms.
Une nouvelle variable de type chaîne contenant le nom de variable d'origine,
case_lbl, est automatiquement créée.

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Transposer
Besoin/Explication :

V1 V2 V3
Transposer un fichier On remarquera :
A 001 320
Que les scores de type «Chaine
B 002 125 » ne sont pas transposé
C 006 214 La création d’une nouvelle
D 008 214 variable « CASE_LBL »

CASE_LBL Var001 Var002 Var003 var004


V1 . . . .
V2 001 002 006 008
V3 320 125 214 214

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Transposer
Comment faire : Transposer un fichier

Ouvrir le fichier « «Transposer_test.sav » a partir de votre CD des exemples


Activer le menu « Données »  « Transposer »
La boite de dialogue suivante est affichée  il faut la renseigner

Puis cliquer sur « Ok »

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Transposer
Comment faire : Transposer un fichier

Maintenant : utilisez la « Variable de noms » comme suit :

Puis cliquer sur « Ok »  Remarquez la différence 

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Agréger

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Agréger

Besoin/Explication :

Agréger  c’est-à-dire obtenir des résumés


L’agrégation des données permet d'agréger des groupes d'observations de
l'ensemble de données actif dans des observations uniques. Elle permet
également de créer dans l'ensemble de données actif un nouveau fichier agrégé
ou de nouvelles variables qui contiennent des données agrégées. Les observations
sont agrégées en fonction de la valeur de zéro ou de plusieurs critères
d'agrégation (regroupement). Si aucun critère d'agrégation n'est spécifié,
l'ensemble de données entier est un agrégat unique.

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Agréger
Besoin/Explication :

V1 2 V3 V1 V2 V3 P
A
A
G1
A
B
G2 B
C
C
G3
C
Variable crée lors D
de la pondération
G4 D
Cours SPSS Said El Hassani
Manipulation des Données
Fonctionnalité : Agréger

Besoin/Explication :

Les observations sont regroupées selon les valeurs des critères d'agrégation.
Chaque combinaison unique de valeurs de critères d'agrégation définit un groupe.

Les variables source sont utilisées avec des fonctions d'agrégation pour créer de
nouvelles variables d'agrégation.

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Agréger
Comment faire : Agréger

Ouvrir le fichier « «Agreger_test.sav » a partir de votre CD des exemples.


Activer le menu « Données »  « Agréger»
La boite de dialogue suivante est affichée  il faut la renseigner
Puis cliquer sur « Ok »

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Agréger

Variables de
groupement ou
critère d’agrégation

Variables source
avec la fonction
d’agrégation

Choix de la sortie

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Pondérer les observations

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Pondérer les observations

Besoin/Explication :

Pondérer  c’est-à-dire donner un poids à une observation.


Cette fonctionnalité permet de pondérer (ou bien de donner un poids)
différemment les observations (par réplication simulée) dans le cadre de l'analyse
statistique
La pondération est une opération logique, elle ne modifie pas les données
La pondération se fait par une variable  cette variable peut calculée ou saisie
La pondération est visible lors des résultats

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Pondérer les observations
Comment faire : Pondérer les observations

Ouvrir le fichier « «Ponderer_test.sav » a partir de votre CD des exemples.


Activer le menu « Données »  « Pondérer les observations»
La boite de dialogue suivante est affichée  il faut la renseigner
Puis cliquer sur « Ok »

La variable avec
laquelle on voudrait
pondérer

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Pondérer les observations
Comment faire : Pondérer les observations

Anticipons un peu sur les résultats :

Faire sortir le tableau des effectifs sans pondération


Faire sortir le tableau des effectifs avec pondération

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Transformations de Variables

Cours SPSS Said El Hassani


Manipulation des Données
Transformation de Variables

Parfois, on a besoin de transformer nos données pour les adapter à certaines


analyses.
Dans certains cas on doit effectuer des transformations de données simples
comme:
Créer une variable qualitative à partir d'une variable d'échelle.
Combiner plusieurs modalités de réponses en une seule modalité.
Créer une nouvelle variable qui représente la différence calculée entre
deux variables existantes.
A d’autres occasion, on construit de nouvelles variables basées sur des
équations complexes et des instructions conditionnelles.

Cours SPSS Said El Hassani


Manipulation des Données
Transformation de Variables

SPSS vous permet d’effectuer ces transformations à l’aide de la rubriques des


transformations: « Transformer » à partir du menu principal
On peut :
Calculer des variables

Recoder des variables

Créer des variables

Dans ce qui suit, on va voir ces fonctionnalités

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Calculer des variables

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Calculer des variables

Besoin/Explication :

Il arrive parfois ou l’on veuille calculer une variable a partir d’autres variables
Par exemple : si on dispose d’une variable contenant l’année de naissance de
l’individu et on voudrait calculer son âge : on pourra créer une nouvelle variable
qui donnera l’âge de l’individu en soustrayant l’année de naissance à l’année
courante.

Année
Âge
Naissance
1984 29
1994 Année Courante : 2013 19
1967 46
1985 28
1956 57
Cours SPSS Said El Hassani
Manipulation des Données
Fonctionnalité : Calculer des variables
Comment faire : Calculer des variables

Ouvrir le fichier « «Calculer_test.sav » a partir de votre CD des exemples.


Activer le menu « Transformer»  « Calculer la variable»
La boite de dialogue suivante est affichée  il faut la renseigner
Puis cliquer sur « Ok »

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Calculer des variables
La variable cible ou
celle qui sera crée

Expression de la
nouvelle variable

Opérateurs et
chiffres

Condition

Cours SPSS Said El Hassani


Manipulation des Données

Fonctionnalités :

Recodage des variables

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Recoder des variables

Besoin/Explication :

Il arrive parfois ou l’on veuille calculer recoder une variable


Par exemple : si on dispose d’une variable contenant la consommation de
carburant, on pourra classer ces consommations en catégorie:
Consommation excessive : Plus de 30
Grande consommation : Entre 25 et 29
Consommation modérée : Entre 20 et 24
Petite consommation : Moins de 20 (c’est-à-dire entre 0 et 19)

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Recoder des variables

On veut recoder la variable « Consommation »


Marque Conso Catégorie
Acura CL 26 2
1 : Consommation excessive : Plus de 30
Audi A4 27 2
2 : Grande consommation : Entre 25 et 29
BMW 528i 25 2 3 : Consommation modérée : Entre 20 et 24
BMW 323i 26 2 4 : Petite consommation : Moins de 20 (c’est-à-dire entre 0 et 19)
Buick Regal 23 3
Buick Century 25 2
Cadillac Catera 22 3
Cadillac DeVille 22 3
Chevrolet Camaro 25 2
Dodge Viper 16 4
Ford Crown Victoria 21 3
Ford Contour 25 2
Honda Passport 19 4
Honda Odyssey 23 3
Honda CR-V 24 3
Honda Accord 27 2
Honda Civic 32 1
Hyundai Sonata 25 2
Hyundai Elantra 27 2
Hyundai Accent 31 1
Cours SPSS
Infiniti I30 25 2 Said El Hassani
Manipulation des Données
Fonctionnalité : Recoder des variables
Comment faire : Recoder des variables

Ouvrir le fichier « «Recodage_test.sav » a partir de votre CD des exemples.


Activer le menu « Transformer»  « Recoder des variables»
La boite de dialogue suivante est affichée  il faut la renseigner
Puis cliquer sur « Ok »

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Recoder des variables

Variables à recoder

Positionnement d’une condition

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Recoder des variables
Choisir la colonne qui va
être recodée

Cours SPSS Said El Hassani


Manipulation des Données
Fonctionnalité : Recoder des variables
Choisir la colonne qui va
être recodée
Cliquer sur «Anciennes et
nouvelles valeurs»  la
boite de dialogue suivante

Ancienne et nouvelles valeurs


Anciennes valeurs : se sont les valeurs à recoder («Consommation»)
Nouvelles valeurs : ici par exemple les tranches de consommation
une variable alphanumérique peut être recodée pour une nouvelle variable
numérique
Les anciennes valeurs individuelles (variables numériques) doivent être recordées
par de nouvelles valeurs de même type;
Cours SPSS Said El Hassani
Manipulation des Données
Fonctionnalité : Recoder des variables
Choisir la colonne qui va
être recodée
Cliquer sur «Anciennes et
nouvelles valeurs»  la
boite de dialogue suivante

Cours SPSS Said El Hassani

Vous aimerez peut-être aussi