Vous êtes sur la page 1sur 157

INFORMATIQUE APPLIQUÉE Pr.

Mouna ELMACHKOUR

Filière Science Economique et Gestion Semestre 6


OVERVIEW Informatique, Gestion, Entreprise..
Une entreprise est une entité économique qui utilise des moyens humains, matériels et
financiers en vue d’atteindre les objectifs fixés.
Les moyens humains sont les différents métiers et domaines d’activité de l’entreprise
(comptabilité, commerce, production, communication , logistique…). Il s’agit de
plusieurs personnes qui fournissent un travail de manière organisée.
Qu'est-ce que l'informatique ?

INFORmation autoMATIQUE.
L’informatique est une science qui permet de traiter l’information
de façon automatique.

- Science : donc des théories et des modèles,


- Information : texte, image ou son représentés sous une forme manipulable par la
machine en fonction de sa technologie.

L'informatique désigne l'automatisation du traitement de l'information considérée comme le support des


connaissances humaines et des communications dans les domaines technique, économique et social

L’informatique (en anglais computer science, ou computing science), est l’étude des
fondations théoriques de l’information et du calcul et leur implantation et application
avec des ordinateurs.
QUELLE RELATION ENTRE L’ENTREPRISE ET L’INFORMATIQUE ?
- La mondialisation
-Le taux de concurrence
-L'obligation de se développer, de perfectionner
-la digitalisation des processus de production
-L’obligation de les processus
-Exemple:
SYSTÈME D’INFORMATION
Le système d’information (SI) est un élément central d’une entreprise ou d’une
organisation.
Il permet aux différents acteurs de véhiculer des informations et de communiquer
grâce à un ensemble de ressources matérielles, humaines et logicielles.
Un SI permet de créer, collecter, stocker, traiter, modifier des informations sous
divers formats.
L’objectif d’un SI est de restituer une
information à la bonne personne et au bon
moment sous le format approprié.

« le système d’information est un ensemble complexe, souvent hétérogène car il est


constitué d’éléments qui se sont juxtaposés au fil du temps au gré des choix
stratégiques, des évolutions technologiques des systèmes informatiques mis en place,
du développement de l’organisation elle-même » M. Lafitte (2003)
SYSTÈME D’INFORMATION
SI est un sous-système de l'organisation qui s'occupe de collecter, stocker, traiter
et diffuser l'information dans le système opérant et dans le système de pilotage.
Le système d'information a pour rôle de coordonner les activités de l‘entreprise:
 applications du mailing,
 application de communication et de conférence en ligne,
 système de gestion de production

C’est le véhicule de la communication entre l'ensemble des ressources systèmes


(personnes, matériels, logiciels) afin d’assurer les objectifs :
1. Saisie de données
2. Stockage des données
3. Traitement des informations
4. Restitution des informations
5. Transmission des information
SYSTÈME INFORMATIQUE ET SYSTÈME D’INFORMATION

L’IT (Système informatique) est l’ensemble des actifs matériels et logiciels de l’entreprise ayant pour
vocation à automatiser le traitement de l’information.
C’est la partie visible à laquelle tout le monde pense quand on parle de projets et d’infrastructures
informatiques: le logiciel, le serveur, les écrans, les ordinateurs…

Le système informatique: c’est un ensemble des éléments


permettant de traiter automatiquement les données

Le SI (Système d’information) est l’ensemble des actifs de l’IT (matériels et logiciels), qui comprend aussi
et surtout les actifs humains et immatériels, les procédés, processus d’industrialisation …
Le système informatique est la partie informatique du système d’information, composée de matériels,
logiciels, réseaux et procédures d’utilisation
DONNÉES ET INFORMATION

Une donnée est une information brute, sans contexte, un fait sans arrière-plan.
Forme inexploitable
Une donnée brute peut prendre différents aspects: données numériques, textuelles, ou un mélange
de texte et de chiffres
Une donnée doit passer par un processus de traitement de données (input) pour résulter
‘l’output’, qui est l’information.
Les informations sont des « données transformées ».
Pour avoir une réelle pertinence, l’information obtenue doit avoir une signification logique et doit
être fiable.
APPLICATION VS LOGICIEL VS PROGICIEL

Un logiciel est un ensemble de programmes, procédures, algorithmes liés au


fonctionnement d’un système de traitement de données.
Utilisateur final Le logiciel est un élément indispensable au fonctionnement de tout dispositif
Application informatique. Logiciel système responsable de enregistrement des fichiers sur le
disque dur, imprimer un document, supprimer un fichier, chercher un fichier…
Logiciel système
Une application est un logiciel informatique conçu pour aider l’utilisateur à
SE
effectuer diverses tâches sur l’ordinateur, smartphone, tablette…
Une application est un logiciel qui a été conçu/développé pour l’utilisateur final.
Matériel
Un progiciel est un produit logiciel ou un logiciel produit par un éditeur de
logiciel informatique pour une utilisation professionnelle
PLAN DU COURS
oIntroduction générale et définition
oIntroduction au progiciel SPSS
o Vocabulaire de Base et Gestion des Fichiers de Données
o Présentation des Fenêtres SPSS
o Saisie des Données
o Importation des Données
o Manipulation des Données
o Plusieurs Fonctionnalités seront présentées
o Quelques Analyses Statistiques
o Statistique Descriptive
o Exploration des Données
o Tableau de Fréquence
o Tableaux Croisés
o Modification et Exportation des Résultats
TOUR D’HORIZON..
oSPSS
oActuellement détenu et développé par la société IBM
oprincipalement utilisé pour l'analyse statistique, l'exploration de donnéeset la collecte de
données

oSPSS signifie "Statistical Product and Service Solutions"


oVersions:
o SPSS 1 – 1968 «Progiciel statistique en sciences sociales»
o SPSSx release 2 – 1983
o SPSS Statistics V.17
o PASW Statistics V.18
o IBM SPSS Statistics V.19, après la création de SPSS Inc. acquis par IBM en 2009.
o IBM SPSS Statistics 20.0 en août 2011
o…
o IBM SPSS Statistics V.28 en mai 2021
POURQUOI SPSS?
oIBM SPSS Statistics est une puissante plateforme de logiciels statistiques

Il offre une interface conviviale

 Simplicité d'utilisation
 Préparer et analyser les données facilement grâce à une interface utilisateur intuitive sans avoir à écrire le code

oIl permet d’exécuter des statistiques avancées et descriptives, des analyses de régression, des arbres de décision avec une
interface intégrée

oToutes les facettes du cycle de vie de l'analyse sont incluses, depuis la préparation et la gestion des données jusqu'à
l'analyse et la génération de rapports

oDans ce cours:

 Coder des données issus d’un questionnaire ou d’un entretien


 Extraire des informations descriptives
 Les résumer graphiquement
PLAN DU COURS
oIntroduction
o Vocabulaire de Base et Gestion des Fichiers de Données
o Présentation des Fenêtres SPSS
o Saisie des Données
o Importation des Données
o Manipulation des Données
o Plusieurs Fonctionnalités seront présentées
o Quelques Analyses Statistiques
o Statistique Descriptive
o Exploration des Données
o Tableau de Fréquence
o Tableaux Croisés
o Modification et Exportation des Résultats
Vocabulaire de Base / Gestion des Fichiers de Données
o Organisation et interface de SPSS

o Différence au logiciel MS Excel, les données et les graphiques sont


représentés dans une même feuille
Vocabulaire de Base / Gestion des Fichiers de Données
o Organisation et interface de SPSS

o Dans SPSS :

o Les données et les résultats restent constamment séparés


o Les données sont enregistrées dans des fichiers .sav
o Les résultats sont disponibles dans des fichiers .spv ou .spo
o Le langage de commande permet d'enregistrer les analyses dans un fichier de
syntaxe afin de les relancer à une date ultérieure
Un fichier de syntaxe de commande est un fichier texte simple contenant des
commandes de syntaxe IBM SPSS Statistics .sps
o Il y’a aussi les scripts : ensemble de lignes de code exécutable, il sont
stockés dans des fichiers .sbs
Vocabulaire de Base / Gestion des Fichiers de Données
• Logique SPSS
Données Résultats

Syntaxe Syntaxe
.spv
.sav
.spo

Syntaxe Script

.sps .sbs
Vocabulaire de Base / Gestion des Fichiers de Données
o Logique SPSS

o Syntaxe SPSS:

o C’est un langage spécifique à SPSS

o Tous ce que l’on peut faire interactivement par menu est généré par le moteur SPSS comme
syntaxe lignes de code

o L’interface SPSS fait abstraction du code derrière les opérations réalisées  


GET
FILE='C:\Exploitation\Cours Fac
Salé\SPSS\Exemples\Ventes_Voitures.sav'.
DATASET NAME Ensemble_de_données1 WINDOW=FRONT.
COMPUTE Classe_Consommation=Consommation / 1.5.
VARIABLE LABELS Classe_Consommation 'Classe Consommation'.
EXECUTE.
SUMMARIZE
/TABLES=Prix BY Modele
/FORMAT=VALIDLIST NOCASENUM TOTAL LIMIT=100
/TITLE='Récapitulatif des observations'
/MISSING=VARIABLE
/CELLS=COUNT MEAN MEDIAN GMEDIAN SUM MAX STDDEV VAR.
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS
o Qu’est ce qu’une donnée statistique?

Une donnée statistique est une information codifiée, figée et transmissible


Typologie: Une donnée statistique peut être une donnée à caractère quantitatif ou qualitatif.

o Qu’est ce qu’une information?

Les informations sont des données transformées. Une information représente 'l'output' du
processus d'analyse.

o Qu’est ce qu’une variable?

Une variable statistique est une caractéristique commune à l'ensemble des individus d'une étude.
C’est une quantité ou une qualité définie sur une population et qui est susceptible de varier d’un
individu à l'autre.
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Définition d’une Variable
• Une variable est la propriété d’un événement ou d’un objet pouvant prendre plusieurs valeurs

Un exemple: Participants à un événement:

Age:
Genre : 1 : Femme
Vous organisez Evénement
2 : Homme
Satisfaction :
Sur une échelle
Vous recevez Participants croissante de 1 à 5

Vous voulez savoir Âge Genre Satisfaction


Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Définition d’une Variable

Evénement
Si on s’intéresse aux colonnes
Les colonnes sont nos
variables
Participants

Âge Genre Satisfaction


Âge Genre Satisfaction 21 1 3
25 2 3
36 1 2
Si on s’intéresse aux lignes 26 1 4

En lisant une ligne, on reconstitue 48 1 1


le profil d’un événement ou d’un 18 2 4
individu
Une fois les résultats consignés, nous
obtenons la matrice suivante
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Définition d’une Variable

o Une ligne est une observation


o Une colonne est une variable

Âge Genre Satisfaction


21 1 3
25 2 3
36 1 2
Si on s’intéresse aux cases 26 1 4
48 1 1
18 2 4

Chaque case ne doit contenir qu’une seule donnée Appelée : Score de la variable
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Définition d’une Variable

o Une ligne est une observation


o Une colonne est une variable
o Une case représente le score d’une variable pour une observation donnée

Satisfaction

o Les scores possibles pour une variables sont appelés : Modalités Score 3
o Les types des modalités définissent les types des Variables Score 3
Score 2
Score 4
Score 1
Score 4
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Définition d’une Variable

o Une ligne est une observation


o Une colonne est une variable
o Une case représente le score d’une variable pour une observation donnée

o Revenons à notre matrice : Âge Genre Satisfaction


21 1 3
o Pour La variable « Âge » : Le signifiant est le signifié
: On dit que la variable est « Quantitative » 25 2 3
36 1 2
o Pour les variables « Genre » et « Satisfaction » : Le
26 1 4
signifiant n’est pas le signifié : On dit que se sont
des variables « Qualitatives » 48 1 1
18 2 4
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Définition d’une Variable

o Une ligne est une observation


o Une colonne est une variable
o Une case représente le score d’une variable pour une observation donnée
Astuce pour différencier entre une variable
Quantitative et une autre Qualitative : Âge Genre Satisfaction
21 1 3
Faire la somme des scores des variables :
25 2 3
o La somme des âges fait sens  Variable 36 1 2
Quantitative
26 1 4
o La somme des genres et des satisfactions n’a
pas de sens  Variable Qualitative 48 1 1
18 2 4

∑ 174 8 17
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Définition d’une Variable
o Variables qualitatives:
o On fait distinction selon que la variable présente une forme d’ordre ou pas:
Variable Genre Variable Satisfaction
Âge Genre Satisfaction
Deux catégories : Femme Une échelle croissante de
et Homme. Ne présente 1 à 5. Présente un ordre 21 1 3
pas d’ordre 25 2 3
1 : Femme 5 : Très satisfait 36 1 2
2 : Homme 4 : Plutôt satisfait
3 : Satisfait 26 1 4
2 : Indifférent 48 1 1
1 : Déteste
18 2 4

o La variable « Genre » ne présente pas d’ordre  elle est dite « Nominale »


o La variable « Satisfaction » présente un Ordre  elle est dite « Ordinale »
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données
Trois étapes sont essentielles à la saisie des données :

1. Définition des noms des variables de la matrice de données


2. Saisie proprement dite des données
3. Modification (s'il y a lieu) des propriétés des variables

La qualité des analyses statistiques est


L’analyse se fait à partir des fonction de la dextérité du choix des
données saisies variables et de la qualité des données
saisies.
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

• Au lancement du logiciel, on a l’écran suivant


• On peut choisir entre autres : soit ouvrir une
source de données existante, soit saisir des
données nouvelles
• Dans notre cas, on choisit de saisir des données
nouvelles
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Fenêtre d’affichage des données


Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Fenêtre d’affichage des variables


Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

o Tout ensemble de données SPSS comporte deux vues complémentaires


accessibles via leurs onglets

 Une vue des données « Affichage des données »

 Une vue pour la description des variables : « Affichage des Variables »


Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

• Les variables sont placées en colonnes


• Les observations sont placées en lignes
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

• Chaque variable est caractérisée par un ensemble de caractéristiques:


o Nom o Valeurs
o Type o Manquants
o Longueur o Colonne
o Décimales o Alignement
o Etiquette o Mesure
o Rôle
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Caractéristiques des variables

Caractéristique Explication
C’est le nom de la variable. Il est unique. Il a généralement le sens de
Nom l’information qu’il porte (Ex: Age, Genre, datenaiss pour Date de
naissance, etc.). Le nom est le code de la variable.
Le type de la variable, il peut être Numérique, Chaine, Date,
Type Monétaire, ou autres ( Voir dans la pratique). Le type est
généralement lié aussi au sens de la variable.
C’est l’espace alloué à la variable par SPSS pour le stockage. Par
Longueur exemple, une variable de type Chaine et de longueur 10 ne peut
stocker que des chaines de 10 caractères.
Le nombre de décimales après la "virgule" (exemple : pour 3,4  1;
Décimales
pour 3  0
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Caractéristiques des variables

Caractéristique Explication
Un label descriptif pour la variable (exemple : « Âge du répondant »
pour la variable « Age »). L’étiquette de la variable peut être
Etiquette différente du nom de la variable. Elle peut être plus longue que le
nom de la variable. L’étiquette, et non le nom de la variable, suivra la
variable dans les sorties ( outputs).
Pour affecter des étiquettes descriptives de valeur pour chaque valeur
d'une variable. Cela est utile si votre fichier de données utilise des
Valeurs
codes numériques pour représenter des modalités non numériques (par
exemple, les codes 1 et 0 pour homme et femme)
Cette caractéristique donne sens aux valeurs manquantes. Elle sera
Manquants
présentée dans la suite de ce cours.
Colonnes La largeur de la colonne pour la variable en question.
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Caractéristiques des variables

Caractéristique Explication

Alignement L’alignement de la valeur de la variable : Droite, Gauche ou Centre.

Cette caractéristique donne la nature de la variable : Quantitative (ou


Echelle), Nominale ou Ordinale.
Echelles : pour les variables dont les valeurs sont quantitatives
continues et discrètes (exemple: nombre de livres empruntés, prix, âge
salaire, ...etc.)
Mesure Nominales : pour les variables dont les valeurs sont qualitatives
(situation familiale, sexe, etc.)
Ordinales pour les variables dont les valeurs sont qualitatives mais il
y’a un ordre hiérarchique entre les observations (niveau d’études,
qualité d'un travail, ...)
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

 Première saisie de données

 Essayons de créer un fichier de données qui répond à l’exemple précédent :

 Les variables suivantes :

 « Age » : Numérique
 « Genre » : Chaine de longueur 1
 « Satisfaction : Numérique

 Ne pas se soucier des caractéristiques «Manquants » et « Valeurs »


 On expliquera ces notions ultérieurement.
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

L’écran de description des variables devrais ressembler à ceci .


Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Et l’écran de saisie devrais ressembler à ceci .


Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Notion de valeurs Manquantes

o L'option « Valeurs manquantes » permet de définir les valeurs de données


spécifiées comme valeurs manquantes spécifiées par l'utilisateur.
o Par exemple, vous pouvez faire la distinction entre les données manquantes
parce qu'une personne interrogée a refusé de répondre et les données
manquantes parce que la question ne s'appliquait pas au répondant.
o Les valeurs des données définies comme valeurs utilisateur manquantes sont
repérées par un indicateur en vue d'un traitement spécial et sont exclues de la
plupart des calculs.
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Notion de valeurs Manquantes


o Les données manquantes ou non valides sont trop fréquentes pour être
ignorées.
o Les personnes interrogées peuvent refuser de répondre à certaines
questions, ne pas connaître la réponse…..
o L’absence d’une donnée est considérée automatiquement comme une
valeur manquante systémique
o Les valeurs manquantes sont exclues des analyses et des opérations de
calcul
o Il est conseillé de symboliser les valeurs manquantes par autre chose
que le vide
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

• Sur la variable «Âge», si on clique sur le champs « Manquants» de la


grille de visualisation des variables  On obtient la boite de dialogue
suivante
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Notion de valeurs Manquantes


o La fenêtre vous donne trois choix:
o Ou vous n’avez aucune valeur
manquante,
o Ou vous avez jusqu'à trois valeurs
manquantes distinctes ( c’est ce que signifie
le mot « discrètes »)
o Ou vous considérez comme manquantes
toutes les valeurs qui tombent dans l’étendu
entre deux nombres, avec la possibilité d’avoir
une valeur manquante distincte additionnelle
( seulement dans le cas d’une variable
numérique)
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Notion de valeurs Manquantes


o Remarque:
o Les champs de données vides
sont gérés de la manière suivante:
ils sont convertis en données
manquantes par défaut, et signalées
par un point .
o Lors des statistiques de fréquence,
SPSS donne l’information sur les
valeurs manquantes
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Notion de valeurs Manquantes


o Il faut donner une valeur significative à une valeur
manquante
o Par exemple, on peut attribuer le nombre 999 à la valeur
manquante d’un Âge.

o Pratiquons cela sur notre exemple :


o Donnons la valeur 999 à une valeur manquante de la
variable « Âge »
o C’est une variable discrète
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Notion de valeurs Manquantes


o Valeurs manquantes des variables chaîne :

o Les valeurs manquantes des variables chaine sont gérées de la même


façon que celles des valeurs numériques. Contrairement aux valeurs
numériques, les champs vides pour les variables chaînes ne sont pas
désignés comme données manquantes par défaut. Ils sont interprétés
comme des chaînes de caractères vides.

o Contrairement aux variables numériques, on ne peut pas introduire


des plages de valeurs comme valeurs manquantes.
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données

Valeurs
o Dans le cas ou la variable est de type nominale ou ordinale, elle stockée sous
forme de code
o Exemple : Variable Genre Variable Satisfaction
1 : Femme 5 : Très satisfait
2 : Homme 4 : Plutôt satisfait
3 : Satisfait
2 : Indifférent
1 : Déteste

o Il faut indiquer à SPSS cette codification ou la correspondance des codes aux


valeurs
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données/ Valeurs

• En cliquant sur le champs « Valeurs » de la grille de visualisation des


variables  On obtient la boite de dialogue suivante
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données/ Valeurs

o En cliquant sur le bouton « Ajouter» pour ajouter une correspondance


«Code»  «Valeur»
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données/ Valeurs

Fin du chapitre
o Faire des TP sur les exemples fournis
o Définir les variables
o Variable quantitative
o Variable nominale
o Variable ordinale
o Définir des listes de valeurs
o Définir les valeurs manquantes d’une variable
o Saisir des données
o Sauvegarder les résultats
Plan du Cours

o Introduction
o Vocabulaire de Base / Gestion des Fichiers de Données
o Présentation des Fenêtres SPSS
o Saisie des Données
o Importation des Données
o Manipulation des Données
o Plusieurs Fonctionnalités seront présentées
o Quelques Analyses Statistiques
o Statistique Descriptive
o Exploration des Données
o Tableau de Fréquence
o Tableaux Croisés
o Modification et Exportation des Résultats
Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

Comme tout logiciel ouvert, SPSS dispose d’un certain nombre de possibilités d’échange
avec l’extérieur :
o Importation des données
o Exportation des données

o L’importation des données consiste à rapatrier des données externes à SPSS vers un
fichier .sav pour qu’ils puissent être traité par ce dernier

o Puisque les données sont externes à SPSS, il faut lui indiquer de quelle manière il va
faire l’import des données
Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

Fichier .sav
de SPSS Import des données
Différents types de
fichiers
Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Parmi les formats de données acceptées par SPSS:


o Les tableurs Lotus et Excel (*.xls);
o Les bases de données dBase (*.dbf);
o Les fichiers (*.txt et *.dat);
o Les fichiers de données SYSTAT (*.syd et *.sys);
o Les fichiers de données sous forme SPSS (*.sav);
o Les fichiers STATA (*.dta);
o Les fichiers SAS.
o Etc.
Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Comme exemple, nous allons importer un fichier Excel

o Mais d’abord, il faut constituer le fichier Excel suivant :


Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Aller sur « Fichier » puis « Lire Données externes »

o On choisit le type de fichier « Excel »


Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Il faut spécifier à SPSS comment il va importer les données

o Si les en-têtes de colonne ne sont pas conformes aux règles de


dénomination de variable SPSS, ils sont convertis en noms de variable
valides et les en-têtes de colonne d'origine sont enregistrés comme
étiquettes de variable
Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Importation des fichiers de Texte :

o Les conditions sont les suivantes :


o Chaque ligne correspond à une observation
o Chaque colonne correspond à une variable
o Les colonnes sont
o Soit délimitées par des délimiteurs (Espace, Tabulation, Virgule,
Point virgule, ou autre délimiteur spécifié lors de l’import)
o Soit des champs fixes
Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Dérouler l’action d’import sur le fichier « ImportText.txt »


Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Dérouler l’action d’import sur le fichier « ImportText.txt »


Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Dérouler l’action d’import sur le fichier « ImportText.txt »


Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Dérouler l’action d’import sur le fichier « ImportText.txt »


Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Dérouler l’action d’import sur le fichier « ImportText.txt »


Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Dérouler l’action d’import sur le fichier « ImportText.txt »


Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Dérouler l’action d’import sur le fichier « ImportText.txt »


Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

o Dérouler l’action d’import sur le fichier « ImportText.txt »


Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS

Fin Chapitre sur la saisie et l’importation des données


Plan du Cours

o Introduction
o Vocabulaire de Base / Gestion des Fichiers de Données
o Présentation des Fenêtres SPSS
o Saisie des Données
o Importation des Données
o Manipulation des Données
o Plusieurs Fonctionnalités seront présentées
o Quelques Analyses Statistiques
o Statistique Descriptive
o Exploration des Données
o Tableau de Fréquence
o Tableaux Croisés
o Modification et Exportation des Résultats
Manipulation des Données
Rappel

o Dans les chapitres précédents, nous avons vu :

o Le vocabulaire de SPSS
o Le système de fenêtre de SPSS
o Comment créer un fichier de données
o Comment créer des variables et leur donner des caractéristiques
o Comment importer des données

o Une fois constituées, les données peuvent être manipulées


Manipulation des Données
Que veux dire manipuler les données :
o Il arrive parfois ou les enquêtes sur le terrain génèrent beaucoup de variables, et
énormément de données

o L’analyste est amené parfois à n’étudier qu’une partie des données, voir créer
d’autres données à partir des données initiales ou recoder d’autres variables

o Il se peut aussi qu’il soit amener à modifier ou pondérer des données par d’autres
données , ou à catégoriser des variables pour faciliter l’analyse

o Il peut aussi fusionner des données, scinder ou trier d’autres

o Et bien d’autres manipulation ………………..


SPSS, en bon logiciel d’analyse statistique, Offre une multitude
de possibilités qui permettent de manipuler ainsi les données
Manipulation des Données
Fonctionnalités qui seront présentées
oInsérer une observation oSélectionner des observations
oInsérer une variable oCompter les occurrences des valeurs
oIdentifier les observations dupliquées oPondérer des observations
oIdentifier les observations inhabituelles oCalculer des variables
oTrier les observations oRecodage des variables
oMasquer/Afficher une variable oCréation de variables
oFusionner des fichiers oRecodage automatique
oScinder un fichier oRemplacer des valeurs manquantes
oTransposer
oAgréger
Manipulation des Données
Représentation schématique des menus de SPSS
Menu
Principal

Fichier Edition Affichage Données Transformer Analyse Graphes Utilitaires

Nouveau Copier/Cou
per/Coller
Divers
opérations Divers Divers Menus pour
Ouvrir Insérer pour la opérations
Variable manipulatio pour la opérations la Menu des
n des transformat d’analyse Génération Utilitaires
Insérer données et ion des des des
Fermer Observatio données Graphes
des données
n variables

Sauvegarde Etc.
r

Sauvegarde
r sou

Etc.
Manipulation des Données
Représentation schématique des menus de SPSS
Manipulation des Données
Représentation schématique des menus de SPSS
Manipulation des Données
Représentation schématique des menus de SPSS
Manipulation des Données

Fonctionnalités :

Insérer une observation


Manipulation des Données
Fonctionnalité : Insérer une observation

Besoin/Explication :
• Il arrive des fois ou l’on veut insérer une observation dans un endroit précis d’un fichier (ex : Troisième ligne,
avant dernière ligne, etc.)

Comment faire :
• La feuille de saisie des données étant activée, et une ligne de données étant sélectionnée, vous pouvez insérer
une observation juste après la ligne sélectionnée en activant le menu « Edition »  « Insérer les Observations.. »
ou bien avec le menu contextuel du bouton droit.
• SPSS insère alors une nouvelle observation vide qu’il faudra renseigner
• Après insertion de la ligne, toute les cellules (c’est-à-dire les scores) sont vides
Manipulation des Données

Fonctionnalités :

Insérer une variable


Manipulation des Données
Fonctionnalité : Insérer une variable

Besoin/Explication :
• Il arrive des fois ou l’on veut insérer une variable dans une colonne précise (ex : Première colonne,
avant dernière colonne, etc.)

Comment faire :
o L’insertion d’une variable revient à insérer une ligne dans le volet d’affichage des variables
o La feuille de saisie des données étant activée et le volet d’affichage des variables étant activé aussi,
vous pouvez insérer une variable juste après la ligne sélectionnée en activant le menu « Edition »  «
Insérer une Variable.. » ou bien avec le menu contextuel du bouton droit.
o SPSS insère alors une nouvelle variable qu’il faudra compléter (modifier les caractéristiques de la
variable)
Manipulation des Données

Fonctionnalités :

Trier des observations


Manipulation des Données
Fonctionnalité : Trier les observations
Besoin/Explication :

• Cette fonctionnalité permet de trier les observations (lignes) de l'ensemble de données actif en
fonction des valeurs d'une ou plusieurs variables de tri. Vous pouvez trier les observations par ordre
croissant ou décroissant.

Comment faire :
o Le tri des observations pas par l’activation du menu « Données »  « Trier les observations » . La
fenêtre suivante apparait pour renseigner les champs de tri et la nature du tri.
Manipulation des Données
Fonctionnalités: Trier des observations
Manipulation des Données

Fonctionnalités :

Sélectionner des observations


Manipulation des Données
Fonctionnalité : Sélectionner des observations

Besoin/Explication :

• Il est fréquent de vouloir sélectionner ou d’isoler un groupe d’observations pour une analyse particulière

• La fonction « Sélectionner des observations » est parmi les opérations les plus utilisées dans une analyse
statistiques de données..

Comment faire : Sélectionner des observations

o Ouvrir le fichier « «selection_test.sav »


o Activer le menu « Données »  « Sélectionner des Observations»
o La boite de dialogue suivante est affichée  il faut la renseigner
Manipulation des Données
Fonctionnalités: Sélectionner des observations
o Sélectionner « Selon une condition
logique
Manipulation des Données
Fonctionnalités: Sélectionner des observations
o Sélectionner « Selon
une condition logique
o Pour une condition de
sélection  Cliquer sur
«le bouton « Si… » 
boite de dialogue de
condition

• Remarquez les autres options de sélection


Manipulation des Données
Fonctionnalités: Sélectionner des observations
o Sélectionner « Selon
une condition logique
o Pour une condition de
sélection  Cliquer sur
«le bouton « Si… » 
boite de dialogue de
condition
o Positionner la
condition, Ici :
«Consommation <=25 »
Manipulation des Données
Fonctionnalités: Sélectionner des observations

o Remarquer la création d’une nouvelle variable


o Remarquer aussi les hachures sur le côté gauche de la fenêtre
Manipulation des Données

Fonctionnalités :

Masquer/Afficher des variables


Manipulation des Données

Fonctionnalité : Masquer / Afficher des Variables


Besoin/Explication :
• Il est possible de ne sélectionner qu’un certain nombre de variables à afficher.

Comment faire :
o La fenêtre d’affichage des variables étant activée. On peut personnaliser l’affichage des variables en
activant le menu « Affichage»  «Personnaliser l’affichage des variables ». La fenêtre suivante apparait où
il est possible de cocher les variables visibles et décocher les variables non visibles.
o On peut aussi rétablir les valeurs d’affichage par défaut
Manipulation des Données
Fonctionnalités: Afficher/Masquer des variables
Manipulation des Données

Fonctionnalités :

Identifier les observations dupliquées


Manipulation des Données
Fonctionnalité : Identifier les observations dupliquées

Besoin/Explication :
• Les données peuvent comprendre des observations « dupliquées » pour les raisons suivantes :
• La même observation est saisie plusieurs fois par erreur.
• Plusieurs observations partagent la même valeur d’un identifiant principal, mais ont des valeurs
d’identifiant secondaire différentes (par exemple, les membres d'une famille qui vivent tous dans la
même maison).
• Plusieurs observations représentent la même observation, mais les valeurs des variables autres que
celles qui identifient l'observation sont différentes (par exemple, plusieurs achats effectués par la
même personne ou la même société pour des produits différents ou à des heures différentes).
• L'identification des observations dupliquées vous permet de définir la variable dupliquée suivant vos
besoins et de contrôler la détermination automatique des observations principales par rapport aux
observations dupliquées
Manipulation des Données
Fonctionnalités: Identifier les observations dupliquées

Comment faire :

o L’identification des observations dupliquées passe par l’activation du menu «Donnée »  «


Identifier les Observations Dupliquées ». A l’activation de ce menu, la fenêtre suivante apparait
pour renseigner :
o Les variables sur lesquelles SPSS se basera pour juger si une observation est
dupliquée ou non
o La nature et les variables de tri du résultat
o Autres informations (voir fenêtre)
o À la fin de l’analyse, le résultat est affiché dans la fenêtre des résultats.
Manipulation des Données
Fonctionnalités: Identifier les observations dupliquées
Manipulation des Données

Fonctionnalités :

Identifier les observations inhabituelles


Manipulation des Données
Fonctionnalité : Identifier les observations inhabituelles

Besoin/Explication :
• La procédure de détection des observations inhabituelles ( on dit aussi des anomalies) vise à repérer
les observations inhabituelles en se basant sur les écarts par rapport aux normes de leurs groupes. La
procédure est destinée à détecter rapidement les observations inhabituelles afin de vérifier les données à
l'étape d'analyse exploratoire des données, avant d'effectuer toute sorte d'analyse inférentielle de ces
mêmes données

Comment faire :
o L’identification des observations inhabituelle peut être activée directement par le menu « Données » 
« Identifier les Observations Inhabituelles ». La fenêtre suivante alors apparait pour renseigner quelques
détails pour le calcul des groupes et des écarts dans le groupe.
o La variable d’analyse
o Autres informations
o Le résultat est affiché dans la fenêtre de sortie (des résultats)
Manipulation des Données
Fonctionnalités: Identifier les observations inhabituelles
Manipulation des Données

Fonctionnalités :

Fusionner des fichiers


Manipulation des Données
Fonctionnalité : Fusionner des fichiers
Besoin/Explication :
• Les données peuvent être distribuées dans plusieurs fichiers différents, on peut être amener à vouloir
les fusionner dans un seul fichier :
• Pour fusionner deux fichiers, deux cas peuvent se présenter :
• Les variables sont les mêmes, mais les observations sont différentes : on parle dans ce cas d’ajout
d’observations
• Les observations sont les mêmes, mais les variables sont différentes : on parle dans ce cas d’ajout
de variables

Fichier données de SPSS

Fichier données de SPSS


Fichier données de SPSS

Fusion de fichier
Manipulation des Données
Fonctionnalité : Fusionner des fichiers
Besoin/Explication :

Fusion par ajout d’observation :

• Si les données sont contenues dans deux ou plusieurs fichiers distincts (par exemple : les fichiers
proviennent de plusieurs enquêteurs différents), il est possible de regrouper tous ces fichiers séparés en
un seul grâce à la fonction fusionner des fichiers de la rubriques données.

Fusion par ajout de variables :

• Si on dispose de deux fichiers contenant les mêmes sujets, mais avec des variables différentes (par
exemple, deux expériences différentes avec le même groupe de sujets) avec pour but de fusionner ces
expériences dans un même fichier.
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
Variable Variable 2 X1 X2 Variable 1 Variable 2 Y1 Y2
1 aa A D 40 X1 Y1
A 10 bb B E 50 X2 Y2
B 20 cc C F 60 X3 Y3
C 30
Fusion par Ajout d’observations

Variable 1 Variable 2 X1 X2 Y1 Y2
A 10 aa A
B 20 bb B
C 30 cc C
D 40 X1 Y1
E 50 X2 Y2
F 60 X3 Y3
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
ID Variable 1 Variable 2 ID Variable 3 Variable 4
001 A 10 00 D 40
002 B 20 1
003 C 30 00 E 50
2
Fusion par Ajout de variables
00 F 60
3
ID Variable 1 Variable 2 Variable 3 Variable 4
00 A 10 D 40
1 E 50
00 B 20 F 60
2
00 C 30
3
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
Comment faire : fusion par ajout d’observations
o Pratiquer sur l’exemple «merge_o1.sav » et « merge_o2.sav »
o Ouvrir le fichier « merge_o1.sav »
o Activer le menu

o Rechercher le fichier à fusionner (c’est-à-dire « merge_o2.sav »)


o Renseigner la boite de dialogue suivante :

Variables non communes


Manipulation des Données
Fonctionnalités: Fusionner des fichiers

Comment faire : fusion par ajout de variables


o Pratiquer sur l’exemple «merge_v1.sav » et « merge_v2.sav »
o Ouvrir le fichier « merge_v1.sav »
o Activer le menu

o Rechercher le fichier à fusionner (c’est-à-dire « merge_v2.sav »)


o Renseigner la boite de dialogue suivante :
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
Comment faire : fusion par ajout de variables
o Les observations doivent être placées dans le même ordre dans les deux fichiers de
données (utiliser trier les observations pour les deux fichiers).

o Les observations qui n'ont pas de correspondance dans les clés d'appariement sont inclus
dans le fichier fusionné et elles sont fusionnées avec les observations de l'autre fichier.

o Les observations sans correspondance contiennent des valeurs uniquement pour les
variables du fichier duquel elles sont issues. Les variables de l'autre fichier contiennent la
valeur manquante par défaut.

o Les variables qui viendront s’ajouter au fichier courant (fichier de données ouvert) devront
porter des noms différents, sinon elles seront exclues.
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
Comment faire : fusion par ajout de variables
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
Comment faire : fusion par ajout de variables
o boite de dialogue

o Cocher « Apparier les observations …. »


Manipulation des Données
Fonctionnalités: Fusionner des fichiers
Comment faire : Fusion par ajout de variables
• boite de dialogue

• Cocher « Apparier les observations …. »

• Sélectionner la variable « CIN »


• Comme Clé d’appariement

• Cliquer sur « Ok »
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
Comment faire : fusion par ajout de variables
- le résultat
Manipulation des Données

Fonctionnalités :

Scinder un fichier
Manipulation des Données
Fonctionnalité : Scinder un Fichier

Besoin/Explication :
• La fonction scinder un fichier sert à fragmenter un fichier de données en groupes et en sous
groupes selon une ou plusieurs variables de regroupement.

• Elle prépare le fichier en vue d’effectuer des procédures et des analyses qui seront exécutées à
l’intérieur de chacun de ces sous-groupes.

• La manière avec laquelle on scinde un fichier influera sur la manière avec laquelle les résultats des
analyses seront présentés.

• La fragmentation du fichier est logique seulement, elle ne va pas produire plusieurs fichiers
Manipulation des Données
Fonctionnalités: Scinder un fichier
Besoin/Explication :

V1 V2 V3 V1 V2 V3
A 001 320 A 001 320
Groupe 1
A 002 125 A 002 125
B 006 214 B 006 214
B 008 214 B 008 214
Groupe 2
B 004 025 B 004 025
B 005 256 B 005 256
Scinder un fichier
C 006 214 C 006 214 Groupe 3
selon la variable V1
D 001 236 D 001 236
Groupe 4
D 010 452 D 010 452
Manipulation des Données
Fonctionnalités: Scinder un fichier
Besoin/Explication :

• On peut scinder un fichier selon HUIT variable maximum


Comment faire : Scinder un fichier

o Ouvrir le fichier « «scinder_test.sav »


o Activer le menu « Données »  « Scinder un Fichier »
o La boite de dialogue suivante est affichée  il faut la renseigner
Manipulation des Données
Fonctionnalités: Scinder un fichier
Comment faire : Scinder un fichier

Influe sur la
présentation
des résultats
Nous verrons lors de l’analyse des données comment
les résultats seront présentés
Manipulation des Données

Fonctionnalités :

Transposer
Manipulation des Données
Fonctionnalités: Transposer

Besoin/Explication :
Comment faire :
• La transposition
N,;n;, permet de créer un nouveau fichier dans lequel les lignes et les colonnes du
fichier initial sont inversées pour que les observations (lignes) deviennent des variables (colonnes),
et vice versa. Transposer génère automatiquement de nouveaux noms pour les variables, et
affiche une liste de ces nouveaux noms.

• Une nouvelle variable de type chaîne contenant le nom de variable d'origine, case_lbl, est
automatiquement créée.
Manipulation des Données
Fonctionnalités: Transposer
Besoin/Explication :

V1 V2 V3
Transposer un fichier On remarquera :
A 001 320
• Que les scores de type «Chaine » ne sont pas
B 002 125 transposés
C 006 214 • La création d’une nouvelle variable «
D 008 214 CASE_LBL »

CASE_LBL Var001 Var002 Var003 var004


V1 . . . .
V2 001 002 006 008
V3 320 125 214 214
Manipulation des Données
Fonctionnalités: Transposer
Comment faire : Transposer un fichier

o Ouvrir le fichier « «Transposer_test.sav » a partir de votre CD des exemples


o Activer le menu « Données »  « Transposer »
o La boite de dialogue suivante est affichée  il faut la renseigner

o Puis cliquer sur « Ok »


Manipulation des Données
Fonctionnalités: Transposer
Comment faire : Transposer un fichier

o Maintenant : utilisez la « Variable de noms » comme suit :

o Puis cliquer sur « Ok »  Remarquez la différence


Manipulation des Données

Fonctionnalités :

Agréger
Manipulation des Données
Fonctionnalités: Agréger
Besoin/Explication :

• Agréger  c’est-à-dire obtenir des résumés

• L’agrégation des données permet d'agréger des groupes d'observations de l'ensemble de


données actif dans des observations uniques. Elle permet également de créer dans l'ensemble de
données actif un nouveau fichier agrégé ou de nouvelles variables qui contiennent des données
agrégées. Les observations sont agrégées en fonction de la valeur de zéro ou de plusieurs critères
d'agrégation (regroupement). Si aucun critère d'agrégation n'est spécifié, l'ensemble de données
entier est un agrégat unique.
Manipulation des Données
Fonctionnalités: Agréger
Besoin/Explication :

V1 V2 V3 V1 V2 V3 P
A
A
G1
A
B
G2 B
C
C
G3
C
Variable crée lors D
de l’agrégation
G4 D
Manipulation des Données
Fonctionnalités: Agréger
Besoin/Explication :

• Les observations sont regroupées selon les valeurs des critères d'agrégation. Chaque combinaison
unique de valeurs de critères d'agrégation définit un groupe.

• Les variables sources sont utilisées avec des fonctions d'agrégation pour créer de nouvelles
variables d'agrégation.
Manipulation des Données
Fonctionnalités: Agréger
Comment faire : Agréger

o Ouvrir le fichier « «Agreger_test.sav »


o Activer le menu « Données »  « Agréger»
o La boite de dialogue suivante est affichée  il faut la renseigner
o Puis cliquer sur « Ok »
Manipulation des Données
Fonctionnalités: Agréger
Variables de
groupement ou
critère d’agrégation

Variables source
avec la fonction
d’agrégation

Choix de la sortie
Manipulation des Données

Fonctionnalités :

Pondérer des observations


Manipulation des Données
Fonctionnalités: Pondérer des observations

Besoin/Explication :

• Pondérer  c’est-à-dire donner un poids à une observation.


• Cette fonctionnalité permet de pondérer (ou bien de donner un poids) différemment les
observations (par réplication simulée) dans le cadre de l'analyse statistique
• La pondération est une opération logique, elle ne modifie pas les données
• La pondération se fait par une variable  cette variable peut être calculée ou saisie
• La pondération est visible lors des résultats
Manipulation des Données
Fonctionnalités: Pondérer
Comment faire : Pondérer les observations

o Ouvrir le fichier « «Ponderer_test.sav »


o Activer le menu « Données »  « Pondérer les observations»
o La boite de dialogue suivante est affichée  il faut la renseigner
o Puis cliquer sur « Ok »

La variable avec
laquelle on voudrait
pondérer
Manipulation des Données
Fonctionnalités: Pondérer

Comment faire : Pondérer les observations

o Anticipons un peu sur les résultats :

o Faire sortir le tableau des effectifs sans pondération


o Faire sortir le tableau des effectifs avec pondération
Manipulation des Données

Fonctionnalités :

Transformer des variables


Manipulation des Données
Fonctionnalités: Transformation des variables

o Parfois, on a besoin de transformer nos données pour les adapter à certaines


analyses.
o Dans certains cas on doit effectuer des transformations de données simples
comme:
o Créer une variable qualitative à partir d'une variable d'échelle.
o Combiner plusieurs modalités de réponses en une seule modalité.
o Créer une nouvelle variable qui représente la différence calculée entre
deux variables existantes.
o A d’autres occasion, on construit de nouvelles variables basées sur des
équations complexes et des instructions conditionnelles.
Manipulation des Données
Fonctionnalités: Transformation des variables

o SPSS vous permet d’effectuer ces transformations à l’aide de la rubriques des


transformations: « Transformer » à partir du menu principal
o On peut :
o Calculer des variables

o Recoder des variables

o Créer des variables

o Dans ce qui suit, on va voir ces fonctionnalités


Manipulation des Données

Fonctionnalités :

Calculer des variables


Manipulation des Données
Fonctionnalités: Calculer des variables
Besoin/Explication :

o Il arrive parfois où l’on veuille calculer une variable à partir d’autres variables
o Par exemple : si on dispose d’une variable contenant l’année de naissance de l’individu et on
voudrait calculer son âge : on pourra créer une nouvelle variable qui donnera l’âge de l’individu
en soustrayant l’année de naissance à l’année courante.

Année
Âge
Naissance
1984 29
1994 Année Courante : 2022 19
1967 46
1985 28
1956 57
Manipulation des Données
Fonctionnalités: Calculer des variables

Comment faire : Calculer des variables

Ouvrir le fichier « «Calculer_test.sav »


Activer le menu « Transformer»  « Calculer la variable»
La boite de dialogue suivante est affichée  il faut la renseigner
Puis cliquer sur « Ok »
Manipulation des Données
Fonctionnalités: Calculer des variables
La variable cible ou
celle qui sera crée

Expression de la
nouvelle variable

Opérateurs et
chiffres

Condition
Manipulation des Données

Fonctionnalités :

Recoder des variables


Manipulation des Données
Fonctionnalités: Recoder des variables
Besoin/Explication :

o Il arrive parfois où l’on veuille calculer recoder une variable


o Par exemple : si on dispose d’une variable contenant la consommation de carburant, on
pourra classer ces consommations en catégorie:
o Consommation excessive : Plus de 30
o Grande consommation : Entre 25 et 29
o Consommation modérée : Entre 20 et 24
o Petite consommation : Moins de 20 (c’est-à-dire entre 0 et 19)
Manipulation des Données
Fonctionnalités: Recoder des variables

On veut recoder la variable « Consommation »


Marque Conso Catégorie
Acura CL 26 2
• 1 : Consommation excessive : Plus de 30
Audi A4 27 2
• 2 : Grande consommation : Entre 25 et 29
BMW 528i 25 2 • 3 : Consommation modérée : Entre 20 et 24
BMW 323i 26 2 • 4 : Petite consommation : Moins de 20 (c’est-à-dire entre 0 et 19)
Buick Regal 23 3
Buick Century 25 2
Cadillac Catera 22 3
Cadillac DeVille 22 3
Chevrolet Camaro 25 2
Dodge Viper 16 4
Ford Crown Victoria 21 3
Ford Contour 25 2
Honda Passport 19 4
Honda Odyssey 23 3
Honda CR-V 24 3
Honda Accord 27 2
Honda Civic 32 1
Hyundai Sonata 25 2
Hyundai Elantra 27 2
Hyundai Accent 31 1
Infiniti I30 25 2
Manipulation des Données
Fonctionnalités: Recoder des variables
Comment faire : Recoder des variables

• Ouvrir le fichier « «Recodage_test.sav »


• Activer le menu « Transformer»  « Recoder des variables»
• La boite de dialogue suivante est affichée  il faut la renseigner
• Puis cliquer sur « Ok »
Manipulation des Données
Fonctionnalités: Recoder des variables

Variables à recoder

Positionnement d’une condition


Manipulation des Données
Fonctionnalités: Recoder des variables
• Choisir la colonne qui va
être recodée
Manipulation des Données
Fonctionnalités: Recoder des variables
• Choisir la colonne qui va
être recodée
• Cliquer sur «Anciennes et
nouvelles valeurs»  la
boite de dialogue suivante

Ancienne et nouvelles valeurs


o Anciennes valeurs : se sont les valeurs à recoder («Consommation»)
o Nouvelles valeurs : ici par exemple les tranches de consommation
o une variable alphanumérique peut être recodée pour une nouvelle variable
numérique
o Les anciennes valeurs individuelles (variables numériques) doivent être
recordées par de nouvelles valeurs de même type;
Manipulation des Données
Fonctionnalités: Recoder des variables
• Choisir la colonne qui va
être recodée
• Cliquer sur «Anciennes et
nouvelles valeurs»  la
boite de dialogue suivante
Génération des graphiques: Graphe à Bâton
Génération des graphiques: Graphe à Bâton
Génération des graphiques: Boite à moustache ou boxplot
Génération des graphiques: Boite à moustache ou boxplot
Génération des graphiques: Boite à moustache ou boxplot
Génération des graphiques: Dispersion/points
Génération des graphiques: Dispersion/points
Génération des graphiques: Dispersion/points

Donne une idée sur la


corrélation des deux
variables
Génération des graphiques: Histogramme
Génération des graphiques: Histogramme
Génération des graphiques: Histogramme

La courbe gaussienne
donne une idée sur la
normalité, la symétrie
et l’aplatissement de
la distribution

Vous aimerez peut-être aussi