Cours Informatique Appliquée S6

INFORMATIQUE APPLIQUÉE Pr.
Mouna ELMACHKOUR
Filière Science Economique et Gestion Semestre 6

OVERVIEW Informatique, Gestion, Entreprise..
Une entreprise est une entité économique qui utilise des moyens humains, matériels et
financiers en vue d’atteindre les objectifs fixés.
Les moyens humains sont les différents métiers et domaines d’activité de l’entreprise
(comptabilité, commerce, production, communication , logistique…). Il s’agit de
plusieurs personnes qui fournissent un travail de manière organisée.
Qu'est-ce que l'informatique ?
INFORmation autoMATIQUE.
L’informatique est une science qui permet de traiter l’information
de façon automatique.
- Science : donc des théories et des modèles,

- Information : texte, image ou son représentés sous une forme manipulable par la
machine en fonction de sa technologie.
L'informatique désigne l'automatisation du traitement de l'information considérée comme le support des

connaissances humaines et des communications dans les domaines technique, économique et social
L’informatique (en anglais computer science, ou computing science), est l’étude des
fondations théoriques de l’information et du calcul et leur implantation et application
avec des ordinateurs.
QUELLE RELATION ENTRE L’ENTREPRISE ET L’INFORMATIQUE ?
- La mondialisation
-Le taux de concurrence
-L'obligation de se développer, de perfectionner
-la digitalisation des processus de production
-L’obligation de les processus
-Exemple:
SYSTÈME D’INFORMATION
Le système d’information (SI) est un élément central d’une entreprise ou d’une
organisation.
Il permet aux différents acteurs de véhiculer des informations et de communiquer
grâce à un ensemble de ressources matérielles, humaines et logicielles.
Un SI permet de créer, collecter, stocker, traiter, modifier des informations sous
divers formats.
L’objectif d’un SI est de restituer une
information à la bonne personne et au bon
moment sous le format approprié.
« le système d’information est un ensemble complexe, souvent hétérogène car il est

constitué d’éléments qui se sont juxtaposés au fil du temps au gré des choix
stratégiques, des évolutions technologiques des systèmes informatiques mis en place,
du développement de l’organisation elle-même » M. Lafitte (2003)
SYSTÈME D’INFORMATION
SI est un sous-système de l'organisation qui s'occupe de collecter, stocker, traiter
et diffuser l'information dans le système opérant et dans le système de pilotage.
Le système d'information a pour rôle de coordonner les activités de l‘entreprise:
 applications du mailing,
 application de communication et de conférence en ligne,
 système de gestion de production
C’est le véhicule de la communication entre l'ensemble des ressources systèmes

(personnes, matériels, logiciels) afin d’assurer les objectifs :
1. Saisie de données
2. Stockage des données
3. Traitement des informations
4. Restitution des informations
5. Transmission des information
SYSTÈME INFORMATIQUE ET SYSTÈME D’INFORMATION
L’IT (Système informatique) est l’ensemble des actifs matériels et logiciels de l’entreprise ayant pour
vocation à automatiser le traitement de l’information.
C’est la partie visible à laquelle tout le monde pense quand on parle de projets et d’infrastructures
informatiques: le logiciel, le serveur, les écrans, les ordinateurs…
Le système informatique: c’est un ensemble des éléments

permettant de traiter automatiquement les données
Le SI (Système d’information) est l’ensemble des actifs de l’IT (matériels et logiciels), qui comprend aussi
et surtout les actifs humains et immatériels, les procédés, processus d’industrialisation …
Le système informatique est la partie informatique du système d’information, composée de matériels,
logiciels, réseaux et procédures d’utilisation
DONNÉES ET INFORMATION
Une donnée est une information brute, sans contexte, un fait sans arrière-plan.
Forme inexploitable
Une donnée brute peut prendre différents aspects: données numériques, textuelles, ou un mélange
de texte et de chiffres
Une donnée doit passer par un processus de traitement de données (input) pour résulter
‘l’output’, qui est l’information.
Les informations sont des « données transformées ».
Pour avoir une réelle pertinence, l’information obtenue doit avoir une signification logique et doit
être fiable.
APPLICATION VS LOGICIEL VS PROGICIEL
Un logiciel est un ensemble de programmes, procédures, algorithmes liés au

fonctionnement d’un système de traitement de données.
Utilisateur final Le logiciel est un élément indispensable au fonctionnement de tout dispositif
Application informatique. Logiciel système responsable de enregistrement des fichiers sur le
disque dur, imprimer un document, supprimer un fichier, chercher un fichier…
Logiciel système
Une application est un logiciel informatique conçu pour aider l’utilisateur à
SE
effectuer diverses tâches sur l’ordinateur, smartphone, tablette…
Une application est un logiciel qui a été conçu/développé pour l’utilisateur final.
Matériel
Un progiciel est un produit logiciel ou un logiciel produit par un éditeur de
logiciel informatique pour une utilisation professionnelle
PLAN DU COURS
oIntroduction générale et définition
oIntroduction au progiciel SPSS
o Vocabulaire de Base et Gestion des Fichiers de Données
o Présentation des Fenêtres SPSS
o Saisie des Données
o Importation des Données
o Manipulation des Données
o Plusieurs Fonctionnalités seront présentées
o Quelques Analyses Statistiques
o Statistique Descriptive
o Exploration des Données
o Tableau de Fréquence
o Tableaux Croisés
o Modification et Exportation des Résultats
TOUR D’HORIZON..
oSPSS
oActuellement détenu et développé par la société IBM
oprincipalement utilisé pour l'analyse statistique, l'exploration de donnéeset la collecte de
données
oSPSS signifie "Statistical Product and Service Solutions"

oVersions:
o SPSS 1 – 1968 «Progiciel statistique en sciences sociales»
o SPSSx release 2 – 1983
o SPSS Statistics V.17
o PASW Statistics V.18
o IBM SPSS Statistics V.19, après la création de SPSS Inc. acquis par IBM en 2009.
o IBM SPSS Statistics 20.0 en août 2011
o…
o IBM SPSS Statistics V.28 en mai 2021
POURQUOI SPSS?
oIBM SPSS Statistics est une puissante plateforme de logiciels statistiques
Il offre une interface conviviale
 Simplicité d'utilisation
 Préparer et analyser les données facilement grâce à une interface utilisateur intuitive sans avoir à écrire le code
oIl permet d’exécuter des statistiques avancées et descriptives, des analyses de régression, des arbres de décision avec une
interface intégrée
oToutes les facettes du cycle de vie de l'analyse sont incluses, depuis la préparation et la gestion des données jusqu'à
l'analyse et la génération de rapports
oDans ce cours:
 Coder des données issus d’un questionnaire ou d’un entretien

 Extraire des informations descriptives
 Les résumer graphiquement
PLAN DU COURS
oIntroduction
o Vocabulaire de Base et Gestion des Fichiers de Données
o Tableaux Croisés
Vocabulaire de Base / Gestion des Fichiers de Données
o Organisation et interface de SPSS
o Différence au logiciel MS Excel, les données et les graphiques sont

représentés dans une même feuille
o Organisation et interface de SPSS
o Dans SPSS :
o Les données et les résultats restent constamment séparés

o Les données sont enregistrées dans des fichiers .sav
o Les résultats sont disponibles dans des fichiers .spv ou .spo
o Le langage de commande permet d'enregistrer les analyses dans un fichier de
syntaxe afin de les relancer à une date ultérieure
Un fichier de syntaxe de commande est un fichier texte simple contenant des
commandes de syntaxe IBM SPSS Statistics .sps
o Il y’a aussi les scripts : ensemble de lignes de code exécutable, il sont
stockés dans des fichiers .sbs
• Logique SPSS
Données Résultats
Syntaxe Syntaxe
.spv
.sav
.spo
Syntaxe Script
.sps .sbs
o Logique SPSS
o Syntaxe SPSS:
o C’est un langage spécifique à SPSS
o Tous ce que l’on peut faire interactivement par menu est généré par le moteur SPSS comme
syntaxe lignes de code
o L’interface SPSS fait abstraction du code derrière les opérations réalisées  

GET
FILE='C:\Exploitation\Cours Fac
Salé\SPSS\Exemples\Ventes_Voitures.sav'.
DATASET NAME Ensemble_de_données1 WINDOW=FRONT.
COMPUTE Classe_Consommation=Consommation / 1.5.
VARIABLE LABELS Classe_Consommation 'Classe Consommation'.
EXECUTE.
SUMMARIZE
/TABLES=Prix BY Modele
/FORMAT=VALIDLIST NOCASENUM TOTAL LIMIT=100
/TITLE='Récapitulatif des observations'
/MISSING=VARIABLE
/CELLS=COUNT MEAN MEDIAN GMEDIAN SUM MAX STDDEV VAR.
o Saisie des données sous SPSS
o Qu’est ce qu’une donnée statistique?
Une donnée statistique est une information codifiée, figée et transmissible

Typologie: Une donnée statistique peut être une donnée à caractère quantitatif ou qualitatif.
o Qu’est ce qu’une information?
Les informations sont des données transformées. Une information représente 'l'output' du
processus d'analyse.
o Qu’est ce qu’une variable?
Une variable statistique est une caractéristique commune à l'ensemble des individus d'une étude.
C’est une quantité ou une qualité définie sur une population et qui est susceptible de varier d’un
individu à l'autre.
o Saisie des données sous SPSS / Définition d’une Variable
• Une variable est la propriété d’un événement ou d’un objet pouvant prendre plusieurs valeurs
Un exemple: Participants à un événement:
Age:
Genre : 1 : Femme
Vous organisez Evénement
2 : Homme
Satisfaction :
Sur une échelle
Vous recevez Participants croissante de 1 à 5
Vous voulez savoir Âge Genre Satisfaction

Evénement
Si on s’intéresse aux colonnes
Les colonnes sont nos
variables
Participants
Âge Genre Satisfaction

Âge Genre Satisfaction 21 1 3
25 2 3
36 1 2
Si on s’intéresse aux lignes 26 1 4
En lisant une ligne, on reconstitue 48 1 1

le profil d’un événement ou d’un 18 2 4
individu
Une fois les résultats consignés, nous
obtenons la matrice suivante
o Une ligne est une observation

o Une colonne est une variable

21 1 3
25 2 3
36 1 2
Si on s’intéresse aux cases 26 1 4
48 1 1
18 2 4
Chaque case ne doit contenir qu’une seule donnée Appelée : Score de la variable

o Une case représente le score d’une variable pour une observation donnée
Satisfaction
o Les scores possibles pour une variables sont appelés : Modalités Score 3
o Les types des modalités définissent les types des Variables Score 3
Score 2
Score 4
Score 1
Score 4

o Revenons à notre matrice : Âge Genre Satisfaction

21 1 3
o Pour La variable « Âge » : Le signifiant est le signifié
: On dit que la variable est « Quantitative » 25 2 3
36 1 2
o Pour les variables « Genre » et « Satisfaction » : Le
26 1 4
signifiant n’est pas le signifié : On dit que se sont
des variables « Qualitatives » 48 1 1
18 2 4

Astuce pour différencier entre une variable
Quantitative et une autre Qualitative : Âge Genre Satisfaction
21 1 3
Faire la somme des scores des variables :
25 2 3
o La somme des âges fait sens  Variable 36 1 2
Quantitative
26 1 4
o La somme des genres et des satisfactions n’a
pas de sens  Variable Qualitative 48 1 1
18 2 4
∑ 174 8 17
o Variables qualitatives:
o On fait distinction selon que la variable présente une forme d’ordre ou pas:
Variable Genre Variable Satisfaction
Deux catégories : Femme Une échelle croissante de
et Homme. Ne présente 1 à 5. Présente un ordre 21 1 3
pas d’ordre 25 2 3
1 : Femme 5 : Très satisfait 36 1 2
2 : Homme 4 : Plutôt satisfait
3 : Satisfait 26 1 4
2 : Indifférent 48 1 1
1 : Déteste
18 2 4
o La variable « Genre » ne présente pas d’ordre  elle est dite « Nominale »

o La variable « Satisfaction » présente un Ordre  elle est dite « Ordinale »
o Saisie des données sous SPSS / Saisie des données
Trois étapes sont essentielles à la saisie des données :
1. Définition des noms des variables de la matrice de données

2. Saisie proprement dite des données
3. Modification (s'il y a lieu) des propriétés des variables
La qualité des analyses statistiques est

L’analyse se fait à partir des fonction de la dextérité du choix des
données saisies variables et de la qualité des données
saisies.
• Au lancement du logiciel, on a l’écran suivant

• On peut choisir entre autres : soit ouvrir une
source de données existante, soit saisir des
données nouvelles
• Dans notre cas, on choisit de saisir des données
nouvelles
Fenêtre d’affichage des données

Fenêtre d’affichage des variables

o Tout ensemble de données SPSS comporte deux vues complémentaires

accessibles via leurs onglets
 Une vue des données « Affichage des données »
 Une vue pour la description des variables : « Affichage des Variables »

• Les variables sont placées en colonnes

• Les observations sont placées en lignes
• Chaque variable est caractérisée par un ensemble de caractéristiques:

o Nom o Valeurs
o Type o Manquants
o Longueur o Colonne
o Décimales o Alignement
o Etiquette o Mesure
o Rôle
Caractéristiques des variables
Caractéristique Explication
C’est le nom de la variable. Il est unique. Il a généralement le sens de
Nom l’information qu’il porte (Ex: Age, Genre, datenaiss pour Date de
naissance, etc.). Le nom est le code de la variable.
Le type de la variable, il peut être Numérique, Chaine, Date,
Type Monétaire, ou autres ( Voir dans la pratique). Le type est
généralement lié aussi au sens de la variable.
C’est l’espace alloué à la variable par SPSS pour le stockage. Par
Longueur exemple, une variable de type Chaine et de longueur 10 ne peut
stocker que des chaines de 10 caractères.
Le nombre de décimales après la "virgule" (exemple : pour 3,4  1;
Décimales
pour 3  0
Un label descriptif pour la variable (exemple : « Âge du répondant »
pour la variable « Age »). L’étiquette de la variable peut être
Etiquette différente du nom de la variable. Elle peut être plus longue que le
nom de la variable. L’étiquette, et non le nom de la variable, suivra la
variable dans les sorties ( outputs).
Pour affecter des étiquettes descriptives de valeur pour chaque valeur
d'une variable. Cela est utile si votre fichier de données utilise des
Valeurs
codes numériques pour représenter des modalités non numériques (par
exemple, les codes 1 et 0 pour homme et femme)
Cette caractéristique donne sens aux valeurs manquantes. Elle sera
Manquants
présentée dans la suite de ce cours.
Colonnes La largeur de la colonne pour la variable en question.
Alignement L’alignement de la valeur de la variable : Droite, Gauche ou Centre.
Cette caractéristique donne la nature de la variable : Quantitative (ou

Echelle), Nominale ou Ordinale.
Echelles : pour les variables dont les valeurs sont quantitatives
continues et discrètes (exemple: nombre de livres empruntés, prix, âge
salaire, ...etc.)
Mesure Nominales : pour les variables dont les valeurs sont qualitatives
(situation familiale, sexe, etc.)
Ordinales pour les variables dont les valeurs sont qualitatives mais il
y’a un ordre hiérarchique entre les observations (niveau d’études,
qualité d'un travail, ...)
 Première saisie de données
 Essayons de créer un fichier de données qui répond à l’exemple précédent :
 Les variables suivantes :
 « Age » : Numérique
 « Genre » : Chaine de longueur 1
 « Satisfaction : Numérique
 Ne pas se soucier des caractéristiques «Manquants » et « Valeurs »

 On expliquera ces notions ultérieurement.
L’écran de description des variables devrais ressembler à ceci .

Et l’écran de saisie devrais ressembler à ceci .

Notion de valeurs Manquantes
o L'option « Valeurs manquantes » permet de définir les valeurs de données

spécifiées comme valeurs manquantes spécifiées par l'utilisateur.
o Par exemple, vous pouvez faire la distinction entre les données manquantes
parce qu'une personne interrogée a refusé de répondre et les données
manquantes parce que la question ne s'appliquait pas au répondant.
o Les valeurs des données définies comme valeurs utilisateur manquantes sont
repérées par un indicateur en vue d'un traitement spécial et sont exclues de la
plupart des calculs.

o Les données manquantes ou non valides sont trop fréquentes pour être
ignorées.
o Les personnes interrogées peuvent refuser de répondre à certaines
questions, ne pas connaître la réponse…..
o L’absence d’une donnée est considérée automatiquement comme une
valeur manquante systémique
o Les valeurs manquantes sont exclues des analyses et des opérations de
calcul
o Il est conseillé de symboliser les valeurs manquantes par autre chose
que le vide
• Sur la variable «Âge», si on clique sur le champs « Manquants» de la

grille de visualisation des variables  On obtient la boite de dialogue
suivante

o La fenêtre vous donne trois choix:
o Ou vous n’avez aucune valeur
manquante,
o Ou vous avez jusqu'à trois valeurs
manquantes distinctes ( c’est ce que signifie
le mot « discrètes »)
o Ou vous considérez comme manquantes
toutes les valeurs qui tombent dans l’étendu
entre deux nombres, avec la possibilité d’avoir
une valeur manquante distincte additionnelle
( seulement dans le cas d’une variable
numérique)

o Remarque:
o Les champs de données vides
sont gérés de la manière suivante:
ils sont convertis en données
manquantes par défaut, et signalées
par un point .
o Lors des statistiques de fréquence,
SPSS donne l’information sur les
valeurs manquantes

o Il faut donner une valeur significative à une valeur
manquante
o Par exemple, on peut attribuer le nombre 999 à la valeur
manquante d’un Âge.
o Pratiquons cela sur notre exemple :

o Donnons la valeur 999 à une valeur manquante de la
variable « Âge »
o C’est une variable discrète

o Valeurs manquantes des variables chaîne :
o Les valeurs manquantes des variables chaine sont gérées de la même

façon que celles des valeurs numériques. Contrairement aux valeurs
numériques, les champs vides pour les variables chaînes ne sont pas
désignés comme données manquantes par défaut. Ils sont interprétés
comme des chaînes de caractères vides.
o Contrairement aux variables numériques, on ne peut pas introduire

des plages de valeurs comme valeurs manquantes.
Valeurs
o Dans le cas ou la variable est de type nominale ou ordinale, elle stockée sous
forme de code
o Exemple : Variable Genre Variable Satisfaction
1 : Femme 5 : Très satisfait
2 : Homme 4 : Plutôt satisfait
3 : Satisfait
2 : Indifférent
1 : Déteste
o Il faut indiquer à SPSS cette codification ou la correspondance des codes aux

valeurs
o Saisie des données sous SPSS / Saisie des données/ Valeurs
• En cliquant sur le champs « Valeurs » de la grille de visualisation des

variables  On obtient la boite de dialogue suivante
o En cliquant sur le bouton « Ajouter» pour ajouter une correspondance

«Code»  «Valeur»
Fin du chapitre
o Faire des TP sur les exemples fournis
o Définir les variables
o Variable quantitative
o Variable nominale
o Variable ordinale
o Définir des listes de valeurs
o Définir les valeurs manquantes d’une variable
o Saisir des données
o Sauvegarder les résultats
Plan du Cours
o Introduction
o Vocabulaire de Base / Gestion des Fichiers de Données
o Tableaux Croisés
Importation des Données sous SPSS
Comme tout logiciel ouvert, SPSS dispose d’un certain nombre de possibilités d’échange
avec l’extérieur :
o Importation des données
o Exportation des données
o L’importation des données consiste à rapatrier des données externes à SPSS vers un
fichier .sav pour qu’ils puissent être traité par ce dernier
o Puisque les données sont externes à SPSS, il faut lui indiquer de quelle manière il va
faire l’import des données
Fichier .sav
de SPSS Import des données
Différents types de
fichiers
o Parmi les formats de données acceptées par SPSS:

o Les tableurs Lotus et Excel (*.xls);
o Les bases de données dBase (*.dbf);
o Les fichiers (*.txt et *.dat);
o Les fichiers de données SYSTAT (*.syd et *.sys);
o Les fichiers de données sous forme SPSS (*.sav);
o Les fichiers STATA (*.dta);
o Les fichiers SAS.
o Etc.
o Comme exemple, nous allons importer un fichier Excel
o Mais d’abord, il faut constituer le fichier Excel suivant :

o Aller sur « Fichier » puis « Lire Données externes »
o On choisit le type de fichier « Excel »

o Il faut spécifier à SPSS comment il va importer les données
o Si les en-têtes de colonne ne sont pas conformes aux règles de

dénomination de variable SPSS, ils sont convertis en noms de variable
valides et les en-têtes de colonne d'origine sont enregistrés comme
étiquettes de variable
o Importation des fichiers de Texte :
o Les conditions sont les suivantes :

o Chaque ligne correspond à une observation
o Chaque colonne correspond à une variable
o Les colonnes sont
o Soit délimitées par des délimiteurs (Espace, Tabulation, Virgule,
Point virgule, ou autre délimiteur spécifié lors de l’import)
o Soit des champs fixes
o Dérouler l’action d’import sur le fichier « ImportText.txt »








Fin Chapitre sur la saisie et l’importation des données

Plan du Cours
o Introduction
o Vocabulaire de Base / Gestion des Fichiers de Données
o Tableaux Croisés
Manipulation des Données
Rappel
o Dans les chapitres précédents, nous avons vu :
o Le vocabulaire de SPSS
o Le système de fenêtre de SPSS
o Comment créer un fichier de données
o Comment créer des variables et leur donner des caractéristiques
o Comment importer des données
o Une fois constituées, les données peuvent être manipulées

Que veux dire manipuler les données :
o Il arrive parfois ou les enquêtes sur le terrain génèrent beaucoup de variables, et
énormément de données
o L’analyste est amené parfois à n’étudier qu’une partie des données, voir créer
d’autres données à partir des données initiales ou recoder d’autres variables
o Il se peut aussi qu’il soit amener à modifier ou pondérer des données par d’autres
données , ou à catégoriser des variables pour faciliter l’analyse
o Il peut aussi fusionner des données, scinder ou trier d’autres
o Et bien d’autres manipulation ………………..

SPSS, en bon logiciel d’analyse statistique, Offre une multitude
de possibilités qui permettent de manipuler ainsi les données
Fonctionnalités qui seront présentées
oInsérer une observation oSélectionner des observations
oInsérer une variable oCompter les occurrences des valeurs
oIdentifier les observations dupliquées oPondérer des observations
oIdentifier les observations inhabituelles oCalculer des variables
oTrier les observations oRecodage des variables
oMasquer/Afficher une variable oCréation de variables
oFusionner des fichiers oRecodage automatique
oScinder un fichier oRemplacer des valeurs manquantes
oTransposer
oAgréger
Représentation schématique des menus de SPSS
Menu
Principal
Fichier Edition Affichage Données Transformer Analyse Graphes Utilitaires
Nouveau Copier/Cou
per/Coller
Divers
opérations Divers Divers Menus pour
Ouvrir Insérer pour la opérations
Variable manipulatio pour la opérations la Menu des
n des transformat d’analyse Génération Utilitaires
Insérer données et ion des des des
Fermer Observatio données Graphes
des données
n variables
Sauvegarde Etc.
r
Sauvegarde
r sou
Etc.
Fonctionnalités :
Insérer une observation

Fonctionnalité : Insérer une observation
Besoin/Explication :
• Il arrive des fois ou l’on veut insérer une observation dans un endroit précis d’un fichier (ex : Troisième ligne,
avant dernière ligne, etc.)
Comment faire :
• La feuille de saisie des données étant activée, et une ligne de données étant sélectionnée, vous pouvez insérer
une observation juste après la ligne sélectionnée en activant le menu « Edition »  « Insérer les Observations.. »
ou bien avec le menu contextuel du bouton droit.
• SPSS insère alors une nouvelle observation vide qu’il faudra renseigner
• Après insertion de la ligne, toute les cellules (c’est-à-dire les scores) sont vides
Fonctionnalités :
Insérer une variable

Fonctionnalité : Insérer une variable
• Il arrive des fois ou l’on veut insérer une variable dans une colonne précise (ex : Première colonne,
avant dernière colonne, etc.)
Comment faire :
o L’insertion d’une variable revient à insérer une ligne dans le volet d’affichage des variables
o La feuille de saisie des données étant activée et le volet d’affichage des variables étant activé aussi,
vous pouvez insérer une variable juste après la ligne sélectionnée en activant le menu « Edition »  «
Insérer une Variable.. » ou bien avec le menu contextuel du bouton droit.
o SPSS insère alors une nouvelle variable qu’il faudra compléter (modifier les caractéristiques de la
variable)
Fonctionnalités :
Trier des observations

Fonctionnalité : Trier les observations
• Cette fonctionnalité permet de trier les observations (lignes) de l'ensemble de données actif en
fonction des valeurs d'une ou plusieurs variables de tri. Vous pouvez trier les observations par ordre
croissant ou décroissant.
Comment faire :
o Le tri des observations pas par l’activation du menu « Données »  « Trier les observations » . La
fenêtre suivante apparait pour renseigner les champs de tri et la nature du tri.
Fonctionnalités: Trier des observations
Fonctionnalités :
Sélectionner des observations

Fonctionnalité : Sélectionner des observations
• Il est fréquent de vouloir sélectionner ou d’isoler un groupe d’observations pour une analyse particulière
• La fonction « Sélectionner des observations » est parmi les opérations les plus utilisées dans une analyse
statistiques de données..
Comment faire : Sélectionner des observations
o Ouvrir le fichier « «selection_test.sav »

o Activer le menu « Données »  « Sélectionner des Observations»
o La boite de dialogue suivante est affichée  il faut la renseigner
Fonctionnalités: Sélectionner des observations
o Sélectionner « Selon une condition
logique
o Sélectionner « Selon
une condition logique
o Pour une condition de
sélection  Cliquer sur
«le bouton « Si… » 
boite de dialogue de
condition
• Remarquez les autres options de sélection

o Sélectionner « Selon
une condition logique
o Pour une condition de
sélection  Cliquer sur
«le bouton « Si… » 
boite de dialogue de
condition
o Positionner la
condition, Ici :
«Consommation <=25 »
o Remarquer la création d’une nouvelle variable

o Remarquer aussi les hachures sur le côté gauche de la fenêtre
Fonctionnalités :
Masquer/Afficher des variables

Fonctionnalité : Masquer / Afficher des Variables

• Il est possible de ne sélectionner qu’un certain nombre de variables à afficher.
Comment faire :
o La fenêtre d’affichage des variables étant activée. On peut personnaliser l’affichage des variables en
activant le menu « Affichage»  «Personnaliser l’affichage des variables ». La fenêtre suivante apparait où
il est possible de cocher les variables visibles et décocher les variables non visibles.
o On peut aussi rétablir les valeurs d’affichage par défaut
Fonctionnalités: Afficher/Masquer des variables
Fonctionnalités :
Identifier les observations dupliquées

Fonctionnalité : Identifier les observations dupliquées
• Les données peuvent comprendre des observations « dupliquées » pour les raisons suivantes :
• La même observation est saisie plusieurs fois par erreur.
• Plusieurs observations partagent la même valeur d’un identifiant principal, mais ont des valeurs
d’identifiant secondaire différentes (par exemple, les membres d'une famille qui vivent tous dans la
même maison).
• Plusieurs observations représentent la même observation, mais les valeurs des variables autres que
celles qui identifient l'observation sont différentes (par exemple, plusieurs achats effectués par la
même personne ou la même société pour des produits différents ou à des heures différentes).
• L'identification des observations dupliquées vous permet de définir la variable dupliquée suivant vos
besoins et de contrôler la détermination automatique des observations principales par rapport aux
observations dupliquées
Fonctionnalités: Identifier les observations dupliquées
Comment faire :
o L’identification des observations dupliquées passe par l’activation du menu «Donnée »  «

Identifier les Observations Dupliquées ». A l’activation de ce menu, la fenêtre suivante apparait
pour renseigner :
o Les variables sur lesquelles SPSS se basera pour juger si une observation est
dupliquée ou non
o La nature et les variables de tri du résultat
o Autres informations (voir fenêtre)
o À la fin de l’analyse, le résultat est affiché dans la fenêtre des résultats.
Fonctionnalités: Identifier les observations dupliquées
Fonctionnalités :
Identifier les observations inhabituelles

Fonctionnalité : Identifier les observations inhabituelles
• La procédure de détection des observations inhabituelles ( on dit aussi des anomalies) vise à repérer
les observations inhabituelles en se basant sur les écarts par rapport aux normes de leurs groupes. La
procédure est destinée à détecter rapidement les observations inhabituelles afin de vérifier les données à
l'étape d'analyse exploratoire des données, avant d'effectuer toute sorte d'analyse inférentielle de ces
mêmes données
Comment faire :
o L’identification des observations inhabituelle peut être activée directement par le menu « Données » 
« Identifier les Observations Inhabituelles ». La fenêtre suivante alors apparait pour renseigner quelques
détails pour le calcul des groupes et des écarts dans le groupe.
o La variable d’analyse
o Autres informations
o Le résultat est affiché dans la fenêtre de sortie (des résultats)
Fonctionnalités: Identifier les observations inhabituelles
Fonctionnalités :
Fusionner des fichiers

Fonctionnalité : Fusionner des fichiers
• Les données peuvent être distribuées dans plusieurs fichiers différents, on peut être amener à vouloir
les fusionner dans un seul fichier :
• Pour fusionner deux fichiers, deux cas peuvent se présenter :
• Les variables sont les mêmes, mais les observations sont différentes : on parle dans ce cas d’ajout
d’observations
• Les observations sont les mêmes, mais les variables sont différentes : on parle dans ce cas d’ajout
de variables
Fichier données de SPSS

Fusion de fichier
Fonctionnalité : Fusionner des fichiers
Fusion par ajout d’observation :
• Si les données sont contenues dans deux ou plusieurs fichiers distincts (par exemple : les fichiers
proviennent de plusieurs enquêteurs différents), il est possible de regrouper tous ces fichiers séparés en
un seul grâce à la fonction fusionner des fichiers de la rubriques données.
Fusion par ajout de variables :
• Si on dispose de deux fichiers contenant les mêmes sujets, mais avec des variables différentes (par
exemple, deux expériences différentes avec le même groupe de sujets) avec pour but de fusionner ces
expériences dans un même fichier.
Fonctionnalités: Fusionner des fichiers
Variable Variable 2 X1 X2 Variable 1 Variable 2 Y1 Y2
1 aa A D 40 X1 Y1
A 10 bb B E 50 X2 Y2
B 20 cc C F 60 X3 Y3
C 30
Fusion par Ajout d’observations
Variable 1 Variable 2 X1 X2 Y1 Y2
A 10 aa A
B 20 bb B
C 30 cc C
D 40 X1 Y1
E 50 X2 Y2
F 60 X3 Y3
ID Variable 1 Variable 2 ID Variable 3 Variable 4
001 A 10 00 D 40
002 B 20 1
003 C 30 00 E 50
2
Fusion par Ajout de variables
00 F 60
3
ID Variable 1 Variable 2 Variable 3 Variable 4
00 A 10 D 40
1 E 50
00 B 20 F 60
2
00 C 30
3
Comment faire : fusion par ajout d’observations
o Pratiquer sur l’exemple «merge_o1.sav » et « merge_o2.sav »
o Ouvrir le fichier « merge_o1.sav »
o Activer le menu
o Rechercher le fichier à fusionner (c’est-à-dire « merge_o2.sav »)

o Renseigner la boite de dialogue suivante :
Variables non communes

Comment faire : fusion par ajout de variables

o Pratiquer sur l’exemple «merge_v1.sav » et « merge_v2.sav »
o Ouvrir le fichier « merge_v1.sav »
o Activer le menu
o Rechercher le fichier à fusionner (c’est-à-dire « merge_v2.sav »)

o Renseigner la boite de dialogue suivante :
o Les observations doivent être placées dans le même ordre dans les deux fichiers de
données (utiliser trier les observations pour les deux fichiers).
o Les observations qui n'ont pas de correspondance dans les clés d'appariement sont inclus
dans le fichier fusionné et elles sont fusionnées avec les observations de l'autre fichier.
o Les observations sans correspondance contiennent des valeurs uniquement pour les
variables du fichier duquel elles sont issues. Les variables de l'autre fichier contiennent la
valeur manquante par défaut.
o Les variables qui viendront s’ajouter au fichier courant (fichier de données ouvert) devront
porter des noms différents, sinon elles seront exclues.
o boite de dialogue
o Cocher « Apparier les observations …. »

Comment faire : Fusion par ajout de variables
• boite de dialogue
• Cocher « Apparier les observations …. »
• Sélectionner la variable « CIN »

• Comme Clé d’appariement
• Cliquer sur « Ok »
- le résultat
Fonctionnalités :
Scinder un fichier
Fonctionnalité : Scinder un Fichier
• La fonction scinder un fichier sert à fragmenter un fichier de données en groupes et en sous
groupes selon une ou plusieurs variables de regroupement.
• Elle prépare le fichier en vue d’effectuer des procédures et des analyses qui seront exécutées à
l’intérieur de chacun de ces sous-groupes.
• La manière avec laquelle on scinde un fichier influera sur la manière avec laquelle les résultats des
analyses seront présentés.
• La fragmentation du fichier est logique seulement, elle ne va pas produire plusieurs fichiers
Fonctionnalités: Scinder un fichier
V1 V2 V3 V1 V2 V3
A 001 320 A 001 320
Groupe 1
A 002 125 A 002 125
B 006 214 B 006 214
B 008 214 B 008 214
Groupe 2
B 004 025 B 004 025
B 005 256 B 005 256
Scinder un fichier
C 006 214 C 006 214 Groupe 3
selon la variable V1
D 001 236 D 001 236
Groupe 4
D 010 452 D 010 452
• On peut scinder un fichier selon HUIT variable maximum

Comment faire : Scinder un fichier
o Ouvrir le fichier « «scinder_test.sav »

o Activer le menu « Données »  « Scinder un Fichier »
Comment faire : Scinder un fichier
Influe sur la
présentation
des résultats
Nous verrons lors de l’analyse des données comment
les résultats seront présentés
Fonctionnalités :
Transposer
Fonctionnalités: Transposer
Comment faire :
• La transposition
N,;n;, permet de créer un nouveau fichier dans lequel les lignes et les colonnes du
fichier initial sont inversées pour que les observations (lignes) deviennent des variables (colonnes),
et vice versa. Transposer génère automatiquement de nouveaux noms pour les variables, et
affiche une liste de ces nouveaux noms.
• Une nouvelle variable de type chaîne contenant le nom de variable d'origine, case_lbl, est
automatiquement créée.
V1 V2 V3
Transposer un fichier On remarquera :
A 001 320
• Que les scores de type «Chaine » ne sont pas
B 002 125 transposés
C 006 214 • La création d’une nouvelle variable «
D 008 214 CASE_LBL »
CASE_LBL Var001 Var002 Var003 var004

V1 . . . .
V2 001 002 006 008
V3 320 125 214 214
Comment faire : Transposer un fichier
o Ouvrir le fichier « «Transposer_test.sav » a partir de votre CD des exemples

o Activer le menu « Données »  « Transposer »
o Puis cliquer sur « Ok »

Comment faire : Transposer un fichier
o Maintenant : utilisez la « Variable de noms » comme suit :
o Puis cliquer sur « Ok »  Remarquez la différence

Fonctionnalités :
Agréger
Fonctionnalités: Agréger
• Agréger  c’est-à-dire obtenir des résumés
• L’agrégation des données permet d'agréger des groupes d'observations de l'ensemble de

données actif dans des observations uniques. Elle permet également de créer dans l'ensemble de
données actif un nouveau fichier agrégé ou de nouvelles variables qui contiennent des données
agrégées. Les observations sont agrégées en fonction de la valeur de zéro ou de plusieurs critères
d'agrégation (regroupement). Si aucun critère d'agrégation n'est spécifié, l'ensemble de données
entier est un agrégat unique.
V1 V2 V3 V1 V2 V3 P
A
A
G1
A
B
G2 B
C
C
G3
C
Variable crée lors D
de l’agrégation
G4 D
• Les observations sont regroupées selon les valeurs des critères d'agrégation. Chaque combinaison
unique de valeurs de critères d'agrégation définit un groupe.
• Les variables sources sont utilisées avec des fonctions d'agrégation pour créer de nouvelles
variables d'agrégation.
Comment faire : Agréger
o Ouvrir le fichier « «Agreger_test.sav »

o Activer le menu « Données »  « Agréger»
Variables de
groupement ou
critère d’agrégation
Variables source
avec la fonction
d’agrégation
Choix de la sortie
Fonctionnalités :
Pondérer des observations

Fonctionnalités: Pondérer des observations
• Pondérer  c’est-à-dire donner un poids à une observation.

• Cette fonctionnalité permet de pondérer (ou bien de donner un poids) différemment les
observations (par réplication simulée) dans le cadre de l'analyse statistique
• La pondération est une opération logique, elle ne modifie pas les données
• La pondération se fait par une variable  cette variable peut être calculée ou saisie
• La pondération est visible lors des résultats
Fonctionnalités: Pondérer
Comment faire : Pondérer les observations
o Ouvrir le fichier « «Ponderer_test.sav »

o Activer le menu « Données »  « Pondérer les observations»
La variable avec
laquelle on voudrait
pondérer
Fonctionnalités: Pondérer
Comment faire : Pondérer les observations
o Anticipons un peu sur les résultats :
o Faire sortir le tableau des effectifs sans pondération

o Faire sortir le tableau des effectifs avec pondération
Fonctionnalités :
Transformer des variables

Fonctionnalités: Transformation des variables
o Parfois, on a besoin de transformer nos données pour les adapter à certaines

analyses.
o Dans certains cas on doit effectuer des transformations de données simples
comme:
o Créer une variable qualitative à partir d'une variable d'échelle.
o Combiner plusieurs modalités de réponses en une seule modalité.
o Créer une nouvelle variable qui représente la différence calculée entre
deux variables existantes.
o A d’autres occasion, on construit de nouvelles variables basées sur des
équations complexes et des instructions conditionnelles.
Fonctionnalités: Transformation des variables
o SPSS vous permet d’effectuer ces transformations à l’aide de la rubriques des

transformations: « Transformer » à partir du menu principal
o On peut :
o Calculer des variables
o Recoder des variables
o Créer des variables
o Dans ce qui suit, on va voir ces fonctionnalités

Fonctionnalités :
Calculer des variables

Fonctionnalités: Calculer des variables
o Il arrive parfois où l’on veuille calculer une variable à partir d’autres variables
o Par exemple : si on dispose d’une variable contenant l’année de naissance de l’individu et on
voudrait calculer son âge : on pourra créer une nouvelle variable qui donnera l’âge de l’individu
en soustrayant l’année de naissance à l’année courante.
Année
Âge
Naissance
1984 29
1994 Année Courante : 2022 19
1967 46
1985 28
1956 57
Comment faire : Calculer des variables
Ouvrir le fichier « «Calculer_test.sav »

Activer le menu « Transformer»  « Calculer la variable»
La boite de dialogue suivante est affichée  il faut la renseigner
Puis cliquer sur « Ok »
La variable cible ou
celle qui sera crée
Expression de la
nouvelle variable
Opérateurs et
chiffres
Condition
Fonctionnalités :
Recoder des variables

Fonctionnalités: Recoder des variables
o Il arrive parfois où l’on veuille calculer recoder une variable

o Par exemple : si on dispose d’une variable contenant la consommation de carburant, on
pourra classer ces consommations en catégorie:
o Consommation excessive : Plus de 30
o Grande consommation : Entre 25 et 29
o Consommation modérée : Entre 20 et 24
o Petite consommation : Moins de 20 (c’est-à-dire entre 0 et 19)
On veut recoder la variable « Consommation »

Marque Conso Catégorie
Acura CL 26 2
• 1 : Consommation excessive : Plus de 30
Audi A4 27 2
• 2 : Grande consommation : Entre 25 et 29
BMW 528i 25 2 • 3 : Consommation modérée : Entre 20 et 24
BMW 323i 26 2 • 4 : Petite consommation : Moins de 20 (c’est-à-dire entre 0 et 19)
Buick Regal 23 3
Buick Century 25 2
Cadillac Catera 22 3
Cadillac DeVille 22 3
Chevrolet Camaro 25 2
Dodge Viper 16 4
Ford Crown Victoria 21 3
Ford Contour 25 2
Honda Passport 19 4
Honda Odyssey 23 3
Honda CR-V 24 3
Honda Accord 27 2
Honda Civic 32 1
Hyundai Sonata 25 2
Hyundai Elantra 27 2
Hyundai Accent 31 1
Infiniti I30 25 2
Comment faire : Recoder des variables
• Ouvrir le fichier « «Recodage_test.sav »

• Activer le menu « Transformer»  « Recoder des variables»
• La boite de dialogue suivante est affichée  il faut la renseigner
• Puis cliquer sur « Ok »
Variables à recoder
Positionnement d’une condition

• Choisir la colonne qui va
être recodée
être recodée
• Cliquer sur «Anciennes et
nouvelles valeurs»  la
boite de dialogue suivante
Ancienne et nouvelles valeurs

o Anciennes valeurs : se sont les valeurs à recoder («Consommation»)
o Nouvelles valeurs : ici par exemple les tranches de consommation
o une variable alphanumérique peut être recodée pour une nouvelle variable
numérique
o Les anciennes valeurs individuelles (variables numériques) doivent être
recordées par de nouvelles valeurs de même type;
être recodée
• Cliquer sur «Anciennes et
nouvelles valeurs»  la
boite de dialogue suivante
Génération des graphiques: Graphe à Bâton
Génération des graphiques: Graphe à Bâton
Génération des graphiques: Boite à moustache ou boxplot
Génération des graphiques: Dispersion/points
Donne une idée sur la

corrélation des deux
variables
Génération des graphiques: Histogramme
La courbe gaussienne
donne une idée sur la
normalité, la symétrie
et l’aplatissement de
la distribution

Cours Informatique Appliquée S6

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours Informatique Appliquée S6

Transféré par

Droits d'auteur :

Formats disponibles

INFORMATIQUE APPLIQUÉE Pr.

Filière Science Economique et Gestion Semestre 6

- Science : donc des théories et des modèles,

L'informatique désigne l'automatisation du traitement de l'information considérée comme le support des

« le système d’information est un ensemble complexe, souvent hétérogène car il est

C’est le véhicule de la communication entre l'ensemble des ressources systèmes

Le système informatique: c’est un ensemble des éléments

Un logiciel est un ensemble de programmes, procédures, algorithmes liés au

oSPSS signifie "Statistical Product and Service Solutions"

Il offre une interface conviviale

 Coder des données issus d’un questionnaire ou d’un entretien

o Différence au logiciel MS Excel, les données et les graphiques sont

o Les données et les résultats restent constamment séparés

o C’est un langage spécifique à SPSS

o L’interface SPSS fait abstraction du code derrière les opérations réalisées  

Une donnée statistique est une information codifiée, figée et transmissible

o Qu’est ce qu’une information?

o Qu’est ce qu’une variable?

Un exemple: Participants à un événement:

Vous voulez savoir Âge Genre Satisfaction

Âge Genre Satisfaction

En lisant une ligne, on reconstitue 48 1 1

o Une ligne est une observation

Âge Genre Satisfaction

o Une ligne est une observation

o Une ligne est une observation

o Revenons à notre matrice : Âge Genre Satisfaction

o Une ligne est une observation

o La variable « Genre » ne présente pas d’ordre  elle est dite « Nominale »

1. Définition des noms des variables de la matrice de données

La qualité des analyses statistiques est

• Au lancement du logiciel, on a l’écran suivant

Fenêtre d’affichage des données

Fenêtre d’affichage des variables

o Tout ensemble de données SPSS comporte deux vues complémentaires

 Une vue des données « Affichage des données »

 Une vue pour la description des variables : « Affichage des Variables »

• Les variables sont placées en colonnes

• Chaque variable est caractérisée par un ensemble de caractéristiques:

Caractéristiques des variables

Caractéristiques des variables

Caractéristiques des variables

Alignement L’alignement de la valeur de la variable : Droite, Gauche ou Centre.

Cette caractéristique donne la nature de la variable : Quantitative (ou

 Première saisie de données

 Essayons de créer un fichier de données qui répond à l’exemple précédent :

 Les variables suivantes :

 Ne pas se soucier des caractéristiques «Manquants » et « Valeurs »

L’écran de description des variables devrais ressembler à ceci .

Et l’écran de saisie devrais ressembler à ceci .

Notion de valeurs Manquantes

o L'option « Valeurs manquantes » permet de définir les valeurs de données

Notion de valeurs Manquantes

• Sur la variable «Âge», si on clique sur le champs « Manquants» de la

Notion de valeurs Manquantes

Notion de valeurs Manquantes

Notion de valeurs Manquantes

o Pratiquons cela sur notre exemple :

Notion de valeurs Manquantes

o Les valeurs manquantes des variables chaine sont gérées de la même

o Contrairement aux variables numériques, on ne peut pas introduire

o Il faut indiquer à SPSS cette codification ou la correspondance des codes aux

• En cliquant sur le champs « Valeurs » de la grille de visualisation des