Académique Documents
Professionnel Documents
Culture Documents
Mouna ELMACHKOUR
INFORmation autoMATIQUE.
L’informatique est une science qui permet de traiter l’information
de façon automatique.
L’informatique (en anglais computer science, ou computing science), est l’étude des
fondations théoriques de l’information et du calcul et leur implantation et application
avec des ordinateurs.
QUELLE RELATION ENTRE L’ENTREPRISE ET L’INFORMATIQUE ?
- La mondialisation
-Le taux de concurrence
-L'obligation de se développer, de perfectionner
-la digitalisation des processus de production
-L’obligation de les processus
-Exemple:
SYSTÈME D’INFORMATION
Le système d’information (SI) est un élément central d’une entreprise ou d’une
organisation.
Il permet aux différents acteurs de véhiculer des informations et de communiquer
grâce à un ensemble de ressources matérielles, humaines et logicielles.
Un SI permet de créer, collecter, stocker, traiter, modifier des informations sous
divers formats.
L’objectif d’un SI est de restituer une
information à la bonne personne et au bon
moment sous le format approprié.
L’IT (Système informatique) est l’ensemble des actifs matériels et logiciels de l’entreprise ayant pour
vocation à automatiser le traitement de l’information.
C’est la partie visible à laquelle tout le monde pense quand on parle de projets et d’infrastructures
informatiques: le logiciel, le serveur, les écrans, les ordinateurs…
Le SI (Système d’information) est l’ensemble des actifs de l’IT (matériels et logiciels), qui comprend aussi
et surtout les actifs humains et immatériels, les procédés, processus d’industrialisation …
Le système informatique est la partie informatique du système d’information, composée de matériels,
logiciels, réseaux et procédures d’utilisation
DONNÉES ET INFORMATION
Une donnée est une information brute, sans contexte, un fait sans arrière-plan.
Forme inexploitable
Une donnée brute peut prendre différents aspects: données numériques, textuelles, ou un mélange
de texte et de chiffres
Une donnée doit passer par un processus de traitement de données (input) pour résulter
‘l’output’, qui est l’information.
Les informations sont des « données transformées ».
Pour avoir une réelle pertinence, l’information obtenue doit avoir une signification logique et doit
être fiable.
APPLICATION VS LOGICIEL VS PROGICIEL
Simplicité d'utilisation
Préparer et analyser les données facilement grâce à une interface utilisateur intuitive sans avoir à écrire le code
oIl permet d’exécuter des statistiques avancées et descriptives, des analyses de régression, des arbres de décision avec une
interface intégrée
oToutes les facettes du cycle de vie de l'analyse sont incluses, depuis la préparation et la gestion des données jusqu'à
l'analyse et la génération de rapports
oDans ce cours:
o Dans SPSS :
Syntaxe Syntaxe
.spv
.sav
.spo
Syntaxe Script
.sps .sbs
Vocabulaire de Base / Gestion des Fichiers de Données
o Logique SPSS
o Syntaxe SPSS:
o Tous ce que l’on peut faire interactivement par menu est généré par le moteur SPSS comme
syntaxe lignes de code
Les informations sont des données transformées. Une information représente 'l'output' du
processus d'analyse.
Une variable statistique est une caractéristique commune à l'ensemble des individus d'une étude.
C’est une quantité ou une qualité définie sur une population et qui est susceptible de varier d’un
individu à l'autre.
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Définition d’une Variable
• Une variable est la propriété d’un événement ou d’un objet pouvant prendre plusieurs valeurs
Age:
Genre : 1 : Femme
Vous organisez Evénement
2 : Homme
Satisfaction :
Sur une échelle
Vous recevez Participants croissante de 1 à 5
Evénement
Si on s’intéresse aux colonnes
Les colonnes sont nos
variables
Participants
Chaque case ne doit contenir qu’une seule donnée Appelée : Score de la variable
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Définition d’une Variable
Satisfaction
o Les scores possibles pour une variables sont appelés : Modalités Score 3
o Les types des modalités définissent les types des Variables Score 3
Score 2
Score 4
Score 1
Score 4
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Définition d’une Variable
∑ 174 8 17
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Définition d’une Variable
o Variables qualitatives:
o On fait distinction selon que la variable présente une forme d’ordre ou pas:
Variable Genre Variable Satisfaction
Âge Genre Satisfaction
Deux catégories : Femme Une échelle croissante de
et Homme. Ne présente 1 à 5. Présente un ordre 21 1 3
pas d’ordre 25 2 3
1 : Femme 5 : Très satisfait 36 1 2
2 : Homme 4 : Plutôt satisfait
3 : Satisfait 26 1 4
2 : Indifférent 48 1 1
1 : Déteste
18 2 4
Caractéristique Explication
C’est le nom de la variable. Il est unique. Il a généralement le sens de
Nom l’information qu’il porte (Ex: Age, Genre, datenaiss pour Date de
naissance, etc.). Le nom est le code de la variable.
Le type de la variable, il peut être Numérique, Chaine, Date,
Type Monétaire, ou autres ( Voir dans la pratique). Le type est
généralement lié aussi au sens de la variable.
C’est l’espace alloué à la variable par SPSS pour le stockage. Par
Longueur exemple, une variable de type Chaine et de longueur 10 ne peut
stocker que des chaines de 10 caractères.
Le nombre de décimales après la "virgule" (exemple : pour 3,4 1;
Décimales
pour 3 0
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données
Caractéristique Explication
Un label descriptif pour la variable (exemple : « Âge du répondant »
pour la variable « Age »). L’étiquette de la variable peut être
Etiquette différente du nom de la variable. Elle peut être plus longue que le
nom de la variable. L’étiquette, et non le nom de la variable, suivra la
variable dans les sorties ( outputs).
Pour affecter des étiquettes descriptives de valeur pour chaque valeur
d'une variable. Cela est utile si votre fichier de données utilise des
Valeurs
codes numériques pour représenter des modalités non numériques (par
exemple, les codes 1 et 0 pour homme et femme)
Cette caractéristique donne sens aux valeurs manquantes. Elle sera
Manquants
présentée dans la suite de ce cours.
Colonnes La largeur de la colonne pour la variable en question.
Vocabulaire de Base / Gestion des Fichiers de Données
o Saisie des données sous SPSS / Saisie des données
Caractéristique Explication
« Age » : Numérique
« Genre » : Chaine de longueur 1
« Satisfaction : Numérique
Valeurs
o Dans le cas ou la variable est de type nominale ou ordinale, elle stockée sous
forme de code
o Exemple : Variable Genre Variable Satisfaction
1 : Femme 5 : Très satisfait
2 : Homme 4 : Plutôt satisfait
3 : Satisfait
2 : Indifférent
1 : Déteste
Fin du chapitre
o Faire des TP sur les exemples fournis
o Définir les variables
o Variable quantitative
o Variable nominale
o Variable ordinale
o Définir des listes de valeurs
o Définir les valeurs manquantes d’une variable
o Saisir des données
o Sauvegarder les résultats
Plan du Cours
o Introduction
o Vocabulaire de Base / Gestion des Fichiers de Données
o Présentation des Fenêtres SPSS
o Saisie des Données
o Importation des Données
o Manipulation des Données
o Plusieurs Fonctionnalités seront présentées
o Quelques Analyses Statistiques
o Statistique Descriptive
o Exploration des Données
o Tableau de Fréquence
o Tableaux Croisés
o Modification et Exportation des Résultats
Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS
Comme tout logiciel ouvert, SPSS dispose d’un certain nombre de possibilités d’échange
avec l’extérieur :
o Importation des données
o Exportation des données
o L’importation des données consiste à rapatrier des données externes à SPSS vers un
fichier .sav pour qu’ils puissent être traité par ce dernier
o Puisque les données sont externes à SPSS, il faut lui indiquer de quelle manière il va
faire l’import des données
Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS
Fichier .sav
de SPSS Import des données
Différents types de
fichiers
Vocabulaire de Base / Gestion des Fichiers de Données
Importation des Données sous SPSS
Plan du Cours
o Introduction
o Vocabulaire de Base / Gestion des Fichiers de Données
o Présentation des Fenêtres SPSS
o Saisie des Données
o Importation des Données
o Manipulation des Données
o Plusieurs Fonctionnalités seront présentées
o Quelques Analyses Statistiques
o Statistique Descriptive
o Exploration des Données
o Tableau de Fréquence
o Tableaux Croisés
o Modification et Exportation des Résultats
Manipulation des Données
Rappel
o Le vocabulaire de SPSS
o Le système de fenêtre de SPSS
o Comment créer un fichier de données
o Comment créer des variables et leur donner des caractéristiques
o Comment importer des données
o L’analyste est amené parfois à n’étudier qu’une partie des données, voir créer
d’autres données à partir des données initiales ou recoder d’autres variables
o Il se peut aussi qu’il soit amener à modifier ou pondérer des données par d’autres
données , ou à catégoriser des variables pour faciliter l’analyse
Nouveau Copier/Cou
per/Coller
Divers
opérations Divers Divers Menus pour
Ouvrir Insérer pour la opérations
Variable manipulatio pour la opérations la Menu des
n des transformat d’analyse Génération Utilitaires
Insérer données et ion des des des
Fermer Observatio données Graphes
des données
n variables
Sauvegarde Etc.
r
Sauvegarde
r sou
Etc.
Manipulation des Données
Représentation schématique des menus de SPSS
Manipulation des Données
Représentation schématique des menus de SPSS
Manipulation des Données
Représentation schématique des menus de SPSS
Manipulation des Données
Fonctionnalités :
Besoin/Explication :
• Il arrive des fois ou l’on veut insérer une observation dans un endroit précis d’un fichier (ex : Troisième ligne,
avant dernière ligne, etc.)
Comment faire :
• La feuille de saisie des données étant activée, et une ligne de données étant sélectionnée, vous pouvez insérer
une observation juste après la ligne sélectionnée en activant le menu « Edition » « Insérer les Observations.. »
ou bien avec le menu contextuel du bouton droit.
• SPSS insère alors une nouvelle observation vide qu’il faudra renseigner
• Après insertion de la ligne, toute les cellules (c’est-à-dire les scores) sont vides
Manipulation des Données
Fonctionnalités :
Besoin/Explication :
• Il arrive des fois ou l’on veut insérer une variable dans une colonne précise (ex : Première colonne,
avant dernière colonne, etc.)
Comment faire :
o L’insertion d’une variable revient à insérer une ligne dans le volet d’affichage des variables
o La feuille de saisie des données étant activée et le volet d’affichage des variables étant activé aussi,
vous pouvez insérer une variable juste après la ligne sélectionnée en activant le menu « Edition » «
Insérer une Variable.. » ou bien avec le menu contextuel du bouton droit.
o SPSS insère alors une nouvelle variable qu’il faudra compléter (modifier les caractéristiques de la
variable)
Manipulation des Données
Fonctionnalités :
• Cette fonctionnalité permet de trier les observations (lignes) de l'ensemble de données actif en
fonction des valeurs d'une ou plusieurs variables de tri. Vous pouvez trier les observations par ordre
croissant ou décroissant.
Comment faire :
o Le tri des observations pas par l’activation du menu « Données » « Trier les observations » . La
fenêtre suivante apparait pour renseigner les champs de tri et la nature du tri.
Manipulation des Données
Fonctionnalités: Trier des observations
Manipulation des Données
Fonctionnalités :
Besoin/Explication :
• Il est fréquent de vouloir sélectionner ou d’isoler un groupe d’observations pour une analyse particulière
• La fonction « Sélectionner des observations » est parmi les opérations les plus utilisées dans une analyse
statistiques de données..
Fonctionnalités :
Comment faire :
o La fenêtre d’affichage des variables étant activée. On peut personnaliser l’affichage des variables en
activant le menu « Affichage» «Personnaliser l’affichage des variables ». La fenêtre suivante apparait où
il est possible de cocher les variables visibles et décocher les variables non visibles.
o On peut aussi rétablir les valeurs d’affichage par défaut
Manipulation des Données
Fonctionnalités: Afficher/Masquer des variables
Manipulation des Données
Fonctionnalités :
Besoin/Explication :
• Les données peuvent comprendre des observations « dupliquées » pour les raisons suivantes :
• La même observation est saisie plusieurs fois par erreur.
• Plusieurs observations partagent la même valeur d’un identifiant principal, mais ont des valeurs
d’identifiant secondaire différentes (par exemple, les membres d'une famille qui vivent tous dans la
même maison).
• Plusieurs observations représentent la même observation, mais les valeurs des variables autres que
celles qui identifient l'observation sont différentes (par exemple, plusieurs achats effectués par la
même personne ou la même société pour des produits différents ou à des heures différentes).
• L'identification des observations dupliquées vous permet de définir la variable dupliquée suivant vos
besoins et de contrôler la détermination automatique des observations principales par rapport aux
observations dupliquées
Manipulation des Données
Fonctionnalités: Identifier les observations dupliquées
Comment faire :
Fonctionnalités :
Besoin/Explication :
• La procédure de détection des observations inhabituelles ( on dit aussi des anomalies) vise à repérer
les observations inhabituelles en se basant sur les écarts par rapport aux normes de leurs groupes. La
procédure est destinée à détecter rapidement les observations inhabituelles afin de vérifier les données à
l'étape d'analyse exploratoire des données, avant d'effectuer toute sorte d'analyse inférentielle de ces
mêmes données
Comment faire :
o L’identification des observations inhabituelle peut être activée directement par le menu « Données »
« Identifier les Observations Inhabituelles ». La fenêtre suivante alors apparait pour renseigner quelques
détails pour le calcul des groupes et des écarts dans le groupe.
o La variable d’analyse
o Autres informations
o Le résultat est affiché dans la fenêtre de sortie (des résultats)
Manipulation des Données
Fonctionnalités: Identifier les observations inhabituelles
Manipulation des Données
Fonctionnalités :
Fusion de fichier
Manipulation des Données
Fonctionnalité : Fusionner des fichiers
Besoin/Explication :
• Si les données sont contenues dans deux ou plusieurs fichiers distincts (par exemple : les fichiers
proviennent de plusieurs enquêteurs différents), il est possible de regrouper tous ces fichiers séparés en
un seul grâce à la fonction fusionner des fichiers de la rubriques données.
• Si on dispose de deux fichiers contenant les mêmes sujets, mais avec des variables différentes (par
exemple, deux expériences différentes avec le même groupe de sujets) avec pour but de fusionner ces
expériences dans un même fichier.
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
Variable Variable 2 X1 X2 Variable 1 Variable 2 Y1 Y2
1 aa A D 40 X1 Y1
A 10 bb B E 50 X2 Y2
B 20 cc C F 60 X3 Y3
C 30
Fusion par Ajout d’observations
Variable 1 Variable 2 X1 X2 Y1 Y2
A 10 aa A
B 20 bb B
C 30 cc C
D 40 X1 Y1
E 50 X2 Y2
F 60 X3 Y3
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
ID Variable 1 Variable 2 ID Variable 3 Variable 4
001 A 10 00 D 40
002 B 20 1
003 C 30 00 E 50
2
Fusion par Ajout de variables
00 F 60
3
ID Variable 1 Variable 2 Variable 3 Variable 4
00 A 10 D 40
1 E 50
00 B 20 F 60
2
00 C 30
3
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
Comment faire : fusion par ajout d’observations
o Pratiquer sur l’exemple «merge_o1.sav » et « merge_o2.sav »
o Ouvrir le fichier « merge_o1.sav »
o Activer le menu
o Les observations qui n'ont pas de correspondance dans les clés d'appariement sont inclus
dans le fichier fusionné et elles sont fusionnées avec les observations de l'autre fichier.
o Les observations sans correspondance contiennent des valeurs uniquement pour les
variables du fichier duquel elles sont issues. Les variables de l'autre fichier contiennent la
valeur manquante par défaut.
o Les variables qui viendront s’ajouter au fichier courant (fichier de données ouvert) devront
porter des noms différents, sinon elles seront exclues.
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
Comment faire : fusion par ajout de variables
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
Comment faire : fusion par ajout de variables
o boite de dialogue
• Cliquer sur « Ok »
Manipulation des Données
Fonctionnalités: Fusionner des fichiers
Comment faire : fusion par ajout de variables
- le résultat
Manipulation des Données
Fonctionnalités :
Scinder un fichier
Manipulation des Données
Fonctionnalité : Scinder un Fichier
Besoin/Explication :
• La fonction scinder un fichier sert à fragmenter un fichier de données en groupes et en sous
groupes selon une ou plusieurs variables de regroupement.
• Elle prépare le fichier en vue d’effectuer des procédures et des analyses qui seront exécutées à
l’intérieur de chacun de ces sous-groupes.
• La manière avec laquelle on scinde un fichier influera sur la manière avec laquelle les résultats des
analyses seront présentés.
• La fragmentation du fichier est logique seulement, elle ne va pas produire plusieurs fichiers
Manipulation des Données
Fonctionnalités: Scinder un fichier
Besoin/Explication :
V1 V2 V3 V1 V2 V3
A 001 320 A 001 320
Groupe 1
A 002 125 A 002 125
B 006 214 B 006 214
B 008 214 B 008 214
Groupe 2
B 004 025 B 004 025
B 005 256 B 005 256
Scinder un fichier
C 006 214 C 006 214 Groupe 3
selon la variable V1
D 001 236 D 001 236
Groupe 4
D 010 452 D 010 452
Manipulation des Données
Fonctionnalités: Scinder un fichier
Besoin/Explication :
Influe sur la
présentation
des résultats
Nous verrons lors de l’analyse des données comment
les résultats seront présentés
Manipulation des Données
Fonctionnalités :
Transposer
Manipulation des Données
Fonctionnalités: Transposer
Besoin/Explication :
Comment faire :
• La transposition
N,;n;, permet de créer un nouveau fichier dans lequel les lignes et les colonnes du
fichier initial sont inversées pour que les observations (lignes) deviennent des variables (colonnes),
et vice versa. Transposer génère automatiquement de nouveaux noms pour les variables, et
affiche une liste de ces nouveaux noms.
• Une nouvelle variable de type chaîne contenant le nom de variable d'origine, case_lbl, est
automatiquement créée.
Manipulation des Données
Fonctionnalités: Transposer
Besoin/Explication :
V1 V2 V3
Transposer un fichier On remarquera :
A 001 320
• Que les scores de type «Chaine » ne sont pas
B 002 125 transposés
C 006 214 • La création d’une nouvelle variable «
D 008 214 CASE_LBL »
Fonctionnalités :
Agréger
Manipulation des Données
Fonctionnalités: Agréger
Besoin/Explication :
V1 V2 V3 V1 V2 V3 P
A
A
G1
A
B
G2 B
C
C
G3
C
Variable crée lors D
de l’agrégation
G4 D
Manipulation des Données
Fonctionnalités: Agréger
Besoin/Explication :
• Les observations sont regroupées selon les valeurs des critères d'agrégation. Chaque combinaison
unique de valeurs de critères d'agrégation définit un groupe.
• Les variables sources sont utilisées avec des fonctions d'agrégation pour créer de nouvelles
variables d'agrégation.
Manipulation des Données
Fonctionnalités: Agréger
Comment faire : Agréger
Variables source
avec la fonction
d’agrégation
Choix de la sortie
Manipulation des Données
Fonctionnalités :
Besoin/Explication :
La variable avec
laquelle on voudrait
pondérer
Manipulation des Données
Fonctionnalités: Pondérer
Fonctionnalités :
Fonctionnalités :
o Il arrive parfois où l’on veuille calculer une variable à partir d’autres variables
o Par exemple : si on dispose d’une variable contenant l’année de naissance de l’individu et on
voudrait calculer son âge : on pourra créer une nouvelle variable qui donnera l’âge de l’individu
en soustrayant l’année de naissance à l’année courante.
Année
Âge
Naissance
1984 29
1994 Année Courante : 2022 19
1967 46
1985 28
1956 57
Manipulation des Données
Fonctionnalités: Calculer des variables
Expression de la
nouvelle variable
Opérateurs et
chiffres
Condition
Manipulation des Données
Fonctionnalités :
Variables à recoder
La courbe gaussienne
donne une idée sur la
normalité, la symétrie
et l’aplatissement de
la distribution