Vous êtes sur la page 1sur 73

Logiciel SPSS

SPSS signifie:
Statistical Package for
the Social Sciences.

S6 : Scs Eco. & MFB


Partie pratique
Pr. Hassane BELBIJOU
hassane_belbijou@yahoo.fr
Programmation de la matrice ou la base de
données avec SPSS
 Préparation du questionnaire (nom des
variables; étiquettes)
 Codification des valeurs
 Programmation des variables dans SPSS
(onglet: variable view ou Affichage des
variables)
1. Nom de la variable
2. Type de variable
3. Largeur des colonnes
4. Décimal
5. Libeller de la variable (label)
6. Valeurs
7. Données manquantes
N.B. On peut utiliser le copier-coller
TP pour utiliser les fonctionnalités principales
du logiciel SPSS
•Analyse descriptive des variables;
•Analyse économétrique ;
•Analyse inférentielle: Tests d’hypothèses
✓ test binomiale
✓ test Khi 2
✓ test de normalité
✓ test T de Student pour échantillons
indépendants
✓ test T pour échantillons appariés
✓ test de Leven
Codage &
Saisie Analyse
Ou bien
Importation
de données

Charger
SPSS
Environnement SPSS c’est…
Saisie des données

 Une ligne équivaut à un cas (ex. Un


individu, une rencontre, une journée, un
événement, etc.).
 Chaque colonne équivaut à une variable
ou une information sur le cas (ex. sexe,
âge, reveu, etc.).

NB: Attention aux erreurs de saisie.


Exercice d’application
 Afin de se familiariser avec les procédures disponibles
dans SPSS et appliquer les principales
fonctionnalités du logiciel, nous allons traiter un
petit questionnaire afin de répondre à des questions
telles que :
 Quel est le nombre d’hommes et de femmes de cette recherche ?
 Le niveau de scolarité des femmes est-il différent de celui des
hommes ?
 Le revenu moyen des hommes est-il supérieur au revenu moyen
des femmes ?
 Quel est l'âge moyen des personnes qui ont répondu à la première question
du questionnaire ?
 Quel est l'âge moyen des hommes dans cet échantillon ?
 Quel est l'âge moyen des femmes ?
 Existe-t-il une relation entre la variable « âge » et la variable « « les années
de scolarité » ?
Rappel : Cet exercice se divise
en trois étapes :
Étape 1: D'abord définir dans cette
matrice SPSS les variables retenues du
questionnaire (codage des variables).
Étape 2: Saisir les données (saisie
manuelle ou par importation) dans la
matrice SPSS.
Étape 3: Répondre aux 5 questions en
analysant les données à travers la
fonctionnalité offerte.
Étape 1: Codage des
variables
Comment coder les variables avec
SPSS
 Le codage = l’attribution d’une lettre ou
d’un chiffre à une observation
Ex:
• codage de la variable sexe
1 = hommes
2 = femmes
• codage de la variable motivation
1= très motivé
2=moyennement motivé
3=peu motivé
4=pas du tout motivé
SPSS c’est…

Variable Genre = Homme/Femme


La Largeur ou la taille des données = le nombre de chiffres du plus gros
nombre d'une colonne (Ex: si 444444 --» Largeur = 6; si 55 --» Largeur
= 2; si 3 --» Largeur = 1)
- Échelle (= variable quantitative),
- NOMINALES et ORDINALES (variables qualitatives)

Voilà, notre matrice de données est prête à recevoir les données soit :
- directement en sélectionnant l’onglet « Vue des données »
- par importation à partir du document WORD/Excel.
Étape 2: Saisir les données
dans la matrice SPSS.
Enregistrement de données

 Une fois la saisie des données terminée, il


est toujours recommandé d’enregistrer les
données sur le disque, afin de pouvoir les
réutiliser par la suite. Pour enregistrer les
données, cliquez sur le bouton
d’enregistrement ou bien exécutez
l’option ENREGISTRER SOUS / du
menu FICHIER
 Pour le fichier de données: nomfichier.sav
NB: Toujours garder une copie du fichier de
données.
Étape 3: Répondre aux 5
questions en analysant les
données
Questions ?

1. Quel est le nombre d’hommes et de


femmes de cette recherche ?
L’analyse des données
 Dans cette question, la variable observée est : le
Genre.
 Effectuez une Analyse descriptive des effectifs.
Menu Analyse/statistiques descriptives 
fréquences
 Choisissez les variables pour lesquelles vous
désirez des statistiques: “genre” et faite la basculez
vers la zone Variables
 Choisissez les statistiques que vous désirez
rapporter en cliquant sur le bouton “statistics”
(moyenne, médiane, etc.).
 Cliquez sur “continue” et “ok”.
Une icône à côté de chaque variable fournit
des informations sur le type de données
et le niveau de mesure.
Choisissez « Poursuivre », puis
cliquez sur « Ok ».
2. Le niveau de scolarité des
femmes est-il différent de celui des
hommes ?
Il faut utiliser les variables X= genre et Y= Scolarité
• Il s'agit d'une analyse comparative entre hommes et
femmes (VARIABLE QUALITATIVE X) sur le plan
de la scolarité (VARIABLE QUANTITATIVE Y).
• Il faut donc choisir un Test T.
• Il s'agit d'un test t avec deux groupes
indépendants: un groupe d'hommes et un
groupe de femmes.
Il s'agit d'une analyse comparative : dans le menu ANALYSE,
sélectionnez COMPARER LES MOYENNES puis T TEST
POUR ÉCHANTILLONS INDÉPENDANTS.

- Dans la fenêtre apparue, choisissez vos variables, puis cliquez sur


OK
Voici les résultats recherchés
NB: Sig bilatéral=non orienté
Analyse des résultats
- la probabilité de déclarer différentes les scolarités moyennes
des hommes et des femmes, alors qu'elles sont égales, est de
47 % (,473), donc supérieure au seuil de signification de 5 %
(ou 0,05)
- Il faut donc accepter l'hypothèse nulle (Ho) et on peut
conclure qu'au sein de cette population, il n'y a pas de
différence significative entre les hommes et les femmes sur le
plan de la scolarité (même si dans notre échantillon les
hommes sont légèrement plus scolarisés que les femmes,
comme le montre la figure ci-dessus).
En conclusion, les femmes et les hommes ont un niveau de
scolarité équivalent, ce qu’est le postulait de cette recherche.
On peut donc inférer qu'il n'y pas de lien ou de relation entre le
genre et leur niveau de scolarité.
Tracez le diagramme en bâtons de la scolarité
moyenne des hommes et des femmes.
Pour tracer cette figure, choisir dans les menus SPSS les
fonctions suivantes: GRAPHES, puis GÉNÉRATEUR DE
DIAGRAMMES et cliquez sur OK
Choisir le diagramme en bâtons, faite le glisser vers la zone
dédiée
Choisir vos variables, puis cliquez sur OK.
Test T pour échantillons indépendants

Autres variables:
X=genre et Y=revenu
3. Le revenu moyen des hommes est-il
supérieur au revenu moyen des femmes ?
Comme dans la question précédente on :
X= genre Y= Revenu
- Il s'agit d'une analyse comparative entre les
hommes et femmes (VARIABLE
QUALITATIVE X) sur le plan des revenus
(VARIABLE QUANTITATIVE Y). Il faut donc
choisir un Test T.
- Il s'agit d'un test t avec deux Groupes
indépendants, un groupe d'hommes et un groupe
de femmes.
Voici les résultats de ce test :
La probabilité de déclarer différents les revenus moyens des
hommes et des femmes, alors qu'ils sont égaux, est de 0,006 : le
tableau SPSS indique ,012 mais il faut diviser ce chiffre par deux
car il s'agit d'une hypothèse unilatérale --» H1: RmH>RmF -
formulée pour un test bilatéral par défaut).
Ce résultat - 0,006 - est donc inférieur au seuil de signification
de 5 % (ou 0,05/2).
En conséquence, il faut rejeter l'hypothèse nulle (Ho) et conclure
qu'au sein de cette population, il y a une différence significative
entre les hommes et les femmes sur le plan des revenus (ce
qu'indique le graphique ci-après comparant les deux groupes de
l'échantillon de cette recherche).
Pour conclure, on peut inférer que les hommes ont des revenus
supérieurs aux revenus des femmes. Il semble donc y avoir une
relation ou un lien entre le genre et leur revenu. Bref, l'hypothèse
de cette recherche est confirmée.
Diagramme en bâtons du revenu moyen
des hommes et des femmes
4. Un questionnaire a servi à la collecte des données
de cette recherche. Les participants devaient
répondre par oui ou non à la question no 1 : « Est-il
vrai de dire que, à scolarités égales, les femmes ont
des revenus équivalents à ceux des hommes? ».
Est-ce que le genre des sujets influence les réponses
à la question no 1 ? Autrement dit, existe-t-il une
relation entre la réponse des participants et leur
genre?
De même que les deux dernières questions
X= genre Y= Les réponses à la question no 1.
Il s'agit d'une analyse comparative entre les hommes et
femmes (VARIABLE QUALITATIVE NOMINALE X) et
leurs réponses (oui/non) à la question no 1 (VARIABLE
QUALITATIVE NOMINALE Y). Il faut donc choisir un
Khi-deux.
Menu analyse, Statistiques Descriptives, puis
Tableaux Croisés
Sur les lignes mettez la variable genre et sur les
colonnes mettez la variable Question1

Cliquez sur le bouton


statistique et
choisissez Khi-deux
Analyse des résultats
La probabilité ou le risque de déclarer différentes les
réponses des hommes et des femmes alors qu'elles sont égales
est de 69 % (on ne divise pas 0,69 par deux car le test KHI
DEUX est toujours unilatéral).
Cette probabilité de commettre une erreur est donc
supérieure au seuil de signification de 5 % (Voir tableau ci-
haut sous Sig. asymptotique bilatérale). En conséquence, il
faut accepter l'hypothèse nulle (Ho) et conclure qu'au sein de
cette population, les proportions de OUI et de NON chez les
hommes et les femmes ne sont pas significativement
différentes.
En conséquence, on peut inférer qu'il n'y a pas de lien ou de
relation entre le genre et leur réponse à la question No 1.
5. Les participants de cette recherche ont-ils répondu plus
souvent oui que non à la question no 1 : « Est-il vrai que, à
scolarités égales, les femmes ont les mêmes revenus que les
hommes ? » ? Cette différence est-elle significative ?

X= Il n'y a pas de x dans cette question


Y= Les réponses à la question no 1.
Il s'agit d'une analyse comparative entre les deux
niveaux de la variable Y (oui/non).
Il faut donc choisir un Test binomial.
Pour effectuer un Test binomial, allez dans le menu Analyse,
puis sélectionnez Non Paramétriques, puis choisissez sur
Boîte de Dialogue Ancienne Version et enfin cliquez sur
Binomial
La probabilité de se tromper en affirmant que la fréquence des OUI et
des NON est attribuable au hasard est de 4,3 % (on ne divise pas par
deux car il s'agit déjà d'une hypothèse bilatérale).
Ce résultat est donc inférieur au seuil de signification de 5 % (Voir
tableau sous Signification exacte bilatérale). En conséquence, il faut
rejeter l'hypothèse nulle (Ho) et conclure que la fréquence des OUI et des
NON s'écarte significativement du hasard (le hasard prédit que OUI =
1/2 et NON = 1/2, donc 15 oui et 15 non).
En conséquence, on peut inférer que cette population ne croit pas que
les femmes et les hommes ont des revenus équivalents.
De fait, les résultats de cette recherche leur donnent raison car le
revenu moyen des femmes est inférieur de 30 % à celui des hommes, et
ce même si elles ont un niveau de scolarité équivalent à celui des
hommes.
Pour compléter cette analyse des données, on pourrait mettre en
relation les réponses des participants avec leur niveau de scolarité ou
leurs revenus; c'est ce que l'on appelle une analyse secondaire.
Diagramme en bâtons de cette variable en choisissant
dans le menu Graphes, Générateur de
diagrammes, puis cliquez sur OK
Fréquences, moyennes et médianes

 10 particants ont répondu


à la question sur l’âge.
 Aucune donnée manquante.
 La moyenne d’âge des
participants est de 39
ans.
 L’âge médian des
participants est de 38
ans.
 L’âge des participants
s’étend de 22 ans à 56
ans.
L’analyse des données

 Croisements entre 2 variables catégorielles


 Exemple. Le nombre d’hommes qui ont déjà reçu
une formation sur le logiciel SPSS
 Onglet Analyse /statistiques descriptives 
tableaux croisés
 Choisissez les deux variables que vous désirez
croisées (une dans “row” et une dans “column”).
 Cliquez sur le bouton “cells” et cochez les trois
choix sous “pourcentages” (row, column, total)
 Cliquez sur “continue” et “ok”
Croisements entre 2 variables
Croisements entre 2 variables
 3 participants (33.3%) sur
9 ont reçu une formation
SPSS dans le passé.
 3 hommes sur 6 (50.0%)
ont suivi une formation
SPSS dans le passé.
 Parmi les 3 femmes
recrutées, aucune n’a suivi
de formation SPSS dans le
passé.
Croisements entre 2 variables
 Croisements entre 2 variables dont une est continue
 Exemple. Quel est l’âge moyen des hommes?
 Onglet Data  select case
 Cliquez “if condition is satisfied”
 Indiquez la valeur de la variable qui vous intéresse (ex. q2_sexe = 1)
 Cliquez sur “continue” et “ok”
 Ensuite, les analyses (ex. moyenne) que vous effectuerez se feront
uniquement sur les participants sélectionnés (ex. Hommes).
 Il ne faut pas oublier d’enlever le filtre avant de faire des analyses
s’adressant à l’échantillon global.
 Variable viewcliquez bouton droit sur la variable filter  cliquez sur
clear pour effacer le filtre.
Croisements entre 2 variables (select if)
Croisements entre 2 variables
(select if)

 La moyenne d’âge
des hommes est de
40 ans.
 L’âge des
participants de sexe
masculin s’étend de
24 ans 53 ans.
Recodage des variables

 Permet de faire des regroupements de


valeurs
 Modification d’une variable existante
 Création d’une nouvelle variable à partir d’une
variable existante
 Permet de faire des opérations
mathématiques
 Création de nouvelles variables
N.B. Il est recommandé de conserver des traces des
modifications apportées aux variables avec un
fichier syntaxe.
Recodage des variables

 La syntaxe
 Un fichier syntaxe est un fichier comprenant des
commandes écrites qui réfèrent aux opérations
effectuées sur les données.
 Il n’est pas nécessaire de connaître la syntaxe pour
l’utiliser. Il suffit seulement de copier (“paste”) les
commandes dans la syntaxe avant de soumettre les
opérations et de sauvegarder ce fichier.
 La syntaxe peut être utilisée autant pour
sauvegarder les commandes des recodages que les
analyses effectuées.
 Lorsque les commandes sont dans la syntaxe, il
suffit de sélectionner la commande et de cliquer
sur le triangle bleu dans le menu pour enclencher
l’opération.
La syntaxe
Regroupement de valeurs

 Modification d’une variable existante


 Onglet “Transform”  recode into same variables
(recoder une même variable)
 Choisir la variable à recoder (ex. q1_age) et définir
les nouvelles valeurs
 Cliquez sur “paste”
 Sélectionnez la commande dans le fichier syntaxe
et cliquez sur le triangle bleu dans le menu.
N.B. Il n’est pas recommandé de modifier une variable
existante à moins de garder des traces des
modifications effectuées (ex. syntaxe) ou d’utiliser
une copie du fichier original.
Modification d’une variable existante
Regroupement de valeurs

 Création d’une nouvelle variable à partir d’une


variable existante
 Onglet “Transform”  recode into different
variables (recoder une variable différente)
 Choisir la variable à recoder (ex. q1_age), donnez
un nom (ex. r_age_30) et un libeller à la nouvelle
variable (ex. Recode age à 30 ans) et définir les
valeurs (1=30 ans et moins et 2=31 ans et plus)
 Cliquez sur “change”, “continue” et “paste”.
 Sélectionnez la commande dans le fichier syntaxe
et cliquez sur le triangle bleu dans le menu.
Création d’une nouvelle variable à partir
d’une variable existante
Création de nouvelles variables

 Création de nouvelles variables


 Onglet “Transform”  “compute variable”
(opération)
 Donnez un nom à la nouvelle variable (ex.
nb_raison_SPSS)
 Inscrire l’opération permettant de construire
cette nouvelle variable (ex. Sommes du nombre de
raisons pour lesquelles les participants désirent
utiliser le logiciel SPSS).
 Cliquez sur “paste”.
 Sélectionnez la commande dans le fichier syntaxe
et cliquez sur le triangle bleu dans le menu.
Création de nouvelles variables
Comment rapporter les données
 Tableaux
 Il est possible de changer le format des tableaux qui se
retrouvent dans les “outputs” pour qu’ils soient
directement utilisables dans les rapports.
 Onglet “Edit”  “options”  “pivot table”
 Choisir le format de tableau
 Cliquez sur “OK”
 Graphiques
 Il est possible de demander au logiciel de sortir les
résultats directement en graphique
 Exemple : Onglet “analyze”  descriptives statistics 
frequencies  choisir les variables pour lesquelles vous
désirez avoir un graphique  choisir le type de
statistiques désirez  cliquez le bouton “charts”
choisir le type de graphique ainsi que les valeurs
désirez
 Cliquez sur “continue” et “ok”
Exportation des résultats
vers un fichier Microsoft
Word ou Excel
Comment rapporter les données

 Exportation dans des fichiers Excel ou Word


 À partir du fichier “outputs” dans lequel se trouve
les résultats à exporter
 Onglet “File”  “Export”
 Choisir le type de fichier (word, excel, etc.) et le
nom du fichier ainsi que le lieu où vous désirez
l’exporter sur votre ordinateur.
 Vous pouvez aussi choisir si vous désirez exporter
le document en entier ou seulement une partie (ex.
seulement le graphique)
 Cliquez sur “ok”.
Comment rapporter les données
Création d’une variable qualitative à
partir d’une variable
d’échelle
La transformation d'une variable quantitative
se fait en 3 étapes :
- Trouver le point-milieu
- Transformer votre variable
- Créer des classes pour votre nouvelle
variable
Étape 1 : Pour transformer en classe une variable
quantitative, il faut d'abord trouver le point milieu de la
distribution de données de votre variable.
Pour trouver ce point milieu, choisir dans le menu SPSS
ANALYSE + STATISTIQUES DESCRIPTIVES + EFFECTIFS.
•Ensuite, choisir la variable que vous
souhaitez transformer en classe (ici
Scolarité).
•Puis cliquez ensuite sur Statistiques.

•Inscrire dans la fenêtre de gauche, Point de


césure pour :, le nombre de classe que vous
désirez (Exemple = 2).

•Puis cliquez sur Poursuivre au bas de la


fenêtre.
Étape 2 : Maintenant pour transformer votre
variable, choisir dans le menu TRANSFORMER +
CRÉATION DE VARIABLES.

Une fenêtre s'ouvre; on y trouve à gauche


la liste de vos variable et à droite une
fenêtre qui contiendra la ou les variables
que vous souhaitez transformer (ou
variable d'entrée):
Choisir la variable quantitative que vous souhaitez
transformer (ici Scolarité) au moyen de la flèche bleue

•Maintenant donnez à cette variable un


nouveau nom; dans SPSS, il est impossible
que deux variables aient le même nom.

•À l'extrême droite, entrez ce nouveau nom


dans la fenêtre Variable de destination (ici
Classescolarité).
Étape 3 : Complétez la transformation de vos données en
créant deux nouvelles classes de scolarité.

Voilà, vous pouvez maintenant utiliser la scolarité comme variable


indépendante nominale dans vos analyses secondaires.
Calcul de nouvelles
variables
A l’aide d’une grande variété de fonctions mathématiques, vous
pouvez calculer de nouvelles variables en fonction d’équations
extrêmement complexes. Dans cet exemple, cependant, nous
calculerons simplement une nouvelle variable qui représente la
différence entre les valeurs de deux variables existantes.

Transformer
Calculer

Vous aimerez peut-être aussi