Vous êtes sur la page 1sur 97

Introduction lanalyse

exploratoire des donnes


avec SPSS




Professeurs : O. Renaud et G. Pini
Assistante: K. Iglesias
Moniteurs : R. Wipfli et B. Ossipow



Certaines parties de ce polycopi sont bases sur le
cours de M.Eid et T. Lischetzke
Programme des cours

16 mars Tous Intro



23

mars
Jaune
et
bleu





30

mars
Rouge
et
vert

La dmarche de la recherche :

o, quand et pourquoi utiliser SPSS ?




6

avril
Jaune
et
bleu





13

avril
Rouge
et
vert

Le questionnaire et la transformation de donnes




27

avril
Jaune
et
bleu





4

mai
Rouge
et
vert


Analyse des donnes :

Reprsentations graphiques





11

mai
Jaune
et
bleu





18

mai
Rouge
et
vert

Analyse des donnes :

Les mesures descriptives




1

juin
Jaune
et
bleu





8

juin
Rouge
et
vert


Analyse des donnes :

Corrlation et rgression linaire simple



15

juin Tous Questions et distribution de lexamen


Programme des TD
18h-20h 21 mars Jaune

12h-14h 22 mars Bleu

18h-20h 28 mars Rouge

12h-14h 29 mars Vert
Dcouverte de SPSS

18h-20h 4 avril Jaune

12h-14h 5 avril Bleu

18h-20h 11 avril Rouge

12h-14h 12 avril Vert
Entres les donnes partir du
questionnaire

18h-20h 25 avril Jaune

12h-14h 26 avril Bleu

18h-20h 2 mai Rouge

12h-14h 3 mai Vert
Transformer les donnes

18h-20h 9 mai Jaune

12h-14h 10 mai Bleu

18h-20h 16 mai Rouge

12h-14h 17 mai Vert
Reprsentations graphiques

18h-20h 23 mai Jaune

12h-14h 24 mai Bleu

18h-20h 30 mai Rouge

12h-14h 31 mai Vert
Mesures descriptives

12h-14h 7 juin Jaune

14h-16h 7 juin Bleu

18h-20h 13 juin Rouge

12h-14h 14 juin Vert
Corrlation et rgression


Monitorat

22, 23, 29 et 30 mars, 5, 6, 12, 13, 26 et 27 avril
3, 4, 10, 11, 17, 18, 24 et 31 mai et 1, 8, 14 et 15 juin


Informations pratiques
Professeurs : O. Renaud (Olivier.Renaud@pse.unige.ch)
G. Pini (Gianreto.Pini@pse.unige.ch)
Assistante : Katia Iglesias (Katia.Iglesias@pse.unige.ch)
Moniteurs : Baptiste Ossipow (Ossipow1@etu.unige.ch)
Rolf Wipfli (Wipflra7@etu.unige.ch)

Indications Gnrales :

Semestre dt, 3 crdits

Les tudiant-e-s seront rparti-e-s en 4 groupes (jaune, bleu, rouge et vert). Les
cours ont lieu en alternance une semaine sur deux les jeudis de 10h-12h en salle
U300 (en alternance jaune-bleu et rouge-vert).

Les TD ont lieu en alternance les mardi de 18h-20h pour les groupes jaunes et
rouge et les mercredis de 12h-14h pour les groupes bleu et vert ( lexception du
7 juin pour les bleus, les TD auront lieu le mardi de 14h-16h au lieu des TP) en
salle M4183.

Pour les TP, ils ont lieu les mercredis 14h-16h et jeudis 16h-18h en salle M5183
indpendamment de votre groupe dappartenance.

Objectifs du cours :

Se familiariser avec les mthodes de base d'exploration de donnes de
recherche en psychologie et l'utilisation du logiciel statistique SPSS.

Descriptif du cours :

Le cours aborde tous les aspects de l'analyse de donnes, aussi bien thoriques
que l'application avec un logiciel statistique. Les donnes utilises proviennent de
recherches dans le domaine de la psychologie. Les tudiant-e-s apprennent
comment entrer les donnes dans l'ordinateur et comment effectuer des calculs
lmentaires, qui rpondent aux questions de recherche. Le cours donne aussi
une introduction aux mthodes statistiques pour dcrire la distribution des
variables nominales, ordinales et quantitatives et leurs relations.

Programme indicatif :

La dmarche de la recherche : o, quand et pourquoi utiliser SPSS ?
Le questionnaire et la transformation de donnes
Analyse des donnes : Reprsentations graphiques
Analyse des donnes : Les mesures descriptives
Analyse des donnes : Corrlation et rgression linaire simple
Questions
Distribution de lexamen
Support de cours et des travaux dirigs :

Il peut tre achet la centrale des polycopis (ou tlcharg depuis dokeos).

Informations et documents :

Toutes les informations, horaires et support sont sur Dokeos :
http://dokeos.unige.ch/courses/7111F/

Examen :

Et 2006 : Distribution, le 15 juin 2006 lors du cours, du ou des jeu/x de donne
pour lexamen. Lexamen sera un crit de 2 heures portant sur les analyses faites
la maison et sur la matire vue en cours et aux travaux dirigs.

Automne 2006 : Disponibilit, le 28 septembre 2006 sur dokeos, du ou des jeu/x
de donne pour lexamen. Lexamen sera un crit de 2 heures portant sur les
analyses faites la maison et sur la matire vue en cours et aux travaux dirigs

Hiver 2007 : examen oral (session extraordinaire).

Rception des tudiants :

Toutes vos questions doivent tre poses dans un premier temps aux moniteurs.
Si vous avez encore des questions vous prendre rendez-vous durant le TD ou par
mail avec Katia Iglesias (Katia.Iglesias@pse.unige.ch).


Support

de

cours


1
Logiciels statistiques et psychologie :
chercher lerreur
2
Dsol
Psychologie rime bien souvent avec Statistique
3
Les nombres peuvent effrayer certains.
Le choc : pour tudier la psychologie, il est ncessaire
dapprendre les statistiques.
But du cours : faire disparatre la peur des uns et
augmenter le plaisir des uns et des autres.
nous travaillerons partir dun questionnaire et sur
vos propres donnes.
Le choc des statistiques
4
Connaissances utiles
Comprendre la littrature, la recherche, lire les
rsultats, pouvoir tre critique, etc.
2me anne votre propre recherche
Mmoire de fin dtudes
5
Les tudiant-e-s qui disposent dune bonne connaissance
danalyse des donnes, de la statistique et de la
mthodologie ont de meilleures possibilits de
dbouchs.
Ces capacits sont beaucoup valorises non seulement
dans la psychologie scientifique mais galement dans les
domaines diffrents de la pratique comme les cliniques
et les entreprises.
Amlioration des dbouchs
6
La psychologie et la recherche
Pour trouver une rponse nos questions :
Rcolter des donnes et interprter les
rsultats
Rflchir sur le monde et le comportement
7
Recherche : lectro-encphalogramme
Analyses temps-frquences des potentiels voqus (EEG)
But: Tester loccurrence temporelle de lvaluation de la
nouveaut versus de la pertinence. Les participants
devaient dtecter une image-cible (15% des stimuli visuels)
dans un flux dimages nouvelles (15%) et familires (70%).
8
Trac de lnergie moyenne en frquence Delta pour toutes les lectrodes
(N=15) obtenus par dcomposition discrte dondelette pour les trois
conditions exprimentales,
Notez que lvaluation de la nouveaut (implicite) induit des modifications
temporellement antrieures aux modifications associes la manipulation
exprimentale de la pertinence.
Familiarit
Nouveaut
Pertinence
9
8 cartes topographiques (128 ms par carte) de la bande Delta
(rouge = polarit positive, bleu = polarit ngative) vue de dessus
(partie suprieure de la carte = partie antrieure du scalp).
Encadr en rouge les priodes durant lesquelles lnergie dans
cette bande est significativement diffrente compare la
condition familiarit (p< 0.05).
Extrait de Grandjean, D., Scherer, K.R. (2003). Appraisal processes in emotion elicitation: a topographic
electrophysiological approach. Human Brain Mapping, New-York: USA.
Nouveaut
2
2 3
Pertinence
1
Familiarit
2 3 4
5 6 7 8
10
Exemple de recherche sur les adolescents
Influences maternelles sur le comportement sexuel des
adolescents :
Echantillon : 751 adolescents noirs entre 14 et 17 ans de la
rgion de Philadelphia
11
Variables dintrt
But : analyser les diffrents facteurs pouvant expliquer les
variables ci-dessous :
Sur lexprience dune relation sexuelle ou non.
Pour ceux qui ont dj eu (au moins) une relation,
Sur la frquence de relation sexuelle et
Sur la frquence dutilisation de moyen de
contraception.
12
Variables permettant dexpliquer les variables
dintrt
3 variables nous intressent :
Satisfaction de la relation avec la mre
Dsapprobation de la mre pour des relations sexuelles avant
le mariage
Discussions sur les moyens de contraceptions
Il est connu que dautres facteurs influencent le comportement
sexuel des adolescents. Ces derniers ont t pris en compte :
Pour la mre : religiosit, niveau dducation, ge, niveau
social, etc.
Pour lenfant : religiosit, moyenne lcole, etc.
13
Un rsultat
Pour la frquence de relation sexuelle, les auteurs ont
trouv :
Satisfaction de la relation : 2.11 Influence ngative
forte
Dsaprobation maternelle :1.74 Influence ngative
moyenne
Discussion contraception : 0.83 Pas dinfluence
14
Sils avaient uniquement tenu compte de la relation entre la
Satisfaction de la relation avec la mre et la frquence des relations
sexuelles, on aurait obtenu un graphique de ce genre :
Satisfaction de la relation
N
o
m
b
r
e

d
e

r
e
l
a
t
i
o
n
(
s
)

s
e
x
u
e
l
l
e
(
s
)

p
a
r

m
o
i
s
0 10 20 30 40 50
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
Jaccard, J., Dittus, P. J., and Gordon V. V. (1996). Maternal Correlates of Adolescent Sexual and Contraceptive Behavior. Family
Planning Perspectives. 28, 4, 159-165.
15
Exemple de recherche en psychologie :
problme de mthodologie
Exprience :
Mesurer leffet de lge sur les capacits cognitives
Passation des tches laprs-midi par commodit pour le chercheur
Erreur mthodologique :
ne pas tenir compte que les conditions optimales de passation pour
chacun des groupes sont diffrentes
les personnes ges sont plus performant le matin et les jeunes
laprs-midi.
Helmuth, L., (2003). The Wisdom of the Wizend. Science, 299, pp. 1300-1302
16
Informations pratiques
17
Programme du cours
La dmarche de la recherche : o, quand et pourquoi
utiliser SPSS ?
Le questionnaire et la transformation de donnes
Analyse des donnes :
Reprsentations graphiques
Les mesures descriptives
Corrlation et rgression linaire simple
Questions
Distribution de lexamen
18
Programme du cours
Vu le nombre important dtudiants suivant ce cours,
vous serez spar en deux groupes pour les cours :
jaune-bleu et rouge-vert.
Le cours a lieu les jeudis de 10h 12h en salle U300 une
semaine sur deux selon le programme et selon le groupe
auquel vous appartenez.
19
Travaux dirigs
Pour les travaux dirigs (TD), vous serez spars en
quatre groupes : jaune, bleu, rouge et vert.
Ils ont lieu les mardis de 18h 20h et les mercredis de
12h 14h une semaine sur deux selon le programme.
Vous pouvez vous changer vos groupes en changeant
les programmes de couleurs (ou sur le Forum du cours).
Linscription aux TD se fait sur prsentation du
programme de couleur.
20
Travaux pratiques
Les travaux pratiques (TP) ont lieu les mercredis de 14h
16h et les jeudis de 16h 18h.
Ils ny a pas de groupes : chacun peut y aller autant quil
en a besoin.
Si vous avez des questions, vous les posez en premiers
aux moniteurs, si ce nest toujours pas clair vous pouvez
alors prendre rendez-vous par e-mail avec Katia Iglesias.
21
Attention
Si vous avez chang de groupe, ce changement est
valable aussi bien pour le cours que pour les travaux
dirigs
22
Questionnaire
Pour illustrer les diffrents concepts qui seront vu dans le
cours et dans les travaux dirigs, nous utiliserons le
questionnaire que nous vous avons distribu.
Remplir 2 exemplaires par tudiants
A amener lors du 2
me
TD
23
Examen en deux temps :
Vous recevez un (ou des) jeu(x) de donnes environ 10
jours avant lexamen.
Vous devrez faire des analyses et apporter les rsultats
le jour de lexamen.
Ces analyses seront trs similaires celles faites
durant les TD et les TP.
Lors de lexamen
A partir des analyses que vous avez faites lavance,
vous devrez rpondre aux questions.
Questions thoriques sur le cours.
24
Sessions dexamen:
Sessions usuelles :
Et 2006 : Distribution du ou des jeu/x de donnes le
15 juin 2006 lors du cours
Automne 2006 : Disponibilit du ou des jeu/x de
donnes le 28 septembre 2006 sur Dokeos
Modalits : examen crit de 2 heures
Session extraordinaire :
Hiver 2007 : examen oral.
25
Bibliographie
Dpelteau, F. (2000), La dmarche dune recherche en sciences
humaines, Ed. De Boeck Universit : Bruxelles.
Howell, D.C. (1998). Mthodes statistiques en sciences humaines.
Bruxelles : De Boeck Universit.
Kinnear, P., Gray, C. (2005). SPSS facile appliqu la psychologie et
aux sciences sociales : matriser le traitement de donnes. Bruxelles :
De Boeck Universit.
Laveault, D., Grgoire, J. (1997). Introduction aux thories des tests
en sciences humaines. Ed. De Boeck Universit : Bruxelles.
26
Sites web
Technique danalyse en psychologie (universit de Montral):
http://www.mapageweb.umontreal.ca/cousined/home/course/
PSY1004/index.html
Annexe 6 : Document gnral :/PSY1004/3-
FormationSPSS/PSY1004_Annexe6-SPSS.pdf
Annexe 7 : SPSS avanc : /PSY1004_Annexe7-
SPSS_avance.pdf
Introduction to SPSS for the PC:
http://abacus.bates.edu/acad/depts/psychology/SPSSPC/sps
spc.html
27
La dmarche de la recherche en sciences
humaines
28
Dmarche de la recherche
Au dpart de toute recherche : un questionnement
Les 4 tapes de la recherche :
Circonscrire lobjet de recherche
Construire lobjet de recherche
Construire les instruments dobservations
Analyser lobjet dobservations
29
Circonscrire lobjet de recherche
Cest apprendre poser et formuler son
questionnement dans le cadre des connaissances
actuelles.
La recherche sinscrit dans un continuum et se situe par
rapport des courants de penses qui la prcdent et
linfluencent.
Monter ce qui rapproche notre recherche des autres et
ce qui la distingue par rapport des cadres thoriques
connus.
30
Construire lobjet de recherche
Adopter un cadre thorique : La thorie est une sorte
de filtre par lequel on regarde la ralit.
Oprationnaliser ce cadre thorique.
traduire une thorie abstraite et une hypothse
gnrale en phnomnes concrets et prcis quon peut
exprimenter, cest--dire observer, toucher, sentir,
goter ou entendre (Dpelteau, 2002, p.170)
31
Construire lobjet de recherche
Pour cela il faut dterminer :
les dimensions des concepts
les composantes des dimensions
les indicateurs des composantes
Une variable est un lment de lhypothse laquelle
on peut attribuer diverses valeurs et qui, comme son
nom lindique, varie (Dpelteau, 2002, p.163)
32
Oprationnalisation
Hypothses
thoriques
Variables thoriques
ou concepts
+ liens
Opration-
alisation
Hypothses
oprationnelles
Variables opration-
nelles ou indicateurs
+ plan de recherche
Hypothses
statistiques
Donnes
+ analyses
33
Construire les instruments dobservation
Observer
Quoi : quelles sont les donnes pertinente ?
Qui : qui ou quoi doit tre observ ?
Comment : comment se droulera le test empirique (mode
dinvestigation) et comment recueillir les donnes permettant
de tester notre hypothse de recherche ?
34
Comment observer ?
Questionnaire
Entretien
Tests
Observation
Mesures psychophysiologiques
Imagerie crbrale
Evaluation ambulatoire
Analyse du texte
Mesures biochimiques

35
Exemple: Test
Exemple de problmes
( gauche la figure reproduire, droite la solution)
Figure 4.2
Test de cubes de Kohs
(Copyright 1960, Centre de psychologie applique)
36
Exemple: Observation
Lchelle HOME (Bradley et Caldwell, 1976) : Ractivit motionnelle et verbale de la mre
La mre sadresse spontanment lenfant deux fois au moins pendant la visite.
La mre rpond verbalement des verbalisations.
La mre nomme des objets ou des personnes de manire didactique.
Le langage de la mre est distinct, clair et audible.
La mre prend linitiative dchanges verbaux avec lobservateur, pose des
questions, fait des commentaires.
La mre exprime ses ides librement et facilement et utilise des phrases de
longueur appropries la conversation (plus que des rponses brves).
La mre laisse lenfant mettre de fouillis en jouant.
La mre fait lloge des qualits ou de la conduite de lenfant au moins deux fois.
Lorsque la mre parle lenfant, le ton de sa voix est affectueux.
La mre caresse ou embrasse lenfant au moins une fois.
La mre rpond positivement aux loges de lenfant faits par lobservateur.
37
Exemple: Mesures psychophysiologique
38
Exemple: Imagerie crbrale
39
Exemple: Evaluation ambulatoire
40
Analyser lobjet dobservation
Pourquoi analyser les donnes rcoltes ?
Pour tester notre hypothse de dpart.
besoin dun logiciel statistique.
41
Analyser lobjet dobservation : 3 oprations
Prparation des donnes (dcrire et agrger).
Analyse des relations entre les variables.
Comparaison des rsultats observs avec les rsultats
attendus et interprtation de lcart.
42
Analyse statistique
Statistique descriptive infrentielle.
Description univarie bivarie multivarie.
Approche exploratoire confirmatoire.
43
Les chelles
Variables qualitatives Variables quantitatives
discrtes
continues
chelle
nominale
chelle
ordinale
chelle
dintervalles
chelle de
rapports
Variables
44
Variables qualitatives
Modalits : Catgories (mots, lettres), non numriques
sexe, tude, profession, nationalit, niveau scolaire
Variable dichotomique/binaire : deux catgories
sexe (fminin, masculin), rsolution vs. non-rsolution dune tche, approbation
vs. dsapprobation dun nonc
Variable polytomique : plusieurs catgories
degr dapprobation
pas du tout
d'accord
peu d'accord plutt
d'accord
tout fait d'accord
45
Variables qualitatives: Assigner des nombres
Lchelle nominale
On utilise les chelles nominales pour reprsenter la
diffrence entre les sujets.
Le mme nombre est assign toutes les personnes
ayant les mmes caractristiques.
Les nombres ne possdent pas de proprits
arithmtiques.
46
Variables qualitatives: Assigner des nombres
Lchelle ordinale
On utilise les chelles ordinales pour reprsenter la
diffrence et lordre entre les sujets (ordre selon la
taille, lintensit, etc.).
Le mme nombre est assign toutes les personnes
ayant les mmes caractristiques.
Un nombre plus grand est assign une personne
appartenant une catgorie plus grande.
Les nombres ne possdent pas de proprits
arithmtiques.
47
Variables quantitatives (variables mtriques)
Les modalits ont des valeurs numriques
la temprature, la taille, le revenu, le quotient intellectuel, le nombre de frres
Variables discrtes : nombre de valeurs possibles
dnombrable
le nombre de frres, le nombre de mots dans un texte, le nombre daccs de
colre dans une semaine
Variables continues : nombre de valeurs possibles non
dnombrable
La temprature
48
Variables quantitatives : Niveaux de mesure
Lchelle dintervalles (ou continue)
Pour reprsenter la diffrence et lordre entre les
sujets. Contrairement lchelle ordinale les distances
entre les valeurs ont un sens.
La temprature : la diffrence entre la temprature aujourdhui (24
Celsius) et hier (22 Celsius) et la mme quentre hier (22 Celsius) et
avant-hier (20 Celsius) parce que la diffrence est la mme (2 Celsius).
Le point zro est dtermin arbitrairement
transformation de la temprature mesure en lchelle Celsius en la
temprature mesure en Fahrenheit : Fahrenheit = 9/5 Celsius + 32
49
Variables quantitatives : Niveaux de mesure
Lchelle de rapport
Pour reprsenter la diffrence et lordre entre les
sujets.
Les distances et le point de zro sont significatifs.
La longueur
50
Le questionnaire utilis dans ce cours
51
Le questionnaire : Echelle dexpressivit
Amour
Joie
Peur
Colre
Tristesse
Honte
52
Le questionnaire : Big Five
Nvrosisme (susceptible, sensible, lunatique, pas sr-e
de moi)
Extraversion (amical-e, sociable, vif/ve, plein-e de
temprament)
Intellect (malin/gne, intelligent-e, cultiv-e, riche
d'esprit)
Agrabilit (chaleureux/se, plein-e dgards, de bonne
nature, serviable)
Conscience (travailleur/se, assidu-e, consciencieux/se,
ambitieux/se)
53
Le questionnaire : Echelle douverture
Ouverture la rverie,
Ouverture lesthtique,
Ouverture aux sentiments,
Ouverture aux ides,
Ouverture aux actions et
Ouverture aux valeurs
54
Le questionnaire : donnes sociodmographiques
Age
Sexe
Taille
Poids
Nationalit
Etude

55
Diffrents types de questions
Questions fermes :
pas du tout
daccord
un peu
daccord
moyenne-
ment
daccord
plutt
daccord
tout
fait
daccord
Jai peu dintrt pour la rflexion sur la nature
de lunivers ou sur la condition humaine.
1
2 3 4
5
Questions ouvertes :
Quest ce que ces loisirs vous apportent ?
56
Diffrents types de questions
Questions rponse unique : Sexe : Femme Homme
Questions rponses multiples :
Quelles loisirs avez-vous rgulirement? (plusieurs rponses sont possibles)

Sport

Rencontrer des amis

Activits culturelles (cinma, expositions, concerts, etc.)

Animal domestique

Instrument de musique

Tlvision

Internet

Bricolage (tricot, jardinage, etc.)

Autre : _____________________________________________________
57
Du questionnaire la base de donnes
N individus (objets, units statistiques) qui ont
rpondu au questionnaire
P rponses ou variables (caractristiques, attributs)
par questionnaire
L espace dobservation comme rsultats du produit
cartsien entre ces deux ensembles dlments : la
matrice et le fichier des donnes.
58
Du questionnaire la base de donnes
Crer un fichier de donnes pour cela, il faut laborer
et utiliser un plan de codage
59
Tableau de codage pour notre questionnaire
Variable Variable label Value labels
id Numro didentification
exp1 exp12 Expressivit 1 = jamais ou presque jamais
2 = parfois
3 = souvent
4 = presque toujours ou toujours
bf1 bf20 Big Five (adjectives) 1 = pas du tout
5 = tout fait
ouv1-ouv30 Ouverture 1 = pas du tout daccord
5 = tout fait daccord
loisirs1
loisirs8
Loisirs 0 = na pas ce loisir
1 = a ce loisir
sexe Sexe 1 = Femme
2 = Homme
age Age
60
Tableau de codage pour notre questionnaire
natio Nationalit 1 allemande 19 roumaine
2 corenne de sud 20 nerlandaise
3 mexicaine 21 indienne
4 slovaque 22 grecque
5 italienne 23 isralienne
6 taiwanaise 24 belge
7 finnoise 25 chinoise
8 russe 26 marocaine
9 franaise 27 autrichienne
10 polonaise 28 espagnole
11 tchque 29 bulgare
12 ukrainienne 30 bolivienne
13 moldavienne 31 lituanienne
14 usbekienne 32 palestinienne
15 turque 33 islandaise
16 Etats-Unis 34 britannique
17 luxembourgeoise 35 croate
18 hongroise 36 suisse
61
Tableau de codage pour notre questionnaire
etude Domaine dtudes 1 mathmatiques 10 conomie
2 psychologie 11 histoire
3 droit 12 architecture
4 langues 13 design
5 gologie 14 informatique
6 ducation 15 mdias
7 ingnierie 16 thologie
8 politique 17 philosophie
9 sociologie 18 ethnologie
taille Taille en cm
poids Poids en kg
code Code
62
Transformer les donnes
63
Transformer les donnes
Pourquoi transformer les donnes ?
Modifier la structure (la forme) dune variable
(recodage) modifier la manire dont la variable a
t initialement code pour satisfaire aux exigences
de certaines analyses.
Crer une nouvelle variable cration dune nouvelle
variable laide doprations arithmtiques et/ou
doprations logiques sur une ou plusieurs variable(s)
dorigine.
64
Recoder une variable : Exemple 1 : inverser lchelle
On cherche mesurer louverture aux sentiments avec les 5 questions
suivantes (chelle : 1 pas du tout daccord 5 tout fait daccord) :
8 La manire dont je sens les choses est importante pour moi.
14 Il est rare que jaccorde beaucoup dattention mes sentiments du moment.
19 Jprouve une grande varit dmotions ou de sentiments.
24 Je remarque rarement les changements dhumeurs ou les sentiments que
provoquent des environnements diffrents.
27 Je trouve facile davoir de lempathie, cest--dire de ressentir moi-mme ce
que les autres ressentent.
Les questions 8, 19 et 27 mesurent louverture aux
sentiments et les questions 14 et 24 la fermeture
65
recoder les questions 14 et 24 pour que lchelle
mesure bien louverture aux sentiments
Pour cela, on attribue la valeur 1 la valeur 5, la valeur 2
la valeur 4, la valeur 3 la valeur 3, la valeur 4 la
valeur 2 et la valeur 5 la valeur 1 :
Anciennes valeurs Nouvelles valeurs
1 5
2 4
3 3
4 2
5 1
Missing Missing
66
Exemple 2 : restreindre lchelle
a) Passage de 4 modalits 2 :
Ancienne variable Nouvelle variable
Pas
satisfait
Plutt pas
satisfait
Plutt
satisfait
Satisfait Insatisfait satisfait
Etes-vous satisfait
avec la manire
dont vous grez
vos motions ?
1 2 3 4

1 2
67
Exemple 2 : restreindre lchelle
b) Age : variable quantitative allant de 16 35 ans
Variable recode en quatre modalits :
16 20 ans
21 25 ans
26 30 ans
31 35 ans
68
Exemple 2 : restreindre lchelle
c) Nationalit :
1 allemand 7 finnois 13 moldavien 19 roumain 25 chinois 31 lituanien
2 coren du sud 8 russe 14 usbekien 20 nerlandais 26 marocain 32 palestinien
3 mexicain 9 franais 15 turque 21 indien 27 autrichien 33 islandais
4 slovaque 10 polonais 16 Etats-Unis 22 grecque 28 espagnol 34 britannique
5 italien 11 tchque 17 luxembourgeois 23 isralien 29 bulgare 35 croate
6 taiwanais 12 ukrainien 18 hongrois 24 belge 30 bolivien 36 suisse
Ouest de lEurope : 1, 5, 7, 9, 17, 20, 22, 24, 27, 28, 33, 36
Est de lEurope : 4, 8, 10, 11, 12, 13, 15, 18, 19, 29, 31, 35
Asie : 2, 6, 14, 15, 21, 23, 25, 32
Amrique : 3, 16,21, 30
Afrique : 26
69
Crer une nouvelle variable : Ex 1 : une sous-chelle
Pour construire la sous chelle douverture aux
sentiments, il a fallu dans un premier temps recoder deux
des cinq variables mesurant cette dimension.
A ce stade, nous avons 5 questions qui mesurent
louverture aux sentiments (Q : 8, 14r, 19, 24r et 27, o
r signifie renvers ).
But : passer de 5 mesures une seule
moyenne de nos 5 questions :
Mean (ouv08,ouv14r,ouv19,ouv24r,ouv27)
70
Exemple 2 : lindice de masse corporelle (IMC)
L Indice de masse corporelle sobtient en divisant le
poids dun individu (exprim en kg) par le carr de sa
taille (en mtres).
A partir des variables "Poids" et "Taille" figurant dans un
fichier, on peut donc crer la nouvelle variable "Masse
corporelle" : poids/taille
2
71
Exemple : croisement sexe-ge
Connaissant le sexe et lge dun groupe dindividus, on
peut crer une variable composite en dfinissant 4
modalits :
Homme Femme
Moins de 25 ans 1 3
25 ans et plus 2 4
1 : Hommes dge infrieur 25 ans
2 : Hommes de 25 ans ou plus
3 : Femmes dge infrieur 25 ans
4 : Femmes de 25 ans ou plus
72
Analyses des donnes : reprsentations
graphiques et mesures descriptives
73
Description et reprsentation
Description des caractristiques dun ensemble
dobservations / dindividus partir dune seule variable
Deux familles de moyens :
des tableaux (tableau deffectifs) et des graphiques
(diagramme en btons, diagramme circulaire,
histogramme).
des indices numriques dautre part.
74
Distribution de frquences
Frquence absolue Frquence relative Frquence cumule
1
k
i
i
n n

i
i
n
f
n

F
1
= f
1
F
2
= f
1
+ f
2
F
3
= f
1
+ f
2
+ f
3
.
.
.
F
k
= f
1
+ + f
k
= 1
n
i
: nombre dlments ayant pour une modalit / valeur
dune variable X et n : nombre total dlments
Note : Pourcentage = frquence * 100
75
Sexe
307 63.7 63.7 63.7
175 36.3 36.3 100.0
482 100.0 100.0
Femme
Homme
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
Joie
1 .2 .2 .2
25 5.2 5.3 5.5
194 40.2 40.8 46.2
256 53.1 53.8 100.0
476 98.8 100.0
6 1.2
482 100.0
jamais ou
presque jamais
parfois
souvent
presque toujours
ou toujours
Total
Valid
System Missing
Total
Frequency Percent Valid Percent
Cumulative
Percent
76
Age
1 .2 .2 .2
5 1.0 1.0 1.3
36 7.5 7.5 8.8
51 10.6 10.6 19.4
66 13.7 13.8 33.1
81 16.8 16.9 50.0
50 10.4 10.4 60.4
41 8.5 8.5 69.0
49 10.2 10.2 79.2
22 4.6 4.6 83.8
25 5.2 5.2 89.0
15 3.1 3.1 92.1
10 2.1 2.1 94.2
8 1.7 1.7 95.8
5 1.0 1.0 96.9
4 .8 .8 97.7
3 .6 .6 98.3
8 1.7 1.7 100.0
480 99.6 100.0
2 .4
482 100.0
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
35
Total
Valid
System Missing
Total
Frequency Percent Valid Percent
Cumulative
Percent
77
Diagramme en btons (graphique colonnes,
bar plot)
Une colonne verticale ou
horizontale est dessine
pour chaque valeur ou
modalit de la variable
considre
Hauteur/longueur : nombre
de membres de chaque
classe
78
Diagramme en btons
79
Diagramme circulaire: camembert, pie- chart
Cercle : Population
totale
Tranches (aire ou
angle) : frquence
relative
80
Histogramme (vars quantitatives continues)
Intervalles de classe : Division de
lintervalle de variation en k classes
81
Histogramme (vars quantitatives continues)
Pour construire un histogramme, il faut :
Choisir les intervalles (intervalles qui doivent tre de
mmes tailles)
Compter le nombre de cas (observations) dans chaque
intervalle
82
Mesure de tendance (centrale)
Mode (mode)
Mdiane (median)
Moyenne (mean, average)
83
Mode
Le mode dune variable qualitative (ou quantitative
discrte) est la valeur qui possde la frquence la plus
leve.
Il y des distributions unimodale, bimodale, plurimodale
0 1 2 3 4 5 6 7 8 9 10
Scores
E
f
f
e
c
t
i
f
s
0 1 2 3 4 5 6 7 8 9 10
Scores
E
f
f
e
c
t
i
f
s
Distribution uniforme (rectangulaire) Distribution bimodale
84
Mdiane
La mdiane partage la distribution dune srie
dobservations en deux parties gales.
Les variables doivent tre mesures au moins sur une
chelle ordinale.
Pour calculer la mdiane il faut ordonner les valeurs.
Calcul :
Le nombre dobservations est impair : la mdiane est la
valeur situe au milieu de la srie
Le nombre dobservations est pair : la mdiane est la
moyenne de la
j \
, (
( , 2
e
n
est la
+ j \
, (
( ,
2
2
e
n
85
Moyenne
Moyenne arithmtique
Valeurs individuelles :
x
i
: valeur individuelle dun sujet i
n : nombre de sujets
1
n
i
i
x
x
n

86
Extrait de M. A. Martin, (2003). Journal of Statistics Education,11
87
Mesure de dispersion et de forme
Variance et cart-type
Empan
Intervalle interquartile
Box plot
Coefficient de symtrie et daplatissement
88
Variance (variance)
2 2
1
1
( )

n
i
i
s x x
n
Ecart-type (standard error) :
2
s s
Proprits
La variance a toujours une valeur non-ngative.
La variance est gale 0, si toutes les observations
sont identiques.
89
Variance
Estimateur de la variance dans une population grce un
chantillon :
2 2
1
1
( )
1


n
i
i
x x
n
90
Empan (tendue, range)
Diffrence entre la valeur la plus leve et la valeur la
plus base
91
Intervalle interquartile (interquartile range)
Les quartiles divisent un ensemble dobservations en
quatre parties gales (25%).
Lintervalle interquartile est la distance entre le 1er et le
3e quartile.
Lintervalle interquartile comprend 50 % des observations
les plus au centre de la distribution.
92
Box plot
93
Extrait de M. A. Martin, (2003). Journal of Statistics Education,11
94
Box plot
175 307 N =
Sexe
Homme Femme
A
g
e
60
50
40
30
20
10
273
160
173 27
53
280 191
322
420 181
139
269
Valeurs extrmes
1
er
quartile
Mdiane (2
me
quartile)
3
me
quartile
95
Mesures de forme : Mesure dasymtrie
valeur = 0: symtrie
valeur > 0: oblique gauche (ou talement droite)
valeur < 0 : oblique droite (ou talement gauche)
0 1 2 3 4 5 6 7 8 9 10
Scores
E
f
f
e
c
t
i
f
s
0 1 2 3 4 5 6 7 8 9 10
Scores
E
f
f
e
c
t
i
f
s
Asymtrie positive Asymtrie ngative
96
Mesures de forme : Mesure daplatissement
valeur = 0: distribution normale ( cloche de Gauss )
valeur > 0: distribution leptocurtique ( tass )
valeur < 0 : distribution platocurtique ( plate
leptocurtique platocurtique
4 2 0 -2 -4
2'000
1'500
1'000
500
0
F
r
e
q
u
e
n
c
y
Mean =
0.01383714845621
Std. Dev. =
1.309785898660584
N = 10'000
1.2 1.0 0.8 0.6 0.4 0.2 0.0 -0.2
1'200
1'000
800
600
400
200
0
F
r
e
q
u
e
n
c
y
Mean =
0.50357070403304
Std. Dev. =
0.187251416005701
N = 10'000
97
Analyses des donnes bivaries: corrlation
et rgression linaire simple
98
Relation entre deux variables
Description des caractristiques dun ensemble
dobservations / dindividus partir de deux variables
considres simultanment : tude de la relation entre
variables (statistique bivarie).
Corrlation (Spermann, Kendall, Pearson)
Rgression linaire simple
99
Corrlation (correlation)
La corrlation mesure la relation linaire entre deux
variables
La corrlation peut prendre des valeurs entre 1 et 1 avec
proche de 1 : forte relation ngative,
proche de 0 : pas de relation linaire et
proche de 1 : forte relation positive.
100
Corrlation
Primordial de vrifier la linarit de la relation, car :
Corrlation linaire de valeur nulle ne veut pas dire
quil nexistepas de relation entre les variables p.ex.
relation quadratique.
La mesure de la corrlation est trs sensible aux
donnes extrmes possible dobtenir une
corrlation linaire significative mme sil ny a pas de
relation entre les variables.
101
Forte relation linaire positive Forte relation linaire ngative
102
Pas de relation linaire, mais relation Pas de relation
103
Relation linaire positive parfaite Relation linaire positive faible
104
Relation entre variables quantitatives
Deux variables quantitatives de types dintervalles ou de
rapport :
corrlation avec le coefficient de corrlation linaire
"r" de Bravais-Pearson et le coefficient de
dtermination
105
Y
X
Y
X
A
C
B
D
(y - y ) < 0
i
(y - y ) > 0
i
(y - y ) < 0
i
(y - y ) > 0
i
(x - x ) > 0
i
(x - x ) < 0
i
(x - x ) > 0
i
(x - x ) < 0
i
*
*
*
*
1) Donnes sont en majorit dans les quadrants B et C => corrlation positive
2) Donnes sont en majorit dans les quadrants A et D => corrlation ngative
3) Donnes sont partout => pas de corrlation
106
Corrlation de Bravais-Pearson
La correlation r de Pearson est une mesure
dassociation paramtrique pour deux variables
alatoires continues
2
2
) ( ) (
) )( (

y y x x
y y x x
r
i i
i i
xy
Avec
x
la moyenne de x et y la moyenne de y
107
Relation taille-poids
POIDS
100 90 80 70 60 50 40
T
A
I
L
L
E
200
190
180
170
160
150
140
Corrlations
1 .961**
. .000
24 24
.961** 1
.000 .
24 24
Corrlation de Pearson
Sig. (bilatrale)
N
Corrlation de Pearson
Sig. (bilatrale)
N
TAILLE
POIDS
TAILLE POIDS
La corrlation est significative au niveau 0.01
(bil l)
**.
108
Relation entre variables qualitatives
Deux variables qualitatives de types nominales :
tableau crois (ne sera pas trait dans le cours).
Deux variables qualitatives de types ordinales :
corrlation de rangs avec les coefficients de corrlation
rh de Spearman et tau de Kendall.
109
Corrlation rh de Spearman
Le rh de Spearman est une mesure dassociation non
paramtrique base sur le rang des valeurs des donnes.
Il peut tre utilis pour des donnes qualitatives et pour
des valeurs extrmes. Pour cela, remplacez les valeurs par
des rangs, cest--dire remplacez x
i
par R
i
et y
i
par S
i
110
Corrlation rh de Spearman
2
2
) ( ) (
) )( (

S S R R
S S R R
i i
i i

Avec R
i
est le rang de la i
me
valeur de x, S
i
est le rang de la i
me
valeur de x,
R
est la moyenne des valeurs R
i
et S est la moyenne des valeurs S
i
111
Corrlation tau de Kendall
Le tau de Kendall est une mesure dassociation non
paramtrique base sur le nombre de concordance et de non
concordance dans les pairs dobservations.
La concordance a lieu lorsque les pairs dobservations
varient ensemble et la discordance lorsque les pairs
dobservations varient de manire diffrente.
112
Corrlation tau de Kendall
On compte combien de segments sont orients vers le haut
et combien sont orients vers le bas :
113
Corrlation tau de Kendall : relation
Heures travailles
N
o
t
e
30 40 50 60 70 80
2
.
5
3
.
0
3
.
5
4
.
0
4
.
5
5
.
0
114
Corrlation tau de Kendall : pas de relation
Heures travailles
N
o
t
e
1 2 3 4
1
.
0
1
.
5
2
.
0
2
.
5
3
.
0
3
.
5
4
.
0
115
Corrlation tau de Kendall
) )( (
) ( ) sgn(
2 0 1 0
T T T T
y y sign x x
j i
j i j i

<

2 / ) 1 (
2 / ) 1 (
2 / ) 1 (
2
1
0


i i
i i
u u T
t t T
n n T
i
t est le nombre des valeurs lies x dans le i
me
groupe des valeurs lies x
i
u
est le nombre des valeurs lies y dans le i
me
groupe des valeurs lies y
n le nombre dobservations
sgn(z) est dfinit par:

<

>

0 if 1
0 if 0
0 if 1
) sgn(
z
z
z
z
116
Relation positive
Corrlations
1,000 ,514**
. ,000
482 482
,514** 1,000
,000 .
482 482
1,000 ,541**
. ,000
482 482
,541** 1,000
,000 .
482 482
Coefficient de corrlation
Sig. (bilatrale)
N
Coefficient de corrlation
Sig. (bilatrale)
N
Coefficient de corrlation
Sig. (bilatrale)
N
Coefficient de corrlation
Sig. (bilatrale)
N
exp02 Joie
exp08 Bonheur
exp02 Joie
exp08 Bonheur
Tau-B de Kendall
Rho de Spearman
exp02 Joie
exp08
Bonheur
La corrlation est significative au niveau 0,01 (bilatral).
**.
117
Relation ngative
Corrlations
1,000 -,169**
. ,000
480 478
-,169** 1,000
,000 .
478 480
1,000 -,196**
. ,000
480 478
-,196** 1,000
,000 .
478 480
Coefficient de corrlation
Sig. (bilatrale)
N
Coefficient de corrlation
Sig. (bilatrale)
N
Coefficient de corrlation
Sig. (bilatrale)
N
Coefficient de corrlation
Sig. (bilatrale)
N
ouv14 il est rare que
j'accorde beaucoup
d'importance aux
sentiments que je
ressens
ouv27 je trouve facile
de sentir de l'empathie
ouv14 il est rare que
j'accorde beaucoup
d'importance aux
sentiments que je
ressens
ouv27 je trouve facile
de sentir de l'empathie
Tau-B de Kendall
Rho de Spearman
ouv14 il est rare que
j'accorde beaucoup
d'importance aux
sentiments que je
ressens
ouv27 je
trouve facile
de sentir de
l'empathie
La corrlation est significative au niveau 0,01 (bilatral).
**.
118
Rgression linaire simple
Permet de mesurer la relation linaire entre deux
variables, tout comme la corrlation, mais elle donne une
direction la relation cest la VI qui explique, qui est la
cause de la variation de la VD.
Le but de cette mesure est de savoir (1) si cette relation
est prsente (2) quelle est sa force (quel pourcentage de
la variance de la VD, la VI peut expliquer) et (3) comment
utiliser ce rsultat pour pouvoir prdire la VD sur
dautres sujets pour lesquels on connat la valeur de la VI.
119
Rgression linaire simple
Ex : expliquer le revenu (la VD) par le nombre danne
dtude (la VI), cela signifie que nous cherchons
connatre le pourcentage de variance du revenu qui
peut tre expliqu par le fait davoir fait peu ou
beaucoup dtude.
120
Rgression linaire simple
Linarit de la relation : comme pour la corrlation, la
rgression mesure la relation linaire entre deux
variables continues.
121
Rgression linaire simple : R-deux ajust
R-deux ajust : pourcentage de variance explique par la
variable indpendante.
R-deux ajust entre 0 et 1
proche de 1 : la valeur VI prdit presque exactement
la valeur de la VD.
proche de 0 : la VI narrive pas prdire la VD.
122
0 20 40 60 80 100 120
Heures travailles
1
2
3
4
5
6
n
o
t
e
totale
rsiduelle
explique
totale=
variance(note)
123
Rgression linaire simple
Equation de la droite de rgression :
Y= a + B*X
Y : la variable dpendante (VD)
X : la variable indpendante (VI)
a : ordonne lorigine (intercept) de la droite de
rgression
B : pente (slope) de la droite de rgression
124
Exemple
Hypothse : Le nombre dheure de travail augmente la
note obtenue un examen. Ce qui signifie que le nombre
dheures passes travailler a un effet sur la note
obtenue. Il y a une direction sur leffet. Nous cherchons
limpact des heures de travail (la VI) sur la note (la VD).
Avant de pouvoir faire lanalyse, il faut vrifier quil y a
bien une relation linaire entre nos deux variables, ce qui
a dj t fait prcdemment.
125
1) La statistique infrencielle nous dirait si on peut
affirmer que la relation est significative (cours Stat
II).
2) Combien le nombre dheures de travail explique de
variance de la note ? R-deux ajust est de 82.3%
(0.823) dans notre exemple, ce qui trs lev. Les
heures de travail permettent dexpliquer presque
totalement la variance des notes obtenus.
Model Summary
.909
a
.827 .823 .49181 .827 181.846 1 38 .000
Model
1
R R Square
Adjusted
R Square
Std. Error of
the Estimate
R Square
Change F Change df1 df2 Sig. F Change
Change Statistics
Predictors: (Constant), heurestrav
a.
126
Le tableau ci-dessous permet dcrire lquation de rgression
qui exprime la relation linaire existant entre la VD et la VI :
Note = -27.090 + 21.750*nb dheure de travail
Coefficients
a
1.722 .186 9.249 .000
.038 .003 .909 13.485 .000
(Constant)
heurestrav
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig.
Dependent Variable: note
a.
Ce qui signifie que lorsquune personne travail une heure de
plus, elle augmente en moyenne sa note de 0.038 point. Donc
avec 13 de travail supplmentaire, on peut augmenter en
moyenne sa note dun demi point
127
AEDheurestrav
A
E
D
n
o
t
e
0 20 40 60 80 100 120
0
1
2
3
4
5
6
128
NATURE DES
DONNEES
QUALITATIVES QUANTITATIVES
ECHELLES NOMINALE ORDINALE INTERVALLE RAPPORT
1
V
A
R
INDICES DE
TENDANCE
(DE POSITION)
INDICES DE
VARIABILITE
(DE DISPERSION)
Mode(s) Mdian
Ecart interquartile
Moyenne arithmtique
Variance
Ecart-type
Coefficient de variation
2
V
A
R
INDICES
DASSOCIATION OU
DE DEPENDANCE
Coefficient rho
de Spearman
Coefficient tau de
Kendall
Coefficient r de Bravais-
Pearson
Analyse de rgression

1


Travaux Dirigs

et

Travaux Pratiques


2
Table des matires

TD1 : Dcouverte de SPSS ........................................................................................................ 4
Quest-ce que SPSS ?............................................................................................................. 4
Comment dmarrer SPSS....................................................................................................... 4
Lditeur de donnes .............................................................................................................. 5
Menu File : Ouvrir un fichier de donnes avec SPSS............................................................ 6
Menu File : Obtenir les informations sur les variables dans un format imprimable.............. 9
Menu File : Ouvrir et sauvegarder des fichier de donnes..................................................... 9
Informations compactes sur les variables dans un fichier de donnes................................... 9
Les diffrentes fentres de SPSS.......................................................................................... 10
Fentre de donnes (Data Editor)..................................................................................... 10
Fentre des rsultats (Output Editor) ............................................................................... 10
Fentre de syntaxe (Syntax Editor) .................................................................................. 10
Menu Graphs : refaire le graphe du cours ............................................................................ 11
Menu Help............................................................................................................................ 13
TD2 : Entrer les donnes partir du questionnaire.................................................................. 15
Entrer les donnes directement dans SPSS .......................................................................... 15
Encoder le questionnaire .................................................................................................. 15
Crer un nouveau fichier de donnes dans SPSS............................................................. 16
Comment coder les variables alphanumriques/srie de caractres ?.............................. 18
Comment coder les rponses rponses courtes ?........................................................... 18
Comment coder les rponses multiples ? ......................................................................... 18
Comment coder les rponses ouvertes ?........................................................................... 18
Comment coder les valeurs manquantes ? ....................................................................... 19
Conseil et remarques ........................................................................................................ 19
Rduire les erreurs en entrant les donnes ....................................................................... 19
Eliminer et insrer des observations/variables dans la vue de donnes ........................... 19
Fusionner des fichiers de donnes.................................................................................... 20
Ajouter des observations .............................................................................................. 20
Ajouter des variables.................................................................................................... 21
Utiliser Excel pour entrer les donnes dans SPSS ............................................................... 22
Crer une grille de donnes avec Excel............................................................................ 22
Importer les donnes dans SPSS...................................................................................... 22
Utiliser un fichier texte pour entrer les donnes dans SPSS ................................................ 23
Crer une grille de donnes avec un fichier texte ............................................................ 23
Importer les donnes dans SPSS...................................................................................... 23
Eliminer les erreurs de lentre de donnes.......................................................................... 24
TP2 : Entres les donnes partir du questionnaire................................................................. 25
Exercice 1: Entrer les donnes ............................................................................................. 25
Exercice 2: Fusionner les donnes et liminer les erreurs ................................................... 25
A. Fusionner les donnes ................................................................................................. 25
B. Eliminer les erreurs...................................................................................................... 25
TD3 : Prparation des donnes : Transformer les donnes ...................................................... 26
Transformer les donnes ...................................................................................................... 26
Recoder des variables....................................................................................................... 26
Construire des indicateurs ................................................................................................ 27
Transformer les donnes en utilisant la page de syntaxe ................................................. 28

3
TP3 : Prparation des donnes : Transformer les donnes....................................................... 29
Exercice 3: Crer de nouveaux indicateurs .......................................................................... 29
Exercice 4 : Recoder et crer de nouvelles variables ........................................................... 30
Exercice 5 : Ajouter des variables........................................................................................ 30
TD4 : Analyse des donnes : Reprsentations graphiques....................................................... 31
Frquences............................................................................................................................ 31
Graphiques pour les variables nominales et ordinales (montrant les frquences) ............... 32
Bar (btons): ..................................................................................................................... 32
Distribution des frquences d'une variable.................................................................. 32
Distribution des frquences d'une variable par sous-groupes..................................... 33
Pie (Camembert) .............................................................................................................. 34
Graphiques pour les variables mtriques ............................................................................. 34
Histogramme .................................................................................................................... 34
Modifier les caractristiques d'un graphique........................................................................ 35
Exporter des tableaux et des graphiques dans Word............................................................ 36
TP4 : Analyse des donnes : Reprsentations graphiques ....................................................... 36
Exercice 6 : Distributions des variables ............................................................................... 36
TD5 : Analyse des donnes : Mesures descriptives ................................................................. 37
Mesures descriptives ............................................................................................................ 37
Graphiques des mesures descriptives................................................................................... 38
Bar (btons) ...................................................................................................................... 38
Error bar ........................................................................................................................... 41
Boxplot ................................................................................................................................. 43
Modifier la prsentation des rsultats (Output Labels) ........................................................ 44
Slectionner des cas ............................................................................................................. 45
Comparer les groupes........................................................................................................... 45
TP5 : Analyse des donnes : Mesures descriptives.................................................................. 45
Exercice 7 : Distributions des variables ............................................................................... 45
Exercice 8 : Slectionner et comparer les groupes............................................................... 46
TD6 : Analyse des donnes : Corrlation et rgression ........................................................... 47
Corrlation de rang............................................................................................................... 47
Scatterplot............................................................................................................................. 47
Corrlation de Bravais-Pearson............................................................................................ 48
Rgression linaire simple ................................................................................................... 49
Syntaxe : ........................................................................................................................... 49
SPSS-Viewer (Rsultat) ................................................................................................... 49
TP6 : Analyse des donnes : Corrlation et rgression............................................................ 51
Exercice 9 corrlation de rang.............................................................................................. 51
Exercice 10 corrlation et rgression linaire simple........................................................... 51

4
TD1 : Dcouverte de SPSS

Quest-ce que SPSS ?
SPSS signifie Statistical Package for the Social Sciences . Son objectif est d'offrir un
logiciel permettant de raliser la totalit des analyses statistiques habituellement utilises en
sciences humaines. Cest un logiciel trs complet et dans ce cours, nous ne verrons qu'une trs
faible partie de ses possibilits. Il existe bien dautres logiciels comme S-Plus, R ou SAS qui
permettent datteindre les mmes buts, cest--dire faire des analyses statistiques.
Comment dmarrer SPSS
Allumer lordinateur (si cela est dj trop difficile, veuillez vous rfrer votre cours de
SFA !). Une fois lordinateur sous tension entrer votre nom dutilisateur et votre mot de passe.
Aller sous Dmarrer (en bas gauche de lcran), puis sous Programme , puis sous
SPSS for Windows et finalement sous SPSS 13.0 for Windows (cf. figure 1).


Figure 1

Lorsque SPSS dmarre, il ouvre une fentre principale qui ressemble un peu une feuille
Excel. Il ouvre devant cette grille, une bote de dialogue (Figure 2) permettant : douvrir un
jeu de donnes SPSS ou dans un autre format, de crer un nouveau jeu de donnes, etc. On
peut soit utiliser cette bote de dialogue, soit juste cliquer sur Cancel , car nous pouvons
faire exactement les mmes manipulations directement lintrieur de SPSS.

5

Figure 2

Lditeur de donnes
Une fois cette bote de dialogue ferme, nous voyons lditeur de donne. Lditeur de
donnes contient la grille (matrice) de donnes (vue des donnes = Data View ) et les
descriptions des variables (vue des variables = Variable View ).
6

Figure 3

Dans la partie suprieure de lditeur de donnes nous avons, comme dans Word et Excel, des
menus droulants :


Figure 4

File: (TP1)
Edit: (TP1)
View: (TP1)
Data: (TP1)
Transform: (TP3)
Analyze: (TP5 et TP6)
Graphs: (TP4)
Utilities: (TP1)
Window: (TP1)
Help: (TP1)
Menu File : Ouvrir un fichier de donnes avec SPSS

Pour ouvrir un fichier de donnes SPSS (extension .sav), nous allons utiliser les menus
droulant. Cliquer sur File , puis sur Open et finalement sur Data . L, vous
pouvez chercher votre fichier dans le rpertoire o vous lavez enregistr.

7

Figure 5

Une fois nos donnes ouvertes, nous pouvons explorer les deux affichages mentionns en
dessus : laffichage des donnes ( Data View ) et laffichage des variables ( Variable
View ) :

Affichage des donnes :
Chaque ligne reprsente un cas, par exemple un sujet (case)
Chaque colonne reprsente une variable (variable)
Chaque cellule contient une valeur dun cas sur une variable


Figure 6
8
Vue des variables :

Chaque ligne reprsente une variable
Les colonnes dcrivent les caractristiques des variables


Figure 7
Name: nom de la variable
le nom de la variable doit tre unique
max 8 caractres ( partir de la version SPSS 12, on peut utiliser plus de caractres :
max. 64 !)
dbutant par une lettre
les autres caractres peuvent tre une lettre, un chiffre, un point ou les symbols @ _ #
$ (tous les autres symbols sont interdits)
Le nom ne peut pas se terminer par un point
les espaces vides ne sont pas possibles
majuscules et minuscules ne sont pas diffrencis dans lappellation dune variable ou
dans celui dun fichier
les mots cl de SPSS ne peuvent pas tre utiliss (all, and, by, eq, ge, gt, le, lt, ne, not,
or, to, with)
Ne pas mettre de lettre accentue mme si cest possible

Type : nature de la variable (numrique, date, dollar, etc.)
par dfaut, SPSS considrera la variable de type numrique;
peut tre chang dans la bote de dialogue qui souvre en appuyant sur (symbole
qui apparat quand on slectionne la cellule)

Width : nombre de chiffres accords la donne (dcimaux inclus)

Decimals : nombre de dcimaux

9
Attention : Width et Decimals dfinissent le format des donnes dans la grille
de donnes la donne apparaissant dans une cellule peut diffrer de la donne
exacte (qui est utilis par SPSS pour les oprations de calcul et qui est visible
dans la cellule blanche au-dessous la barre doutils pour la cellule active )

Label : tiquette ou description de la variable
max. 256 caractres

Values : valeurs dfinies et leur description,
p.ex. 1 = Femme, 2 = Homme
peuvent tre dfinit dans la bote de dialogue qui souvre en cliquant sur - ce qui
apparat quand on choisit la cellule

Missing: attribution de certaines valeurs comme codes pour valeurs manquantes

Attention : none ne signifie pas quil ny a pas de valeurs manquantes dans
les donnes, a signifie quil ny a pas de valeurs manquantes dfinit par
lutilisateur. Par contre, il est possible davoir des valeurs system
missing (correspond aux cellules vides dans la grille de donnes).

Columns: largeur des colonnes dans la vue de donnes (en augmentant/diminuant le dfaut
8 , plus/moins de caractres de la colonne seront visibles dans la vue de donnes)

Align : Alignement des valeurs des variables dans les cellules de la grille de donnes (
droite, gauche, centres)

Measure : Description de lchelle de mesure (continue (scale), ordinal ou nominal)

Attention : na pas dinfluence sur le type danalyse quon peut effectuer avec
SPSS !!!

Menu File : Obtenir les informations sur les variables dans un format imprimable
Pour obtenir toutes les informations sur les variables dans un format imprimable, il faut
cliquer sur File | Display data file information | Working file. Les informations sont
transfres dans une nouvelle fentre (SPSS Viewer). Cette page des rsultats peut tre
sauvegarde et/ou imprime. Les lments peuvent tre copis et colls dans un document
gr par un autre logiciel (p.ex. Word). Le fichier des rsultats (Output Editor) porte
lextension .spo .

Menu File : Ouvrir et sauvegarder des fichier de donnes
Dans le menu File , on trouve toutes les commandes pour grer les fichiers SPSS (ouvrir,
sauvegarder, sauvegarder sous...) pareil aux autres logiciels Windows (p.ex. Word)

Informations compactes sur les variables dans un fichier de donnes
Menu Utilities: Dans le menu Utilities | Variables on peut consulter les caractristiques de
toutes les variables. Quand vous travaillez avec un fichier avec beaucoup de variables, cette
10
option a lavantage de trouver des variables en tapant les premires lettres du nom de la
variable. En appuyant sur le bouton Go to on arrive la variable cherche dans la vue de
donnes.

Menu Edit : en gnral, il est plus facile de trouver des variables dans les listes des botes-
dialogue quand elles sont affiches par leur nom (variable name) et pas par leur tiquette
(variable label). En plus, il est recommand de choisir le mme ordre que dans le fichier (au
lieu dun ordre alphabtique). Pour cela, il faut aller sous Edit | Options: General, Variable
list : Display names (au lieu de labels), File (au lieu de alphabetical).

Menu View : pour passer de la vue des donnes la vue des variables et vice versa, il faut
cliquer sur Variable View (respectivement Data View ) dans le coin infrieur gauche de la
grille des donnes ou via le menu View | Variable (respectivement Data)
Les diffrentes fentres de SPSS
Fentre de donnes (Data Editor)

Cette fentre permet d'entrer des donnes, de les modifier ou de les effacer. Il est rare que l'on
tape les donnes manuellement dans SPSS car il y a trop d'erreurs de saisie possibles (on
reviendra sur ce point dans le TP2). On va plutt ouvrir un fichier dj existant.
Fentre des rsultats (Output Editor)

Cette fentre apparat aprs quune commande danalyse a t effectue, et contient les
rsultats de cette analyse. Les rsultats apparaissent droite dans la fentre. A gauche, figure
une table des matires des rsultats gnrs par SPSS.

Les rsultats peuvent tre imprims tels quels (mais avec le risque de voir un tableau
simprimer sur plusieurs pages. Il est galement possible de copier les tableaux qui nous
intressent pour les coller ensuite dans Word, Excel ou dans un autre logiciel. Il est possible
de copier un tableau de deux manires. En cliquant sur le tableau en appuyant sur le bouton de
droite de la souris, SPSS vous propose de copier (copy) ou de copier lobjet (copy object).
Copier correspond copier les valeurs, mais lorsquil est coll il peut perdre son format (utile
pour copier les rsultats dans une feuille Excel par exemple). Copier les objets corresponds
copier les valeurs et le format du tableau : une fois coll, impossible de modifier les cellules
du tableau (utile pour copier les rsultats dans Word).

Parfois, le rsultat est trs long et SPSS n'en montre qu'une partie, suivi d'un triangle rouge.
Pour visualiser la suite, il faut double-cliquer sur le texte, puis tendre la taille de la zone de
texte vers le bas jusqu' ce que vous ne voyez plus de texte.
Fentre de syntaxe (Syntax Editor)

Jusqu maintenant, nous avons vu comment travailler avec les menus droulant. Il existe une
autre manire de lancer des analyse : passer par la fentre de syntaxe. Cette fentre permet
dcrire les commandes danalyses statistiques. Elle fonctionne comme un traitement de texte
simple.

11
Mais pourquoi samuser taper les analyses quand il suffit de faire dfiler des menus et
cliquer sur des icnes ? Parce que lorsquon veut refaire une analyse quon a dj effectue et
juste changer un paramtre, il suffit de reprendre la feuille de syntaxe de lanalyse prcdente,
changer un mot et renvoyer lanalyse. Sinon, il faudrait recommencer toute lanalyse de A
Z, vu quon ne peut pas enregistrer la squence de clics. De plus, les menus ne donnent pas
accs toutes les commandes SPSS. Finalement, cest aussi utile pour faire la mme analyse
sur plusieurs fichiers de donnes.

Ainsi, une fois la syntaxe faite pour une opration, il est facile denregistrer les commandes et
de les rutiliser pour diffrents fichiers de donnes.

Voici les rgles gnrales pour crire des commandes dans SPSS :

Chaque nouvelle commande se trouve en tte de ligne, prcde d'aucun espace.
Les options qui suivent une commande dbutent sur la ligne suivante et sont prcdes
d'au moins un espace et dune barre oblique ( / ).
Chaque commande doit ABSOLUMENT se terminer par un point.
Lorsquon spcifie un nom de fichier, il doit tre entre guillemets.
SPSS ne fait pas de diffrence entre les lettres majuscules et minuscules. Vous pouvez
taper les commandes autant dune manire ou de lautre.
De plus, entre les commandes, vous pouvez insrer des lignes vides. SPSS les ignore,
mais elles peuvent amliorer la lisibilit des commandes quand il y en a plusieurs dans
une fentre.

Pour excuter une commande, il faut slectionner la commande excuter puis choisir dans le
menu Run : Current ou encore Ctrl-R ou encore utiliser le bouton run (? ).

Vous pouvez enregistrer votre script pour le modifier plus tard (menu File | Save). Vous
pouvez aussi enregistrer la fentre de rsultats bien que trs souvent, il en rsulte un fichier
norme (que vous ne pourrez sauvegarder sur une disquette). Cependant, tant et aussi
longtemps que vous avec votre syntaxe et vos donnes, vous pouvez toujours excuter la
syntaxe nouveau pour revoir les rsultats.

Menu Graphs : refaire le graphe du cours
Le menu graphique permet de gnrer en quelques cliques de souris toute une panoplie de
graphiques. Nous reviendrons plus en dtail lors du TD 4.

Lors du cours, on vous a prsent les rsultats dune recherche mettant en avant (entre autre)
le lien entre la satisfaction des relations avec sa mre et la frquence des relations sexuelles
pour des adolescents noirs de quartiers dfavoriss de Philadelphie gs de 14 17 ans.

Le menu Graphs permet en quelque clique de souris de reproduire le graphique prsent en
cours pour cette exprience. Pour cela, allez chercher sur dokeos la base de donnes
Philadelphie.sav. Enregistrer l sur votre rpertoire h:\. Puis ouvrez SPSS par Dmarrer |
Programme | SPSS for Windows | SPSS 13.0 for Windows. Allez sous File | Open | Data.
Cherchez la base de donnes Philadelphie.sav qui se trouve dans votre rpertoire h. Une fois
la base de donnes ouvertes, allez sous Graphs.
12

Figure 8

Slectionnez Scatter/Dot| Simple Scatter. Dans Y Axis introduisez la variable de sexfreq
(frquence des relations sexuelles) et dans X Axis, satisf (la variable de la satisfaction de la
relation avec la mre). Cliquez sur Ok et vous obtenez le graphique suivant :


60.00 50.00 40.00 30.00 20.00 10.00 0.00
satisf
2.50
2.00
1.50
1.00
0.50
0.00
s
e
x
f
r
e
q

Figure 9
13
Menu Help
SPSS offre plusieurs niveaux daide (extrait tir de laide de SPSS pour Windows 13.0 en
franais):


Figure 10
L'aide apparat sous plusieurs formes :
Menu Aide : Le menu Aide de la plupart des fentres SPSS permet d'accder au systme
d'aide principal, ainsi qu'aux didacticiels et aux informations de rfrence technique.
Rubriques (Topics) : Les rubriques permettent d'accder aux onglets Sommaire,
Index et Rechercher, que vous pouvez utiliser pour chercher des rubriques d'aide
particulires.
Didacticiel (Tutorial) : Instructions illustres et dtailles tape par tape vous
expliquant comment utiliser de nombreuses fonctions de base de SPSS. Il n'est pas
ncessaire de visualiser le didacticiel du dbut la fin. Vous pouvez choisir les
rubriques visualiser, ignorer et visualiser des rubriques dans l'ordre de votre choix, et
utiliser l'index ou le sommaire pour rechercher des rubriques donnes.
Etudes de cas (Case Studies) : Exemples pratiques indiquant comment crer diffrents
types d'analyse statistique et comment interprter les rsultats. Les fichiers de donnes
d'exemple utiliss dans ces cas pratiques vous sont galement fournis afin que vous
puissiez voir exactement comment les rsultats ont t gnrs. Vous pouvez choisir
partir du sommaire les procdures sur lesquelles vous souhaitez obtenir des
informations ou rechercher des rubriques appropries dans l'index.
Assistant statistique (Statistics Coach) : Vous aide rechercher la procdure que vous
souhaitez utiliser. Une fois vos slections effectues, l'Assistant statistique ouvre la
bote de dialogue de la procdure statistique, de rapport ou de diagramme qui
correspond aux critres slectionns. L'Assistant statistique permet d'accder la
plupart des procdures statistiques et de rapport du systme de base, et de
nombreuses procdures de diagramme.
Command Syntax Reference : Vous trouverez des informations dtailles de rfrence
de syntaxe des commandes dans le manuel SPSS Command Syntax Reference,
accessible via le menu Aide.
14
Aide sensible au contexte : Plusieurs emplacements de l'interface utilisateur vous permettent
d'accder l'aide contextuelle.
Boutons Aide de bote de dialogue : La plupart des botes de dialogue disposent d'un
bouton Help qui vous conduit directement la rubrique d'aide relative la bote de
dialogue. La rubrique d'aide fournit des informations gnrales et propose des liens
vers les rubriques apparentes.
Aide du menu contextuel de la bote de dialogue : De nombreuses botes de dialogue
fournissent une aide contextuelle pour les commandes et les fonctions. Cliquez avec le
bouton droit sur n'importe quel contrle d'une bote de dialogue et slectionnez
Whats this ? dans le menu contextuel. Une description du contrle s'affiche alors,
ainsi que son mode d'utilisation. (Si Whats this ? n'apparat pas dans le menu
contextuel, ce type d'aide n'est pas disponible pour cette bote de dialogue.)
Aide du menu contextuel du tableau pivotant : Cliquez sur le bouton droit de la souris
sur les termes du tableau pivotant dans le Viewer et slectionnez Whats this ? dans le
menu contextuel afin d'afficher les dfinitions de ces termes.
Etudes de cas : Cliquez avec le bouton droit de la souris sur un tableau pivotant, puis
slectionnez Case Studies dans le menu contextuel pour accder directement un
exemple dtaill relatif la procdure qui a gnr ce tableau. (Si Case Studies
n'apparat pas dans le menu contextuel, ce type d'aide n'est pas disponible pour cette
procdure.)
Tableaux de syntaxe de commande : Dans une fentre de syntaxe de commande,
positionnez le curseur n'importe o dans un bloc de syntaxe de commande, puis
appuyez sur la touche F1. Vous voyez alors apparatre un tableau de syntaxe de
commande complet. (lAide franais de SPSS 13.0 pour Windows)

15
TD2 : Entrer les donnes partir du questionnaire

Il y a plusieurs manires d'entrer les donnes :

directement dans SPSS
dans Excel ; puis nous importons les donnes dans SPSS
dans un diteur de texte, puis nous importons les donnes dans SPSS (pas recommand,
sujet erreur!)
scannage des donnes : pour cela il est ncessaire davoir un hardware avec logiciel et
mise en page spcialiss
Entrer les donnes directement dans SPSS
Encoder le questionnaire

Il est recommand de rsumer les informations les plus importantes sur les variables
rassembles dans un tableau de codage . Ce tableau de codage deux utilits deux
moments bien prcis :

Pendant lentre des donnes : comme rgle de codage des valeurs des variables
Aprs lentre des donnes : comme description compacte du fichier des donnes

Le tableau de codage contient les informations suivantes:

Nom de la variable : les items qui appartiennent au mme questionnaire devraient
porter le mme radical dans leur nom (p.ex., exp1, exp2, exp3 pour un questionnaire
mesurant lexpressivit des motions)
Etiquette de la variable (variable label)
Etiquettes des valeurs (value labels) : Noubliez pas une variable didentification qui
tablit une relation entre les documents dun cas (p.ex. questionnaire, prlvements
physiologiques) et les donnes dans le fichier.
Numro didentification (ID variable): doit tre not sur les questionnaires, pour que
lon puisse facilement retrouver le document dun sujet afin de contrler ou corriger
des valeurs dans la base de donnes
Dans le cas dune recherche exprimentale, il faut en plus coder la condition
dans laquelle on a mesur les variables dpendantes: variable pour les
conditions exprimentales (p. ex. 1 = groupe exprimental, 2 = groupe de
contrle)

16
Tableau de codage pour notre questionnaire
Variable Variable label Value labels
id Numro didentification
exp1 exp12 Expressivit * 1 = jamais ou presque jamais
2 = parfois
3 = souvent
4 = presque toujours ou toujours
bf1 bf20 Big Five (adjectives) * 1 = pas du tout
5 = tout fait
ouv1-ouv30 Ouverture * 1 = pas du tout daccord
5 = tout fait daccord
loisirs1 loisirs8 Loisirs * 0 = na pas ce loisir
1 = a ce loisir
sexe Sexe 1 = Femme
2 = Homme
age Age
natio Nationalit 1 allemande 19 roumaine
2 corenne de sud 20 nerlandaise
3 mexicaine 21 indienne
4 slovaque 22 grecque
5 italienne 23 isralienne
6 taiwanaise 24 belge
7 finnoise 25 chinoise
8 russe 26 marocaine
9 franaise 27 autrichienne
10 polonaise 28 espagnole
11 tchque 29 bulgare
12 ukrainienne 30 bolivienne
13 moldavienne 31 lituanienne
14 usbekienne 32 palestinienne
15 turque 33 islandaise
16 Etats-Unis 34 britannique
17 luxembourgeoise 35 croate
18 hongroise 36 suisse
etude Domaine dtudes 1 mathmatique 10 conomie
2 psychologie 11 histoire
3 droit 12 architecture
4 langues 13 design
5 gologie 14 informatique
6 ducation 15 mdias
7 ingnierie 16 thologie
8 politique 17 philosophie
9 sociologie 18 ethnologie
code Code

* Pour une vue gnrale sur les variables qui sont mesures dans une tude, il suffit de donner le nom du
questionnaire dans le tableau de codage (p.e.x, Big Five pour les 20 items). Dans le fichier SPSS, on peut
entrer le contenu de chaque item dans Variable label (p.ex., bf1: amical , bf2: chaleureux ).
Crer un nouveau fichier de donnes dans SPSS

Lorsquon dmarre SPSS, une fentre What would you like to do ? apparat par
dfaut (cf. TD1). On slectionne Type in data et on obtient un diteur de donnes
vide.
17
Si on se trouve dj dans lditeur des donnes (p. ex., un autre fichier de donnes est
ouvert), il faut cliquer sur File | New | Data
Une fois lditeur de donnes ouvert, il faut dfinir les variables dans la vue des
variables (Variable View). Pour cela on va saider du tableau de codage quon a dj
cr partir de notre questionnaire.
On commence avec le nom de la premire variable. Pour passer la cellule suivante,
appuyez sur TAB ou .
Vous pouvez attribuer une ou toutes les caractristiques dune variable une ou
plusieurs autres variables !
Une caractristique : Copiez la cellule (en cliquant droit : Copy, ou en cliquant
sur le menu Edit | Copy) et collez une ou plusieurs autres cellules (en
cliquant droit : Past, ou en cliquant sur le menu Edit | Past)
Toutes les caractristiques dune variable : Copiez et collez toute la variable
(en cliquant sur le numro de la ligne, ce qui la grise)
La seule chose qui ne peut pas tre copie, cest le nom dune variable, parce que
chaque variable doit avoir un nom unique, comme mentionn prcdemment. Cest
pour a que SPSS nomme une variable nouvelles var00001 (que lon renomme aprs)
Pour crer plusieurs nouvelles variables avec le mme radical dans leur nom
(par exemple bf1, bf2, , bf20), il faut
Entrez la variable bf1 avec son type, son tiquette, etc. (vue : Data View)
Copiez cette variable.
Slectionnez la ligne du dessous de la variable et cliquez sur le bouton de
droite de la souris.
Slectionnez Copy variables .
Dans la bote de dialogue qui apparat entrez le nombre de nouvelles variables
crer ici 19 (20 variables big five moins une dj entre), leur radical (nom
des nouvelles variables : bf) et le numro de la premire variable qui suivra le
radical (2, car on a dj crer bf1).


Figure 11

18
Comment coder les variables alphanumriques/srie de caractres ?

Exemple : Code dun sujet (MAPRGE) dans des tudes longitudinales

Solution : entrez les caractres et dfinissez la variable comme chane de caractre (String)

Comment coder les rponses rponses courtes ?

Exemple :
Quelle est votre nationalit ? _______________

Solution : Codez les rponses ouvertes avec des valeurs numrique (1 = suisse, 2 = franaise,
etc.) en faisant une liste
Comment coder les rponses multiples ?

Exemple :
Quelles occupations/loisirs avez-vous rgulirement? (plusieurs rponses sont possibles)

q
Activits culturelles (expositions, concerts, lecture, universit 3
e
ge, etc.)

q
Activits physiques (natation, marche, club de sport, etc.)

q
Bricolage (tricot, jardinage, etc.)

q
Animal domestique

q
Instrument de musique

q
Internet, e-mail

q
Autre : _____________________________________________________

Solution :
Crez une variable pour chaque catgorie (p.ex, loisir1 loisir6), cod par
0 = na pas ce loisir, 1 = a ce loisir
Pour les rponses ouvertes ( autre : ), crez soit une variable alphanumrique
(Chane de caractre), p.ex. add_lois, soit une variable numrique en faisant une liste
des loisirs qui apparaissent
Comment coder les rponses ouvertes ?

Exemple :
Quest ce que ces loisirs vous apportent ?



Solution :
regrouper linformation en catgorie grce lanalyse de contenu. Technique que nous
ne verrons pas dans ce cours.
Donc, pour ce cours, nous laisserons de ct cette question du questionnaire.
19
Comment coder les valeurs manquantes ?

Ds quon a entr une donne, toutes les cellules des autres variables numriques de ce
cas sont dsigns par un point (= Sysmis , system defined missing) qui est
remplac quand on entre une valeur. Garder le point dans la cellule signifie que la
valeur pour cette cellule est manquante et ce type de donne manquante na pas tre
dfinie comme telle car elle est reconnue automatiquement par SPSS comme valeur
manquante.
Garder la cellule vierge pour les variables alphanumriques nest pas considr par
SPSS comme valeur manquante. Il faut la dfinir comme telle dans la vue des
variables. Pour cela, entrez un espace dans discret missing values .
Entrer un chiffre en dehors de ltendue de valeurs valables (p. ex. 9 ou 99). Il faut
dfinir ces valeurs dans la vue des variables. Pour cela, entrez un espace dans
discret missing values .
Conseil et remarques

Il est recommand dutiliser le pav numrique droite du clavier.
Quand on utilise la touche Entre pour confirmer une donne, la cellule au-dessous
devient active (= prochain cas)!

Rduire les erreurs en entrant les donnes

Entrez toujours les donnes brutes telles quelles sont. Par exemple, il ne faut pas
recoder la main un item (recodage ou transformation (cf TD3)).
Si vous avez un format de rponse bipolaire avec des valeurs positives et ngatives, il
est prfrable dutiliser un codage avec uniquement des valeurs positives. Mais il est
important davoir dfinit cela dans le tableau de codage du questionnaire.

Format de rponse: 0 + ++
sujet erreur: -2 -1 0 1 2
mieux: 1 2 3 4 5

Eliminer et insrer des observations/variables dans la vue de donnes

Eliminer un cas : slectionnez la ligne et appuyez sur Delete sur le clavier
Eliminer une variable : slectionnez la colonne et appuyez sur Delete sur le clavier
Insrer un cas entre deux autres cas : slectionnez la ligne au-dessus de laquelle vous
voulez insrer une observation et cliquez sur Data | Insert cases ou cliquez droit :
Inserte cases.
Insrer une variable entre deux autres variables : slectionnez la colonne avant celle o
vous voulez insrer une variable et cliquez sur Data | Insert variables ou cliquez
droit : Inserte Variables.
20
Fusionner des fichiers de donnes
Ajouter des observations

On a deux fichiers contenant des variables similaires, mais des observations diffrentes (par
exemple, saisie dune moiti des questionnaires par Paul et saisie de lautre moiti par Pierre
avec pour but davoir un et un seul fichier la fin). Pour cela il faut ouvrir le premier fichier,
cest--dire celui qui sera pour nous notre fichier de travail. A partir du menu, faites Data |
Merge files | Add cases : cherchez votre deuxime fichier.

La bote de dialogue qui apparat vrifie si les deux fichiers contiennent les mmes variables
(avec les mmes noms
1
). Par dfaut, toutes les variables de mme nom seront incluses
Si ce nest pas le cas, les variables non apparies se trouvent dans la section Unpaired
Variables .


Figure 12

Les variables qui apparaissent seulement dans un fichier de donnes peuvent quand mme tre
ajoutes en appuyant sur (les cas de lautre fichier qui nont pas de valeurs ces variables
reoivent des valeurs manquantes = Sysmis)

Sil y a des variables dans les deux fichiers qui mesurent la mme chose mais qui ne portent
pas le mme nom (p.ex. par erreur), on peut les apparier. Pour faire cela, il faut slectionner
les deux variables (on slectionne la deuxime variable en pressant sur la touche CTRL), puis
appuyer sur Paired , on obtient ainsi dans Variables in new working data file , une
nouvelle variable qui se nomme var1 & var2 (dans le fichier fusionn, la variable portera le
nom du premier fichier (le fichier de travail)).


1
Attention, il est important que le nom des variables, ainsi que le type, ltiquette et les valeurs et les donnes
manquantes soient dfinis exactement de la mme manire dans les deux fichiers, sinon SPSS dfinira une
variable avec mme nom comme Unpaired variables (fentre de gauche) toujours vrifier que les
variables communes aux deux fichiers qui nous intressent se trouvent bien dans Variables in new working
data file .
21
Une fois toutes les variables qui nous intressent slectionnes, il faut cliquer sur ok, ce qui
ajoute les observations du deuxime fichier au premier. On a maintenant un nouveau fichier
de donnes. Si nous sauvons ce fichier en faisant File | Save, cela va craser le premier
fichier. Ce quil faut faire cest File | Save as et on obtient ainsi une nouvelle base de
donnes, diffrentes des deux initialement utilises pour sa cration.
Ajouter des variables

Si on a deux fichiers contenant les mmes sujets, mais avec des variables diffrentes (par
exemple, deux expriences diffrentes avec le mme groupe de sujets avec pour but davoir
des informations supplmentaires sur nos sujets venant de lautre exprience). Pour cela il
faut ouvrir le premier fichier, cest--dire celui qui sera pour nous notre fichier de travail. A
partir du menu, faites Data | Merge files | Add variables : cherchez votre deuxime fichier.

Pour pouvoir effectuer cette manipulation, il faut imprativement avoir une variable cl
pour identifier les diffrentes observations (p. ex. par un code) et pouvoir fusionner les
donnes. Les valeurs de cette variable cl doivent tre identiques (p.ex. une variable
alphanumrique doit tre entre de la mme faon par rapport aux majuscules/minuscules et
nombre de caractres attention aux espaces aprs les derniers caractres !)
Triez les observations selon la variable cl dans tous les fichiers quon veut fusionner :
Data | Sort cases.
Ouvrez le premier fichier et faites Data | Merge files | Add variables: choisissez le
deuxime fichier
Dans la bote de dialogue qui apparat, cochez Match cases on key variables in
sorted files - Les deux fichiers fournissent des observations . Il faut slectionner
la variable cl (key variable) dappariement dans la section de gauche et appuyer sur
.

Figure 13

Une fois toutes les variables qui nous intressent slectionnes, il faut cliquer sur ok, ce qui
ajoute les variables du deuxime fichier slectionnes au premier. On a maintenant un
nouveau fichier de donnes. Si nous sauvons ce fichier en faisant File | Save, cela va craser
le premier fichier. Il est beaucoup plus prudent de slectionner File | Save as ... On obtient
ainsi une nouvelle base de donnes, diffrentes des deux initialement utilises pour sa
cration.
22
Utiliser Excel pour entrer les donnes dans SPSS
Crer une grille de donnes avec Excel
Tapez les noms des variables (pas les tiquettes) dans la premire ligne
Les lignes au-dessous des noms reprsentent les observations (une observation (cas ou
individu) par ligne).
Sauvegardez les donnes (File | Save as ) comme classeur Excel (extension .xls)
Importer les donnes dans SPSS
Ouvrir SPSS
Cliquez sur File | Open a database | New query
Slectionnez Fichiers Excel , cliquez sur suivant

Figure 14
Slectionnez la ou les feuilles Excel o se trouvent les donnes dont vous avez besoin
en faisant glisser les feuilles ou les variables dans les feuilles qui nous intressent dans
la fentre de gauche vers la fentre de droite. Puis cliquez sur suivant.

Figure 15
23
Dfinir les variables : type des variables, tiquettes, valeurs, etc.


Figure 16

Terminer et Sauvegardez les donnes (File | Save as) comme fichier SPSS
(extension .sav).
Utiliser un fichier texte pour entrer les donnes dans SPSS
Crer une grille de donnes avec un fichier texte
Ouvrir un fichier texte (p.ex. notepad)
Tapez les noms des variables dans la premire ligne que vous sparer soit par un
point-virgule (ou autre sparateur comme tab)
Les lignes au-dessous des noms reprsentent les observations (une observation (cas ou
individu) par ligne) et chaque valeur de la ligne doit tre spar par un sparateur
(toujours utiliser le mme sparateur).
Sauvegardez les donnes (File | Save as) comme classeur texte (extension .txt)
Importer les donnes dans SPSS
Ouvrir SPSS
Cliquez sur File | Read text data
Spcifiez larrangement de vos variables : types de sparateur, est-ce que chaque ligne
correspond un cas, est-ce que le fichier contient le nom des variables sur la premire
ligne, etc.
Terminer et Sauvegardez les donnes (File | Save as) comme fichier SPSS
(extension .sav).
24
Eliminer les erreurs de lentre de donnes
Deux types derreurs possibles : a) la valeur fausse est une valeur dans ltendue des valeurs
valables ou b) la valeur fausse est une valeur dehors de ltendue des valeurs valables.

On peut reprer les erreurs du type (a) quen comparant les donnes vraies avec les donnes
entres. Mais cela est trs coteux, do limportance dtre trs minutieux en entrant les
donnes ! Donc seules les erreurs de type (b) peuvent tre repres et limines aprs lentre
des donnes.

Pour cela, il faut inspecter les valeurs minimales et maximales de toutes les variables en
passant par Analyze | Descriptive Statistics | Frequencies. Il faut slectionner toutes les
variables numriques (en utilisant la souris ou les touches SHIFT et ) et ajoutez-les dans la
section droite , puis cliquez dans Statistics , choisissez Minimum et Maximum


Figure 17

Dans la page des rsultats, le tableau frequencies peut tre pivot en double-cliquant sur
le tableau et cliquant sur le menu Pivot | Transpose rows and columns ce qui rend le tableau
plus facile lire.

Sil y a des valeurs dehors de ltendue valable :

Vrifier combien de valeurs sont fausses : pour chaque variable ayant un minimum
trop petit ou un maximum trop grand. Pour cela, il faut inspecter les tableaux de
frquences pour les variables ayant des valeurs errones et noter le nombre de ces
valeurs et leurs valeurs numriques.
Corriger les valeurs fausses dans la vue des donnes : pour cela il faut trouver la
variable p. ex. laide du menu Utilities | Variables go to et la slectionner.
Puis allez dans Edit | Find et entrez la valeur fausse que vous cherchez et cliquez sur
Find next . Activez la cellule. Ensuite, cliquez sur le menu Utilities | Variables,
25
choisissez la variable didentification et cliquez sur Go to : la cellule montre le
numro du cas cherch.
Vrifiez la valeur correcte dans les documents (p. ex., questionnaire) de ce cas et
corrigez-la dans la base de donnes
Attention: Aprs avoir trouv la cellule avec une valeur fausse, il semble peut-
tre plus facile de noter le numro de la ligne dans la grille de donnes (au lieu
daller via le menu). Mais le numro de la ligne ne doit pas tre identique avec
le numro didentification du cas !!! (p. ex. si le fichier a t tri par une autre
variable ou si la variable didentification a des valeurs manquantes)
TP2 : Entres les donnes partir du questionnaire

Exercice 1: Entrer les donnes
Prparez l'entre des donnes en dfinissant les variables dans la vue des variables.

Vous avez en votre possession 2 exemplaires du questionnaire remplis. Entrez ces donnes
dans la vue des donnes.

Crez un classeur exercices dans votre domaine (h:\) et enregistrez-y le fichier sous le
nom exercice1.sav .

Envoyez par mail le fichier exercice1.sav katia.iglesias@pse.unige.ch au plus tard une
semaine aprs la date du TD2 afin de pouvoir prparer la base de donnes qui servira de
support lors des TD suivants et des TP.

Exercice 2: Fusionner les donnes et liminer les erreurs
A. Fusionner les donnes

Deux tudiants ont entr ensemble des donnes dune tude chacun a entr environ la moiti
des questionnaires. Les donnes se trouvent dans deux fichiers qui se trouvent sur dokeos.
Fusionnez-les.

Ouvrez le premier fichier
questionnaire-donnes avec erreurs-1.sav
ajoutez les cases (sujets) du deuxime fichier
questionnaire-donnes avec erreurs-2.sav

Enregistrez le fichier fusionn sous le nom exercice2a.sav dans le classeur exercices
sur votre domaine (h:\)
B. Eliminer les erreurs

Vrifiez si les tudiants ont entr les donnes sans erreurs.
Utilisez le fichier exercice2.sav que vous venez de crer.
En utilisant Analyze | Descriptive statistics | Frequencies trouvez les valeurs fausses.
Notez le nom de la variable et le numro d'identification du sujet pour chaque erreur.

Corrigez les erreurs* et sauvegardez le fichier sous le nom exercice2b.sav dans votre
domaine (h:\).
26
TD3 : Prparation des donnes : Transformer les donnes
Transformer les donnes
Avant deffectuer des analyses statistiques, il est souvent ncessaire de modifier les donnes
brutes :
recoder des items (regrouper des catgories, inverser le sens de lchelle, etc.),
construire des indicateurs (calculer des scores dchelles, des sous chelles, centrer et
rduire un variable, etc.).

Quelques conseils au moment deffectuer des transformations de donnes :

Aprs avoir limin les erreurs, gardez toujours un fichier des donnes brutes.
Avant deffectuer des modifications, sauvegardez les donnes sous un autre nom pour
conserver le fichier original!
Toutes les variables initiales restent dans le fichier. Les variables recodes obtiennent
un nouveau nom.
Recoder des variables

Pour recoder une variable que ce soit pour regrouper des catgories ou inverser le sens de
lchelle, il faut passer par Transform | Recode | into different variables. Il faut viter
dutiliser Recode | into same variables, parce que cette option craserait votre variable
initiale.

Exemple: dans la bote de dialogue Transform | Recode | into different variables,
choisissez une (ou plusieurs) variables . Ici on choisit ouv02.


Figure 18
27
Dans Output variable, on peut choisir le nouveau nom de la variable, ainsi que ltiquette de
la variable. Puis on slectionne change pour que SPSS puisse faire le lien entre lancienne
et la nouvelle variable (ouv02 ouv02r). Puis on slectionne Old and new values . Une
nouvelle bote de dialogue souvre o lon peut prciser l'ancienne valeur gauche et la
nouvelle valeur droite. A chaque changement de valeur, il faut appuyer sur Add .

Lorsquil y a des valeurs manquantes dans notre variable initiale, si rien nest spcifi, alors
SPSS attribuera galement des valeurs manquantes (sysmis) la nouvelle variable.

Lorsque dans un questionnaire plusieurs variables dune chelle sont codes dans le sens
inverse des autres (par exemple ouv02 est un lment de lchelle de mesure de louverture,
avec 1 pas du tout ouvert 5 tout fait ouvert, mais ouv02 (je suis bien install dans mes
habitudes) va de 1 tout fait ouvert 5 pas du tout ouvert), il est possible de recoder toutes les
variables dont lchelle est inverse pour une mme dimension en une seule fois.
Construire des indicateurs

Pour construire une nouvelle variable partir de plusieurs variables de dpart, il faut passer
par Transform | Compute. Une manire usuelle pour agrger diffrente variable, cest
dutiliser la moyenne ou la somme des diffrentes variables initiales. Pour construire la sous-
chelle dexpression de joie, nous allons utiliser la moyenne des deux lments qui composent
cette sous chelle : exp02 (joie) et exp08 (bonheur).


Figure 19

Pour cela, on va sous Transform | Compute. On obtient la bote de dialogue ci-dessus. On
dfinit le nom de la nouvelle variable ( target variable ), ainsi que le type, ltiquette et les
valeurs en cliquant en haut gauche sous le nom de la variable. En haut droite sous
numeric expression on dfinit la transformation des variables initiales quon souhaite
effectuer, ici une moyenne. Les transformations qui peuvent tre effectues sont dfinies en
28
bas droite dans functions and special variables . En cliquant sur une des fonctions, on
obtient au centre de la bote de dialogue une explication de ce que fait lopration choisie et
comment rentrer les variables initiales (qui se trouvent gauche dans la bote).

Au lieu de mettre dans numerique expression : MEAN(exp02,exp08), il est possible de
calculer la moyenne des items seulement pour les personnes qui ont une valeur valable (non
manquante) sur au moins g de ces items (sinon, la nouvelle valeur sera manquante). Pour
cela il faut spcifier le nombre de valeurs valables aprs lexpression MEAN :
MEAN.g(exp02,exp08). Par exemple, MEAN.2(exp02,exp08) ne fait la moyenne que sil ny
a pas de valeur manquante. N.B. : Il est recommand davoir au moins 80% de valeurs
valables pour calculer le score (la moyenne) dun chelle. Si on choisit MEAN(exp02,exp08),
cela correspond MEAN.1(exp02,exp08), c'est--dire quon fait la moyenne au moins une
variable (mais pas forcment plus).

Attention: On pourrait aussi calculer la somme de tous les items dune chelle (Sum).
Cependant, il nest pas vident comment grer les valeurs manquantes en crant la somme des
items si on enlve tous les cas avec les valeurs manquantes on risque de fortement diminuer
lchantillon. Le remplacement des valeurs manquantes par la moyenne de lchantillon est
aussi problmatique! Cest pour cela que calculer la moyenne est recommand.
Transformer les donnes en utilisant la page de syntaxe

Dans la bote de dialogue dun menu Transform | ... appuyez sur le bouton Paste
au lieu de Ok . La commande excute sinscrira sur la page de syntaxe.
La syntaxe est un fichier de texte qui peut tre sauvegard (extension .sps) et imprim.
Les commandes peuvent tre copies, colles et changes.
On peut ajouter du texte commentaire qui doit tre prcd dun astrisque et suivi par
un point.
Pour excuter les commandes, on la slectionne et on envoie la syntaxe en appuyant
sur le bouton .

Figure 20
29

Pourquoi travailler avec la page de syntaxe (cf TD1) :

Transparence: Les commandes peuvent tre sauvegardes, imprimes, et contrles.
Les commandes enregistres peuvent tre rutilises dans les sances de travail
ultrieures.
Les rgles les plus importantes suivre:
Une commande se compose de son nom (p. ex. recode) et de ses spcifications (p. ex.
noms des variables, rgle de recodage).
Chaque commande doit dbuter sur une nouvelle ligne et se terminer par un point.
Il ny a pas de lignes vides lintrieur dune commande.

Rgles de transformation pour notre questionnaire:

Variable Variable label Items recoder Echelles
exp01
exp12
Expressivit - Amour (exp_amo) : exp01, exp07
Joie (exp_joi): exp02, exp08
Peur (exp_peu) : exp03, exp09
Colre (exp_col) : exp04, exp10
Tristesse (exp_tri) : exp06, exp12
Honte (exp_hon) : exp05, exp11
bf01
bf20
Big Five - Extraversion (bf_ext): bf01, bf06, bf13, bf16
Agrabilit (bf_agr): bf02, bf08, bf15, bf17
Conscience (bf_con): bf03, bf07, bf11, bf20
Nvrosisme (bf_nev): bf04, bf10, bf12, bf19
Intelligence (bf_int) : bf05, bf09, bf14, bf18
ouv01
ouv30
Ouverture
ouv02, ouv03, ouv04,
ouv06, ouv07, ouv09,
ouv11, ouv12, ouv14,
ouv16, ouv18, ouv20,
ouv21, ouv22, ouv24,
ouv25, ouv28, ouv30,

Ouverture aux rveries (ouv-rev) : ouv01, ouv04, ouv11, ouv17, ouv22
Ouverture l-esthtique (ouv-est): ouv05, ouv07, ouv13, ouv18, ouv23
Ouverture aux sentiments (ouv-sen): ouv08, ouv14, ouv19, ouv24, ouv27
Ouverture aux actions (ouv-act): ouv02, ouv09, ouv15, ouv20, ouv28
Ouverture aux ides (ouv-ide): ouv06, ouv10, ouv16, ouv25, ouv29
Ouverture aux valeurs (ouv-val): ouv03, ouv12, ouv21, ouv26, ouv30
TP3 : Prparation des donnes : Transformer les donnes

Exercice 3: Crer de nouveaux indicateurs
Crez des scores dchelles reprsentant les dimensions de lexpressivit des motions et les
dimensions des Big Five :

Amour (exp_amo) : moyenne de exp01, exp07
Joie (exp_joi): moyenne de exp02, exp08
Peur (exp_peu) : moyenne de exp03, exp09
Colre (exp_col) : moyenne de exp04, exp10
Tristesse (exp_tri) : moyenne de exp06, exp12
Honte (exp_hon) : moyenne de exp05, exp11
Extraversion (bf_ext): moyenne de bf01, bf06, bf13, bf16
Agrabilit (bf_agr): moyenne de bf02, bf08, bf15, bf17
Conscience (bf_con): moyenne de bf03, bf07, bf11, bf20
Nvrosisme (bf_nev): moyenne de bf04, bf10, bf12, bf19
Intelligence (bf_int) : moyenne de bf05, bf09, bf14, bf18

Dmarche :

Ouvrez le fichier data.sav
30
Utilisez le menu Transform | Compute pour la premire variable, entrez toutes les
informations ncessaires (nom, label/tiquette, formule) et appuyez sur paste (au lieu
de ok) pour transmettre la commande la syntaxe.
Dans la syntaxe, copiez, collez et adaptez la commande pour calculer les autres scores
dchelles.
Acceptez au maximum 20% de donnes manquantes.

Excuter les commandes. Sauvegardez la syntaxe sous le nom exercice3.sps et les
donnes sous le nom exercice3.sav dans votre domaine (h:\).

Exercice 4 : Recoder et crer de nouvelles variables
Louverture aux motions est constitue de 6 dimensions. Pour chacune de ces dimensions
certaines variables sont mesures avec une chelle positive (mesure de louverture) et dautres
sont mesures avec une chelle ngative (mesure de la fermeture). Avant de pouvoir
construire nos nouveaux indicateurs douverture, il faut dans dabord faire en sorte que toutes
les variables mesures louverture.

Variables avec chelle ngative Les 6 dimensions douverture construire

ouv02, ouv03, ouv04, ouv06, ouv07, ouv09,
ouv11, ouv12, ouv14, ouv16, ouv18, ouv20,
ouv21, ouv22, ouv24, ouv25, ouv28, ouv30,

Ouverture aux rveries (ouv-rev) : moyenne de ouv01, ouv04, ouv11, ouv17, ouv22
Ouverture l-esthtique (ouv-est): moyenne de ouv05, ouv07, ouv13, ouv18, ouv23
Ouverture aux sentiments (ouv-sen): moyenne de ouv08, ouv14, ouv19, ouv24, ouv27
Ouverture aux actions (ouv-act): moyenne de ouv02, ouv09, ouv15, ouv20, ouv28
Ouverture aux ides (ouv-ide): moyenne de ouv06, ouv10, ouv16, ouv25, ouv29
Ouverture aux valeurs (ouv-val): moyenne de ouv03, ouv12, ouv21, ouv26, ouv30

Dmarche :

Ouvrez le fichier data.sav
Recode : Utilisez le menu Transform Recode into different variable pour la premire
variable, entrez toutes les informations ncessaires (nom, label/tiquette, formule) et
appuyez sur paste (au lieu de ok) pour transmettre la commande la syntaxe.
Dans la syntaxe, copiez, collez et adaptez la commande pour recoder les autres
variables
Construction des indicateurs : Utilisez le menu Transform Compute pour la premire
variable, entrez toutes les informations ncessaires (nom, label/tiquette, formule) et
appuyez sur paste (au lieu de ok) pour transmettre la commande la syntaxe.
Dans la syntaxe, copiez, collez et adaptez la commande pour calculer les autres scores
dchelles.
Acceptez au maximum 20% de donnes manquantes.

Excuter les commandes. Sauvegardez la syntaxe sous le nom exercice4.sps et les
donnes sous le nom exercice4.sav dans votre domaine (h:\).

Exercice 5 : Ajouter des variables
Ajouter au fichier de donnes exercice3.sav les nouvelles variables construites. Pour cela,
ouvrir exercice3.sav, ajoutez les nouveaux indicateurs qui se trouvent dans exercice4.sav.
Enregistrez le fichier fusionn sous le nom exercice5.sav dans le classeur exercices sur
votre domaine (h:\)
31
TD4 : Analyse des donnes : Reprsentations graphiques

Frquences
Pour obtenir un tableau de frquences, on utilise le menu: Analyze | Descriptive Statistics |
Frequencies.


Figure 21

Choisir une ou plusieurs variables

Joie
1 .2 .2 .2
25 5.2 5.2 5.4
196 40.7 40.7 46.1
260 53.9 53.9 100.0
482 100.0 100.0
jamais ou
presque jamais
parfois
souvent
presque toujours
ou toujours
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent

Figure 22

32
Graphiques pour les variables nominales et ordinales (montrant les frquences)
Bar (btons):
Distribution des frquences d'une variable

Prsentation graphique de la distribution des frquences d'une variable dans tout l'chantillon
Graphs | Bar: Choisir Simple et Summaries for groups of cases


Figure 23

Sous Bars represent , on peut choisir : N of cases (frquences absolues), % of cases
(frquences relatives), Cum. N (effectif cumul), Cum. % (pourcentage cumul) ou un autre
type de statistique (que nous verrons dans le TD5)

Sous Category axes , il faut entrer la variable pour laquelle on veut obtenir les frquences.



33
Homme Femme
Sexe
300
200
100
0
C
o
u
n
t

Figure 24
Distribution des frquences d'une variable par sous-groupes

Pour comparer la distribution des frquences d'une variable dans les sous-groupes, passez par
Graphs | Bar, choisir Clustered et Summaries for groups of cases . Pour Bars
represent choisir N of cases (frquences absolues) ou % of cases (frquences relatives).
Dans category axes entrer la variable pour laquelle on veut obtenir les frquences et dans
Define Clusters by la variable de groupement pour laquelle on veut obtenir des diffrents
btons.
presque toujours
ou toujours
souvent parfois jamais ou
presque jamais
Bonheur
60.0%
50.0%
40.0%
30.0%
20.0%
10.0%
0.0%
P
e
r
c
e
n
t
Homme
Femme
Sexe

Figure 25

34
Pie (Camembert)

Prsentation graphique de la distribution des frquences d'une variable dans tout l'chantillon,
on passe par Graphs | Pie: Summaries for groups of cases , dans Slices represent on
peut choisir N of cases (frquences absolues) ou % of cases (frquences relatives). Dans
Define Slices by on entre la variable qui nous intresse ici : je suis travailleur/se

tout fait
4
3
2
pas du tout
travailleur (se)

Figure 26

Graphiques pour les variables mtriques
Histogramme

Pour prsenter la distribution des frquences d'une variable mtrique dans tout l'chantillon,
on peut faire un histogramme, pour cela, allez sous Graphs | Histogram, entrez la variable
pour laquelle vous voulez obtenir les frquences dans Variable , par exemple : ouv _sen.

1,50 2,00 2,50 3,00 3,50 4,00 4,50
Ouverture aux sentiments
0
20
40
60
80
F
r

q
u
e
n
c
e
Mean = 3,1378
Std. Dev. = 0,48288
N = 482

Figure 27
35
Modifier les caractristiques d'un graphique
Pour pouvoir modifier un graphique, il faut commencer par double-cliquer dessus. Dans
l'diteur des graphiques (chart editor) qui s'ouvre on peut modifier diffrents paramtres :

les proprits (p.ex. taille, couleurs, motifs) des diffrents lments d'un graphique
(p.ex. titre, axes, btons) en double-cliquant sur llment (aprs choisir longlet
pertinent, p.ex. Fill and Border pour changer les couleurs) ;
le texte (p.ex. d'un titre ou dune catgorie) en grisant l'lment (cliquer une fois) et -
aprs une petite pause - en cliquant une 2
e
fois dessus (double-cliquer va ouvrir la
bote-dialogue pour changer le proprits !).

Par exemple pour changer l'chelle de l'axe des ordonnes, il faut, aprs avoir double-cliquer
sur le graphique, double-cliquer sur l'axe. Dans la bote-dialogue, choisissez longlet
scale . Cliquer sur minimum ou maximum (colonne auto ) et remplacez les valeurs
dans la colonne custom . En cliquant sur major increment , on peut changer les
intervalles. Et pour transposer les axes, on peut passer par Menu Chart | Transpose Chart



Figure 28
36
Exporter des tableaux et des graphiques dans Word
Pour exporter un tableau ou un graphique, slectionner dans le SPSS-Viewer le tableau et
cliquez sur le bouton droit de la souris. Slectionnez Copy et les rsultats seront colls
dans un tableau Word qui peut tre modifi ou Copy objects et les rsultats seront colls
dans le format du tableau SPSS, ce dernier ne pourra plus tre modifi dans Word. Dans
Word, cliquez sur le bouton droit de la souris et slectionnez coller.

La taille du graphique peut tre modifie en tranant un coin du cadre du graphique. Parfois, le
graphique nest pas bien reproduit dans Word dans ce cas, il faut sauvegarder le graphique
comme un fichier et linsrer aprs dans Word. Dans le SPSS Viewer, cliquez droit sur le
graphique, slectionnez export . Dans la bote-dialogue, option export , choisir
charts only . Pour File Type choisissez Enhanced Metafile *.EMF . En cliquant
sur Browse , choisissez lendroit o vous voulez sauvegarder le fichier et son nom. Dans
Word : menu Insertion | Image | a partir du fichier. Si le graphique est de nouveau mal
reproduit, faire la mme opration, mais Pour File Type choisir JPEG File *.JPG .
Ce type de format est trs universelle, cependant la dfinition (en points par pouce) du
graphique ne sera pas trs bonne et typiquement pas acceptable pour une publication (cf.
manuel de lAPA).

TP4 : Analyse des donnes : Reprsentations graphiques

Exercice 6 : Distributions des variables
Ouvrez le fichier data1.sav

Analysez les frquences des 4 items mesurant le nvrosisme (bf4, bf10, bf12, bf19).
Pour chaque item, crez des tableaux de frquences. Modifiez les tableaux de sorte
que le nombre de dcimales soit gal 2.
Pour chaque item, crez un graphique en btons reprsentant les pourcentages de
personnes.
Crez des histogrammes pour les 6 indicateurs construits au TP3 mesurant louverture.

Sauvegardez tous les rsultats ( output ) sous le nom exercice6.spo dans votre domaine
(h:\).

37
TD5 : Analyse des donnes : Mesures descriptives

Mesures descriptives
Pour obtenir des informations (en forme de tableaux ou graphiques) sur la distribution d'une
variable (frquences, tendance (mode, mdiane, moyenne), dispersion (variance, empan,
intervalle interquartile)), on utilise le menu: Analyze | Descriptive Statistics | Frequencies


Figure 29

Choisir une ou plusieurs variables
Display frequency tables: tableaux de distribution de frquences; il est coch par
dfaut (peut tre enlev si on souhaite seulement des statistiques et/ou des graphiques)
Statistics: percentiles/quartiles, coefficients de tendance centrale [mean = moyenne,
median = mdiane, mode = mode], de dispersion [standard deviation = cart-type,
variance = variance, range = tendue/empan, Min = minimum, Max = maximum, SE
mean = erreur standard de la moyenne] et de distribution [skewness = coefficients
dasymtrie, kurtosis = coefficient daplatissement]

Attention le choix des statistiques dpend de l'chelle de mesure, mais SPSS calcule tous les
coefficients pour toutes les variables choisies - mme si a n'a pas de sens!

Charts: graphiques on a le choix entre diagramme en btons (bar charts) pour les
variables nominales ou ordinales, diagramme circulaire / camembert (pie charts) pour
les variables nominales ou ordinales et histogramme (histogram) pour les variables
mtriques.

38

Figure 30

Format: Ici, on peut choisir dans quel ordre les catgories de la variable seront
affiches (order by; default = ascending values) et la forme de prsentation des
coefficients de plusieurs variables (compare variables = tous les rsultats dans un
tableau, organize output by variables = tableaux spars pour les diffrentes
variables).


Figure 31

Graphiques des mesures descriptives
Bar (btons)

Prsentation graphique de la moyenne d'une variable mtrique dans diffrents sous-groupes,
pour cela cliquez sur Graphs | Bar, choisissez Simple et Summaries for groups of
cases . Dans Bars represent, choisissez Other summary function variable pour laquelle
on veut obtenir les moyennes, MEAN(ouv_sen) apparat. Dans Category axes , entrez la
variable de groupement, par exemple sexe.

39

Figure 32
Femme Homme
Sexe
0,00
1,00
2,00
3,00
4,00
5,00
M
o
y
e
n
n
e

O
u
v
e
r
t
u
r
e

a
u
x

s
e
n
t
i
m
e
n
t
s

Figure 33

Prsentation graphique de la moyenne de plusieurs variables mtriques dans tout l'chantillon,
pour cela cliquez sur Graphs | Bar, choisissez Simple et Summaries of separate
variables . Dans Bars represent, entrez les variables pour lesquelles vous voulez obtenir les
40
moyennes; MEAN(var) apparat pour chaque variable, comme par exemple la mean pour les 6
dimensions de louverture.
Ouverture
aux rveries
Ouverture
l-esthtique
Ouverture
aux
sentiments
Ouverture
aux actions
Ouverture
aux ides
Ouverture
aux valeurs
0,00
1,00
2,00
3,00
4,00
M
o
y
e
n
n
e

Figure 34

Prsentation graphique de la moyenne de plusieurs variables mtriques dans diffrents sous-
groupes, pour cela cliquez sur Graphs | Bar, choisissez Clustered et Summaries of
separate variables . Dans Bars represent, entrez les variables pour lesquelles vous voulez
obtenir les moyennes; MEAN(var) apparat pour chaque variable. Dans Category axes, entrez
la variable de groupement, comme par exemple la moyenne de louverture pour deux
dimensions en fonction du sexe.
Femme Homme
Sexe
0,00
1,00
2,00
3,00
4,00
5,00
M
o
y
e
n
n
e
Ouverture aux
sentiments
Ouverture aux
actions

Figure 35
41
Remarque : la moyenne devrait tre reprsente par un point et non par une hauteur ou une
surface comme cest le cas dans les graphes bar, cest pourquoi nous vous conseillons
dutiliser les graphes error bar (ci-aprs) qui sont corrects dun point de vue strictement du
sens de la mesure de la moyenne.

Error bar

LError bar permet de prsenter la moyenne et la variabilit de variables mtriques (moyenne
plus ou moins lcart-type). Pour obtenir un graphique de la moyenne et la variabilit d'une
variable mtrique dans diffrents sous-groupes, slectionnez Graphs | Error Bar. Choisissez
Simple et Summaries for groups of cases . Dans Variable, choisissez la variable
pour laquelle vous voulez obtenir les moyennes et leur variabilit. Dans Category axes,
entrez la variable de groupement. Dans Bars represent, choisisez Standard deviation
(cart type) [ Confidence interval for mean et Standard error of mean ne sont pas
trait dans ce cours] et multipliez par un. 1


Homme Femme
Sexe
4.2
4.1
4.0
3.9
3.8
3.7
3.6
M
e
a
n

+
-

2

S
E

O
u
v
e
r
t
u
r
e

a
u
x

s
e
n
t
i
m
e
n
t
s

Figure 36

Pour obtenir un graphique de la moyenne et la variabilit de plusieurs variables mtriques
dans tout l'chantillon, slectionnez Graphs | Error Bar. Choisissez Simple et
Summaries of separate variables . Dans Error Bars, entrez les variables pour lesquelles
vous voulez obtenir les moyennes et leur variabilit. Dans Bars represent, choisissez
Standard deviation (cart type) comme par exemple les 6 dimensions de louverture.

42

Ouverture aux
valeurs
Ouverture aux
ides
Ouverture aux
actions
Ouverture aux
sentiments
Ouverture l-
esthtique
Ouverture aux
rveries
4.0
3.9
3.8
3.7
3.6
3.5
3.4
3.3
3.2
M
e
a
n

+
-

2

S
E

Figure 37
Pour obtenir un graphique de la moyenne et la variabilit de plusieurs variables mtriques
dans diffrents sous-groupes, slectionnez Graphs | Error Bar. Choisissez Clustered et
Summaries of separate variables . Dans Error Bars, entrer les variables pour lesquelles
vous voulez obtenir les moyennes et leur variabilit, comme par exemple pour les variables
ouverture aux sentiment et ouverture aux actions. Dans Category axes, entrez la variable de
groupement, par exemple la variable sexe.

Homme Femme
Sexe
4.2
4.0
3.8
3.6
3.4
3.2
3.0
M
e
a
n

+
-

2

S
E
Ouverture aux actions
Ouverture aux
sentiments

Figure 38
43

Boxplot
Le Boxplot est un moyen de reprsenter graphiquement daspects de la distribution dune
variable, comme la mdiane et la dispersion. La variable doit tre au minimum ordinale :

Boxplots pour une variable dans diffrents sous-groupes : slectionnez Graphs |
Boxplot. Choisissez Simple et Summaries for groups of cases . Dans
Variable, entrez la variable pour laquelle vous voulez obtenir la mdiane et la
dispersion, par exemple ouverture aux sentiments. Dans Category axes, entrez la
variable de groupement, par exemple le sexe. Dans Label cases by, si on a une
variable didentification des sujets, on peut l'y entrer pour identifier les valeurs
extrmes (quand on laisse cette option vide, SPSS utilise le numro de ligne). Une
alternative, cest de passer par Analyze | Descriptive Statistics | Explore. Dans
Dependent list , entrez la variable pour laquelle vous voulez obtenir le boxplot.
Dans Factor list , entrez la variable de groupement.
Femme Homme
Sexe
2,00
2,50
3,00
3,50
4,00
4,50
5,00
O
u
v
e
r
t
u
r
e

a
u
x

s
e
n
t
i
m
e
n
t
s
371

Figure 39

Comment lire le graphique : la hauteur de la bote correspond l'intervalle interquartile (IQ),
le bord infrieur de la bote reprsente le 1
er
et le bord suprieur de la bote reprsente le 3
me

quartile. Le trait traversant la bote reprsente la mdiane, le trait en dessous de la bote relie
le 1
er
quartile l'extrme infrieur (cest--dire l'observation gale ou juste suprieure la
valeur du 1
er
quartile moins 1.5 fois l'IQ). Le trait en dessus la bote relie le 3
me
quartile
l'extrme suprieur (cest--dire l'observation gale ou juste infrieure la valeur 3
me
quartile
plus 1.5 fois l'IQ) Les points sont des valeurs extrmes qui se trouvent entre 1,5 et 3 fois l'IQ
au-dessous ou au-dessus de la bote. Les astrisques sont des valeurs extrmes qui se trouvent
plus de 3 fois l'IQ au-dessous ou au-dessus la bote. Les chiffres ct d'un point ou dune
astrisque sont le numro du sujet.

Boxplots pour plusieurs variables dans tout l'chantillon : cliquez sur Graphs |
Boxplot, choisissez Simple et Summaries of separate variables . Dans Boxes
represent, entrez les variables qui vous intressent comme par exemple les 6
dimension de louverture.
44
Ouverture
aux rveries
Ouverture
l-esthtique
Ouverture
aux
sentiments
Ouverture
aux actions
Ouverture
aux ides
Ouverture
aux valeurs
1,00
2,00
3,00
4,00
5,00
376
289
413
88
1
254
371
296
214
178
169
371
97
313
455
74
147
480

Figure 40
Boxplots pour plusieurs variables dans diffrents sous-groupes : cliquez sur Graphs |
Boxplot, choisissez Clustered et Summaries of separate variables . Dans
Boxes represent, entrez les variables qui vous intressent, par exemple les variables
ouvertures aux sentiments et ouverture aux actions. Dans Category axes, entrez la
variable de groupement, comme par exemple le sexe.

Femme Homme
Sexe
2,00
3,00
4,00
5,00
371
71
169
292
178
Ouverture aux
sentiments
Ouverture aux
actions

Figure 41

Modifier la prsentation des rsultats (Output Labels)
Pour modifier la prsentation des rsultats, passez par le menu, cliquez dans Edit | Options.
Output Labels permet de modifier la prsentation des rsultats. Dans la partie Pivot Table
Labeling, on peut choisir entre (1) les tiquettes des variables (labels), (2) les noms des
variables (names), (3) les noms des variables et leurs tiquettes (names and labels).

45
Slectionner des cas
La fonction Data | Select cases permet de slectionner des cas en fonction des valeurs d'une
variable (ou de plusieurs variables). C'est dire qu'on peut limiter les analyses un sous-
groupe de l'chantillon (p.ex. les femmes, un pays, etc.). Pour cela passez par Data | Select
Cases. Choisissez If condition is satisfied , pressez le bouton If... et dfinissez la
condition l'aide de la variable, une valeur, ainsi que des oprateurs relationnels (gal = ,
diffrent de ~= , plus petit que < , plus grand que > , plus petit ou gal <= , plus
grand ou gal >= ) et des oprateurs logiques (et & / and , ou | / or ), puis
pressez Continue. Pour Unselected cases are..., choisissez l'option Filtered ( par dfaut).
Attention : l'option deleted supprime tous les cas non-slectionns!!!

Dans la vue des donnes, les cas non-slectionns sont barrs (dans la premire colonne).
Dans le coin en bas droite, SPSS nous informe que la fonction et active ( Filter on ).
SPSS ajoute une nouvelle variable nomme filter_$ . Les valeurs de cette variable filtre
sont 1 (Le cas remplit la condition/est slectionn) ou 0 (Le cas ne remplit pas la condition/
n'est pas slectionn). Une fois cette fonction en marche, seuls les cas slectionns (avec une
valeur de 1 sur la variable filtre) seront utiliss dans les analyses subsquentes. Si on change
la condition sous laquelle les cas sont slectionns, SPSS remplace la variable filter_$. Pour
garder une variable filtre, on peut renommer filter_$ (p.ex. filt_usa pour le sous-groupe de
personnes des Etats-Unis). Attention : La fonction Select cases reste active jusqu' ce
qu'on la dsactive!!! Pour la dsactiver, il faut passer par Data | Select Cases: All cases.

Comparer les groupes
La fonction Data | Split File permet de fragmenter un fichier et de comparer des cas en
fonction des valeurs d'une variable (ou de plusieurs variables). C'est dire qu'on peut analyser
sparment des sous-groupes de l'chantillon afin de les comparer (p.ex. les femmes et les
hommes, les Etats-Unis avec la Chine, etc.). Pour cela il faut passer par les menus droulant et
cliquer sur Data | Split File, puis choisir la variable de regroupement. L'option compare
groups donne un tableau commun pour les sous-groupes et l'option Organize output by
groups donne des tableaux spars pour les sous-groupes.

Dans le coin en bas droite, SPSS nous informe que la fonction et active ( Split file on ).
Attention : la fonction Split file reste active jusqu' ce qu'on la dsactive!!! Pour la
dsactiver, il faut passer par Data | Split File, Analyze all cases, do not create groups.

TP5 : Analyse des donnes : Mesures descriptives

Exercice 7 : Distributions des variables
Ouvrez le fichier data1.sav

Analysez la tendance centrale et la dispersion des variables Big
Five : nvrosisme [bf_nev], extraversion [bf_ext], intellect [bf_int],
agrabilit [bf_agr] et conscience [bf_con].
Pour chaque variable, calculez la moyenne, la mdiane, le mode,
lcart-type, ltendue, le minimum et le maximum.
46
Crez des histogrammes pour chaque variable.
Sauvegardez tous les rsultats ( output ) sous le nom
exercice7.spo dans votre domaine (h:\ ).

Exercice 8 : Slectionner et comparer les groupes
Ouvrez le fichier data1.sav

Pour le sous-groupe des allemands, analysez la distribution des Big Five de la personnalit
(bf_nev, bf_ext, bf_int, bf_agr et bf_con) en calculant, pour chaque variable,
un tableau de frquences
la moyenne, la mdiane, le mode, la variance, lcart-type, lintervalle interquartile,
lasymtrie, laplatissement

et en crant, pour chaque variable,
un histogramme
un boxplot
error bar.

Pour toute la population, comparez les hommes et les femmes par rapport aux
variables Big Five (bf_nev, bf_ext, bf_int, bf_agr et bf_con).

Pour les deux sous-groupes, calculez les moyennes et les cart-types des 5 variables.

Pour chaque variable Big Five , crez des boxplots qui reprsentent leur dispersion
dans les deux sous-groupes, cest--dire, crez des graphiques o les catgories de la
variable sexe se trouvent sur laxe des abscisses.

Sauvegardez tous les rsultats ( output ) sous le nom exercice8.spo dans votre domaine
(h:\).

47
TD6 : Analyse des donnes : Corrlation et rgression

Corrlation de rang
Pour calculer une corrlation de rang, allez sous Analyze | Correlate | Bivariate, cochez,
dans Correlation Coefficients, Spearmann et/ou Kendalls tau-b. Les variables qui sont
entres seront corrles et on obtient une matrice complte, cest dire un tableau avec toutes
les corrlations des variables deux deux.

Tout ce qui concerne la significativit: pas encore trait en premire anne
Options: Missing values important seulement si on analyse plusieurs variables
en mme temps.

Scatterplot
Le Scatterplot permet de prsenter la relation entre deux variables mtriques. Chaque point
dans le graphique reprsente un cas, cest dire un couple de valeurs issu de deux variables.
Pour obtenir un scatterplot, passez par Graphs | Scatter: Simple . Pour cela :

Choisir les variables : Y-Axis pour l'axe des ordonnes et X-Axis pour l'axe des abcisses
Set markers by : on peut entrer une variable de groupement (p.ex. le sexe) les
diffrents sous-groupes seront affichs par des couleurs diffrentes. Attention : un point
dans le Scatterplot peut reprsenter plusieurs cas la couleur affiche correspond au
sous-groupe du premier cas! L'utilisation de cette option n'est pas recommande!
Label cases by : on peut entrer la variable ID (numrotation des cas) pour obtenir le
numro d'un cas individuel dans l'diteur de graphique quand on n'entre pas de variable
ici, SPSS prend la numrotation des lignes (qui ne correspond pas forcment la variable
ID!)
Options: Aprs avoir entr une
variable ID dans label cases by ,
on peut cocher l'option Display
chart with case labels (en cliquant
sur Options ). Ainsi, tous les
points seront marqus par leurs
numros, le dsavantage, cest que ce
nest pas trs lisible.
Ex : Extraversion et l'expressivit de joie

Pour obtenir le numro d'un cas individuel
dans l'diteur de graphique :

double-cliquez sur le graphique
pour activer l'diteur
Cliquez sur le symbol
48
Cliquez sur le point dont on veut obtenir le numro
Cliquez encore une fois au-dessus pour effacer le numro

D'autres options dans l'diteur de graphique :

Pour que le nombre de cas reprsents soit indiqu par la taille des points ou par
lintensit de leur couleur, double-cliquez sur les points de donnes, puis choisissez
longlet Point bins et cliquez sur Bins (dfaut : marker size )
Pour obtenir la droite de rgression, slectionnez les points de donnes, aprs cliquez
sur Chart | Add chart element: Fit line at total

Corrlation de Bravais-Pearson
Pour calculer une corrlation pour des variables numriques, allez sous Analyze | Correlate |
Bivariate, le coefficient de corrlation de Pearson est le coefficient par dfaut. Les variables
qui sont entres seront corrles et on obtient une matrice complte. Pour obtenir la moyenne
et l'cart-type pour chaque variable ( means and standard deviations ) ainsi que les
produits croiss et les covariances ( cross-product deviations and covariances ) allez sous
Options. Sous Options, vous trouverez galement les missing values , cette fonction est
importante uniquement si on analyse plusieurs variables en mme temps. Si on choisis
Exclude cases pairwise pour chaque coefficient de corrlation, les cas qui n'ont pas de
valeurs valables sur le couple de variables seront exclus. Dans le cas o on choisist Exclude
cases listwise alors pour chaque coefficient de corrlation, seulement les cas qui ont des
valeurs valables sur toutes les variables seront analyss (mme N pour chaque coefficient).

Tout ce qui concerne la significativit: pas encore trait en premire anne

Passer par la syntaxe : parfois, on veut obtenir des corrlations entre deux groupes de
variables (p.ex., les Big Five et les diffrentes variables de l'expressivit motionnelle).
Dans ce cas, le tableau standard (obtenu par le menu Correlate) devient trs grand et il y aura
des corrlations dont on n'a pas besoin (p.ex. entre les variables Big Five ). Pour obtenir
seulement les corrlations entre les deux groupes, il faut utiliser la syntaxe :
Dans la bote-dialogue, entrer toutes les variables et cliquer sur Paste (au lieu de OK)
Dans la fentre de syntaxe, il faut ajouter le mot WITH entre les deux groupes de
variables. Exemple:

CORRELATIONS
/VARIABLES=bf_ext bf_agr bf_con bf_nev bf_int WITH exp_amo
exp_joi exp_peu exp_col exp_tri
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE .

49
Correlations
.348** .418** .079 .062 .114*
.000 .000 .085 .175 .013
481 481 481 478 480
.245** .224** .120** -.140** .132**
.000 .000 .008 .002 .004
482 482 482 479 481
.077 .048 .071 -.050 .065
.094 .291 .119 .280 .157
481 481 481 478 480
-.042 -.055 .141** .162** .241**
.352 .232 .002 .000 .000
481 481 481 478 480
.145** .094* .036 .088 .086
.001 .040 .435 .055 .059
481 481 481 478 480
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
bf_ext Big Five:
Extraversion
bf_agr Big Five:
Agrabilit
bf_con Big Five:
Conscience
bf_nev Big Five:
Nevrocisme
bf_int Big Five:
Intelligence
exp_amo
Expressivit:
Amour
exp_joi
Expressivit:
Joie
exp_peu
Expressivit:
Peur
exp_col
Expressivit:
Colre
exp_tri
Expressivit:
Tristesse
Correlation is significant at the 0.01 level (2-tailed).
**.
Correlation is significant at the 0.05 level (2-tailed).
*.


Rgression linaire simple
Pour effectuer une rgression linaire simple, allez sous Analyze | Regression | Linear :
Dependent : Entrez la variable Y (variable explique), par exemple louverture
aux sentiments.
Independent : Entrez la variable X (variable explicative), par exemple
lextraversion.
Statistics: on peut cocher descriptives pour obtenir des statistiques descriptives pour
les variables (moyenne, cart-type, taille de l'chantillon, corrlation des variables)
Pour la rgression simple (avec une variable explicative X), il ne faut pas d'autres
options!
Syntaxe :

REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT ouv_sen
/METHOD=ENTER bf_ext .
SPSS-Viewer (Rsultat)
Model summary :
R : correspond la corrlation r
xy
dans le cas de la rgression simple
R
2
: coefficient de dtermination ou pourcentage de la variation de Y explique par la
rgression
50
Rcapitulatif du modle
,325
a
,106 ,104 ,45768
Modle
1
R R-deux R-deux ajust
Erreur
standard de
l'estimation
Valeurs prdites : (constantes), bf_ext Big Five:
Extraversion
a.


Tableau ANOVA : sommes des carrs de la rgression
ANOVA
b
11,881 1 11,881 56,720 ,000
a
100,339 479 ,209
112,220 480
Rgression
Rsidu
Total
Modle
1
Somme
des carrs ddl Carr moyen F Signification
Valeurs prdites : (constantes), bf_ext Big Five: Extraversion
a.
Variable dpendante : ouv_sen Ouverture aux sentiments
b.


Tableau Coefficients

Ligne (Constant) et colonne B : l'ordonne l'origine de la droite de rgression
Ligne de la variable et colonne B (valeur non-standardise) : pente de la droite de
rgression
colonne Beta (valeur standardise) : correspond la corrlation r
xy
dans le cas de
la rgression simple
Standard error et les valeurs t et sig. concernent la significativit des coefficients:
pas encore trait en premire anne!
Coefficients
a
3,139 ,109 28,676 ,000
,214 ,028 ,325 7,531 ,000
(constante)
bf_ext Big Five:
Extraversion
Modle
1
B
Erreur
standard
Coefficients non
standardiss
Bta
Coefficients
standardiss
t Signification
Variable dpendante : ouv_sen Ouverture aux sentiments
a.

51
TP6 : Analyse des donnes : Corrlation et rgression

Exercice 9 corrlation de rang

Ouvrez le fichier data1.sav .

Analysez la corrlation entre les variables dexpressions par dimension.

Sauvegardez tous les rsultats ( output ) sous le nom exercice9.spo dans votre domaine
(h:\).

Exercice 10 corrlation et rgression linaire simple

Ouvrez le fichier data1.sav .

Recoder la variable ge en quatre groupes contenant chacun 25% de la population. Puis pour
chaque groupe dge sparment, analysez la relation entre la frquence expression de la peur
et la frquence dexpression de la colre :

Crez un scatterplot et rajoutez une droite de rgression.
Analysez la corrlation entre les deux variables.
Analysez la rgression linaire en utilisant la frquence dexpression de peur comme
variable X (variable explicative) et la frquence dexpression de colre comme
variable Y (variable explique).

Sauvegardez tous les rsultats ( output ) sous le nom exercice10.spo dans votre domaine
(h:\).
52

53


SECTION DE PSYCHOLOGIE
UNI MAIL - 40 bd du Pont-dArve | CH-1205 Genve

Prof. G.R. Pini et O. Renaud
Ass. : K. Iglesias


Cour Introduction lanalyse exploratoire des donnes
Semestre dt 2006

QUESTIONNAIRE
Ci-aprs, vous trouverez une liste dmotions. Svp, indiquez pour chaque
motion quelle frquence vous exprimez cette motion dautres
personnes quand vous la ressentez.
jamais presque
ou par- sou- toujours
presque fois vent ou
jamais toujours
1 Affection 1 2 3 4
2 Joie 1 2 3 4
3 Peur 1 2 3 4
4 Colre 1 2 3 4
5 Honte 1 2 3 4
6 Tristesse 1 2 3 4
7 Amour 1 2 3 4
8 Bonheur 1 2 3 4
9 Inquitude 1 2 3 4
10 Irritation 1 2 3 4
11 Culpabilit 1 2 3 4
12 Depression 1 2 3 4
jamais presque
ou par- sou- toujours
presque fois vent ou
jamais toujours

54
Ci-aprs, vous trouverez une liste de traits de caractre. Pour chaque mot, veuillez indiquer
la rponse qui vous semble le mieux dcrire votre personnalit, svp.


Je suis
Je suis

pas du tout
tout fait
pas du tout
tout fait
1 2 3 4 5 1 2 3 4 5
amical(e)


consciencieux
(se)

chaleureux(se)


lunatique


travailleur(se)


vif (vive)


susceptible


cultiv(e)


malin (maligne)


dun bon naturel


sociable


plein(e) de
temprament

assidu(e)


serviable


plein(e)
dgards

riche desprit


intelligent(e)


pas sr(e) de moi


sensible

ambitieux(se)

pas du tout
tout fait
pas du tout
tout fait




55
Les questions qui suivent portent sur un aspect de votre personnalit. Pour chaque
question, veuillez indiquer la rponse qui vous semble la plus approprie. Evaluez
les affirmations en utilisant lchelle dapprobation.

pas du
tout
daccord
un peu
daccord
moyenne-
ment
daccord
plutt
daccord
tout fait
daccord
1 Jai une imagination trs active.
1
2 3 4
5
2 Je suis bien install(e) dans mes habitudes.
1
2 3 4
5
3 Je crois que laisser les tudiants couter des orateurs controverss
ne peut que les embrouiller et les garer.
1
2 3 4
5
4 Jessaie de maintenir toutes mes penses dans une direction
raliste et dviter les envoles de limagination.
1
2 3 4
5
5 Il marrive quelquefois de mabsorber compltement dans la
musique que jcoute.
1
2 3 4
5
6 Je trouve les discussions philosophiques ennuyeuses.
1
2 3 4
5
7 Assister des spectacles de ballet ou de danse moderne mennuie.
1
2 3 4
5
8 La manire dont je sens les choses est importante pour moi.
1
2 3 4
5
9 Une fois que jai trouv la bonne manire de faire quelque chose,
je my tiens.
1
2 3 4
5
10 Je prends plaisir rsoudre des problmes ou des nigmes.
1
2 3 4
5
11 Je naime pas perdre mon temps rvasser.
1
2 3 4
5
12 Je crois que nous devrions nous tourner vers nos autorits
religieuses pour les dcisions concernant les questions morales.
1
2 3 4
5
13 Je suis intrigu(e) par les formes et les motifs que je trouve dans
lart et dans la nature.
1
2 3 4
5
14 Il est rare que jaccorde beaucoup dattention mes sentiments du
moment.
1
2 3 4
5
15 Jessaie souvent des plats nouveaux et exotiques.
1
2 3 4
5
16 Je perds quelquefois tout intrt quand les gens parlent de sujets
trs abstraits et thoriques.
1
2 3 4
5
17 Je prends plaisir me concentrer sur une image intrieure ou une
rverie et explorer toutes ses possibilits en les laissant crotre et
se dvelopper.
1
2 3 4
5
18 La posie a peu ou pas deffet sur moi.
1
2 3 4
5
19 Jprouve une grande varit dmotions ou de sentiments.
1
2 3 4
5
20 Je prfre passer mon temps dans un entourage familier.
1
2 3 4
5
56
21 Je crois que la fidlit ses propres idaux et principes est plus
importante que louverture desprit .
1
2 3 4
5
22 Si je sens que mon esprit commence driver vers des rveries,
jai lhabitude de moccuper et de me mettre me concentrer sur
un travail ou une activit.
1
2 3 4
5
23 Certains genres de musique exercent sur moi une fascination sans
fin.
1
2 3 4
5
24 Je remarque rarement les changements dhumeurs ou les
sentiments que provoquent des environnements diffrents.
1
2 3 4
5


pas du
tout
daccord
un peu
daccord
moyenne-
ment
daccord
plutt
daccord
tout fait
daccord
25 Jai peu dintrt pour la rflexion sur la nature de lunivers ou sur
la condition humaine.
1
2 3 4
5
26 Je me trouve large desprit et tolrant(e) pour les faons de vivre
des autres.
1
2 3 4
5
27 Je trouve facile davoir de lempathie, cest--dire de ressentir
moi-mme ce que les autres ressentent.
1
2 3 4
5
28 En vacances, je prfre retourner dans un endroit que je connais
bien plutt qualler dans un nouvel endroit.
1
2 3 4
5
29 Jai beaucoup de curiosit intellectuelle.
1
2 3 4
5
30 Je pense que si les gens ne savent pas quoi ils croient quand ils
ont vingt-cinq ans, il y a quelque chose qui ne tourne pas rond
chez eux.
1
2 3 4
5


Pas
satisfait
Plutt pas
satisfait
Plutt
satisfait
Satisfait
1 Etes-vous satisfait avec la manire dont vous grez vos motions ?
1
2 3 4


Quelles loisirs avez-vous rgulirement?
(plusieurs rponses sont possibles)


q
Sport

q
Rencontrer des amis

q
Activits culturelles (cinma, expositions, concerts, etc.)

q
Animal domestique

q
Instrument de musique

q
Tlvision

q
Internet

q
Bricolage (tricot, jardinage, etc.)

q
Autre : _____________________________________________________


57
Quest ce que ces loisirs vous apportent ?





Variables socio-dmographiques :

Sexe : Femme Homme
Age : ______ ans
Taille : ____ cm
Poids : ____ kg
Nationalit : Suisse autre: ______________________

Vous tes tudiant(e) dans quel domaine? _____________________________

Votre code:
Premire lettre du prnom de votre mre:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Dernire lettre du prnom de votre mre:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Premire lettre du prnom de votre pre:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Dernire lettre du prnom de votre pre:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Premire lettre de votre lieu de naissance:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Dernire lettre de votre lieu de naissance:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Vous aimerez peut-être aussi