Vous êtes sur la page 1sur 16

Traitement de donnes avec SPSS

Une fois acheve la "rcolte des donnes" par questionnaire, par entretien ou par toute autre mthode, celles-ci doivent tre structures et analyses. En fonction de la mthode utilise, les donnes rcoltes sont comptes, rsumes, calcules ou interprtes, puis prsentes de manire en obtenir une bonne vue d ensemble. !es connaissances spcifiques sont ncessaires cet effet "uand les donnes rcoltes sont e#amines et structures. $l e#istent des pro%rammes lectroniques qui facilitent le traitement de donnes numriques &par e#emple E#cel, '('') et de donnes verbales &par e#emple *icrosoft +ord, ,tlas-ti, -).

Dfinition
. . /e lo%iciel &'('') est un lo%iciel de %estion et d analyse de donnes statistiques de porte %nrale. /e lo%iciel '('' constitue un systme de traitement de donnes permettant, partir de fichiers '('' ou partir d0autres types de fichiers &E#cel, !base, ,ccess -) de %nrer divers tableau#, %raphiques et dia%rammes ou encore d0effectuer divers traitements statistiques & descriptive 1 rfrentiel).

Utilisation
2n peut utiliser le lo%iciel '('' pour effectuer diffrentes t3ches, comme par e#emple4 A) La prsentation des donnes sources . 2n peut importer ou saisir en direct des donnes dans une feuille de tableur prsente dans le lo%iciel. . /e 5opier - coller de tableau permet de rutiliser en cha6ne les valeurs rsultats de tableau. . 2n peut trier des rsultats. . . /e lo%iciel permet la division et l clatement de fichiers. . /a cration d une nouvelle variable est possible partir d autres variables et de formules. B) Le traitement des donnes 7outes les oprations de base &cart-type, moyenne, variance, mdiane, mode, etc...) peuvent tre ralises. C) Les tests statistiques 4 7est student, 5hi-deu#, D) Reprsentations grap iques! /es %raphiques &histo%rammes, secteurs, boites, points, etc.) sont copiables vers d0autres lo%iciels.

") #anipulation de $ase sur les donnes %) Saisie de donnes & partir de SPSS
5ette opration s0effectue en deu# tapes 4 . !finir les variables et leurs proprits . 'aisir les donnes Les r'gles & respecter pour dfinir le nom d(une varia$le ! /e nom doit commencer par une lettre. Un nom de variable ne peut se terminer par un point. /a lon%ueur du nom de la variable ne peut e#cder 8 caractres. /e nom d0une variable ne peut contenir des espaces blancs ou des caractres spciau# &comme 9 , : et ;). 5haque nom de variable doit tre unique. !onner une tiquette une variable c0est donner une identification plus e#plicite cette variable qui sera affiche dans les diffrents calculs statistiques. a) Les t)pes de donnes . <ous disons qu0une donne est de type numrique lorsqu0elle rfre un nombre tant dans sa reprsentation que dans son utilisation. . $l arrive souvent que, pour faciliter le traitement, nous crons des donnes artificiellement numriques. 50est dire nous codifions par un chiffre une variable qualitative. . E#emple 4 = pour se#e masculin et > pour se#e fminin. . 5e coda%e prsente un double avanta%e 4 - $l facilite la saisie des donnes en diminuant les risques d0erreur de frappe. - $l favorise une conomie d0espace en mmoire et de temps. . Une donne est de type alphanumrique lorsqu0elle peut prendre pour ?valeurs la fois des lettres et des chiffres. . /es noms et les prnoms d0individus constituent des e#emples de variable alphanumriques. . /es traitements arithmtiques et statistiques possibles sont plus limits avec des informations de cette nature . $l est possible d0effectuer des dnombrements et des tris, par e#emple . $l e#iste d0autres types de donnes, tels ceu# de dates et de devises $) Affic age des varia$les /0afficha%e des variables est utilis pour spcifier les noms et les proprits des variables ,) 'aisir les noms de variables choisies &colonne ?<om0) $l suffit de nommer la premire variable en respectant les r%les pour nommer les variables @) 5han%er le type de variable &colonne ?7ype0) (ar dfaut le type de variable montr dans la colonne tiquette 7ype est numrique, mais il y a d0autres types de variables disponibles dans '(''. - Aariable cha6ne 4 squence de >B caractres &lettres, symboles, espaces, chiffres) - Aariables !ate, !ollar, -

5) 5han%er la lar%eur de la variable &colonne ?/ar%eur0) !) 5han%er le nombre de dcimales de variable &colonne ?!cimale0) E) 'aisir l0tiquette de variable &colonne ?Etiquette0) - $l est souvent avanta%eu# d0e#pliciter quelques fois le nom ni%matique d0une variable avec une tiquette e#plicative plus lon%ue. - /es tiquettes permettent d0amliorer les apparences des rsultats. C) Aaleurs tiquettes de valeurs &colonne ?Aaleurs0) - Aaleurs 4 sont des codes par e# 4 B, =, >, D - Etiquettes des valeurs 4 sont les continues des variables. E# 4 = 4 *asculin >4 Cminin 50est une tape trs importante dans l0afficha%e des variables, car elle permet de codifier le contenu des variables. E) Aaleurs manquantes &colonne ?*anquant0) . !ans '('', il ne peut y avoir aucune cellule vide dans la srie de donnes. . 5omme par e#. les colonnes &reprsentant les variables) et les li%nes &reprsentant les observations). . (ar consquent, si une cellule n0a pas t rempli par l0utilisateur, '('' fournit une valeur manquante systme, qui est indiqu dans l0diteur de donnes par un point. . '('' e#clura les valeurs manquantes systme des calculs de moyenne, cart F type, et autre statistique. . 'ouvent on utilise le code GG pour les valeurs manquantes. H) <iveau de mesure &colonne ?mesure0) . /es donnes chelles 4 ce sont des donnes numrique 4 le poids, la taille, . /es donnes nominales 4 le %roupe san%uin, le %enre, -. 5e sont des tiquettes. . /es donnes ordinales 4 constituants en des ran%s, des affectations cat%ories ordonnes ou d0informations squentielles. E# 4 7rs satisfait 'atisfait <on satisfait.

*) #anipulations de donnes
E#emple 4 !ans une entreprise, le temps requis pour effectuer l0assembla%e d0un monta%e transistoris est de =B minutes. Un chronomtra%e de cette opration sur >I units de mme type donne le temps ci-contre. Temps o$servs +minutes) ,-% %%-0 %*-. %/-. %/-/ %%-. %/-. ,-0 %/-% %/-2 %%-, %%-1 %%-, %*-* ,-1 %/-, %%-/ %/-1 %%-% %%-1 %/-, %/-0 %*-, %/-. %*-/

a) Trier des donnes 5liquer sur la commande Donnes / Trier les observations puis slectionner la liste de variable. $) Listing des donnes4 5ommandes 4 ,nalyse 1 Japport 1 Jcapitulatif des observations c) Affic er les informations sur le fic ier des donnes 4 5ommandes 4 Cichier 1 ,fficher informations sur les donnes 1 2uvrir.

3uestionnaire

"uel est votre 3%e en anne : 4 "uel est votre se#e : 4 * C ,rts *decine 'ciences ,utres *a6trise ,utre

"uel est votre domaine d0tude 4 "uel est votre niveau : 4

Ktudiant !octorant

"uel est votre poids en L% : 4 "uelle est votre taille en mtre : 4 "uel est votre %roupe san%uin : 4 Eroupe 2 Eroupe @ Est F ce que vous fumeM : 4 2ui <on Eroupe , Eroupe ,@

,%e DB >I >N DD OB >O >= OI >D DP

'e#e * C C C * * C * C *

Ktude > = D O = > O > > D

<iveau D > > = = O > = = O

(oids NI II IN IG 8I PI PB 8N II NG

7aille =,8B =,NI =,NB =,PI =,8D =,N8 =,P> =,PN =,IG =,ND

Eroupe D O = D > = O D O >

Cume = > = > = > > > = =

"") La statistique descriptive

%4 Calcul de diverses statistiques


. . 5liquer sur la commande Analyse / statistique descriptive / Frquences4 *oyenne 1 *diane 1 *ode 1 'omme 1 Ecart - type 1 Aariance -

*4 Dpouillement des valeurs d(une varia$le continue selon une distri$ution de frquence
. . 2n veut obtenir la distribution de frquences en classes de la variable continue A &taille). , partir des rsultas obtenus prcdemment, la rpartition des donnes en classes peut s0effectuer de la faQon suivante. ----------T = ----------T > ----------T D

/es classes sont 4 =,II R S R =,PP =,PN R S R =,NP =,NNR S R =,88

/es commandes sont 4 - 5liquer sur Transformer / Recoder / Cration de variable - Entrer dans la boite de variable de destination - 5liquer sur la boite Remplacer - Cliquer sur la boite ancienne et nouvelle valeur - Entrer dans la boite nouvelle valeur & e#emple 4 =) - 5liquer sur Intervalle - Enter les valeurs limites &e#emple 4 =,II et =,PP) - 5liquer sur Ajouter - Jpter les mmes oprations pour les autres donnes - 5liquer sur la boite Poursuivre - , la fin on faire l(tiquette pour la nouvelle variable &e#emple 4,nciennet par classes) - 5liquer sur !

.) Distri$ution de frquences et istogramme


(our obtenir la distribution de frquences et histo%ramme, . cliquer sur la commande 1Analyse / Frquences 1 . 5hoisir la variable &e# 4 (oids par classe) / "ia#rammes / $isto#ramme / Continue / . !sactiver toutes les commandes de la fentre 'tatistique %moyenne& mode& '( / continue / !.

O) Traitement de donnes nominales

"uestion = 4 ,u cours des => mois, aveM-vous pris l0autobus de faQon r%ulire ou occasionnelle : - J%ulire ---. - 2ccasionnelle ---. - <e prend pas l0autobus --.. "uestion > 4 'e#e 4 *asculin - Cminin "uestion D 4 ,%e 4 ; =8 F DO ans -.. ; DI F IO ans -.. ; II ans et plus -.

. .

54%) 6n va associer des codes et des tiquettes au7 diverses modalits des varia$les 86# 9T"3U9TT9 "uest= (rendre l0autobus :AL9URS +#6DAL"T9S) J%ulire 2ccasionnelle <e prend pas l0autobus C6D9S = > D

"uest> 'e#e

*asculin Cminin

= >

"uestD ,%e

=8 F DO ans DI F IO ans II ans et plus

= > D

Les commandes sont ! - 5liqueM sur Afficha#e des variables - EntreM dans la colonne )tiquette de la variable *uest+ la variable 4 (rendre l(auto$us - 5liquer sur la colonne :aleurs- puis entreM dans le champ ,aleur 4 %, puis dans le champ )tiquette de valeur 4 Rguli're. - 5liqueM sur le bouton Ajouter et l0information saisie se retrouvera dans la Mone voisine. - EntreM dans le champ ,aleur 4 >, puis dans le champ )tiquette de valeur 4 6ccasionnelle. - 5liqueM sur le bouton Ajouter et l0information saisie se retrouvera dans la Mone voisine - EntreM dans le champ ,aleur 4 D, puis dans le champ )tiquette de valeur4 8e prend pas l(auto$us. - 5liqueM sur le bouton Ajouter et l0information saisie se retrouvera dans la Mone voisine

- 5liqueM sur Continue puis sur !. ;/a codification des modalits des variables "uest> et "uestD s0effectuent de la mme faQon.

Ta$leau des donnes


*uest+ J%ulire <e prend pas l0autobus 2ccasionnelle J%ulire <e prend pas l0autobus <e prend pas l0autobus J%ulire <e prend pas l0autobus 2ccasionnelle J%ulire <e prend pas l0autobus 2ccasionnelle <e prend pas l0autobus 2ccasionnelle *uest*asculin Cminin Cminin Cminin Cminin Cminin *asculin *asculin *asculin *asculin Cminin *asculin *asculin *asculin *uest. =8 F DO ans II ans et plus =8 F DO ans =8 F DO ans =8 F DO ans DI F IO ans II ans et plus =8 F DO ans DI F IO ans =8 F DO ans II ans et plus II ans et plus II ans et plus DI F IO ans

54*) 6n va maintenant dpouiller les donnes +nominales) de la question % selon une distri$ution de frquences et on trace un diagramme & secteurs +/raphique en secteurs)4 . . . . . 5liquer sur la commande Statistique descriptive / Frquences 'lectionner la variable "uest= 5liqueM sur le bouton Diagrammes puis slectionner raphique en secteurs et pourcentages 5liquer sur 5ontinue puis 2L 2n procde de la mme faQon pour la variable "uest>. ,u lieu de la commande Eraphique en secteurs on slectionne Diagrammes en b!tons. /es rsultats sont prsents de la faQon suivante 4

54.) 6n veut la$orer un diagramme illustrant la rpartition des rpondants selon les diverses modalits de la question % +utilisation de l(auto$us) en tenant compte du se7e du rpondant4

. . . . . . . . .

!ans la barre menus, slectionner Eraphes 1 @3tons. 5eci permet d0avoir la boite de dialo%ue !ia%rammes en b3tons. 5elle F ci prsente trois types de dia%rammes barres, soit 4 'imple Uu#tapos &5at%oris) Empil 2n veut le type "u#tapos &5at%oris), ce qui va nous permettre de visualiser le pourcenta%e de rpondants d0aprs la frquence d0utilisation du transport en commun avec une distinction quant au se#e du rpondant. 5liqueM sur l0icVne identifiant "u#tapos / $capitulatifs pour groupes dobservations puis Dfinir% 5eci permet d0avoir une boite de dialo%ue 4 (laceM la variable "uest= sur l0a#e des abscisses, puis la variable "uest> sur l0a#e des ordonnes. 5liqueM sur le bouton & dobservations puis '( pour lancer le traitement.

Les niveau7 de signification


- /orsqu0on teste la diffrence &entre moyenne par e#emple), on se posera la question suivante4 /a diffrence observe entre les chantillons doit-elle tre attribue au hasard ou bien provient-elle d0une cause systmatique: ,ccepter HB 4 50est la diffrence observe est attribuable au# fluctuations dues au hasard de l0chantillonna%e. JeWeter HB 4 50est la diffrence observe est due une cause systmatique La r'gle ar$itraire est la suivante 4 . . '0il y a plus de I X &B,BI) des chances que la diffrence observe soit due au hasard, on adopte Ho et on dit que la diffrence n0est pas si%nificative &< '). '0il y a IX &B,BI) des chances ou moins, que la diffrence soit due au hasard, on reWette Ho et on dit 4 . 'i%nificative &') 4 si la diffrence observe a plus de =X &B,B=) des chances &mais moins de IX) d0tre due au hasard. . 7rs si%nificative &7 ') 4 si la diffrence observe =X de chance ou moins d0tre due au hasard.

2n note les niveau# de si%nification de la manire suivante 4 ; !iffrence non si%nificative p T B,BI &<on si%nificative) ; !iffrence si%nificative p Y B,BI &'i%nificative) ; !iffrence si%nificative p Y B,B= &7rs si%nificative)

""") Comparaisons de mo)ennes


/es diffrents tests de comparaison de moyenne qui e#iste en '('' sont 4

=. Test T pour chantillon unique 4 7est de comparaison d0une moyenne une valeur donne. >. Test T pour chantillons indpendants4 7est d0%alit de deu# moyenne. D. Test T pour chantillons apparis 4 comparaison de deu# sries de mesures apparies. O. )*'+) , facteur4 ,nalyse de variance un seul facteur.

%) Test de comparaison d(une mo)enne de population normale & une valeur donne
. . 2n va choisir un petit chantillon provenant d0une population normale de variance inconnue. 5e test statistique s0est effectue avec le t de 'tudent. !ans une entreprise, le temps requis pour effectuer l0assembla%e d0un monta%e transistoris est de =B minutes. Un chronomtra%e de cette opration sur >I units de mme type donne le temps ci-contre. Temps o$servs +minutes) G,= ==,P =>,D =B,D =B,B ==,D =B,D G,P =B,= =B,I ==,G ==,8 ==,G =>,> G,8 =B,G ==,B =B,8 ==,= ==,8 =,G =B,P =>,G =B,D =>,B

Les commandes sont ! . . . 5liquer sur 0tatistiques descriptives / Comparer les moyennes / puis sur Test T pour chantillon unique. $ntroduiseM la variable temps dans la Mone ,ariable 1 tester et la valeur donne &%/) dans la Mone Test ,aleur de test. 5liquer sur ! pour lancer le traitement

*) Test d(galit de deu7 mo)ennes


. $l s0a%it d0un test d0%alit de deu# moyennes.

E#emple 4 'oit deu# classes qui obtiennent au mme test pda%o%ique &not sur =B). Ta$leau des donnes 5lasse = O I P N G 8 P I N I D O N 5lasse> 8 N G 8 P 8 G N 8 8 =B G N 8 8 N *oyenne > Z

*oyenne = Z

I,8O

N,GD

. . .

/a classe = semble nettement plus faible que la classe >. (eut-on attribuer cette diffrence une cause systmatique ou, au contraire, est-elle attribuable au hasard : En d0autre terme, la classe > est-elle rellement plus forte que la classe =, ou bien doiton penser que la diffrence provient du hasard dans la composition des classes : 2n va commencer par la saisie des donnes. (our faire cette comparaison en '('', on doit utiliser deu# variables, l0une pour la classe et l0autre pour les notes.

Ta$leau des donnes en SPSS Classe = 8otes O

= = = = = = = = = = = = > > > > > > > > > > > > > > > >

I P N G 8 P I N I D O N 8 N G 8 P 8 G N 8 8 =B G N 8 8 N

Les commandes sont ! . . . . 5liquer sur Analyse / Comparer les moyennes puis Test T pour chantillons indpendants2 - $ntroduiseM la variable 8otes dans la Mone ,ariable 1 tester et la variable Classe dans la Mone Crit3re de re#roupement. (uis cliquer dans la boite "finir #roupes. - Ecrire la valeur % dans la Mone /roupe+ et la valeur * dans la Mone /roupe-. - 5liquer sur Continue puis ! pour lancer le traitement

.) Comparaisons de deu7 sries de mesures apparies


- $l s0a%it des donnes qui sont obtenues partir de la mme unit e#primentale &mme individu par e#emple) avant et aprs avoir subir un certain traitement. <ous somme alors en prsence de mesures dpendantes ou apparies. - $l serait alors incorrect de procder un test de comparaison de moyennes. /0outil statistique appropri est alors un test sur la diffrence de mesures. E#emple4 2n veut valuer l0effet ou l0efficacit d0un pro%ramme d0apprentissa%e. (our cela on a passer un test un certain nombre de personne avant et aprs la formation. /es rsultats obtenus sont prsents dan le tableau suivant Avant le programme %2 %. 1 , ; %* %% %* %% , %/ %* %% ; %* Les commandes sont ! . . . . 'lectionner Analyse / Comparer les moyennes puis Test T pour chantillons apparis2 $ntroduiseM les deu# variables &Avant et Apr's) dans la boite ,ariables apparies2 5liquer sur le bouton ptions et spcifier un intervalle de confiance 445. 5liquer sur Continue puis ! pour lancer le traitement. Apr's le programme %; %0 %/ , , %. %5 %2 %5 %% %5 %% %. %/ %.

5)Test d(galit de trois mo)ennes


. . $l s0a%it de la comparaison plus de deu# moyennes. 2n ne peut pas utiliser le test t de 'tudent. /0outil statistique appropri est une analyse de variance suivant un seul facteur &6ne<=a) Anova). /0analyse de variance permet aussi de comparer les moyennes deu# deu#

97emple ! 2n constitue trois %roupes d0lves slectionns au hasard et on leur ensei%ne la mme matire de trois faQons diffrentes 4 - !ans le %roupe = on applique l0ensei%nement ma%istral - !ans le %roupe > un cours pro%ramm appliqu sous surveillance - !ans le %roupe D partiellement domicile. 2n veut comparer le rsultat moyen de trois %roupes d0lves et tester s0il e#iste une diffrence si%nificative au seuil de si%nification IX. /es rsultats obtenus sont prsents dan le tableau suivant 4 >roupe % %/ %* 1 %5 , %. >roupe * %; %, %5 %1 %; >roupe . %5 %1 %2 %2 %5 %0 %2 %.

- 2n va commencer par la saisie des donnes. - (our faire cette comparaison en '('', on doit utiliser deu# variables 4 l0une pour la classe et l0autre pour les notes.

5lasse = =

<otes =B =>

= = = = > > > > > D D D D D D D D Les commandes sont ! . . . . .

8 =O G =D =N =G =O =8 =N =O =8 =I =I =O =P =I =D

'lectionner Analyse / Comparer les moyennes puis A6 ,A 1 + facteur. $ntroduiseM la variable rsultat dans la boite ,ariables dpendantes et la variable classe la boite Crit3re2 5liquer sur le bouton ptions et choisir Caractristique 7 Test d8#alit des variances et e9clure les observations analyse par analyse puis Poursuivre. 5liquer sur le bouton Post $oc et slectionner la mthode de comparaisons multiples de :onferroni avec un seuil de si%nification ;&;<. 5liquer sur Continue puis sur ! pour lancer le traitement.

:") Le ta$leau crois


!ans ce chapitre, on va 4 . associer un code et une tiquette au# diverses modalits d0une variable . laborer un tableau crois . obtenir diverses statistiques associes au# variables du tableau crois Dfinition Un ta$leau crois consiste en un ta$leau & dou$le entre o? les modalits d(une varia$le sont croises avec les modalits d(une autre varia$le4 Ce ta$leau est frquent lorsque l(on veut e7aminer s(il e7iste une certaine dpendance entre deu7 varia$les4

E#emple 4 2n va utiliser un sonda%e sur le transport en commun et laborer un tableau crois des modalits de la frquence d0utilisation de l0autobus &quest=) avec les cat%ories d03%e. 7ableau des donnes *uest+ J%ulire <e prend pas l0autobus 2ccasionnelle J%ulire <e prend pas l0autobus <e prend pas l0autobus J%ulire <e prend pas l0autobus 2ccasionnelle J%ulire <e prend pas l0autobus 2ccasionnelle <e prend pas l0autobus 2ccasionnelle Les commandes sont ! . . . . . 'lectionneM 0tatistiques descriptives / Tableau9 croiss EntreM la variable dans la li#ne et l0autre dans la colonne 5liqueM sur le bouton 0tatistiques et choisir le test Chi = deu9 puis sur le bouton continue 5liqueM sur le bouton Cellules et slectionner les frquences observes & bserv) et les frquences thoriques &Thorique). 5liqueM sur Continue puis sur 6@ pour lancer le traitement. *uest*asculin Cminin Cminin Cminin Cminin Cminin *asculin *asculin *asculin *asculin Cminin *asculin *asculin *asculin *uest. =8 F DO ans II ans et plus =8 F DO ans =8 F DO ans =8 F DO ans DI F IO ans II ans et plus =8 F DO ans DI F IO ans =8 F DO ans II ans et plus II ans et plus II ans et plus DI F IO ans

Su$diviser un fic ier . 5liquer sur la commande Donnes / Scinder un fichier / comparer les groupes . 'lectionner la liste de variable /a subdivision de fichier est quivalente travailler avec deu# ou trois fichiers. &E#emples)