Traitement de données avec SPSS

Une fois achevée la "récolte des données" par questionnaire, par entretien ou par toute autre méthode, celles-ci doivent être structurées et analysées. En fonction de la méthode utilisée, les données récoltées sont comptées, résumées, calculées ou interprétées, puis présentées de manière à en obtenir une bonne vue d ensemble. !es connaissances spécifiques sont nécessaires à cet effet "uand les données récoltées sont e#aminées et structurées. $l e#istent des pro%rammes électroniques qui facilitent le traitement de données numériques &par e#emple E#cel, '('') et de données verbales &par e#emple *icrosoft +ord, ,tlas-ti, -).

Définition
. . /e lo%iciel &'('') est un lo%iciel de %estion et d analyse de données statistiques de portée %énérale. /e lo%iciel '('' constitue un système de traitement de données permettant, à partir de fichiers '('' ou à partir d0autres types de fichiers &E#cel, !base, ,ccess -) de %énérer divers tableau#, %raphiques et dia%rammes ou encore d0effectuer divers traitements statistiques & descriptive 1 référentiel).

Utilisation
2n peut utiliser le lo%iciel '('' pour effectuer différentes t3ches, comme par e#emple4 A) La présentation des données sources . 2n peut importer ou saisir en direct des données dans une feuille de tableur présente dans le lo%iciel. . /e 5opier - coller de tableau permet de réutiliser en cha6ne les valeurs résultats de tableau. . 2n peut trier des résultats. . . /e lo%iciel permet la division et l éclatement de fichiers. . /a création d une nouvelle variable est possible à partir d autres variables et de formules. B) Le traitement des données 7outes les opérations de base &écart-type, moyenne, variance, médiane, mode, etc...) peuvent être réalisées. C) Les tests statistiques 4 7est student, 5hi-deu#, D) Représentations grap iques! /es %raphiques &histo%rammes, secteurs, boites, points, etc.) sont copiables vers d0autres lo%iciels.

$l facilite la saisie des données en diminuant les risques d0erreur de frappe. chiffres) . mais il y a d0autres types de variables disponibles dans '(''. tels ceu# de dates et de devises $) Affic age des varia$les /0afficha%e des variables est utilisé pour spécifier les noms et les propriétés des variables . !ollar. nous créons des données artificiellement numériques. . !éfinir les variables et leurs propriétés .Aariable cha6ne 4 séquence de >B caractères &lettres. . $l arrive souvent que. 'aisir les données Les r'gles & respecter pour définir le nom d(une varia$le !  /e nom doit commencer par une lettre. <ous disons qu0une donnée est de type numérique lorsqu0elle réfère à un nombre tant dans sa représentation que dans son utilisation.) 'aisir les noms de variables choisies &colonne ?<om0) $l suffit de nommer la première variable en respectant les rè%les pour nommer les variables @) 5han%er le type de variable &colonne ?7ype0) (ar défaut le type de variable montré dans la colonne étiquette 7ype est numérique.  /a lon%ueur du nom de la variable ne peut e#céder 8 caractères. Une donnée est de type alphanumérique lorsqu0elle peut prendre pour ?valeurs’ à la fois des lettres et des chiffres. E#emple 4 = pour se#e masculin et > pour se#e féminin.). espaces. pour faciliter le traitement. .  5haque nom de variable doit être unique.  /e nom d0une variable ne peut contenir des espaces blancs ou des caractères spéciau# &comme 9 . a) Les t)pes de données . 50est à dire nous codifions par un chiffre une variable qualitative. /es noms et les prénoms d0individus constituent des e#emples de variable alphanumériques. . .") #anipulation de $ase sur les données %) Saisie de données & partir de SPSS 5ette opération s0effectue en deu# étapes 4 . . $l e#iste d0autres types de données. /es traitements arithmétiques et statistiques possibles sont plus limités avec des informations de cette nature .  !onner une étiquette à une variable c0est donner une identification plus e#plicite à cette variable qui sera affichée dans les différents calculs statistiques. - .Aariables !ate. par e#emple . . symboles. : et .$l favorise une économie d0espace en mémoire et de temps. 5e coda%e présente un double avanta%e 4 . . $l est possible d0effectuer des dénombrements et des tris.  Un nom de variable ne peut se terminer par un point.

si une cellule n0a pas été rempli par l0utilisateur. le %enre. les colonnes &représentant les variables) et les li%nes &représentant les observations). -. =. . 'ouvent on utilise le code GG pour les valeurs manquantes. /es données ordinales 4 constituants en des ran%s. . '('' e#clura les valeurs manquantes système des calculs de moyenne. 5e sont des étiquettes. C) Aaleurs étiquettes de valeurs &colonne ?Aaleurs0) . 5omme par e#. . . E) Aaleurs manquantes &colonne ?*anquant0) . E# 4 = 4 *asculin >4 Céminin 50est une étape très importante dans l0afficha%e des variables. .5) 5han%er la lar%eur de la variable &colonne ?/ar%eur0) !) 5han%er le nombre de décimales de variable &colonne ?!écimale0) E) 'aisir l0étiquette de variable &colonne ?Etiquette0) . . qui est indiqué dans l0éditeur de données par un point. la taille.$l est souvent avanta%eu# d0e#pliciter quelques fois le nom éni%matique d0une variable avec une étiquette e#plicative plus lon%ue. des affectations caté%ories ordonnées ou d0informations séquentielles. /es données échelles 4 ce sont des données numérique 4 le poids. il ne peut y avoir aucune cellule vide dans la série de données. >. (ar conséquent. !ans '(''. . H) <iveau de mesure &colonne ?mesure0) ./es étiquettes permettent d0améliorer les apparences des résultats. E# 4 7rès satisfait 'atisfait <on satisfait. écart F type. /es données nominales 4 le %roupe san%uin.Aaleurs 4 sont des codes par e# 4 B. D . car elle permet de codifier le contenu des variables. et autre statistique. .Etiquettes des valeurs 4 sont les continues des variables. '('' fournit une valeur manquante système.

*) #anipulations de données E#emple 4 !ans une entreprise. %/-. %%-/ %/-1 %%-% %%-1 %/-. %/-/ %%-. %/-0 %*-. %*-* . Un chronométra%e de cette opération sur >I unités de même type donne le temps ci-contre. le temps requis pour effectuer l0assembla%e d0un monta%e transistorisé est de =B minutes. %/-. .-0 %/-% %/-2 %%-. %%-1 %%-. 3uestionnaire . %*-/ a) Trier des données  5liquer sur la commande Données / Trier les observations puis sélectionner la liste de variable.-1 %/-. %/-.fficher informations sur les données 1 2uvrir. $) Listing des données4  5ommandes 4 .nalyse 1 Japport 1 Jécapitulatif des observations c) Affic er les informations sur le fic ier des données 4  5ommandes 4 Cichier 1 .-% %%-0 %*-. Temps o$servés +minutes) .

N8 =.P> =.utre  "uel est votre domaine d0étude 4  "uel est votre niveau : 4 Ktudiant !octorant  "uel est votre poids en L% : 4  "uelle est votre taille en mètre : 4  "uel est votre %roupe san%uin : 4 Eroupe 2 Eroupe @  Est F ce que vous fumeM : 4 2ui <on Eroupe .IG =.rts *édecine 'ciences .%e DB >I >N DD OB >O >= OI >D DP 'e#e * C C C * * C * C * Ktude > = D O = > O > > D <iveau D > > = = O > = = O (oids NI II IN IG 8I PI PB 8N II NG 7aille =. "uel est votre 3%e en année : 4  "uel est votre se#e : 4 * C .NB =.PI =.8D =. Eroupe .ND Eroupe D O = D > = O D O > Cume = > = > = > > > = = "") La statistique descriptive .8B =.NI =.@ .PN =.utres *a6trise .

Cliquer sur la boite ancienne et nouvelle valeur .NNR S R =.Enter les valeurs limites &e#emple 4 =.PP) . !ésactiver toutes les commandes de la fenêtre 'tatistique %moyenne& mode& '( / continue / !.Entrer dans la boite nouvelle valeur & e#emple 4 =) . ----------T = ----------T > ----------T D /es classes sont 4 =. 2n veut obtenir la distribution de fréquences en classes de la variable continue A &taille).5liquer sur la boite Remplacer . 5hoisir la variable &e# 4 (oids par classe) / "ia#rammes / $isto#ramme / Continue / . . O) Traitement de données nominales . 5liquer sur la commande Analyse / statistique descriptive / Fréquences4 *oyenne 1 *édiane 1 *ode 1 'omme 1 Ecart .5liquer sur la boite Poursuivre .88 /es commandes sont 4 . .5liquer sur ! . partir des résultas obtenus précédemment.type 1 Aariance - *4 Dépouillement des valeurs d(une varia$le continue selon une distri$ution de fréquence .II R S R =..II et =.PN R S R =.PP =. .ncienneté par classes) .) Distri$ution de fréquences et istogramme (our obtenir la distribution de fréquences et histo%ramme.5liquer sur Ajouter . cliquer sur la commande 1Analyse / Fréquences 1 . .NP =. la fin on faire l(étiquette pour la nouvelle variable &e#emple 4.%4 Calcul de diverses statistiques .Jépéter les mêmes opérations pour les autres données . la répartition des données en classes peut s0effectuer de la faQon suivante.Entrer dans la boite de variable de destination .5liquer sur Intervalle .5liquer sur Transformer / Recoder / Création de variable .

.EntreM dans la colonne )tiquette de la variable *uest+ la variable 4 (rendre l(auto$us .5liqueM sur le bouton Ajouter et l0information saisie se retrouvera dans la Mone voisine . puis dans le champ )tiquette de valeur 4 Réguli're.Céminin "uestion D 4 .5liqueM sur le bouton Ajouter et l0information saisie se retrouvera dans la Mone voisine .EntreM dans le champ .2ccasionnelle ---. =8 F DO ans -. .aleur 4 %.puis entreM dans le champ .. .5liquer sur la colonne :aleurs. .aleur 4 >.5liqueM sur Afficha#e des variables . "uestion > 4 'e#e 4 *asculin . puis dans le champ )tiquette de valeur4 8e prend pas l(auto$us.EntreM dans le champ . DI F IO ans -. .. puis dans le champ )tiquette de valeur 4 6ccasionnelle.aleur 4 D. II ans et plus -. . .Jé%ulière ---.%e 4 .5liqueM sur le bouton Ajouter et l0information saisie se retrouvera dans la Mone voisine.u cours des => mois.<e prend pas l0autobus --.. 54%) 6n va associer des codes et des étiquettes au7 diverses modalités des varia$les 86# 9T"3U9TT9 "uest= (rendre l0autobus :AL9URS +#6DAL"T9S) Jé%ulière 2ccasionnelle <e prend pas l0autobus C6D9S = > D "uest> 'e#e *asculin Céminin = > "uestD . . aveM-vous pris l0autobus de faQon ré%ulière ou occasionnelle : . "uestion = 4 .%e =8 F DO ans DI F IO ans II ans et plus = > D Les commandes sont ! . . ..

=8 F DO ans II ans et plus =8 F DO ans =8 F DO ans =8 F DO ans DI F IO ans II ans et plus =8 F DO ans DI F IO ans =8 F DO ans II ans et plus II ans et plus II ans et plus DI F IO ans 54*) 6n va maintenant dépouiller les données +nominales) de la question % selon une distri$ution de fréquences et on trace un diagramme & secteurs +/raphique en secteurs)4 . /es résultats sont présentés de la faQon suivante 4 54./a codification des modalités des variables "uest> et "uestD s0effectuent de la même faQon.5liqueM sur Continue puis sur !. 5liquer sur la commande Statistique descriptive / Fréquences 'électionner la variable "uest= 5liqueM sur le bouton Diagrammes puis sélectionner raphique en secteurs et pourcentages 5liquer sur 5ontinue puis 2L 2n procède de la même faQon pour la variable "uest>. .u lieu de la commande Eraphique en secteurs on sélectionne Diagrammes en b!tons. . .. . Ta$leau des données *uest+ Jé%ulière <e prend pas l0autobus 2ccasionnelle Jé%ulière <e prend pas l0autobus <e prend pas l0autobus Jé%ulière <e prend pas l0autobus 2ccasionnelle Jé%ulière <e prend pas l0autobus 2ccasionnelle <e prend pas l0autobus 2ccasionnelle *uest*asculin Céminin Céminin Céminin Céminin Céminin *asculin *asculin *asculin *asculin Céminin *asculin *asculin *asculin *uest. .) 6n veut éla$orer un diagramme illustrant la répartition des répondants selon les diverses modalités de la question % +utilisation de l(auto$us) en tenant compte du se7e du répondant4 . .

BI &'i%nificative) .ccepter HB 4 50est la différence observée est attribuable au# fluctuations dues au hasard de l0échantillonna%e. ce qui va nous permettre de visualiser le pourcenta%e de répondants d0après la fréquence d0utilisation du transport en commun avec une distinction quant au se#e du répondant./orsqu0on teste la différence &entre moyenne par e#emple).. sélectionner Eraphes 1 @3tons.BI) des chances ou moins.B=) des chances &mais moins de IX) d0être due au hasard. JeWeter HB 4 50est la différence observée est due à une cause systématique La r'gle ar$itraire est la suivante 4 .B= &7rès si%nificative) """) Comparaisons de mo)ennes /es différents tests de comparaison de moyenne qui e#iste en '('' sont 4 . '0il y a plus de I X &B. . . !ifférence non si%nificative à p T B. '0il y a IX &B. on se posera la question suivante4 /a différence observée entre les échantillons doit-elle être attribuée au hasard ou bien provient-elle d0une cause systématique: .BI) des chances que la différence observée soit due au hasard. 5liqueM sur le bouton & d’observations puis '( pour lancer le traitement. on adopte Ho et on dit que la différence n0est pas si%nificative &< '). 'i%nificative &') 4 si la différence observée a plus de =X &B. Les niveau7 de signification . . 5elle F ci présente trois types de dia%rammes à barres. . . !ifférence si%nificative à p Y B. 2n note les niveau# de si%nification de la manière suivante 4 . puis la variable "uest> sur l0a#e des ordonnées. 5liqueM sur l0icVne identifiant "u#taposé / $écapitulatifs pour groupes d’observations puis Définir% 5eci permet d0avoir une boite de dialo%ue 4 (laceM la variable "uest= sur l0a#e des abscisses. . !ifférence si%nificative à p Y B. !ans la barre menus. 7rès si%nificative &7 ') 4 si la différence observée à =X de chance ou moins d0être due au hasard. soit 4 'imple Uu#taposé &5até%orisé) Empilé 2n veut le type "u#taposé &5até%orisé). .BI &<on si%nificative) . 5eci permet d0avoir la boite de dialo%ue !ia%rammes en b3tons. . que la différence soit due au hasard. on reWette Ho et on dit 4 . . .

=.ariable 1 tester et la valeur donnée &%/) dans la Mone Test . Test T pour échantillons indépendants4 7est d0é%alité de deu# moyenne. 2n va choisir un petit échantillon provenant d0une population normale de variance inconnue. %) Test de comparaison d(une mo)enne de population normale & une valeur donnée .D =B. Temps o$servés +minutes) G.> G.P =>. . $ntroduiseM la variable temps dans la Mone . 5e test statistique s0est effectue avec le t de 'tudent.G =>. D. $l s0a%it d0un test d0é%alité de deu# moyennes. .P =B.B ==. O. . >.nalyse de variance à un seul facteur.P =>.= ==.G =B. facteur4 .G =B. Un chronométra%e de cette opération sur >I unités de même type donne le temps ci-contre.B =B.= =B. .D =B.= ==.8 ==.8 =.I ==.D G. !ans une entreprise.D =>. 5liquer sur 0tatistiques descriptives / Comparer les moyennes / puis sur Test T pour échantillon unique.B Les commandes sont ! . 5liquer sur ! pour lancer le traitement *) Test d(égalité de deu7 mo)ennes . )*'+) à .8 ==. Test T pour échantillon unique 4 7est de comparaison d0une moyenne à une valeur donnée.D =B.aleur de test.G ==.G ==.8 =B. Test T pour échantillons appariés 4 comparaison de deu# séries de mesures appariées. le temps requis pour effectuer l0assembla%e d0un monta%e transistorisé est de =B minutes.

la classe > est-elle réellement plus forte que la classe =. Ta$leau des données 5lasse = O I P N G 8 P I N I D O N 5lasse> 8 N G 8 P 8 G N 8 8 =B G N 8 8 N *oyenne > Z *oyenne = Z I. l0une pour la classe et l0autre pour les notes.E#emple 4 'oit deu# classes qui obtiennent au même test péda%o%ique &noté sur =B). . au contraire. on doit utiliser deu# variables. (eut-on attribuer cette différence à une cause systématique ou. ou bien doiton penser que la différence provient du hasard dans la composition des classes : 2n va commencer par la saisie des données. Ta$leau des données en SPSS Classe = 8otes O .8O N. /a classe = semble nettement plus faible que la classe >. est-elle attribuable au hasard : En d0autre terme. . (our faire cette comparaison en '(''.GD .

.ariable 1 tester et la variable Classe dans la Mone Crit3re de re#roupement. (uis cliquer dans la boite "éfinir #roupes. . .= = = = = = = = = = = = > > > > > > > > > > > > > > > > I P N G 8 P I N I D O N 8 N G 8 P 8 G N 8 8 =B G N 8 8 N Les commandes sont ! . 5liquer sur Analyse / Comparer les moyennes puis Test T pour échantillons indépendants2 . .Ecrire la valeur % dans la Mone /roupe+ et la valeur * dans la Mone /roupe-.$ntroduiseM la variable 8otes dans la Mone .5liquer sur Continue puis ! pour lancer le traitement . .

%* %% %* %% . %* Les commandes sont ! .$l serait alors incorrect de procéder à un test de comparaison de moyennes. %5 %2 %5 %% %5 %% %.ariables appariées2 5liquer sur le bouton ptions et spécifier un intervalle de confiance à 445. . . %0 %/ .) Comparaisons de deu7 séries de mesures appariées . /0outil statistique approprié est alors un test sur la différence de mesures. %. . . E#emple4 2n veut évaluer l0effet ou l0efficacité d0un pro%ramme d0apprentissa%e. 'électionner Analyse / Comparer les moyennes puis Test T pour échantillons appariés2 $ntroduiseM les deu# variables &Avant et Apr's) dans la boite .. . <ous somme alors en présence de mesures dépendantes ou appariées. 1 . %/ %* %% . (our cela on a passer un test à un certain nombre de personne avant et après la formation.$l s0a%it des données qui sont obtenues à partir de la même unité e#périmentale &même individu par e#emple) avant et après avoir subir un certain traitement. Apr's le programme %. . 5liquer sur Continue puis ! pour lancer le traitement. . %/ %. /es résultats obtenus sont présentés dan le tableau suivant Avant le programme %2 %.

%5 %1 %.!ans le %roupe > un cours pro%rammé appliqué sous surveillance . 2n ne peut pas utiliser le test t de 'tudent. >roupe . %.(our faire cette comparaison en '(''. on doit utiliser deu# variables 4 l0une pour la classe et l0autre pour les notes.2n va commencer par la saisie des données. /0analyse de variance permet aussi de comparer les moyennes deu# à deu# 97emple ! 2n constitue trois %roupes d0élèves sélectionnés au hasard et on leur ensei%ne la même matière de trois faQons différentes 4 . . 2n veut comparer le résultat moyen de trois %roupes d0élèves et tester s0il e#iste une différence si%nificative au seuil de si%nification IX. /es résultats obtenus sont présentés dan le tableau suivant 4 >roupe % %/ %* 1 %5 . . . %.5)Test d(égalité de trois mo)ennes . $l s0a%it de la comparaison plus de deu# moyennes. /0outil statistique approprié est une analyse de variance suivant un seul facteur &6ne<=a) Anova). %5 %1 %2 %2 %5 %0 %2 %. >roupe * %.!ans le %roupe = on applique l0ensei%nement ma%istral .!ans le %roupe D partiellement à domicile. 5lasse = = <otes =B => .

.&. obtenir diverses statistiques associées au# variables du tableau croisé Définition Un ta$leau croisé consiste en un ta$leau & dou$le entrée o? les modalités d(une varia$le sont croisées avec les modalités d(une autre varia$le4 Ce ta$leau est fréquent lorsque l(on veut e7aminer s(il e7iste une certaine dépendance entre deu7 varia$les4 . 5liquer sur Continue puis sur ! pour lancer le traitement. associer un code et une étiquette au# diverses modalités d0une variable .= = = = > > > > > D D D D D D D D Les commandes sont ! . on va 4 . . 8 =O G =D =N =G =O =8 =N =O =8 =I =I =O =P =I =D 'électionner Analyse / Comparer les moyennes puis A6 .ariables dépendantes et la variable classe la boite Crit3re2 5liquer sur le bouton ptions et choisir Caractéristique 7 Test d8é#alité des variances et e9clure les observations analyse par analyse puis Poursuivre. élaborer un tableau croisé . . 5liquer sur le bouton Post $oc et sélectionner la méthode de comparaisons multiples de :onferroni avec un seuil de si%nification . :") Le ta$leau croisé !ans ce chapitre. .<. $ntroduiseM la variable résultat dans la boite .A 1 + facteur.

'électionneM 0tatistiques descriptives / Tableau9 croisés EntreM la variable dans la li#ne et l0autre dans la colonne 5liqueM sur le bouton 0tatistiques et choisir le test Chi = deu9 puis sur le bouton continue 5liqueM sur le bouton Cellules et sélectionner les fréquences observées & bservé) et les fréquences théoriques &Théorique). . 'électionner la liste de variable /a subdivision de fichier est équivalente à travailler avec deu# ou trois fichiers. 5liqueM sur Continue puis sur 6@ pour lancer le traitement. . .E#emple 4 2n va utiliser un sonda%e sur le transport en commun et élaborer un tableau croisé des modalités de la fréquence d0utilisation de l0autobus &quest=) avec les caté%ories d03%e. . =8 F DO ans II ans et plus =8 F DO ans =8 F DO ans =8 F DO ans DI F IO ans II ans et plus =8 F DO ans DI F IO ans =8 F DO ans II ans et plus II ans et plus II ans et plus DI F IO ans Su$diviser un fic ier . 7ableau des données *uest+ Jé%ulière <e prend pas l0autobus 2ccasionnelle Jé%ulière <e prend pas l0autobus <e prend pas l0autobus Jé%ulière <e prend pas l0autobus 2ccasionnelle Jé%ulière <e prend pas l0autobus 2ccasionnelle <e prend pas l0autobus 2ccasionnelle Les commandes sont ! . 5liquer sur la commande Données / Scinder un fichier / comparer les groupes . *uest*asculin Céminin Céminin Céminin Céminin Céminin *asculin *asculin *asculin *asculin Céminin *asculin *asculin *asculin *uest. &E#emples) .

Sign up to vote on this title
UsefulNot useful