Traitement de données avec SPSS

Une fois achevée la "récolte des données" par questionnaire, par entretien ou par toute autre méthode, celles-ci doivent être structurées et analysées. En fonction de la méthode utilisée, les données récoltées sont comptées, résumées, calculées ou interprétées, puis présentées de manière à en obtenir une bonne vue d ensemble. !es connaissances spécifiques sont nécessaires à cet effet "uand les données récoltées sont e#aminées et structurées. $l e#istent des pro%rammes électroniques qui facilitent le traitement de données numériques &par e#emple E#cel, '('') et de données verbales &par e#emple *icrosoft +ord, ,tlas-ti, -).

Définition
. . /e lo%iciel &'('') est un lo%iciel de %estion et d analyse de données statistiques de portée %énérale. /e lo%iciel '('' constitue un système de traitement de données permettant, à partir de fichiers '('' ou à partir d0autres types de fichiers &E#cel, !base, ,ccess -) de %énérer divers tableau#, %raphiques et dia%rammes ou encore d0effectuer divers traitements statistiques & descriptive 1 référentiel).

Utilisation
2n peut utiliser le lo%iciel '('' pour effectuer différentes t3ches, comme par e#emple4 A) La présentation des données sources . 2n peut importer ou saisir en direct des données dans une feuille de tableur présente dans le lo%iciel. . /e 5opier - coller de tableau permet de réutiliser en cha6ne les valeurs résultats de tableau. . 2n peut trier des résultats. . . /e lo%iciel permet la division et l éclatement de fichiers. . /a création d une nouvelle variable est possible à partir d autres variables et de formules. B) Le traitement des données 7outes les opérations de base &écart-type, moyenne, variance, médiane, mode, etc...) peuvent être réalisées. C) Les tests statistiques 4 7est student, 5hi-deu#, D) Représentations grap iques! /es %raphiques &histo%rammes, secteurs, boites, points, etc.) sont copiables vers d0autres lo%iciels.

$l facilite la saisie des données en diminuant les risques d0erreur de frappe.$l favorise une économie d0espace en mémoire et de temps. 50est à dire nous codifions par un chiffre une variable qualitative.). . . .  /e nom d0une variable ne peut contenir des espaces blancs ou des caractères spéciau# &comme 9 .Aariable cha6ne 4 séquence de >B caractères &lettres. 5e coda%e présente un double avanta%e 4 . E#emple 4 = pour se#e masculin et > pour se#e féminin. $l est possible d0effectuer des dénombrements et des tris. nous créons des données artificiellement numériques.") #anipulation de $ase sur les données %) Saisie de données & partir de SPSS 5ette opération s0effectue en deu# étapes 4 . chiffres) . - . $l arrive souvent que. !éfinir les variables et leurs propriétés .  /a lon%ueur du nom de la variable ne peut e#céder 8 caractères. par e#emple . . . a) Les t)pes de données . : et . Une donnée est de type alphanumérique lorsqu0elle peut prendre pour ?valeurs’ à la fois des lettres et des chiffres. !ollar. mais il y a d0autres types de variables disponibles dans '(''. /es traitements arithmétiques et statistiques possibles sont plus limités avec des informations de cette nature . . <ous disons qu0une donnée est de type numérique lorsqu0elle réfère à un nombre tant dans sa représentation que dans son utilisation. $l e#iste d0autres types de données. tels ceu# de dates et de devises $) Affic age des varia$les /0afficha%e des variables est utilisé pour spécifier les noms et les propriétés des variables .Aariables !ate.) 'aisir les noms de variables choisies &colonne ?<om0) $l suffit de nommer la première variable en respectant les rè%les pour nommer les variables @) 5han%er le type de variable &colonne ?7ype0) (ar défaut le type de variable montré dans la colonne étiquette 7ype est numérique. symboles.  !onner une étiquette à une variable c0est donner une identification plus e#plicite à cette variable qui sera affichée dans les différents calculs statistiques. . espaces. pour faciliter le traitement.  5haque nom de variable doit être unique. . 'aisir les données Les r'gles & respecter pour définir le nom d(une varia$le !  /e nom doit commencer par une lettre. /es noms et les prénoms d0individus constituent des e#emples de variable alphanumériques.  Un nom de variable ne peut se terminer par un point.

. . -. il ne peut y avoir aucune cellule vide dans la série de données.5) 5han%er la lar%eur de la variable &colonne ?/ar%eur0) !) 5han%er le nombre de décimales de variable &colonne ?!écimale0) E) 'aisir l0étiquette de variable &colonne ?Etiquette0) . les colonnes &représentant les variables) et les li%nes &représentant les observations). '('' fournit une valeur manquante système. >. . . !ans '(''. C) Aaleurs étiquettes de valeurs &colonne ?Aaleurs0) . E# 4 = 4 *asculin >4 Céminin 50est une étape très importante dans l0afficha%e des variables. .Etiquettes des valeurs 4 sont les continues des variables. (ar conséquent. /es données ordinales 4 constituants en des ran%s. D . qui est indiqué dans l0éditeur de données par un point.$l est souvent avanta%eu# d0e#pliciter quelques fois le nom éni%matique d0une variable avec une étiquette e#plicative plus lon%ue. des affectations caté%ories ordonnées ou d0informations séquentielles. . H) <iveau de mesure &colonne ?mesure0) . E) Aaleurs manquantes &colonne ?*anquant0) ./es étiquettes permettent d0améliorer les apparences des résultats. /es données échelles 4 ce sont des données numérique 4 le poids. . 'ouvent on utilise le code GG pour les valeurs manquantes. le %enre. 5omme par e#. car elle permet de codifier le contenu des variables. et autre statistique. écart F type. . la taille. =.Aaleurs 4 sont des codes par e# 4 B. 5e sont des étiquettes. E# 4 7rès satisfait 'atisfait <on satisfait. '('' e#clura les valeurs manquantes système des calculs de moyenne. si une cellule n0a pas été rempli par l0utilisateur. /es données nominales 4 le %roupe san%uin.

%/-0 %*-.nalyse 1 Japport 1 Jécapitulatif des observations c) Affic er les informations sur le fic ier des données 4  5ommandes 4 Cichier 1 .fficher informations sur les données 1 2uvrir. %/-. Un chronométra%e de cette opération sur >I unités de même type donne le temps ci-contre. %*-/ a) Trier des données  5liquer sur la commande Données / Trier les observations puis sélectionner la liste de variable. Temps o$servés +minutes) . %/-/ %%-. 3uestionnaire . %/-.-0 %/-% %/-2 %%-. $) Listing des données4  5ommandes 4 . %/-.-% %%-0 %*-. le temps requis pour effectuer l0assembla%e d0un monta%e transistorisé est de =B minutes. %%-1 %%-. .*) #anipulations de données E#emple 4 !ans une entreprise.-1 %/-. %*-* . %%-/ %/-1 %%-% %%-1 %/-.

ND Eroupe D O = D > = O D O > Cume = > = > = > > > = = "") La statistique descriptive . Eroupe .@ . "uel est votre 3%e en année : 4  "uel est votre se#e : 4 * C .8D =.PI =.N8 =.P> =.NB =.rts *édecine 'ciences .IG =.PN =.utre  "uel est votre domaine d0étude 4  "uel est votre niveau : 4 Ktudiant !octorant  "uel est votre poids en L% : 4  "uelle est votre taille en mètre : 4  "uel est votre %roupe san%uin : 4 Eroupe 2 Eroupe @  Est F ce que vous fumeM : 4 2ui <on Eroupe .%e DB >I >N DD OB >O >= OI >D DP 'e#e * C C C * * C * C * Ktude > = D O = > O > > D <iveau D > > = = O > = = O (oids NI II IN IG 8I PI PB 8N II NG 7aille =.NI =.utres *a6trise .8B =.

partir des résultas obtenus précédemment.5liquer sur la boite Remplacer . ----------T = ----------T > ----------T D /es classes sont 4 =..5liquer sur la boite Poursuivre .88 /es commandes sont 4 . la fin on faire l(étiquette pour la nouvelle variable &e#emple 4.) Distri$ution de fréquences et istogramme (our obtenir la distribution de fréquences et histo%ramme.5liquer sur Intervalle . 5liquer sur la commande Analyse / statistique descriptive / Fréquences4 *oyenne 1 *édiane 1 *ode 1 'omme 1 Ecart .ncienneté par classes) . O) Traitement de données nominales .PP) .PN R S R =.type 1 Aariance - *4 Dépouillement des valeurs d(une varia$le continue selon une distri$ution de fréquence .%4 Calcul de diverses statistiques .II R S R =.Enter les valeurs limites &e#emple 4 =.5liquer sur Ajouter .Jépéter les mêmes opérations pour les autres données . 2n veut obtenir la distribution de fréquences en classes de la variable continue A &taille).5liquer sur Transformer / Recoder / Création de variable .PP =. . la répartition des données en classes peut s0effectuer de la faQon suivante.NP =.II et =.Entrer dans la boite de variable de destination . .NNR S R =. !ésactiver toutes les commandes de la fenêtre 'tatistique %moyenne& mode& '( / continue / !. . 5hoisir la variable &e# 4 (oids par classe) / "ia#rammes / $isto#ramme / Continue / .5liquer sur ! .Entrer dans la boite nouvelle valeur & e#emple 4 =) .Cliquer sur la boite ancienne et nouvelle valeur . cliquer sur la commande 1Analyse / Fréquences 1 . .

puis dans le champ )tiquette de valeur4 8e prend pas l(auto$us.5liqueM sur le bouton Ajouter et l0information saisie se retrouvera dans la Mone voisine .aleur 4 %. "uestion > 4 'e#e 4 *asculin .EntreM dans le champ ..<e prend pas l0autobus --.aleur 4 >.Céminin "uestion D 4 .. DI F IO ans -.%e =8 F DO ans DI F IO ans II ans et plus = > D Les commandes sont ! . II ans et plus -. . aveM-vous pris l0autobus de faQon ré%ulière ou occasionnelle : ..5liqueM sur Afficha#e des variables . . =8 F DO ans -.EntreM dans la colonne )tiquette de la variable *uest+ la variable 4 (rendre l(auto$us . . puis dans le champ )tiquette de valeur 4 Réguli're. .EntreM dans le champ . .puis entreM dans le champ . . .2ccasionnelle ---..5liquer sur la colonne :aleurs.5liqueM sur le bouton Ajouter et l0information saisie se retrouvera dans la Mone voisine . .u cours des => mois.%e 4 . .Jé%ulière ---.aleur 4 D. . 54%) 6n va associer des codes et des étiquettes au7 diverses modalités des varia$les 86# 9T"3U9TT9 "uest= (rendre l0autobus :AL9URS +#6DAL"T9S) Jé%ulière 2ccasionnelle <e prend pas l0autobus C6D9S = > D "uest> 'e#e *asculin Céminin = > "uestD .5liqueM sur le bouton Ajouter et l0information saisie se retrouvera dans la Mone voisine. "uestion = 4 . puis dans le champ )tiquette de valeur 4 6ccasionnelle.

./a codification des modalités des variables "uest> et "uestD s0effectuent de la même faQon. Ta$leau des données *uest+ Jé%ulière <e prend pas l0autobus 2ccasionnelle Jé%ulière <e prend pas l0autobus <e prend pas l0autobus Jé%ulière <e prend pas l0autobus 2ccasionnelle Jé%ulière <e prend pas l0autobus 2ccasionnelle <e prend pas l0autobus 2ccasionnelle *uest*asculin Céminin Céminin Céminin Céminin Céminin *asculin *asculin *asculin *asculin Céminin *asculin *asculin *asculin *uest.. .5liqueM sur Continue puis sur !.) 6n veut éla$orer un diagramme illustrant la répartition des répondants selon les diverses modalités de la question % +utilisation de l(auto$us) en tenant compte du se7e du répondant4 . 5liquer sur la commande Statistique descriptive / Fréquences 'électionner la variable "uest= 5liqueM sur le bouton Diagrammes puis sélectionner raphique en secteurs et pourcentages 5liquer sur 5ontinue puis 2L 2n procède de la même faQon pour la variable "uest>.u lieu de la commande Eraphique en secteurs on sélectionne Diagrammes en b!tons. . . . /es résultats sont présentés de la faQon suivante 4 54. . =8 F DO ans II ans et plus =8 F DO ans =8 F DO ans =8 F DO ans DI F IO ans II ans et plus =8 F DO ans DI F IO ans =8 F DO ans II ans et plus II ans et plus II ans et plus DI F IO ans 54*) 6n va maintenant dépouiller les données +nominales) de la question % selon une distri$ution de fréquences et on trace un diagramme & secteurs +/raphique en secteurs)4 .

on reWette Ho et on dit 4 . . . 5eci permet d0avoir la boite de dialo%ue !ia%rammes en b3tons.BI &'i%nificative) . ce qui va nous permettre de visualiser le pourcenta%e de répondants d0après la fréquence d0utilisation du transport en commun avec une distinction quant au se#e du répondant.B=) des chances &mais moins de IX) d0être due au hasard. .. !ifférence si%nificative à p Y B. que la différence soit due au hasard. 'i%nificative &') 4 si la différence observée a plus de =X &B. soit 4 'imple Uu#taposé &5até%orisé) Empilé 2n veut le type "u#taposé &5até%orisé). puis la variable "uest> sur l0a#e des ordonnées./orsqu0on teste la différence &entre moyenne par e#emple). . on adopte Ho et on dit que la différence n0est pas si%nificative &< ').B= &7rès si%nificative) """) Comparaisons de mo)ennes /es différents tests de comparaison de moyenne qui e#iste en '('' sont 4 . Les niveau7 de signification .BI) des chances ou moins. 7rès si%nificative &7 ') 4 si la différence observée à =X de chance ou moins d0être due au hasard. '0il y a plus de I X &B. . on se posera la question suivante4 /a différence observée entre les échantillons doit-elle être attribuée au hasard ou bien provient-elle d0une cause systématique: .ccepter HB 4 50est la différence observée est attribuable au# fluctuations dues au hasard de l0échantillonna%e.BI) des chances que la différence observée soit due au hasard. . . 5liqueM sur l0icVne identifiant "u#taposé / $écapitulatifs pour groupes d’observations puis Définir% 5eci permet d0avoir une boite de dialo%ue 4 (laceM la variable "uest= sur l0a#e des abscisses. '0il y a IX &B.BI &<on si%nificative) . !ifférence non si%nificative à p T B. !ifférence si%nificative à p Y B. JeWeter HB 4 50est la différence observée est due à une cause systématique La r'gle ar$itraire est la suivante 4 . 2n note les niveau# de si%nification de la manière suivante 4 . . 5liqueM sur le bouton & d’observations puis '( pour lancer le traitement. !ans la barre menus. sélectionner Eraphes 1 @3tons. . . 5elle F ci présente trois types de dia%rammes à barres.

)*'+) à . >.=. O. Test T pour échantillons appariés 4 comparaison de deu# séries de mesures appariées. Test T pour échantillon unique 4 7est de comparaison d0une moyenne à une valeur donnée. 2n va choisir un petit échantillon provenant d0une population normale de variance inconnue.D =B.aleur de test.B ==. le temps requis pour effectuer l0assembla%e d0un monta%e transistorisé est de =B minutes.G =B.G ==.D =>.G =>. Test T pour échantillons indépendants4 7est d0é%alité de deu# moyenne.B Les commandes sont ! .8 ==. Un chronométra%e de cette opération sur >I unités de même type donne le temps ci-contre. . facteur4 .P =>.= =B. $l s0a%it d0un test d0é%alité de deu# moyennes.D G. . !ans une entreprise. Temps o$servés +minutes) G. 5liquer sur 0tatistiques descriptives / Comparer les moyennes / puis sur Test T pour échantillon unique. $ntroduiseM la variable temps dans la Mone . %) Test de comparaison d(une mo)enne de population normale & une valeur donnée .G ==. 5e test statistique s0est effectue avec le t de 'tudent.= ==. 5liquer sur ! pour lancer le traitement *) Test d(égalité de deu7 mo)ennes .= ==.P =B. .> G.D =B.nalyse de variance à un seul facteur. D.8 =B.ariable 1 tester et la valeur donnée &%/) dans la Mone Test .G =B. .8 ==.B =B.D =B.8 =.I ==.P =>.

(eut-on attribuer cette différence à une cause systématique ou. l0une pour la classe et l0autre pour les notes. Ta$leau des données en SPSS Classe = 8otes O . /a classe = semble nettement plus faible que la classe >. (our faire cette comparaison en '(''. . au contraire. est-elle attribuable au hasard : En d0autre terme.8O N. ou bien doiton penser que la différence provient du hasard dans la composition des classes : 2n va commencer par la saisie des données.E#emple 4 'oit deu# classes qui obtiennent au même test péda%o%ique &noté sur =B). Ta$leau des données 5lasse = O I P N G 8 P I N I D O N 5lasse> 8 N G 8 P 8 G N 8 8 =B G N 8 8 N *oyenne > Z *oyenne = Z I. la classe > est-elle réellement plus forte que la classe =.GD . on doit utiliser deu# variables. .

5liquer sur Analyse / Comparer les moyennes puis Test T pour échantillons indépendants2 . .5liquer sur Continue puis ! pour lancer le traitement . (uis cliquer dans la boite "éfinir #roupes. .Ecrire la valeur % dans la Mone /roupe+ et la valeur * dans la Mone /roupe-.$ntroduiseM la variable 8otes dans la Mone . . .ariable 1 tester et la variable Classe dans la Mone Crit3re de re#roupement. .= = = = = = = = = = = = > > > > > > > > > > > > > > > > I P N G 8 P I N I D O N 8 N G 8 P 8 G N 8 8 =B G N 8 8 N Les commandes sont ! .

%* Les commandes sont ! .$l serait alors incorrect de procéder à un test de comparaison de moyennes. %5 %2 %5 %% %5 %% %. %* %% %* %% . %/ %* %% . 'électionner Analyse / Comparer les moyennes puis Test T pour échantillons appariés2 $ntroduiseM les deu# variables &Avant et Apr's) dans la boite . (our cela on a passer un test à un certain nombre de personne avant et après la formation. %0 %/ . %. 1 . ..) Comparaisons de deu7 séries de mesures appariées . . . %/ %. . /es résultats obtenus sont présentés dan le tableau suivant Avant le programme %2 %. E#emple4 2n veut évaluer l0effet ou l0efficacité d0un pro%ramme d0apprentissa%e.$l s0a%it des données qui sont obtenues à partir de la même unité e#périmentale &même individu par e#emple) avant et après avoir subir un certain traitement. . . /0outil statistique approprié est alors un test sur la différence de mesures. . Apr's le programme %.ariables appariées2 5liquer sur le bouton ptions et spécifier un intervalle de confiance à 445. 5liquer sur Continue puis ! pour lancer le traitement. <ous somme alors en présence de mesures dépendantes ou appariées.

2n va commencer par la saisie des données. . . %. >roupe * %. . 5lasse = = <otes =B => .!ans le %roupe = on applique l0ensei%nement ma%istral . 2n veut comparer le résultat moyen de trois %roupes d0élèves et tester s0il e#iste une différence si%nificative au seuil de si%nification IX. /0outil statistique approprié est une analyse de variance suivant un seul facteur &6ne<=a) Anova). /0analyse de variance permet aussi de comparer les moyennes deu# à deu# 97emple ! 2n constitue trois %roupes d0élèves sélectionnés au hasard et on leur ensei%ne la même matière de trois faQons différentes 4 . 2n ne peut pas utiliser le test t de 'tudent. %.!ans le %roupe > un cours pro%rammé appliqué sous surveillance .!ans le %roupe D partiellement à domicile. $l s0a%it de la comparaison plus de deu# moyennes. >roupe .(our faire cette comparaison en '(''. %5 %1 %. /es résultats obtenus sont présentés dan le tableau suivant 4 >roupe % %/ %* 1 %5 .5)Test d(égalité de trois mo)ennes . on doit utiliser deu# variables 4 l0une pour la classe et l0autre pour les notes. %5 %1 %2 %2 %5 %0 %2 %.

. on va 4 .ariables dépendantes et la variable classe la boite Crit3re2 5liquer sur le bouton ptions et choisir Caractéristique 7 Test d8é#alité des variances et e9clure les observations analyse par analyse puis Poursuivre. .<. . élaborer un tableau croisé . $ntroduiseM la variable résultat dans la boite . associer un code et une étiquette au# diverses modalités d0une variable . 8 =O G =D =N =G =O =8 =N =O =8 =I =I =O =P =I =D 'électionner Analyse / Comparer les moyennes puis A6 .A 1 + facteur.&.= = = = > > > > > D D D D D D D D Les commandes sont ! . 5liquer sur le bouton Post $oc et sélectionner la méthode de comparaisons multiples de :onferroni avec un seuil de si%nification . 5liquer sur Continue puis sur ! pour lancer le traitement. . :") Le ta$leau croisé !ans ce chapitre. obtenir diverses statistiques associées au# variables du tableau croisé Définition Un ta$leau croisé consiste en un ta$leau & dou$le entrée o? les modalités d(une varia$le sont croisées avec les modalités d(une autre varia$le4 Ce ta$leau est fréquent lorsque l(on veut e7aminer s(il e7iste une certaine dépendance entre deu7 varia$les4 .

'électionner la liste de variable /a subdivision de fichier est équivalente à travailler avec deu# ou trois fichiers. *uest*asculin Céminin Céminin Céminin Céminin Céminin *asculin *asculin *asculin *asculin Céminin *asculin *asculin *asculin *uest. .E#emple 4 2n va utiliser un sonda%e sur le transport en commun et élaborer un tableau croisé des modalités de la fréquence d0utilisation de l0autobus &quest=) avec les caté%ories d03%e. &E#emples) . 5liquer sur la commande Données / Scinder un fichier / comparer les groupes . . 'électionneM 0tatistiques descriptives / Tableau9 croisés EntreM la variable dans la li#ne et l0autre dans la colonne 5liqueM sur le bouton 0tatistiques et choisir le test Chi = deu9 puis sur le bouton continue 5liqueM sur le bouton Cellules et sélectionner les fréquences observées & bservé) et les fréquences théoriques &Théorique). 7ableau des données *uest+ Jé%ulière <e prend pas l0autobus 2ccasionnelle Jé%ulière <e prend pas l0autobus <e prend pas l0autobus Jé%ulière <e prend pas l0autobus 2ccasionnelle Jé%ulière <e prend pas l0autobus 2ccasionnelle <e prend pas l0autobus 2ccasionnelle Les commandes sont ! . =8 F DO ans II ans et plus =8 F DO ans =8 F DO ans =8 F DO ans DI F IO ans II ans et plus =8 F DO ans DI F IO ans =8 F DO ans II ans et plus II ans et plus II ans et plus DI F IO ans Su$diviser un fic ier . . 5liqueM sur Continue puis sur 6@ pour lancer le traitement. .

Sign up to vote on this title
UsefulNot useful