Traitement de données avec SPSS

Une fois achevée la "récolte des données" par questionnaire, par entretien ou par toute autre méthode, celles-ci doivent être structurées et analysées. En fonction de la méthode utilisée, les données récoltées sont comptées, résumées, calculées ou interprétées, puis présentées de manière à en obtenir une bonne vue d ensemble. !es connaissances spécifiques sont nécessaires à cet effet "uand les données récoltées sont e#aminées et structurées. $l e#istent des pro%rammes électroniques qui facilitent le traitement de données numériques &par e#emple E#cel, '('') et de données verbales &par e#emple *icrosoft +ord, ,tlas-ti, -).

Définition
. . /e lo%iciel &'('') est un lo%iciel de %estion et d analyse de données statistiques de portée %énérale. /e lo%iciel '('' constitue un système de traitement de données permettant, à partir de fichiers '('' ou à partir d0autres types de fichiers &E#cel, !base, ,ccess -) de %énérer divers tableau#, %raphiques et dia%rammes ou encore d0effectuer divers traitements statistiques & descriptive 1 référentiel).

Utilisation
2n peut utiliser le lo%iciel '('' pour effectuer différentes t3ches, comme par e#emple4 A) La présentation des données sources . 2n peut importer ou saisir en direct des données dans une feuille de tableur présente dans le lo%iciel. . /e 5opier - coller de tableau permet de réutiliser en cha6ne les valeurs résultats de tableau. . 2n peut trier des résultats. . . /e lo%iciel permet la division et l éclatement de fichiers. . /a création d une nouvelle variable est possible à partir d autres variables et de formules. B) Le traitement des données 7outes les opérations de base &écart-type, moyenne, variance, médiane, mode, etc...) peuvent être réalisées. C) Les tests statistiques 4 7est student, 5hi-deu#, D) Représentations grap iques! /es %raphiques &histo%rammes, secteurs, boites, points, etc.) sont copiables vers d0autres lo%iciels.

50est à dire nous codifions par un chiffre une variable qualitative. . . . !ollar. $l arrive souvent que. : et .  !onner une étiquette à une variable c0est donner une identification plus e#plicite à cette variable qui sera affichée dans les différents calculs statistiques. /es noms et les prénoms d0individus constituent des e#emples de variable alphanumériques. .  5haque nom de variable doit être unique. $l est possible d0effectuer des dénombrements et des tris. pour faciliter le traitement. . a) Les t)pes de données . nous créons des données artificiellement numériques.) 'aisir les noms de variables choisies &colonne ?<om0) $l suffit de nommer la première variable en respectant les rè%les pour nommer les variables @) 5han%er le type de variable &colonne ?7ype0) (ar défaut le type de variable montré dans la colonne étiquette 7ype est numérique. !éfinir les variables et leurs propriétés . symboles.Aariable cha6ne 4 séquence de >B caractères &lettres.  /a lon%ueur du nom de la variable ne peut e#céder 8 caractères. 'aisir les données Les r'gles & respecter pour définir le nom d(une varia$le !  /e nom doit commencer par une lettre. . /es traitements arithmétiques et statistiques possibles sont plus limités avec des informations de cette nature . <ous disons qu0une donnée est de type numérique lorsqu0elle réfère à un nombre tant dans sa représentation que dans son utilisation. E#emple 4 = pour se#e masculin et > pour se#e féminin. Une donnée est de type alphanumérique lorsqu0elle peut prendre pour ?valeurs’ à la fois des lettres et des chiffres. tels ceu# de dates et de devises $) Affic age des varia$les /0afficha%e des variables est utilisé pour spécifier les noms et les propriétés des variables .). espaces. .$l facilite la saisie des données en diminuant les risques d0erreur de frappe.Aariables !ate. - . chiffres) .") #anipulation de $ase sur les données %) Saisie de données & partir de SPSS 5ette opération s0effectue en deu# étapes 4 . . 5e coda%e présente un double avanta%e 4 .$l favorise une économie d0espace en mémoire et de temps. $l e#iste d0autres types de données.  Un nom de variable ne peut se terminer par un point.  /e nom d0une variable ne peut contenir des espaces blancs ou des caractères spéciau# &comme 9 . mais il y a d0autres types de variables disponibles dans '(''. par e#emple .

5omme par e#. qui est indiqué dans l0éditeur de données par un point. E# 4 = 4 *asculin >4 Céminin 50est une étape très importante dans l0afficha%e des variables.$l est souvent avanta%eu# d0e#pliciter quelques fois le nom éni%matique d0une variable avec une étiquette e#plicative plus lon%ue. . . le %enre. -. C) Aaleurs étiquettes de valeurs &colonne ?Aaleurs0) . '('' e#clura les valeurs manquantes système des calculs de moyenne.5) 5han%er la lar%eur de la variable &colonne ?/ar%eur0) !) 5han%er le nombre de décimales de variable &colonne ?!écimale0) E) 'aisir l0étiquette de variable &colonne ?Etiquette0) . . (ar conséquent. il ne peut y avoir aucune cellule vide dans la série de données. des affectations caté%ories ordonnées ou d0informations séquentielles.Aaleurs 4 sont des codes par e# 4 B. 'ouvent on utilise le code GG pour les valeurs manquantes. E) Aaleurs manquantes &colonne ?*anquant0) . /es données ordinales 4 constituants en des ran%s. . . . et autre statistique./es étiquettes permettent d0améliorer les apparences des résultats. E# 4 7rès satisfait 'atisfait <on satisfait. >. . '('' fournit une valeur manquante système. /es données échelles 4 ce sont des données numérique 4 le poids. car elle permet de codifier le contenu des variables. D . si une cellule n0a pas été rempli par l0utilisateur. les colonnes &représentant les variables) et les li%nes &représentant les observations).Etiquettes des valeurs 4 sont les continues des variables. /es données nominales 4 le %roupe san%uin. H) <iveau de mesure &colonne ?mesure0) . !ans '(''. 5e sont des étiquettes. =. écart F type. . la taille.

%/-/ %%-.-0 %/-% %/-2 %%-.*) #anipulations de données E#emple 4 !ans une entreprise. %/-0 %*-. %/-. %*-/ a) Trier des données  5liquer sur la commande Données / Trier les observations puis sélectionner la liste de variable.fficher informations sur les données 1 2uvrir. Temps o$servés +minutes) .-1 %/-. . %%-1 %%-. %/-. $) Listing des données4  5ommandes 4 . le temps requis pour effectuer l0assembla%e d0un monta%e transistorisé est de =B minutes. %/-. %%-/ %/-1 %%-% %%-1 %/-. 3uestionnaire .-% %%-0 %*-. %*-* .nalyse 1 Japport 1 Jécapitulatif des observations c) Affic er les informations sur le fic ier des données 4  5ommandes 4 Cichier 1 . Un chronométra%e de cette opération sur >I unités de même type donne le temps ci-contre.

8B =.ND Eroupe D O = D > = O D O > Cume = > = > = > > > = = "") La statistique descriptive .utre  "uel est votre domaine d0étude 4  "uel est votre niveau : 4 Ktudiant !octorant  "uel est votre poids en L% : 4  "uelle est votre taille en mètre : 4  "uel est votre %roupe san%uin : 4 Eroupe 2 Eroupe @  Est F ce que vous fumeM : 4 2ui <on Eroupe .@ . Eroupe .IG =. "uel est votre 3%e en année : 4  "uel est votre se#e : 4 * C .PI =.P> =.rts *édecine 'ciences .PN =.8D =.utres *a6trise .%e DB >I >N DD OB >O >= OI >D DP 'e#e * C C C * * C * C * Ktude > = D O = > O > > D <iveau D > > = = O > = = O (oids NI II IN IG 8I PI PB 8N II NG 7aille =.NB =.NI =.N8 =.

5liquer sur la boite Poursuivre .NNR S R =.) Distri$ution de fréquences et istogramme (our obtenir la distribution de fréquences et histo%ramme.. cliquer sur la commande 1Analyse / Fréquences 1 . .PP =. .PN R S R =. .88 /es commandes sont 4 .II et =.ncienneté par classes) .PP) .5liquer sur ! .Entrer dans la boite de variable de destination .5liquer sur la boite Remplacer . 5hoisir la variable &e# 4 (oids par classe) / "ia#rammes / $isto#ramme / Continue / .II R S R =. !ésactiver toutes les commandes de la fenêtre 'tatistique %moyenne& mode& '( / continue / !.NP =. .Entrer dans la boite nouvelle valeur & e#emple 4 =) .Jépéter les mêmes opérations pour les autres données .5liquer sur Intervalle .Cliquer sur la boite ancienne et nouvelle valeur .type 1 Aariance - *4 Dépouillement des valeurs d(une varia$le continue selon une distri$ution de fréquence . ----------T = ----------T > ----------T D /es classes sont 4 =. la fin on faire l(étiquette pour la nouvelle variable &e#emple 4. O) Traitement de données nominales . 2n veut obtenir la distribution de fréquences en classes de la variable continue A &taille). la répartition des données en classes peut s0effectuer de la faQon suivante.Enter les valeurs limites &e#emple 4 =.%4 Calcul de diverses statistiques .5liquer sur Transformer / Recoder / Création de variable . partir des résultas obtenus précédemment.5liquer sur Ajouter . 5liquer sur la commande Analyse / statistique descriptive / Fréquences4 *oyenne 1 *édiane 1 *ode 1 'omme 1 Ecart .

. =8 F DO ans -. DI F IO ans -. . aveM-vous pris l0autobus de faQon ré%ulière ou occasionnelle : . puis dans le champ )tiquette de valeur 4 Réguli're.puis entreM dans le champ . "uestion = 4 ..5liqueM sur Afficha#e des variables .. . II ans et plus -.%e 4 .Céminin "uestion D 4 .aleur 4 >. .5liqueM sur le bouton Ajouter et l0information saisie se retrouvera dans la Mone voisine . .EntreM dans le champ .EntreM dans le champ .<e prend pas l0autobus --. . . .5liqueM sur le bouton Ajouter et l0information saisie se retrouvera dans la Mone voisine. .u cours des => mois. . puis dans le champ )tiquette de valeur4 8e prend pas l(auto$us.%e =8 F DO ans DI F IO ans II ans et plus = > D Les commandes sont ! . "uestion > 4 'e#e 4 *asculin .Jé%ulière ---.EntreM dans la colonne )tiquette de la variable *uest+ la variable 4 (rendre l(auto$us .aleur 4 D. 54%) 6n va associer des codes et des étiquettes au7 diverses modalités des varia$les 86# 9T"3U9TT9 "uest= (rendre l0autobus :AL9URS +#6DAL"T9S) Jé%ulière 2ccasionnelle <e prend pas l0autobus C6D9S = > D "uest> 'e#e *asculin Céminin = > "uestD .aleur 4 %..2ccasionnelle ---.5liquer sur la colonne :aleurs.5liqueM sur le bouton Ajouter et l0information saisie se retrouvera dans la Mone voisine . . puis dans le champ )tiquette de valeur 4 6ccasionnelle.

/es résultats sont présentés de la faQon suivante 4 54. 5liquer sur la commande Statistique descriptive / Fréquences 'électionner la variable "uest= 5liqueM sur le bouton Diagrammes puis sélectionner raphique en secteurs et pourcentages 5liquer sur 5ontinue puis 2L 2n procède de la même faQon pour la variable "uest>. . . Ta$leau des données *uest+ Jé%ulière <e prend pas l0autobus 2ccasionnelle Jé%ulière <e prend pas l0autobus <e prend pas l0autobus Jé%ulière <e prend pas l0autobus 2ccasionnelle Jé%ulière <e prend pas l0autobus 2ccasionnelle <e prend pas l0autobus 2ccasionnelle *uest*asculin Céminin Céminin Céminin Céminin Céminin *asculin *asculin *asculin *asculin Céminin *asculin *asculin *asculin *uest.) 6n veut éla$orer un diagramme illustrant la répartition des répondants selon les diverses modalités de la question % +utilisation de l(auto$us) en tenant compte du se7e du répondant4 . . .. . =8 F DO ans II ans et plus =8 F DO ans =8 F DO ans =8 F DO ans DI F IO ans II ans et plus =8 F DO ans DI F IO ans =8 F DO ans II ans et plus II ans et plus II ans et plus DI F IO ans 54*) 6n va maintenant dépouiller les données +nominales) de la question % selon une distri$ution de fréquences et on trace un diagramme & secteurs +/raphique en secteurs)4 .5liqueM sur Continue puis sur !. .u lieu de la commande Eraphique en secteurs on sélectionne Diagrammes en b!tons./a codification des modalités des variables "uest> et "uestD s0effectuent de la même faQon.

./orsqu0on teste la différence &entre moyenne par e#emple). puis la variable "uest> sur l0a#e des ordonnées. soit 4 'imple Uu#taposé &5até%orisé) Empilé 2n veut le type "u#taposé &5até%orisé). !ifférence si%nificative à p Y B. '0il y a plus de I X &B.BI &'i%nificative) . on adopte Ho et on dit que la différence n0est pas si%nificative &< '). .B=) des chances &mais moins de IX) d0être due au hasard. ce qui va nous permettre de visualiser le pourcenta%e de répondants d0après la fréquence d0utilisation du transport en commun avec une distinction quant au se#e du répondant. . '0il y a IX &B. . 7rès si%nificative &7 ') 4 si la différence observée à =X de chance ou moins d0être due au hasard. on reWette Ho et on dit 4 . 5liqueM sur l0icVne identifiant "u#taposé / $écapitulatifs pour groupes d’observations puis Définir% 5eci permet d0avoir une boite de dialo%ue 4 (laceM la variable "uest= sur l0a#e des abscisses.BI) des chances que la différence observée soit due au hasard. JeWeter HB 4 50est la différence observée est due à une cause systématique La r'gle ar$itraire est la suivante 4 .BI &<on si%nificative) . 'i%nificative &') 4 si la différence observée a plus de =X &B. 5elle F ci présente trois types de dia%rammes à barres. .BI) des chances ou moins.ccepter HB 4 50est la différence observée est attribuable au# fluctuations dues au hasard de l0échantillonna%e. 5eci permet d0avoir la boite de dialo%ue !ia%rammes en b3tons. . 5liqueM sur le bouton & d’observations puis '( pour lancer le traitement. . sélectionner Eraphes 1 @3tons. 2n note les niveau# de si%nification de la manière suivante 4 . . !ifférence si%nificative à p Y B. . on se posera la question suivante4 /a différence observée entre les échantillons doit-elle être attribuée au hasard ou bien provient-elle d0une cause systématique: . que la différence soit due au hasard. !ans la barre menus. !ifférence non si%nificative à p T B. . .B= &7rès si%nificative) """) Comparaisons de mo)ennes /es différents tests de comparaison de moyenne qui e#iste en '('' sont 4 . Les niveau7 de signification .

D.G ==. .8 =. . . facteur4 .P =B. 2n va choisir un petit échantillon provenant d0une population normale de variance inconnue. )*'+) à .D =B.8 ==. Un chronométra%e de cette opération sur >I unités de même type donne le temps ci-contre.aleur de test.ariable 1 tester et la valeur donnée &%/) dans la Mone Test . 5e test statistique s0est effectue avec le t de 'tudent.I ==.G =>. O.B =B.= =B. le temps requis pour effectuer l0assembla%e d0un monta%e transistorisé est de =B minutes.G =B.8 ==.B ==.=.D =B.= ==. .8 =B. $ntroduiseM la variable temps dans la Mone . 5liquer sur ! pour lancer le traitement *) Test d(égalité de deu7 mo)ennes . !ans une entreprise. Temps o$servés +minutes) G. >. $l s0a%it d0un test d0é%alité de deu# moyennes.P =>. Test T pour échantillon unique 4 7est de comparaison d0une moyenne à une valeur donnée. 5liquer sur 0tatistiques descriptives / Comparer les moyennes / puis sur Test T pour échantillon unique. Test T pour échantillons indépendants4 7est d0é%alité de deu# moyenne.B Les commandes sont ! .= ==.G ==.> G.G =B.D =B. Test T pour échantillons appariés 4 comparaison de deu# séries de mesures appariées. %) Test de comparaison d(une mo)enne de population normale & une valeur donnée .nalyse de variance à un seul facteur.P =>.D G.D =>.

.8O N.GD . . l0une pour la classe et l0autre pour les notes. on doit utiliser deu# variables. (eut-on attribuer cette différence à une cause systématique ou. /a classe = semble nettement plus faible que la classe >. (our faire cette comparaison en '(''.E#emple 4 'oit deu# classes qui obtiennent au même test péda%o%ique &noté sur =B). Ta$leau des données 5lasse = O I P N G 8 P I N I D O N 5lasse> 8 N G 8 P 8 G N 8 8 =B G N 8 8 N *oyenne > Z *oyenne = Z I. Ta$leau des données en SPSS Classe = 8otes O . est-elle attribuable au hasard : En d0autre terme. la classe > est-elle réellement plus forte que la classe =. ou bien doiton penser que la différence provient du hasard dans la composition des classes : 2n va commencer par la saisie des données. au contraire.

= = = = = = = = = = = = > > > > > > > > > > > > > > > > I P N G 8 P I N I D O N 8 N G 8 P 8 G N 8 8 =B G N 8 8 N Les commandes sont ! .ariable 1 tester et la variable Classe dans la Mone Crit3re de re#roupement. (uis cliquer dans la boite "éfinir #roupes.5liquer sur Continue puis ! pour lancer le traitement . .Ecrire la valeur % dans la Mone /roupe+ et la valeur * dans la Mone /roupe-. .$ntroduiseM la variable 8otes dans la Mone . . . . 5liquer sur Analyse / Comparer les moyennes puis Test T pour échantillons indépendants2 .

%* %% %* %% . <ous somme alors en présence de mesures dépendantes ou appariées.$l s0a%it des données qui sont obtenues à partir de la même unité e#périmentale &même individu par e#emple) avant et après avoir subir un certain traitement. .) Comparaisons de deu7 séries de mesures appariées . . (our cela on a passer un test à un certain nombre de personne avant et après la formation.$l serait alors incorrect de procéder à un test de comparaison de moyennes. E#emple4 2n veut évaluer l0effet ou l0efficacité d0un pro%ramme d0apprentissa%e. %. 5liquer sur Continue puis ! pour lancer le traitement. 'électionner Analyse / Comparer les moyennes puis Test T pour échantillons appariés2 $ntroduiseM les deu# variables &Avant et Apr's) dans la boite . Apr's le programme %. %5 %2 %5 %% %5 %% %. %/ %. . /es résultats obtenus sont présentés dan le tableau suivant Avant le programme %2 %. 1 . /0outil statistique approprié est alors un test sur la différence de mesures. %* Les commandes sont ! . . %0 %/ .ariables appariées2 5liquer sur le bouton ptions et spécifier un intervalle de confiance à 445. . %/ %* %% .. . .

%. /0outil statistique approprié est une analyse de variance suivant un seul facteur &6ne<=a) Anova). /es résultats obtenus sont présentés dan le tableau suivant 4 >roupe % %/ %* 1 %5 .!ans le %roupe D partiellement à domicile. %5 %1 %. 5lasse = = <otes =B => . 2n ne peut pas utiliser le test t de 'tudent.2n va commencer par la saisie des données.(our faire cette comparaison en '(''. %.!ans le %roupe > un cours pro%rammé appliqué sous surveillance . 2n veut comparer le résultat moyen de trois %roupes d0élèves et tester s0il e#iste une différence si%nificative au seuil de si%nification IX. . . >roupe . /0analyse de variance permet aussi de comparer les moyennes deu# à deu# 97emple ! 2n constitue trois %roupes d0élèves sélectionnés au hasard et on leur ensei%ne la même matière de trois faQons différentes 4 . . on doit utiliser deu# variables 4 l0une pour la classe et l0autre pour les notes. %5 %1 %2 %2 %5 %0 %2 %. >roupe * %. $l s0a%it de la comparaison plus de deu# moyennes.5)Test d(égalité de trois mo)ennes .!ans le %roupe = on applique l0ensei%nement ma%istral .

&.ariables dépendantes et la variable classe la boite Crit3re2 5liquer sur le bouton ptions et choisir Caractéristique 7 Test d8é#alité des variances et e9clure les observations analyse par analyse puis Poursuivre. 8 =O G =D =N =G =O =8 =N =O =8 =I =I =O =P =I =D 'électionner Analyse / Comparer les moyennes puis A6 . élaborer un tableau croisé . associer un code et une étiquette au# diverses modalités d0une variable . on va 4 . . 5liquer sur le bouton Post $oc et sélectionner la méthode de comparaisons multiples de :onferroni avec un seuil de si%nification . obtenir diverses statistiques associées au# variables du tableau croisé Définition Un ta$leau croisé consiste en un ta$leau & dou$le entrée o? les modalités d(une varia$le sont croisées avec les modalités d(une autre varia$le4 Ce ta$leau est fréquent lorsque l(on veut e7aminer s(il e7iste une certaine dépendance entre deu7 varia$les4 .= = = = > > > > > D D D D D D D D Les commandes sont ! . . 5liquer sur Continue puis sur ! pour lancer le traitement.A 1 + facteur. . $ntroduiseM la variable résultat dans la boite .<. . :") Le ta$leau croisé !ans ce chapitre.

*uest*asculin Céminin Céminin Céminin Céminin Céminin *asculin *asculin *asculin *asculin Céminin *asculin *asculin *asculin *uest. . 'électionneM 0tatistiques descriptives / Tableau9 croisés EntreM la variable dans la li#ne et l0autre dans la colonne 5liqueM sur le bouton 0tatistiques et choisir le test Chi = deu9 puis sur le bouton continue 5liqueM sur le bouton Cellules et sélectionner les fréquences observées & bservé) et les fréquences théoriques &Théorique). &E#emples) . . =8 F DO ans II ans et plus =8 F DO ans =8 F DO ans =8 F DO ans DI F IO ans II ans et plus =8 F DO ans DI F IO ans =8 F DO ans II ans et plus II ans et plus II ans et plus DI F IO ans Su$diviser un fic ier .E#emple 4 2n va utiliser un sonda%e sur le transport en commun et élaborer un tableau croisé des modalités de la fréquence d0utilisation de l0autobus &quest=) avec les caté%ories d03%e. . . 'électionner la liste de variable /a subdivision de fichier est équivalente à travailler avec deu# ou trois fichiers. 7ableau des données *uest+ Jé%ulière <e prend pas l0autobus 2ccasionnelle Jé%ulière <e prend pas l0autobus <e prend pas l0autobus Jé%ulière <e prend pas l0autobus 2ccasionnelle Jé%ulière <e prend pas l0autobus 2ccasionnelle <e prend pas l0autobus 2ccasionnelle Les commandes sont ! . 5liquer sur la commande Données / Scinder un fichier / comparer les groupes . 5liqueM sur Continue puis sur 6@ pour lancer le traitement.

Sign up to vote on this title
UsefulNot useful