Vous êtes sur la page 1sur 69

Cusson, Fabienne et Marie-Marthe Cousineau (2001).

Initiation au traitement statistique sur micro-ordinateur avec SPSS Windows: Notes pour le cours CRI1600, Initiation aux mthodes quantitatives. Montral : Universit de Montral

LE PROGRAMME SPSS UNE INTRODUCTION

1. LE LOGICIEL SPSS
SPSS (Statistical Package for Social Sciences) est essentiellement un logiciel de traitement de donnes en vue d'analyses statistiques. Il lit les donnes, les traduit en format SPSS, les transforme si demand et excute des oprations mathmatiques et statistiques.

2. L'ENVIRONNEMENT SPSS 2.1. LA FENTRE DITEUR DE DONNES La fentre diteur de donnes prsente le contenu d'un fichier de donnes que vous avez pralablement slectionn. Vous pouvez crer de nouvelles feuilles de donnes ou modifier des donnes prexistantes.

2.2. LA FENTRE VIEWER SPSS La fentre Viewer SPSS enregistre les rsultats des oprations effectues : tableaux, statistiques et diagrammes obtenus tout au long de votre session de travail. SPSS ouvre automatiquement cette fentre au dbut de chaque sance de travail et y inscrit l'ensemble des rsultats obtenus ainsi que le dtail des oprations effectues. Les rsultats sempilent les uns la suite des autres, au fur et mesure que vous effectuez de nouvelles oprations, lintrieur dune mme session de travail. Utilisez les menus de la fentre pour slectionner des fichiers, des statistiques et des diagrammes. Vous comprendrez aussi rapidement la pertinence de faire le mnage au fur et mesure dans les rsultats que vous produisez, une feuille Viewer SPSS qui ne -1Intro - CRI 1600G

serait pas dbarrasse des rsultats errons, ou ventuellement devenus inutiles, se faisant de plus en plus difficile consulter. 2.3. LES BARRES DOUTILS Chaque fentre sa barre doutils, utiliser comme dans dautres programmes Windows

2.4. LES BOTES DE DIALOGUE Les botes de dialogues permettent de slectionner des variables et des options pour effectuer des statistiques et des diagrammes.

3. LES FICHIERS ! DANS SPSS


3.1. LES FICHIERS DE DONNES Les fichiers de donnes qui apparaissent dans la fentre diteur de donnes se reconnaissent par lextension .sav suivant le nom. Les fichiers de donnes contiennent les banques de donnes avec lesquelles vous aurez travailler. Ces fichiers se prsentent sous la forme d'une feuille quadrille remplie de chiffres ou de lettres rpartis en colonnes et en ranges. Par dfaut, en ouvrant le programme SPSS, un fichier de donnes vierge apparat. Si vous dsirez crer nouvelle une banque de donnes, il ne vous reste plus qu' y entrer les informations pertinentes en respectant les normes qui vous auront t communiques. Si vous devez plutt travailler partir d'une banque de donnes dj constitue, vous devez alors ouvrir le fichier

! en question en suivant la procdure suivante:

Procdure pour ouvrir un fichier de donnes Fichier (choisir cette option dans le menu principal prsent en entte de SPSS)

"

Ouvrir

"

Donnes (la liste des fichiers de donnes lisibles pour SPSS apparat) cliquez sur le nom du fichier ncessaire vos analyses (extension .sav) qui apparat sous cette rubrique puis cliquez sur

"

OK.

-2Intro - CRI 1600G

Cette procdure ouvre automatiquement la fentre diteur de donnes dans laquelle apparaissent les donnes que vous avez appeles. Vous pouvez choisir, grce aux onglets au bas de lcran, entre laffichage des donnes et laffichage des variables. Le fichier, lorsque mis sous loption affichage des donnes, se prsente cette fois sous la forme suivante:

Le nom du fichier de donnes que vous avez slectionn apparat en entte de la fentre. Vous pouvez ds lors effectuer les traitements que vous jugez ncessaires, qu'il s'agisse de modifications l'intrieur mme du fichier de donnes ou de traitements statistiques. Dans lexemple qui prcde, le fichier de donnes ouvert porte le nom de Sondage victimes Qubec.sav . L'ouverture dun fichier de donnes doit toujours prcder les instructions de traitement statistiques donnes SPSS, autrement celui-ci ne pourra pas s'excuter, ne sachant pas quelles donnes traiter. Si des modifications ont t apportes au fichier de donnes pralablement ouvert, SPSS demandera lutilisateur si ces modifications doivent tre sauvegardes avant que le fichier soit ferm. Par ailleurs, il est impossible, dans SPSS, douvrir deux fichiers de donnes simultanment.

-3Intro - CRI 1600G

3.2. LES FICHIERS DE RSULTATS Les fichiers de rsultats se reconnaissent par lextension .spo suivant le nom attribu au fichier par lutilisateur. Ils apparaissent dans la fentre Viewer SPSS et consistent en Tant et aussi divers rsultats d'oprations prcdentes qui ont t sauvegards.

longtemps que lutilisateur na pas sauvegard le travail effectu en sance, le fichier se nomme RSULTATS1. Au moment de sauvegarder un fichier contenant les rsultats quil dsire conserver, lutilisateur doit obligatoirement lui donner un nom. ouvert, consult, dit, nouveau sauvegard... Mme si tout ce qui se retrouve dans le fichier rsultat est gnr automatiquement par SPSS, il est possible d'accder ces fichiers et de les diter, c'est--dire d'en modifier le contenu dans le but, par exemple, de prsenter intgralement les rsultats dans le cadre d'un travail remettre ou d'un article en production sans avoir en refaire manuellement la prsentation, ou encore pour faire du mnage : effacer les oprations inutiles ou les rsultats errons, enlever les messages derreurs dont on a pris connaissance ou produire une meilleure mise en page. Pour ce faire, il s'agit de manipuler le fichier comme vous le feriez si vous tiez dans un traitement de texte simplifi, en coupant, en collant et en ajoutant du nouveau texte. Les capacits de SPSS en matire traitement de texte sont toutefois limites. Nous verrons comment y pallier. partir de ce moment, le fichier peut tre manipul comme tout autre fichier, cest--dire quil peut tre

Procdure pour ouvrir un fichier de rsultats Fichier (choisir cette option dans le menu principal prsent en entte de SPSS)

"

Ouvrir

"

Rsultat
cliquez sur le nom du fichier choisi (nom .spo), puis sur

"

OK.

-4Intro - CRI 1600G

Voici un exemple dun fichier de rsultats o lon peut voir un tableau de frquence illustrant les rponses une question du sondage de victimisation :

N.B: Afin de passer d'un fichier de donnes un fichier de rsultats dj ouvert (ou vice versa), il sagit simplement de cliquer sur les onglets du bas de votre cran. Le fichier ouvert devant vous tant indiqu par une couleur distincte des autres.

-5Intro - CRI 1600G

4. LES COMMANDES DANS SPSS


Il existe deux faons d'entrer des commandes dans SPSS. La premire est assez simple puisqu'il s'agit de slectionner, laide de la souris #, les lments pertinents des diffrents menus qui vous sont prsents les uns la suite des autres ou en cascade. Cette technique, trs user friendly vous permet d'effectuer toutes les commandes partir des zones de dialogue. C'est la technique qu'on vous enseignera dans le cadre du cours.

4.1. TRAVAILLER AVEC LES MENUS, SOUS-MENUS ET LA SOURIS # C'est l'aide de la souris # que vous vous dplacerez dans SPSS. Le curseur indique l'endroit o vous vous trouvez. La touche de gauche de la souris # vous permet de slectionner, en cliquant dessus, un lment du menu, ou encore une commande, une sous-commande ou une option qui lui sont associes.

4.2. LES COMMANDES, LES SOUS-COMMANDES ET LES OPTIONS Les items qui apparaissent aux diffrents niveaux de menus sont des commandes, des sous-commandes ou des options que vous pouvez (ou dans certains cas devez) ou non slectionner afin de complter ou de prciser une commande principale que vous envisagez demander SPSS de mettre excution. SPSS prvoit ordinairement, par dfaut, un certain nombre d'options minimales qu'il associe automatiquement chaque commande ou sous-commande rencontre sous SPSS, selon le cas. Dans la mesure o ces options vous satisfont, vous n'avez rien d'autre spcifier que les commandes et souscommandes pour que SPSS remplisse la mission (de traitement des donnes) qui vous lui assignez. Une fois que vous avez construit une commande en spcifiant les variables dont vous avez besoin, et que vous avez slectionn les options que vous privilgiez en rapport avec lexcution de la commande en question, alors il ne vous reste plus qu' cliquer sur CONTINUE et/ou sur OK (selon le cas), pour que SPSS excute la commande.

-6Intro - CRI 1600G

N.B. Que vous vous trouviez dans n'importe quelle fentre, si, pour une raison ou une autre, vous voulez quitter cette fentre sans effectuer l'opration qu'elle vous prsente, cliquez simplement sur CANCEL. Vous tes alors ramen au menu prcdent ou, ventuellement, au menu principal, sans que SPSS nentreprenne aucun traitement des donnes.

4.3. RALISER UNE OPRATION DANS SPSS Une fois que vous savez comment utiliser la souris # et vous dplacer dans les divers menus et sous-menus de SPSS, rien n'est plus simple que de demander SPSS d'excuter une commande. En fait, il s'agit chaque fois de slectionner, via la souris # partir de laquelle vous cliquez, les oprations et les options que vous dsirez voir excuter, d'indiquer sur quelles variables les oprations doivent tre faites et, finalement, de lancer la commande en cliquant sur OK, ce qui confirme SPSS de se mettre en action.

N.B. Toutes les commandes de SPSS doivent se terminer par lordre "OK". Cette touche indique que la commande est complte et conforme et que vous tes prt ce qu'elle soit excute.

Si l'opration que vous venez d'excuter est une commande statistique, il est tout fait normal que la fentre rsultat apparaisse. Rappelez-vous aussi que tant et aussi longtemps que vous navez pas vous-mme sauvegard ce fichier-rsultat, celui-ci est temporaire et seffacera la fin de la sance de travail en cours. Voyez-y.

5. SAUVEGARDER LES FICHIERS


Une des oprations les plus importantes connatre lorsquon travaille avec lordinateur, c'est sans aucun doute la sauvegarde des divers fichiers utiliss. Si vous ne sauvegardez pas rgulirement vos oprations, vous risquez de perdre votre travail, du moins en partie. Lorsque vous travaillez sur un ordinateur priv vous pouvez enregistrer votre travail sur le disque dur ou sur une disquette, votre choix (prfrablement les deux, pour plus de sret). -7Intro - CRI 1600G

Par contre, notez bien que si vous travaillez sur les ordinateurs de l'universit, vous devez absolument sauvegarder le fruit de votre travail sur votre disquette, qui doit se trouver dans le lecteur a de lordinateur que vous utilisez, puisque vous n'avez pas accs la mmoire centrale (disque dur) en mode criture.

Procdure pour sauvegarder un fichier pour la premire fois


Assurez-vous que le fichier que vous dsirez sauvegarder est celui qui est ouvert (apparat) devant vous sur lcran. Cliquez sur Fichier, dans le menu principal de SPSS. Cliquez sur Enregistrer Remplacez le nom par dfault par un nom de votre choix (inutile dajouter lextension .sav ou .spo qui sera ajout automatiquement) Cliquez sur Enregistrer pour indiquer SPSS de sexcuter.

N.B.: Il est important que vous conserviez intact lextension de fichier (.sav ou .spo, selon le cas). On peut comparer cette extension un nom de famille qui permet au programme de savoir de quel type de fichier il s'agit, et dagir en consquence.

Procdure pour sauvegarder les dernires modifications apportes un fichier qui possde dj un nom (donc qui a dj t sauvegard) Reproduisez simplement les trois premires tapes dcrites ci-dessus.

ATTENTION: Chaque nouvelle sauvegarde de votre travail lintrieur dun fichier qui garde son nom crase l'ancienne version !!! Soyez donc sr de votre coup avant de sauvegarder un fichier nouveau ou modifi sous le nom dun ancien fichier car vous risquez ainsi de perdre une partie du travail antrieurement ralis, les nouvelles donnes prenant la place des anciennes.

-8Intro - CRI 1600G

Il peut tre trs utile de savoir sauvegarder des fichiers sous de nouveaux noms ou alors de s'en faire des copies ailleurs, comme par exemple sur une autre disquette. Faites en sorte que les noms de fichiers que vous choisissez vous disent quelque chose. La gestion de vos fichiers (et de votre temps) en sera ainsi grandement facilite.

N'hsitez pas multiplier les copies de vos fichiers, on ne sait jamais quelle catastrophe peut survenir et vous obliger tout recommencer si vous n'avez pas de copies jour de votre travail.

5.1. O SAUVEGARDER? LES DRIVES $ ET LES DIRECTORIES % Les drives font rfrence aux divers supports o vous pouvez conserver les fichiers en mmoire. En ce qui vous concerne, vous aurez sans doute travailler partir d'une disquette rigide &. Dans les ordinateurs de l'universit (se trouvant dans les diffrents laboratoires dont celui situ au 3ime tage du Pavillon Lionel-Groulx) le lecteur de disquettes rigides est appele lecteur a . Vous devrez donc slectionner le drive a: afin que le fichier ', quel quil soit, soit enregistr sur votre disquette &. Les dossier % sont, pour leur part, des rpertoires et des sous-rpertoires qui servent ordonner et classer les divers fichiers sur le disque dur $ ou sur les disquettes &. Dans les laboratoires de luniversit, par exemple, les ordinateurs mis en rseau (interconnects) sont organiss de telle sorte que sur le disque dur z: se trouvent diffrents rpertoires, dont celui des COURS. En double cliquant sur ce rpertoire % COURS, on accde, entre autres, au sous-rpertoire du cours CRI 1600G, l'intrieur duquel sont classs plusieurs fichiers.

6. VOUS VOUS SENTEZ DPASS ? VOUS TEZ MAL PRIS ? DEMANDEZ DABORD SPSS
VOUS AIDER.

DE

(avant de vous adresser au prof, ou ses assistants)

SPSS offre un assistant nomm AIDE, trs pratique et trs puissant.

La plupart du

temps, cette source dinformation suffit nous dpanner dans les pires circonstances. Lorsque vous faites face une difficult qui vous semble insurmontable et pour laquelle le petit guide que vous avez en main et que vous avez parcouru en long et en large ne semble pas pouvoir rpondre vos questions, adressez-vous dabord au AIDE de SPSS. Il se fera un plaisir de tenter de vous rpondre. -9Intro - CRI 1600G

7. QUITTER SPSS

Procdure pour quitter SPSS et clore la session de travail: Cliquez sur Fichier dans le menu principal. Cliquez sur Quitter. Alors, automatiquement, SPSS vous demandera successivement si vous voulez sauvegarder les modifications qui ont t faites aux divers fichiers que vous avez utiliss. En temps normal, on sauvegarde tous les fichiers utiliss, mais il arrive aussi qu'on veuille viter enregistrer des fichiers ne contenant que des rsultats errons ou inutiles. On choisira alors de ne pas sauvegarder le fichier ou de faire le mnage avant de quitter de faon ne conserver que les bons rsultats . En d'autres mots, il vaut mieux prendre le temps de rflchir avant de cliquer sur OK et de tout sauvegarder sans discernement. Ces quelques secondes de rflexion pourraient dans certains cas vous sauver beaucoup d'ennuis et de temps. Par exemple, prenez le temps de vous demander si vous avez bel et bien effectu des transformations dans les donnes avant d'accepter de sauvegarder le fichier de donnes. Il arrive en effet qu'on accroche le clavier de lordinateur, par inadvertance, alors que la fentre des donnes est active. Cet accrochage pourrait ventuellement changer des donnes pralablement correctement inscrites dans le fichier de donnes. Par contre, si vous tes certains de vouloir sauvegarder le contenu du fichier qui vous est indiqu, alors vous navez qu rpondre oui linvitation qui vous est faite de procder de la sorte. SPSS vous prsente ds lors le nom du fichier sauvegarder ainsi que le rpertoire sur lequel il se trouve. Vous pouvez alors choisir de conserver le mme nom de fichier. Dans ce cas, SPSS crase lancienne version du fichier pour la remplacer par la nouvelle que vous venez de crer. Vous pouvez aussi choisir de changer le nom du fichier. Il sagit alors de remplacer la partie du nom qui prcde le suffixe .sav ou .spo qui indique le type de fichier dont il sagit, par un autre nom. Dans ce cas, linformation contenue dans le fichier original est conserve et linformation modifie est sauvegarde sous le nouveau nom de fichier. Ceci est vrai (cest--dire que linformation originelle est conserve) tant et aussi longtemps que nous neffectuez pas une procdure de sauvegarde sadressant au fichier original.

- 10 Intro - CRI 1600G

N.B.: Vous devez absolument utiliser des disquettes rigides &, idalement de type high density (HD). Vous ne pouvez pas enregistrer vos rsultats sur le disque dur $ des ordinateurs ( de luniversit, alors n'oubliez pas de sauvegarder rgulirement votre travail sur une disquette &. N'oubliez pas de reprendre votre disquette & la fin de chaque session de travail Identifiez clairement vos disquettes &, de sorte que si, par malheur, vous les oubliez dans le lecteur a dun ordinateur du Pavillon Lionel-Groulx, par exemple, ce qui ne manque jamais darriver, vous puissiez ventuellement les rcuprer. La semaine suivante, rapportez votre disquette de travail, sinon vous ne pourrez tout simplement pas travailler, moins de tout reprendre depuis le dbut )

- 11 Intro - CRI 1600G

LABORATOIRE 1 CRER OU TRANSFORMER UN FICHIER DE DONNES


Crer un fichier de donnes Ajouter une variable Nommer une variable et la dfinir tiqueter les valeurs dune variable Indiquer la prsence de valeurs manquantes

La plupart du temps, lorsquon traite statistiquement des informations, on travaille partir de fichiers de donnes dj constitus. Mais il arrive aussi qu'il faille btir une nouvelle banque de donnes. Lopration est gnralement trs simple. Il faut toutefois avoir pralablement compris la faon dont se prsente une grille de donnes. Dans un fichier de donnes, chaque cas (individu, rpondant, dossier...) est reprsent par une ligne contenant les donnes pour un ensemble de variables. Les variables, pour leur part, figurent en colonnes (chaque variable occupe l'espace d'une colonne). La rencontre d'une variable et d'un cas se prsentera donc sous forme dune cellule dans laquelle l'information se trouve consigne. Exemple: si Paul a 21 ans, l'intersection du cas Paul et de la variable ge se trouvera le chiffre 21 . Par dfaut, lorsque vous ouvrez SPSS, une grille de donnes vierge apparat. Il s'agit alors simplement d'effectuer la saisie des donnes (ce qui veut tout simplement dire d'entrer les donnes dans la grille informatique prvue cet effet). On aura alors soin de sauvegarder le fichier le plus tt possible et de procder des sauvegardes rgulires au fur et mesure de lentre des donnes, de sorte quune panne soudaine naura que des effets limits (autrement dsastreux).

- 12 Labo 1 - CRI 1600G

Une grille de donnes vierge se prsente de la faon suivante pour SPSS:

Afin de vous dplacer dans un fichier de donnes, vous avez le choix procder avec la souris#, les flches + , - . se trouvant sur le sur le clavier / ou alors grce aux ascenseurs situs en bas et sur le ct de l'cran (. approprie et d'inscrire l'information en question. Si vous voulez inscrire ou corriger des donnes, il s'agira alors simplement de placer le curseur dans la case L'information apparatra dans la grille seulement aprs que vous ayez quitt cette case, soit en appuyant sur la touche enter, soit en vous dplaant avec la souris #, ou les flches + , - ., vers une autre cellule ou lextrieur du tableau de donnes.

- 13 Labo 1 - CRI 1600G

1. LA CODIFICATION DES DONNES


Le fichier de donnes comprendra uniquement des donnes brutes. peuvent tre numriques (composes de chiffres ou de codes Ces dernires chiffrs) ou On

alphanumriques (combinaison de lettres seulement ou de lettres et de chiffres).

prfrera toujours, dans la mesure du possible, associer une forme numrique aux donnes. En effet, SPSS travaille beaucoup plus facilement avec des chiffres qu'avec des lettres. Dans le cas des donnes de niveau de mesure nominal ou ordinal, il s'agit alors d'attribuer un code numrique aux donnes. Par exemple, pour indiquer le sexe d'un individu, on prfrera coder les rponses de la faon suivante: femmes: "1"; hommes: "2", plutt que femmes: "F"; hommes: "H". Bien entendu, pour certaines variables telles le nom, le prnom, les alias... il est quasi impossible d'imaginer une codification un tant soit peu sense. Il s'agira donc d'une contrainte incontournable. Le traitement de telles donnes, dans le cadre danalyses statistiques, est toutefois fort limit ce qui diminue les inconvnients que pose leur forme alphanumrique.

2. EXEMPLE D'UN FICHIER DE DONNES INFORMATIQUE


Prenons par exemple un fichier de donnes qui comprendrait les rsultats obtenus au cours d'introduction aux mthodes quantitatives par un groupe de 10 tudiants. Chaque tudiant reprsente, en langage informatique, un cas ou un enregistrement informatique. Le fichier constitu comptera donc 10 cas ou 10 enregistrements. Le fichier comprendra, d'autre part, les donnes caractrisant chacun des dix cas pour neuf variables prtablies. Ces neuf variables sont les suivantes: 1) le prnom et 2) le nom de l'tudiant; 3) la note obtenue au TP1; 4) la note obtenue au TP2; 5) la note obtenue lintra; 6) la note obtenue au TP3; 7) la note obtenue l'examen final; 8) le sexe; et finalement 9) la date de naissance de l'tudiant.

- 14 Labo 1 - CRI 1600G

VARIABLES

prnom Annie Caroline Claude Andr Monique Marcel Roger Annie Michelle Andr

Nom Lger Pelletier Gagnon Perron gagn Tremblay Pich Caron Martin Sguin

tp1 9,5 7 8 7 6 9 8,5 7 8,5 6,5

tp2 9 8 8,5 7,5 6,5 9 8 7,5 7 9,5

intra 25 22 24 29 29 27 13 19 17 19

tp3 10 7 8 9 7 6 8 8 8 7

final 35 32 34 38 33 36 32 39 35 30

sexe 1 1 2 2 1 2 2 1 1 2

date nai. 780116 771221 760512 780721 681122 790915 730508 800401 770523 580420

3.

AJOUTER UN CAS OU UNE VARIABLE UNE BANQUE DE DONNES DJ CONSTITUE

Il est toujours possible d'ajouter une ligne (un cas) ou une colonne (une variable) un fichier de donnes dj constitu. Pour ce faire:

procdures pour insrer un nouveau cas ou une nouvelle variable dans une banque de donnes
Placez le curseur soit sur la ligne qui se trouve immdiatement sous l'endroit o vous voulez que le nouveau cas apparaisse, soit sur la colonne situe immdiatement aprs l'endroit o vous dsirez que la nouvelle variable apparaisse. Cliquez sur Donnes dans le menu principal. Cliquez sur Insrer une observation ou Insrer une variable, selon que vous voulez voir apparatre une nouvelle ligne recevant un nouvel enregistrement ou une nouvelle colonne ajoutant une nouvelle variable aux donnes.

- 15 Labo 1 - CRI 1600G

Vous pouvez ds lors insrer linformation se rapportant au nouveau cas ou la nouvelle variable que vous ajoutez au tableau des donnes en remplissant chacune des cellules correspondant lemplacement o doit se trouver la nouvelle information.

4. NOMMER UNE VARIABLE


Le nom de la variable napparat pas automatiquement en entte de colonne, il faut que vous l'inscriviez vous-mme (par dfaut, les variables sont appeles v00001, v00002, v00003... v0000z) ce qui complique leur reconnaissance, non pas pour la machine mais pour vous, surtout sil vous arrive de devoir revenir au fichier de donnes quelques semaines, quelques mois voire quelques annes plus tard. Vous prfrerez alors renommer la variable de faon pouvoir plus facilement la reconnatre. Rappelez-vous que le nom dune variable ne peut dpasser huit caractres

alphanumriques (vitez les caractres spciaux du genre #, $, !..., leur usage pouvant tre rserv pour SPSS), sans espaces (on peut lier les deux parties du nom par un petit tiret _ comme dans sex_rep pour sexe du rpondant). Procdure pour nommer plus prcisment une variable Double-cliquez dans le rectangle gris au-dessus de la colonne contenant les valeurs de la variable nommer ou cliquez sur longlet affichage des variable au bas de la fentre Il apparatra la liste des variables et de leurs caractristiques, comme son nom, son type, sa largeur, les dcimales prvues, son tiquette, ses valeurs, les valeurs manquantes associes cette variable. Vous navez plus qu complter ou corriger chacune des cases afin de bien nommer et qualifier vos donnes. NOM : Le nom donn la variable doit contenir un maximum de 8 caractres non accentus et sans espaces intercals. TYPE : De prfrence, veuillez traiter vos variables comme si elles taient toutes numriques, mais gardez en tte que toutes les oprations ne peuvent tre faites sur nimporte quel type de variable.

- 16 Labo 1 - CRI 1600G

5. TIQUETER UNE VARIABLE


TIQUETTE : Puisque le nom d'une variable ne peut dpasser 8 caractres, il arrive que vous vouliez lui joindre une tiquette plus explicite qui vous rappellera exactement ce que la variable reprsente. Par exemple, on peut vouloir signifier que la note de l'intra est calcule sur 30, on attachera donc cette information supplmentaire la variable en dfinissant une tiquette, spcifiant quil sagit de la Note de lintra calcule sur 30. Les contraintes lies au nom de la variable ne sappliquent pas ici. Une tiquette peut prendre jusqu 60 caractres de toutes formes et comprendre autant despaces que ncessaire.

6. TIQUETER LES VALEURS DE LA VARIABLE


VALEURS : Il est possible, comme dans l'exemple prcdemment cit (variable SEXE), que vous ayez attribu une valeur numrique des informations de type nominal ou ordinal (ainsi, femme=1; homme=2). Si c'est le cas, vous voudrez sans doute associer une tiquette ces valeurs numriques de remplacement, histoire de vous souvenir quelle valeur correspond en ralit chaque code numrique. procdure pour tiqueter les valeurs numriques d'une variable nominale ou ordinale1 Cliquez sur le petit carr gris apparaissant dans la case approprie Apparat alors une zone de dialogue (tiquettes de valeurs). Il s'agit alors d'inscrire le code numrique (ex: 1) dans le rectangle valeur et la valeur nominale correspondante (ex: femme) dans le rectangle tiquette de valeur.

Dans le cas de variables proportionnelles, comme par exemple lge du rpondant ou le salaire familial brut calcul sur une base annuelle, il nest pas utile de chercher tiquetter les valeurs de la variable puisque les donnes portent de facto ltiquette laquelle elles correspondent (25 ans, 30 ans , 40 ans... 22,432$, 70,557$, 253,500$. Lapposition dune tiquette prcisant le nom de la variable demeure toutefois de mise.

- 17 Labo 1 - CRI 1600G

Une fois que vous avez associ la bonne valeur au chiffre correspondant, cliquez sur Ajouter. Linformation se retrouve alors dans le rectangle de droite. Recommencez lopration jusqu ce que toutes les valeurs numriques de la variable aient leur tiquette. N.B. N'oubliez pas d'appuyer sur Ajouter aprs avoir prcis chaque tiquette correspondant une valeur donne de la variable. Lorsque toutes les valeurs de la variable ont reu leur tiquette, cliquez sur OK

7. INDIQUER LA PRSENCE DE VALEURS MANQUANTE


Lorsquil est question de traitements statistiques des donnes, une chose dont il faut sassurer cest que les valeurs manquantes (les rpondants pour lesquels nous ne possdons pas linformation concernant une ou plusieurs variables) ne soient pas prises en compte. Ces donnes seront tout simplement considres manquantes et retires des analyses. Les valeurs manquantes sont dfinies et comptabilises pour chacune des variables sparment (en effet, une donne peut ne pas tre disponible pour un rpondant et pas pour un autre tout comme le fait de ne pas possder linformation pour un rpondant sur une variable ne signifie pas que linformation est manquante pour les autres variables concernant le mme rpondant).

Procdure pour signifier SPSS la prsence de valeurs manquantes pour une variable Cliquez sur le petit carr gris apparaissant dans la case approprie. Il apparatra alors une seconde zone de dialogue:

- 18 Labo 1 - CRI 1600G

Spss vous soumet diffrentes options: 0 Aucune valeur manquante: signale quil ny a pas de valeurs manquantes pour cette variable Il sagit de la valeur par dfaut de cette sous-commande. 0 Valeurs manquantes discrtes: trois rectangles sont ici prvus afin de permettre de dfinir jusqu trois valeurs manquantes pour une mme variable. Trs souvent, on choisi les valeurs 9, 99 ou 999 comme valeurs manquantes, condition bien entendu que ces valeurs ne sont pas des valeurs possible de la variable. 0 Plage et valeurs manquantes discrtes facultatives: vous permet de dclarer toutes les valeurs comprises entre une borne infrieure (Faible) et une borne suprieure (leve) comme tant autant de valeurs manquantes. Par exemple on pourrait vouloir prciser que toutes les valeurs comprises entre 75 et 99, pour la variable ge du rpondant, correspondent autant de valeurs manquantes. 0 Valeur discrte: reprend les proprits de loption prcdente toute en permettant dajouter la dclaration dune valeur discrte comme tant aussi manquante.

Une fois que vous avez constitu votre fichier de donnes, nomm vos variables, attribus des tiquettes plus explicites tant aux variables quaux catgories des variables de niveau de mesure nominal et ordinal, vous tes prts passer aux traitements statistiques des donnes proprement dites. Les labo suivants ont pour but de vous guider dans cette tche, quil sagisse de produire des distributions de frquences, des tableaux croiss des statistiques uni ou bi-varis.

- 19 Labo 1 - CRI 1600G

LABORATOIRE 2 PRENDRE CONNAISSANCE DES DONNES


Produire des tableaux de frquences Observer les rsultats Dcouvrir valeurs manquantes et erreurs dentre de donnes Prparer les recodages diter les rsultats Imprimer ou transfrer les rsultats

Que vous ayez vous-mme cr une banque de donnes ou que celle-ci vous ait t fournie, il s'agit maintenant d'explorer ces donnes, de vous les approprier suffisamment pour bien les comprendre et pour voir s'il n'y aurait pas quelques modifications leur apporter pour qu'elles puissent tre plus facilement analyses.

1. LES TABLEAUX DE FRQUENCES


Le tableau de frquences est une bonne faon de prsenter les informations que contient une banque de donnes propos d'une variable. En effet, il indique, pour une variable donne, toutes les valeurs que prend cette variable, le nombre de fois que chaque valeur ou catgorie de la variable apparat et la proportion (%) que reprsentent les donnes correspondant une catgorie dune variable par rapport au nombre total d'observations prises en compte.

- 20 Labo 2 - CRI 1600G

TABLEAU 2.1 EXEMPLE D'UN TABLEAU DE FRQUENCES ISSU DE SPSS


Crim dans votre quartier, 5 dern annes? Pourcentage valide 33,0 6,2 60,8 100,0 Pourcentage cumul 33,0 39,2 100,0

Valide

Manquante

Augment Diminu Demeur le mme Total Ne sait pas Non dclar Total

Total

Frquence 7610 1432 14047 23089 2775 12 2787 25876

Pour cent 29,4 5,5 54,3 89,2 10,7 ,0 10,8 100,0

Dans le haut du tableau on retrouve ltiquette de la variable pour laquelle on a demand la production dune distribution des frquences. Viennent ensuite les
tiquettes attribues chacune des valeurs de la variable. Frquence Pourcentage o Le nombre de cas correspondant chacune des valeurs de la variable. Le pourcentages de cas que reprsente chacune des valeurs ou catgories de la variable par rapport l'ensemble des cas, y compris les valeurs manquantes (nombre de cas correspondant une valeur ou catgorie donne / nombre total de cas) Pourcentages des cas associs chacune des valeurs ou catgories dune variable par rapport au nombre de cas valides, cest--dire l'exclusion des valeurs manquantes (nombre de cas correspondant une valeur ou catgorie donne / nombre total de cas nombre de valeurs manquantes).

Pourcentage valide o

Pourcentages cumuls Pourcentage d'une catgorie dune variable ajout aux pourcentages que o cumulent les catgories prcdentes. Les pourcentages cumuls ne sont ordinairement pas pertinents lorsqu'il s'agit d'une variable de niveau de mesure nominal car, dans ce cas, il est impossible dordonner de quelque faon que ce soit les rsultats. Par contre, dans le cas de la distribution d'une variable de niveau ordinal ou proportionnel, les pourcentages cumuls permettent de situer facilement l'emplacement d'une fraction des individus partageant une caractristique donne (ex: 75% des individus ont moins de 30 ans). Cette donne ne sera toutefois intressante que si le nombre de catgories que compte la variable ltude est suffisamment important.

- 21 Labo 2 - CRI 1600G

procdure pour crer un tableau de frquence Cliquez sur Analyse dans le menu principal " cliquez sur Statistiques descriptives... " cliquez sur Frequences... Slectionnez la variable pour laquelle vous dsirez obtenir une distribution de frquences en cliquant sur son nom tel qu'il apparat dans le rectangle de gauche (lequel prsente la liste des variables ltude, par ordre alphabtique). (si le nom de la variable napparat pas lcran, dplacez-vous dans le rectangle grce l'ascenseur droite de lcran, la variable recherche est certainement situe plus haut ou plus bas dans la fentre). Cliquez maintenant sur la flche situe entre les deux rectangles. Vous verrez alors le nom de la variable sauter du rectangle de droite au rectangle de gauche. " cliquez sur OK (confirme SPSS dexcuter la commande)

En format SPSS, lcran de dialogue qui apparat est le suivant, alors quon demande la distribution des frquences de la variable Crim dans votre quartier , laquelle est passe du rectangle de gauche, contenant les liste exhaustive des variables contenues dans le fichier de donnes, dans le rectangle de droite, lequel prcise les variables pour lesquelles une distribution de frquences est demande.

- 22 Labo 2 - CRI 1600G

Cette manire de slectionner les variables sur lesquelles on veut effectuer des oprations (en les faisant passer dun rectangle lautre) est la mme partout dans SPSS, souvenez-vous-en. Notez aussi que vous pouvez slectionner plusieurs variables la fois en retenant le bouton de la souris et en la dplaant vers le haut ou vers le bas de lcran jusqu ce que lensemble des variables quon souhaite soumettre lanalyse soient noircies (et en autant quelles se suivent dans la liste des variables). Mais surtout, notez qu' chaque fois que vous effectuez une nouvelle opration, il faut commencer par RANGER LES ANCIENNES VARIABLES en les slectionnant dans le rectangle de droite et en les envoyant dans le rectangle de gauche (ou en cliquant sur le bouton Restaurer ce qui a pour effet de ramener lensemble des variables leur emplacement initial. Cela vous vitera de nombreux ennuis, dont celui daccumuler inutilement des rsultats reproduits plusieurs fois et vitera SPSS de travailler pour rien.

2. COMMENT DITER LES RSULTATS


Une fois que vous avez fait excuter la commande de tableaux de frquences en cliquant sur OK, la fentre Rsultats1 : Viewer SPSS apparat automatiquement devant vos yeux. Normalement, vous devriez avoir devant vous un fichier contenant le ou les tableaux de frquences demand(s). Tout d'abord, il importe de savoir que la feuille des rsultats des oprations que vous avez demandes SPSS dexcuter, se prsente toujours par le dbut. Il s'agit donc d'utiliser l'ascenseur du ct droit de lcran afin soit de se positionner nimporte o, selon le besoin. Si vous voulez effacer ou dplacer une partie du texte se trouvant dans le listing, il faut d'abord le slectionner.

3. COMMENT IMPRIMER DES RSULTATS


Une fois les rsultats mis en forme votre got, certains d'entre vous prfreront travailler sur du papier et d'autres voudront peut-tre transfrer le tout dans un - 23 Labo 2 - CRI 1600G

traitement de texte plus classique afin dy intgrer des commentaires, de dcrire les rsultats ou encore de fignoler la prsentation. Rappelez-vous que si SPSS est fort puissant pour ce qui est de calculer des statistiques, ses capacits en matire de traitement de texte sont par contre des plus limites. Procdure pour imprimer directement le fichier rsultat partir du menu dentte de SPSS, choisir la commande Fichier (dans le menu principal) " Imprimer... Choisir entre les options " OK (confirme SPSS dexcuter la commande).

Parfois, il est plus intressant de travailler partir dun logiciel de traitement de texte si vous voulez insrer du texte (linterprtation des rsultats par exemple), ou encore prsenter vos rsultats de manire diffrente. Pour ce faire, nous suggrons soit de faire une simple couper-coller , soit de refaire entirement vos tableaux sur Word, si vous dsirez avoir encore davantage de latitude.

4. QUOI OBSERVER DANS LES TABLEAUX DE FRQUENCES


Une fois que vous avez les tableaux de frquences en mains, prenez le temps de regarder rapidement chacun d'eux. De quelles variables s'agit-il? Pour combien de cas "valides" possdons-nous l'information? Quel est le niveau de mesure de la variable: est-elle nominale, ordinale ou quantitative? La distribution des valeurs de la variable vous parat-elle conforme (y a-t-il des donnes qui apparaissent et qui ne devraient pas apparatre) ? Lors de cette premire exploration des tableaux de frquences (qui vous permet en quelque sorte de prendre le pouls de vos donnes et de vous rassurer sur leur qualit au moins apparente), il vous faudra procder systmatiquement en notant manuellement, sur une feuille part, toutes les modifications que vous souhaiterez apporter l'organisation des donnes: limination de certaines variables, recodification dun certain nombre dautres, identification des valeurs tranges que prennent certaines dentre elles... - 24 Labo 2 - CRI 1600G

4.1. LES VALEURS MANQUANTES Il arrive dans certains cas que toute l'information concernant tous les individus pour l'ensemble des variables ou encore pour une variable en particulier ne soit pas disponible. Dans ce cas, on dira que l'information est manquante. Un code sera alors utilis pour en rendre compte. manquantes. C'est l'utilisateur de choisir le code qui lui convient pour identifier les valeurs manquantes lintrieur de sa banque de donnes. Par convention, le chiffre 9 (ou 99 ou 999 , selon le cas) est le plus souvent utilis. On peut aussi prvoir diffrents types de valeurs manquantes et leur attribuer diffrents codes permettant de les distinguer. Par exemple, on attribuera la valeur 7 ceux qui, en rponse une question, indiquent ne sait pas ; la valeur 8 ceux qui refusent de rpondre, et la valeur 9 pour toute information vraiment manquante Il arrive trs souvent quon trouve des valeurs manquantes dans la distribution des donnes, mais que l'ordinateur ne le sache pas initialement. SPSS. Il faut donc que vous observiez chaque tableau en vous demandant s'il y a des valeurs manquantes signifier Vous reconnatrez les valeurs manquantes par leur code numrique (9, 99, 999,...), par l'tiquette qui leur est attache (pas de rponse; N.S.P.; ne s'applique pas; indtermin, ...) ou par l'absence d'annotation. Il est important, au moment de traiter les frquences des rponses, de faire le bilan des valeurs manquantes. Une variable qui prsente un trop grand nombre de valeurs manquantes pourra tre considre non valide. On peut, au contraire, dcider que le nombre de valeurs manquantes n'est pas suffisant pour invalider le traitement de la variable. Toutefois, on ne voudra pas tenir compte des valeurs manquantes dans les analyses. Il faudra alors indiquer SPSS de ne pas tenir compte, au moment des analyses statistiques, des individus pour lesquels l'information n'est pas disponible. Nous verrons comment plus loin. Ce code sert prcisment identifier les valeurs

N.B.: La catgorie rsiduelle Autres ne correspond pas des valeurs manquantes. Elle indique plutt que linformation est autre que celle prvue dans les catgories de rponses prtablies - 25 Labo 2 - CRI 1600G

4.2 LES ERREURS VIDENTES


Il arrive aussi parfois qu'on trouve certaines absurdits dans les tableaux de frquences et qu'elles soient dues des erreurs dans la saisie des donnes. C'est le moment de noter la prsence de ces donnes erratiques, lesquelles seront soit corriges directement dans la banque de donnes, soit associes aux valeurs manquantes si on estime que cela ne remet nullement en cause la valeur des analyses. Par exemple, il arrive qu'on se retrouve devant une valeur bizarre et incomprhensible, comme c'est le cas dans le tableau suivant pour la valeur 6 qui tout fait l'air d'tre une erreur d'entre de donnes. L'indice qu'il s'agit d'une donne erratique est souvent la frquence trs peu leve qui lui est associe. On devra sinquiter des valeurs erratiques qui apparaissent en trop grand nombre. Peut-tre est-ce simplement quon a oubli dassocier une tiquette une valeur qui, par ailleurs, reprsente vraiment un choix de rponse possible. Il sagit de vrifier ce quil en est.

Statut de l'agresseur
Valeur Suspect Accus Condamn N.S.P. 1 2 3 6 9 Total
Valeurs manquantes: 0

Frequence 12 22 43 1 20 ___ 100

Percentage 12.0 22.0 43.0 1.0 20.0 ____ 100.0

Valid % 12.0 22.0 43.0 1.0 20.0 ____ 100.0

Cum % 12.0 36.0 79.0 80.0 100.0

La logique aussi peut nous aider dtecter des erreurs, comme si dans un tableau reprsentant l'ge des meurtriers, on retrouve la valeur 2 . Puisqu'il est fort peu probable que l'un des tueurs apparaissant dans la distribution des donnes ait vraiment eu deux ans au moment de lvnement, on prfrera inclure ce cas dans les valeurs manquantes ou, ventuellement, corriger linformation dans le fichier des donnes, pour peu quon puisse retrouver la bonne donne.

- 26 Labo 2 - CRI 1600G

4.3. LES CATGORIES RETRAVAILLER


Une autre dmarche partir de la distribution de frquences concerne des amnagements de catgories faire pour que les donnes se prsentent mieux. Il existe deux grandes familles de catgorisations: celles concernant les variables nominales ou ordinales et celles associes aux variables proportionnelles. - Les variables ordinales ou nominales Ces variables sont dj considres comme des variables catgorielles . En effet, leurs valeurs se prsentent sous forme de catgories, gnralement tablies par ceux qui ont fait le questionnaire. Normalement, dans ce cas, on ne devrait pas avoir refaire la catgorisation. Mais il arrive qu'on veuille malgr tout procder quelques rorganisations de telles donnes. Il pourrait sagir de regrouper des catgories qui

semblent tre parentes ou de limiter le nombre des catgories analyser. Par exemple, on pourrait vouloir faire seulement 3 catgories avec la liste de dlits reprsente au tableau suivant. On regrouperait alors les catgories 1 homicide + 2 agression sexuelle + 3 vol qualifi sous la grande rubrique: 1 dlits contre la personne; les catgories 4 introduction par effraction + 5 vol de moins de 1000$ + 6 vol de plus de 1000$ sous la grande rubrique: 2 dlits contre la proprit; et finalement les catgories 7 possession de stupfiants + 8 prostitution sous la grande rubrique: 3 dlits sans victimes.

Dlit dont est accus le suspect


Value Labels Homicide Agression sexuelle Vol qualifi Introduction par effraction Vol de moins de 1000$ Vol de plus de 1000$ Possession de stupfiants Prostitution Value 1 2 4 5 6 7 8 9 1

Dlit du suspect (3 catgories)*


Value Labels Dlits contre la personne Value 1

Dlits contre la proprit

Dlits "sans victimes"

*Dlits contre la personne comprenant: homicide, agression sexuelle, vol qualifi; dlits contre les biens comprenant: introduction par effraction, vol de plus et vol de moins de 1000$; et dlits sans victimes comprenant: possession de stupfiants et prostitution.

- 27 Labo 2 - CRI 1600G

- Les variables proportionnelles Les variables proportionnelles, pour leur part, prsentent habituellement un tel nombre de valeurs qu'il faut, presque toujours, les regrouper en un nombre limit de catgories si on veut en prsenter un tableau de frquences lisible. Vous constaterez en effet que le tableau de frquences d'une variable proportionnelle est souvent extrmement long, sa prsentation peut occuper jusqu plusieurs pages, et qu'il est assez peu instructif, linformation se trouvant grandement parpille. prsentation et de consultation rapide du matriel. Par contre, en crant des catgories plus larges, on rgle souvent le problme de

RAPPEL: 4

types

de

regroupements

sont

possibles

pour

les

variables

proportionnelles En classes de largeurs gales En classes d'ingales largeurs respectant un principe conceptuel En classes d'ingales largeurs constitues autour de points de concentration des donnes En classes d'ingales largeurs constitues pour respecter un modle prtabli d'analyse Ces procdures de recodage ne sont par ailleurs pas ncessairement mutuellement exclusives. Il est en effet possible de combiner plusieurs dentre elles. Ainsi, une catgorisation, mme en classes dgales largeurs, pourrait rpondre des caractristiques conceptuelles... etc.

Dans tous les cas, la catgorisation dune variable devra rpondre deux impratifs:
1Les catgories doivent tre mutuellement exclusives et 1 elles doivent tre exhaustives.

- 28 Labo 2 - CRI 1600G

DEUX REMARQUES IMPORTANTES:


Ne perdez pas votre temps catgoriser des variables qui ne seront pas utiles pour la suite des analyses. Rappelez-vous toujours que les analyses statistiques se pratiquent sur les donnes brutes (non regroupes). Le groupement en catgories sert essentiellement des fins de prsentation.

5. PRPARER LE RECODAGE
Vous devez maintenant prparer tous les changements effectuer sur vos donnes avant de passer aux analyses dfinitives. Il s'agit tout simplement de noter, propos de toutes les variables pertinentes, les transformations que vous dsirez effectuer.

Demandez-vous: Cette variable m'intresse-t-elle? Y a-t-il des valeurs manquantes non dclares? Y a-t-il des valeurs absurdes? Faut-il organiser une nouvelle catgorisation (un recodage)? C'est ici la base de tout travail d'analyse de qualit.

Voici quoi pourrait ressembler lutilisation dune distribution de frquences pour fins de nettoyage et de recodage (notification normalement faites manuellement):

- 29 Labo 2 - CRI 1600G

ARME

Arme utilise par l'agresseur Valid % ,6 1,4 10,0 ,6 1,5 12,9 1,7 5,7 ,1 ,2 62,8 1,9 ,5 ,1 ,1 ,1 ------Cum % ,6 2,0 11,9 12,5 14,0 26,9 28,5 34,2

Valeur automatique canon sci arme de poing arme feu carabine/fusil autre arme feu couteau autre tranchant/pointu objet contondant armes explosifs feu force physique darmes autre arme menace =missing inconnu N.S.P. Total Valid cases 1574 Missing cases 0 1 2 3 4 5 6 7 8 9 10 11 12 13 43 98 99

Freq. 9 22 157 9 23 203 26 90 1 3 989 30 9 1 1 1 ------1574

% ,6 1,4 10,0 ,6 1,5 12,9 1,7 5,7 ,1 ,2 62,8 1,9 ,5 ,1 ,1 ,1 ------100,0

1:

=2: autr.

34,3 34,5 97,3 = 3: pas 99,2 = 2 99,7 = 3 99,8 erreur 99,9 missing 100,0 missing 100,0

Voici de quoi pourrait avoir l'air le tableau de frquence de la mme variable, une fois celle-ci retravaille (mnage et recodage fait partir de SPSS):

ARME

Arme utilise par l'agresseur Valeur Freq. 220 353 998 % 14,0 22,5 63,5 Valid % 14,0 22,5 63,5 Cum % 14,0 36,5 100,0

armes feu autres armes Pas darmes utilises

1 2 3

Total Valeurs manquantes 3 (0,2%)

1571

100,0

- 30 Labo 2 - CRI 1600G

LABORATOIRE 3 TRAVAILLER LES DONNES


Recode: Calculer: SI : transformation des variables cration de variables effectuer condition

Il

s'agit

maintenant

d'effectuer

toutes

les

transformations

sur

les

donnes,

transformations que vous avez, bien entendu, minutieusement prpares!

1. RECODER OU TRANSFORMER LES VARIABLES Voyons comment s'y prendre pour transformer la catgorisation initiale dune variable, ou, en langage SPSS, comment "recoder" une variable. Procdure pour recoder une variable Transformer " Recoder " Cration de variable2

Loption RECODAGE DE VARIABLE est aussi disponible. Toutefois, nous suggrons fortement de ne jamais recoder la variable initiale en tant que telle, car une fois les transformations effectues, il nest plus possible de revenir en arrire et de retrouver les valeurs telles

- 31 Labo 4 - CRI 1600G

Slectionnez la variable transformer dans le rectangle de gauche Cliquez sur la flche 2 le nom de la variable slectionne apparat dans le rectangle Variable entre --> Variable Inscrivez laide du clavier dordinateur, dans le rectangle de droite, le nom de la nouvelle variable cre ainsi que son tiquette (ex: infractions en trois catgories) Cliquez sur Remplacer Cliquez sur Anciennes et nouvelles valeurs... Une nouvelle zone de dialogue apparat encore une fois:

Inscrivez, dans le rectangle de gauche, la ou les valeur(s) numrique(s) que vous voulez changer:
- il peut sagir dune valeur unique 3 Valeur - dune valeur antrieurement dclare manquante 3 Manquante par dfault ou 3 Manquante par dfault ou spcifie - ou dune suite de valeurs 3 Intervalle (ex:: les valeurs 1 5----> 1 5 )

Associez, dans le rectangle de droite, la nouvelle valeur (nouvelle: 1) une ou plusieurs anciennes valeurs Cliquez sur Ajouter. Recommencez les deux dernires oprations jusqu' ce que vous ayez trait toutes les valeurs recoder. Attention, si certaines valeurs ne doivent pas tre recodes, il nest pas ncessaire de faire correspondre anciennes et nouvelles valeurs qui sont alors quivalentes. On doit toutefois prciser SPSS que pour toutes ces valeurs (toutes les autres valeurs dans le rectangle de gauche en bas), la valeur de la variable demeure la mme, ceci en lui prcisant de les recopier (copier les anciennes valeurs) dans le rectangle de droite en haut de lcran).

quinitialement colliges. Il vaut donc mieux garder une version intacte de la variable initiale et ne travailler quavec des duplicata pour tout ce qui touche les transformations des donnes.

- 32 Labo 4 - CRI 1600G

Une fois toutes les oprations de transformation ralises, terminez la procdure de la faon suivante: Cliquez sur Ajouter (pour enregistrer la dernire commande de modification) " Poursuivre " OK (complte la procdure)

CLS UTILES POUR LE RECODAGE DES VARIABLES NUMRIQUES (permet de raccourcir l'criture du recodage)
de la plus petite (recode la plus grande (recode ... ... (recode Toutes les autres valeurs les valeurs plus petites que) les valeurs plus grandes que) les valeurs comprises entre ... et ...) (recode les valeurs restantes pour lesquelles aucun autre recodage n'est prvu)

MISE EN GARDE: Appliquez la recodification dune variable de prfrence la variable "nettoye", i.e. celle o les valeurs manquantes sont dj dfinies et les donnes erratiques corriges ou limines en les associant aux valeurs manquantes, lorsque que vous procdez la transformation dune variable. Sinon, n'oubliez pas de redfinir (ou rappeler) SPSS la prsence des valeurs manquantes. Une valeur ne peut tre recode plus d'une fois au cours d'une mme procdure. Toutefois on peut appliquer une mme variable toute une srie de recodages, en autant quon cre autant de nouvelles variables quil y a de recodages diffrents denvisags pour cette mme variable. N'oubliez pas, immdiatement aprs le recodage, d'aller vrifier si les transformations ont effectivement eu lieu. Vous les verrez apparatre dans le fichier de donnes. Mais ne vous attendez pas les voir apparatre dans un tableau de frquences tant et aussi longtemps que vous navez pas command un tableau de frquences pour cette nouvelle variable (et non pour lancienne qui est demeure intacte). Procdez immdiatement ltiquettage des valeurs de la nouvelle variable. ( labo 1).

- 33 Labo 4 - CRI 1600G

3. Calculer, OU CRER DE NOUVELLES VARIABLES La commande Calculer permet de crer une nouvelle variable, partir d'une variable dj existante, pour tous les cas d'une banque de donnes. Elle permet, par exemple, de crer, partir d'une banque de donnes incluant toutes les notes d'un tudiant dans un cours donn, une nouvelle variable qui correspond la somme de toutes ces notes, donc son rsultat final (resultat = tp1 + tp2). Il sagit l dun exemple trs simple de ce que l'on peut faire avec la commande Calculer. Dites-vous que la commande Calculer peut effectuer peu prs n'importe quelle opration mathmatique que lon souhaite appliquer aux donnes. Voyons brivement comment sy prendre dans les cas les plus simples.

Procdure pour crer une nouvelle variable laide de la commande Calculer partir du fichier dentte de SPSS, suivre le cheminement suivant: Transformer (choisir cette option dans le menu principal prsent en entte de SPSS) " Calculer Un cran de dialogue apparat:

- 34 Labo 4 - CRI 1600G

Inscrire, laide du clavier dordinateur /, le nom de la nouvelle variable dans le rectangle (Variable destination) situ en haut gauche de lcran de dialogue. Cliquer sur Type et tiquette pour apposer une tiquette cette nouvelle variable.

crire, droite, l'expression numrique permettant la cration de cette nouvelle variable (vous pouvez soit l'crire grce au clavier dordinateur, soit utiliser la zone de
dialogue en slectionnant les variables sa gauche, les oprateurs et les fonctions endessous et en cliquant successivement sur les touches correspondant aux donnes ncessaires la cration de la nouvelle variable).

Cliquer sur OK (complte la procdure).

Il existe une infinit de possibilits pour crer de nouvelles variables partir doprations plus ou moins complexes. Nous nous contenterons dindiquer ici la faon dinscrire les principaux oprateurs mathmatiques ainsi que quelques fonctions de transformations parmi les plus courantes, rappelez-vous seulement quoprateurs et fonctions peuvent tre combins volont.

Oprateurs:

+: -: *: /: **:

addition soustraction multiplication division exponentiel

<, >: <=, >=: &: |:

plus petit, plus grand; plus petit ou gal, plus grand ou gal. et ou

Quelques fonctions:

Abs: Mean: Squt: Rnd: Sum: Yrmoda:

valeur absolue moyenne racine carre arrondir au nombre entier faire la somme calculer la priode entre deux dates

- 35 Labo 4 - CRI 1600G

N.B. L'ordre d'excution des oprations arithmtiques dans SPSS ne diffre pas de celui que vous avez appris dans vos cours de mathmatiques: exponentiels en premier lieu; multiplications et divisions en second lieu; additions et soustractions en troisime lieu.

Il est important de se le rappeler sinon on risque de ne pas obtenir les rsultats souhaits. Seules les parenthses peuvent modifier l'ordre d'excution des oprations.

- 36 Labo 4 - CRI 1600G

4. L'OPTION SI: L'option SI, qui se prsente sous la forme d'un rectangle situ juste en-dessous des oprations et des fonctions de plusieurs commandes, permet de crer, de recoder ou d'associer une valeur une variable SOUS CERTAINES CONDITIONS. On retrouve loption SI pour les commandes recoder, cration de variable ou calculer et bien dautres (que vous verrez ultrieurement). La procdure est toujours la mme ou fort approche:

Procdure suivre pour imposer une condition une commande Atteindre la commande pour laquelle on veut imposer une condition dexcution (recode, calculer ...) Reprer loption SI dans lcran de dialogue correspondant Cliquer sur SI...
Un nouvel cran de dialogue apparat lequel revt plus ou moins la forme suivante vous permettant de prciser les conditions appliquer la commande (recode, calculer...) en cours:

Choisir loption 3 inclure si lobservation remplit la condition:


Le rectange gris devient actif et vous permet dentrer, manuellement, en vous servant du clavier de lordinateur, ou laide des cls prsentant les oprateurs mathmatiques ou les fonctions ncessaires, la dfinition de la condition impose. Celle-ci peut-tre fort simple (ex: recode SI SEXE_VIC=1) ou fort complexe (ex: Calculer = (TP1+TP2+TP3 + EXAM1 + EXAM2) SI TP1+TP2+TP3*.50) >=50 | (EXAM1 + EXAM2/2)**2 >= (TP1+TP2+TP3)

"

Poursuivre " OK - 37 Labo 4 - CRI 1600G

LABORATOIRE 4 TRAVAILLER SUR UN ENSEMBLE SLECTIONN DE DONNES


SELECTIONNER DES OBSERVATIONS: Slectionner une sous-population Crer un chantillon

1. SLECTIONNER UNE SOUS-POPULATION


La commande Slectionner des observations permet d'effectuer une slection temporaire ou permanente de certaines donnes sur lesquelles doivent porter plus spcifiquement une partie des analyses. Une fois quun sous-ensemble de la population ou de lchantillon de dpart a t slectionn, toutes les commandes suivantes ne concernent que ce sous-ensemble de donnes et ce, jusqu' ce quune nouvelle commande indique de revenir la population ou lchantillon entier. Cette commande sert soit effectuer des analyses uniquement sur une partie spcifique des cas issus de lensemble initial des donnes, cest--dire une sous-population ou un sous-chantillon selon que lensemble de dpart constitue une population ou un chantillon; ou alors quand on dsire utiliser un critre comme variable contrle. Exemple 1: Recherche sappliquant entirement un sous-ensemble de donnes Prenons, par exemple, une recherche s'intressant aux facteurs qui influencent la criminalit des mineurs. mineurs. Admettons que la banque de donnes laquelle vous avez accs initialement contienne la fois des donnes concernant des adultes et des Vous ne vous intressez quaux mineurs contenus dans la banque de donnes. Il suffit alors de demander SPSS d'carter dfinitivement tous les cas qui ont 18 ans ou plus, laide de loption Supprimes (voir plus bas), ce qui permet de crer une nouvelle banque de donnes uniquement compose des mineurs du groupe initial. La condition impose serait alors Selon une condition logique SI : AGE < 18
(la variable AGE reprsentant l'ge des dlinquants)

- 38 Labo 4 - CRI 1600G

ATTENTION On prendra la prcaution de sauvegarder le fichier constitu uniquement des donnes concernant les mineurs sous un nouveau nom. Ceci a pour effet de conserver le fichier de donnes initial intact et de crer un nouveau fichier de donnes contenant uniquement celles pertinentes ltude en cours, ici une tude portant sur la criminalit des mineurs. Ceci fait en sorte quadvenant quon veuille reproduire ltude pour les adultes, ou encore quon souhaite comparer ce qui se passe dans le cas des adultes par rapport aux mineurs, on possde toujours linformation ncessaire dans le fichier de donnes dorigine.

Exemple 2:

Recherche qui utilise un sous-groupe de la population ou de lchantillon initial pour une partie seulement des analyses

Ltude que vous entreprenez consiste dresser le portrait des populations en institutions carcrales. Vient le moment danalyser les donnes concernant la nature (peine pour non-paiement damende, sentence de juridiction provinciale ou sentence de juridiction fdrale) et la dure (en nombre de jours) des peines imposes. On sait que les prisons du Qubec accueillent la fois des prvenus (des suspects en attente de verdict ou de sentence) et des condamns (individus reconnus coupables qui se voient imposer une peine de prison). La question de la dure des sentences concerne uniquement les individus condamns (les autres ne connaissant pas encore le verdict ou la sentence dans leur cause). Aussi, cette partie des analyses, spcifiquement, ne portera que sur ceux dj condamns. Il sagit alors en quelque sorte de neutraliser la partie de la population ou de lchantillon de dpart qui ne doit pas tre prise en compte pour cette partie prcise des analyses. On effectuera alors une slection temporaire (option Filtres, voir plus bas) des cas devant tre pris en compte cette tape de lanalyse.

- 39 Labo 4 - CRI 1600G

REMARQUE Au moment dinterprter les rsultats, il faudra prendre la prcaution de prciser que les analyses portent sur une partie seulement des donnes, celles concernes par la variable ltude. Ainsi, par exemple, on crira que: pour les personnes admises dans les institutions carcrales du Qubec et condamnes une peine de prison, la dure moyenne de la peine est de ... .

Exemple 3: Recherche qui utilise une variable contrle On vous demande de vrifier l'hypothse selon laquelle le mariage serait pour les femmes un facteur important dans la dcision de cesser une carrire criminelle mais pas pour les hommes (variable contrle: sexe de lindividu). Il sagit alors dutiliser une banque de donnes comprenant la fois des hommes et des femmes nanmoins analyss sparment. Ici, il sagit, dans un premier temps, deffectuer les analyses sur le sous-groupe (sous-population ou sous-chantillon) compos uniquement des femmes pour ensuite refaire ces analyses sur le sous-groupe (sous-population ou souschantillon) regroupant spcifiquement les hommes. Schma danalyse: 1re condition impose : Slectionner selon une condition logique SI SEXE = 1 (Si la

valeur "1" reprsente les femmes)

1re srie de traitements statistiques concernant le sous-groupe des femmes. 2me condition impose: Slectionner selon une condition logique SI SEXE = 2 (Si la

valeur "2" reprsente les hommes)

2ime srie de traitements statistiques (quivalents aux premiers) concernant cette fois le sous-groupe des hommes.

- 40 Labo 4 - CRI 1600G

Comparaison des donnes obtenues dans les deux cas. Procdures pour slectionner un sous-groupe (tir dune population ou dun chantillon initial) partir du fichier dentte de SPSS, suivre le cheminement suivant:

" Donnes (choisir cette option dans le menu principal prsent en entte de
SPSS)

" Slectionner des observations...


Une zone de dialogue prenant la forme suivante apparat:

Choisir loption " 3 Selon une condition logique " Cliquer sur le rectangle SI...

- 41 Labo 4 - CRI 1600G

crire dans le rectangle de droite, laide du clavier dordinateur /, la condition permettant la cration du sous-groupe (sous-population ou du sous-chantillon) requis. " Poursuivre REMARQUE: Pour liminer DFINITIVEMENT, cest--dire pour lensemble des analyses ralises dans le cadre de ltude en cours, les cas qui ne rpondent pas aux conditions du groupe sousmis aux analayses: choisir loption " sinon laisser sur " 3 Supprimes 3 Filtres (option par dfaut) la slection est alors
temporaire et il est possible de retourner aisment l'ensemble de la population ou de lchantillon de dpart, ceci en slectionnant:

"

OK.

Remarquez que lorsquune slection temporaire dune sous-population ou dun souschantillon (par l'option Filtres) est effectue pour une partie des analyses, les cas non-slectionns sont facilement identifiables dans la fentre Donnes puisque le numro didentification des lignes correspondantes apparat comme tant barr.

- 42 Labo 4 - CRI 1600G

2. SLECTIONNER UN CHANTILLON La commande Slectionner des observations Par chantillon alatoire permet de crer un chantillon alatoire temporaire ou permanent partir d'un fichier de donnes. Une fois que vous avez cr un chantillon, toutes les commandes suivantes sont excutes partir de cet chantillon, jusqu' ce quune nouvelle commande indique SPSS de revenir la population ou lchantillon de dpart.

Procdures pour slectionner un chantillon alatoire parmi l'ensemble des cas " Donnes "Slectionner des observations... " 3 Par chantillon alatoire Cliquer sur "chantillon... puis:

Soit, indiquer le % des cas devant tre gards dans l'chantillon Soit, indiquer le nombre de cas que l'ordinateur doit slectionner.
(Suivant cette procdure, indiquer dans le second rectangle, le nombre de cas que contient initialement la banque de donnes)

" Continue (indique SPSS de procder la slection des cas


requis)

Choisir

" "

3 Filtres 3 Supprimes
selon que vous vouliez que l'chantillonnage soit temporaire ou permanent, suivant en cela la mme logique que celle prcdemment prsente.

Procdure pour revenir la population entire


(aprs un SI ou un chantillon temporaire)

"Donnes "Slectionner des observations... "3 Toutes les observaions " OK.

- 43 Labo 4 - CRI 1600G

LABORATOIRE 5 MESURES DE TENDENCES CENTRALES ET DE DISPERSION

Mesures de tendance centrale et de dispersion Graphiques

1. LES MESURES DE TENDANCES CENTRALES ET DE DISPERSION Les mesures de tendance centrale et de dispersion sont tout particulirement pertinentes lorsqu'il s'agit de dcrire des variables de niveau de mesure proportionnelle ou intervalle.

Procdures pour obtenir dispersion

les mesures de tendance centrale et de

partir du menu principal choisir successivement: " Analyse " Statistiques descriptives " Frquence (lcran de dialogue que vous connaissez maintenant apparat) Slectionner la variable voulue: (toujours la version proportionnelle ou brute dbarasse des valeurs manquantes :il sagit de la seule valide pour calculer des statistiques Cliquer dans le carr Afficher les tableaux de frquence afin d'enlever le X qui sy trouve (sil sy trouve) car un X dans ce petit carr indique SPSS quon ne souhaite pas que le tableau de frquences soit fourni.
Par contre, lorsquil sagit de produire des statistiques sur un tableau de frquences concernant une variable de niveau interval ou proportionnel, on peut indiquer SPSS les statistiques souhaites tout en lui prcisant quon ne dsire pas voir apparatre le tableau de frquences correspondant, lequel stendrait probablement sur plusieurs pages. vous de choisir la bonne option.

Cliquer sur loption Statistiques.

Lcran de dialogue suivant apparat:

Choisir les mesures de tendances centrales ou de dispersion dont vous avez besoin en cliquant dans les carrs prcdant la statistique en question. "Poursuivre ... " OK

LES MESURES DE TENDANCES CENTRALES


Moyenne: Mdiane: mesure de tendance centrale la plus utilise. Il sagit de la somme des valeurs de toutes les observations, divise par le nombre d'observations. valeur qui occupe la place du milieu dans le rangement ascendant ou descendant des valeurs de la variable. Autrement dit, cest la valeur de la variable qui divise la distribution de telle sorte que 50% des valeurs se trouvent au-dessus delle et 50% des valeurs se rencontrent en-dessous delle. valeur la plus frquemment rencontre dans une srie de donnes. somme de toutes les valeurs d'une srie de donnes.

Mode: Somme:

LES MESURES DE DISPERSION cart-type mesure la dispersion des observations autour de la moyenne. Un cart-type qui est grand par rapport la moyenne indique la prsence de donnes disperses autour de la moyenne donc htrognes, alors quun cart-type petit par rapport la moyenne indique la prsence de donnes concentres autour de la moyenne donc relativement homognes. cart-type lev au carr. Sinterprte en termes dunits carres.

Variance :

- 59 Labo 5 - Cri 1600

tendue: Minimum / Maximum: cart-moyen:

diffrence entre la plus grande valeur et la plus petite valeur d'une srie d'observations. plus petite et distribution. plus grande valeurs rencontres dans la

distance moyenne (en valeur absolue) sparant les observations de la moyenne.

LES MESURES QUI RENDENT COMPTE DE LA FORME DE LA DISTRIBUTION APLATISSEMENT indique le degr de voussure de la distribution (varie en -1 qui indique la prsence dune distribution leptokurtique et 1 qui indique la prsence dune distribution platikurtique en passant par 0, distribution msokurtique). indique le degr de symtrie de la distribution (varie entre -1 qui indique la prsence dune distribution ngativement dissymtrique ou tendue vers la gauche et 1 indiquant la prsence dune distribution positivement dissymtrique ou tendue vers la droite en passant pas zro, distribution symtrique).

ASYMTRIE

Gnralement, on ne prsente pas les mesures de tendance centrale et de dispersion sous forme de tableau, on prfre en discuter dans le texte en les y intgrant. Toutefois, il peut arriver, pour une raison ou pour une autre, qu'on veuille aussi prsenter ces rsultats plus schmatiquement. La prsentation des mesures de tendance centrale et de dispersion pourrait alors se faire de la manire suivante:

Tableau 5.2 Distribution de la dure en jours des sentences de probation (N = 12 369)

Moyenne: Mdiane: Mode: Asymtrie:

890 730 730 0,122

cart-type: Minimum: Maximum:

366.6 90 3650

Aplatissement: 0,336

Valeurs manquantes:

502

(4,1%)

- 60 Labo 5 - Cri 1600

RAPPEL Attention, les statistiques concernant la distribution des valeurs dune variable: mesures de tendance centrale, de dispersion ou de position se calculent sur les donnes brutes nettoyes et lexclusion des valeurs manquantes.

2. LES REPRSENTATIONS GRAPHIQUES


La forme de prsentation la plus visuelle concernant la distribution d'une population en fonction d'une variable donne est sans doute le graphique. SPSS vous offre le choix de plusieurs types de graphiques, allant du graphique en pointes de tarte (ou pointe de camembert pour les franais) jusqu'au graphique linaire en passant par le diagramme en btons. Vous trouverez la liste des types de graphique que permet de raliser SPSS sous l'item Graphe du menu principal. Il n'y a pas de rgle qui tablisse clairement quand et comment utiliser une forme de graphique plutt qu'une autre, notez toutefois que les histogrammes (pour les donnes de niveau de mesure intervalle ou proportionnel) et les pointes de tarte (pour les donnes de niveau de mesure nominal ou ordinal) sont parmi les plus utiliss.

Exemples de graphiques:
FIGURE 5.1 Age du meurtrier (SPCUM, 1989)
600 500 400 300 200 Std. Dev = 12,63 100 0
0,0 10,0 5,0 20,0 30,0 40,0 50,0 60,0 70,0 80,0 90,0 15,0 25,0 35,0 45,0 55,0 65,0 75,0 85,0

Mean = 31,8 N = 2665,00

Age du meutrier

- 61 Labo 5 - Cri 1600

Il sagit ici dun histogramme


Fi gur e 4 . 2 Cat gor i es de m eur t r e ( SP CUM , 1 9 8 9 )

cat gorie indt ermine

f amilial

associ une agression aut re passionnel

pointe de tarte ou de camembert

associ un vol rglement de compt e suivant une querelle

Procdure pour crer un graphique partir du menu principal choisir successivement les options: " Analyse " Statistiques descriptives " Frquence (lcran de dialogue que vous connaissez maintenant apparat) Slectionner la variable pour laquelle on dsire une reprsentation graphique. Cliquer sur loption Diagrammes. Lcran de dialogue suivant apparat:

" Slectionnez alors le diagramme de votre choix OK (complte la procdure et indique SPPS de raliser le graphique) - 62 Labo 5 - Cri 1600

N.B. Pour produire dautres formes de diagrammes ou alors pour en faire de type plus labor, choisissez plutt loption Graphes du menu principal.

Procdures pour diter un graphique Une fois la diagramme apparus dans la fentre de rsultats :: Slectionnez le diagramme en cliquant deux fois dessus La fentre diteur de diagramme SPSS devrait maintenant prsenter le graphique, lequel peut alors tre modifi votre guise.
Ajoutez un titre, une lgende, ou ajustez n'importe quel lment du graphique (son orientation, la taille des caractres ...), soit en double-cliquant sur l'lment transformer, soit en utilisant les menus qui vous prsentent les diffrentes options de transformations possibles cette tape des procdures de cration et ddition dun graphique.

Conseil: Les graphiques ont l'avantage d'tre loquents et amusants faire, par contre, ils prennent beaucoup de place et prsentent des informations relativement limites, n'en abusez donc pas. En outre, une reprsentation graphique, tout comme une prsentation des donnes sous forme de tableau de frquences, appelle un commentaire de la part du chercheur qui prsente les donnes. Ne vous illusionnez pas : de toute manire, vous ny chapperez pas.

- 63 Labo 5 - Cri 1600

LABORATOIRE 6 EFFECTUER UN TEST DE COMPARAISON DE MOYENNES

Le test d'hypothse sur deux moyennes dtermine si une diffrence entre deux statistiques chantillonnales est significative ou si elle est simplement due une variation d'chantillonnage (on dira plus simplement due au hasard). En d'autre mots, on utilise le test de moyenne quant on veut savoir si la diffrence de moyennes entre deux groupes, pour une variable donne, est significative ou pas.

N.B. Le test de diffrence de moyennes peut se faire lorsqu'on est face : 1 variable DPENDANTE de type PROPORTIONNELLE (QUANTITATIVE) et 1 variable INDPENDANTE de type NOMINALE DICHOTOMIQUE (cest--dire prsentant seulement deux modalits ou catgories)

Exemple:
On veut savoir si, parmi les dlinquants qui commettent des vols qualifis, la diffrence dans la moyenne des gains est significative si on compare ceux qui sattaquent aux dpanneurs et ceux qui s'attaquent aux garages? On fait alors un test de moyennes: la variable dpendante (celle qui est appele varier) est le montant d'argent vol et

la variable indpendante (celle qui pourrait faire varier la variable dpendante) est le lieu o
se commet le dlit (dpanneur ou garage). dichotomique. Cette dernire se prsente sous forme

Procdures pour effectuer un test de moyenne: Dans le menu principal slectionner sous loption " Analyse " Comparer les moyennes " Moyennes... Vous obtenez lcran suivant:

Slectionnez la variable dpendante (qui devrait toujours tre de niveau de mesure proportionnel) dans le rectangle de gauche et faites-la passer, en usant de lespace flch prvu cet effet, dans le rectangle intitul Variable(s) dpendante(s). On peut choisir plus dune variable dpendante si plusieurs tests de moyennes doivent tre raliss en fonction dune mme variable indpendante (par exemple on cherche tablir si le nombre dheures passes tudier, le nombre dheures passes travailler, et les rsultats scolaires varient en fonction du fait quon vit encore ou non chez ses parents). Slectionnez la variable indpendante (laquelle devrait toujours se prsenter sous une forme dichotomique, ce qui peut vouloir dire un certain travail de recodage) dans le rectangle de gauche prsentant lensemble des variables contenues dans la banque de donnes et faitesla passer, en usant de lespace flch prvu cet effet, explicatives. dans le rectangle Variables On peut choisir plus dune variable indpendante, si celles-ci sont toutes

susceptibles dinfluencer la moyenne dune ou de plusieurs variables dpendantes. Celles-ci doivent toutes tre testes en regard de la ou des mmes variables dpendantes (par exemple, on calcule la diffrence de moyennes dans la dure des procdures et la dure de la sentence en fonction du sexe masculin / fminin , du statut libre / dtenu., de la situation demploi possde un emploi oui / non et de la prsence ou non dantcdents judiciaires). Cliquez sur OPTION Vous obtenez la boite de dialogue suivante vous permettant de choisir un certain nombre doptions selon quelles vous semblent plus ou moins propos compte tenu des analyses que vous voulez effectuer:

- 6-2 Labo 6 - CRI 1600

Assurez-vous que les options Moyenne, cart-type) et Count (nombre de donnes valides sur lesquelles sappuient les analyses) sont slectionnes. Ce sont les donnes dont vous avez minimalement besoin pour procder votre analyse. Les options Variance (idem en franais) et Sum (qui fait la somme de toutes les donnes disponibles) sont juges moins utiles et servent surtout de base dautres analyses. Slectionnez loption statistique ANOVA (qui vous donnera deux statistiques indispensables: Table et Eta) " Continue " OK.

Rgle de dcision: comment dterminer si la diffrence de moyennes observe est statistiquement significative? Si on accepte un pourcentage d'erreur de 5% (donc qu'on veut tre sr 95% de ne pas se tromper en disant quil existe une diffrence significative entre les moyennes observes et que, par consquent, cette diffrence nest pas simplement de au hasard chantillonnal): Si on trouve P (ou Sig) infrieur 0.05, alors on conclut que la diffrence entre les moyennes est statistiquement significative; Si P (ou Sig) est suprieur 0.05, alors la diffrence observe entre les moyennes n'est pas statistiquement significative.

- 6-3 Labo 6 - CRI 1600

Si on se fixe un pourcentage d'erreur de 1% (donc on veut tre sr 99% de ne pas se tromper en disant quil existe une diffrence significative entre les moyennes observes et que, par consquent, cette diffrence nest pas simplement de au hasard chantillonnal ): Si P (ou Sig) est infrieur 0.01, alors la diffrence est juge statistiquement significative Si P (ou Sig) est suprieur 0.01, alors la diffrence n'est pas statistiquement significative. En sciences humaines on accepte gnralement un pourcentage d'erreur maximum de 10%, 5% ou de 1%. selon les vises de ltude et le degr de certitude ou de prcision requis pourquoi on compare P l'un des seuils suivants, soit: 0.1, 0.05 ou 0.01 C'est

Voici de quoi aurait l'air le rsultat d'un test de diffrences de moyennes permettant de savoir si la valeur des vols dpendent de lendroit ou a t perptr le dlit :

Moyennes
Observation Calculer Rcapituler Observations Exclu(s) N Pourcentage 416 23,3%

N VALVOLFR Valeur du vol ou de la fraude * DEP_BANQ dpanneur ou banque 1366

Inclus Pourcentage 76,7%

N 1782

Total Pourcentage 100,0%

Tableau de bord VALVOLFR Valeur du vol ou de la fraude DEP_BANQ Moyenne N 5,00 Dpanneur 422,8920 1093 6,00 Banque 9393,5128 273 Total 2215,7028 1366

Ecart-type 1592,3371 28697,03 13379,35

Tableau ANOVA Somme des carrs 1,758E+10 2,268E+11 2,443E+11 Moyenne des carrs 1,758E+10 166250827

df 1 1364 1365

VALVOLFR Valeur du vol ou de la fraude * DEP_BANQ dpanneur ou banque

Inter-groupes Intra-classe Total

Combin

F 105,734

Signification ,000

- 6-4 Labo 6 - CRI 1600

Mesures des associations Eta VALVOLFR Valeur du vol ou de la fraude * DEP_BANQ dpanneur ou banque ,268 Eta carr ,072

Amnags, pour tre rendus dans le cadre dun travail ou dun article, les rsultats dun test de moyenne pourraient tre prsents ainsi: Tableau 6.1: Dure du procs en fonction des antcdents judiciaires du suspect

Montant du vol Dans des dpanneurs Dans des banques Au total P = .000 ta carr : 0,072 Valeurs manquantes: 416 ou 23,3% 422,89 9393,51 2215,70

cart-type 1592,34 28697,03 13379,35

Nombre de cas 1093 273 1 366

Quant l'interprtation, on pourrait simplement dire qu'il existe une diffrence de moyennes statistiquement significative dans le montant des vols selon lendroit o ils ont t commis. En effet, on peut dire que ceux qui s'attaquent aux dpanneurs font moins d'argent (en moyenne, 422,89$) que ceux qui volent des banques (en moyenne, 9393,51$), puisque p<.05. La mesure dassociation ta carr nous permet daffirmer que 7,2% de la variation des montants des vols pourrait tre expliqu par oendroit ou celui-ci a t commis.

- 6-5 Labo 6 - CRI 1600

LABORATOIRE 7 METTRE DEUX VARIABLES EN RELATION


Tableau crois Khi carr ( 2) et drivs

1. LE TABLEAU CROIS La commande Tableaux croiss permet de prsenter sous forme de tableau crois la mise en relation de 2 ou plusieurs variables catgorises. Le tableau crois se prsente sous forme de ranges et de colonnes la croise desquelles on retrouve des cellules reprsentant le nombre de cas prenant simultanment une valeur donne pour la variable indpendante et une valeur donne pour la variable dpendante. Chacune des cellules du tableau reprsente donc une seule combinaison de valeurs croisant une valeur de la variable dpendante avec une valeur de la variable indpendante. Par exemple, le tableau croisant la variable CRIME DE VIOLENCE (laquelle prsente 2 catgories: crime violent vs crime non violent) avec la variable EFFET DE LALCOOL (2 catgories: sous l'effet d'alcool vs sobre) donnerait un tableau prsentant quatre cellules constituant respectivement les quatre combinaisons suivantes: Sous l'effet de l'alcool / Crime violent Sous l'effet de l'alcool/ Crime non-violent Sobre / Crime violent Sobre / Crime non-violent

N.B. Il est gnralement prfrable de prsenter les valeurs de la variable indpendante en colonnes et celles de la variable dpendante en ranges. En effet, par convention implicite on a convenu de standardiser la prsentation des tableaux sous cette forme, la lecture des donnes s'en trouvant facilite. Toutefois, par souci d'esthtisme ou pour dautres raisons, il est possible de passer outre cette rgle. Par exemple, dans le cas o la variable dpendante prsente un grand nombre de catgories alors que la variable indpendante n'en affiche pour sa part qu'un trs petit nombre, il peut paratre prfrable de prsenter le tableau croisant les deux variables sur le sens de la largeur plutt que sur celui de la longueur. Une chose demeure capitale, quelle que soit le prsentation que l'on choisi de retenir, il faut rfrer aux pourcentages appropris au moment de procder aux analyses et de formuler son commentaire sur les donnes.

Procdures pour crer un tableau crois Dans le menu principal slectionner sous loption Analyse: "Statistiques descriptives "Tableaux croiss... Vous obtenez lcran suivant:

Slectionnez dans le rectangle de gauche, prsentant lensemble des variables contenues dans la banque de donnes, la ou les variables dpendantes que vous souhaitez soumettre lanalyse et faites-les passer, laide des rectangles flchs prvus cet effet, dans le rectangle Lignes(s). Faire de mme pour la ou les variables indpendantes de sorte quelles sinscrivent, cette fois, dans le rectangle Colonne(s). Vous constatez ainsi que vous pouvez soumettre au cours dune mme commande, plusieurs variables indpendantes et plusieurs variables dpendantes qui seront mises en relations les unes avec les autres. Sachez toutefois que vous multipliez de ce fait le nombre de tableaux croiss produits. Ainsi, le fait de prciser deux variables dpendantes et deux variables indpendantes, comme dans lexemple fourni plus haut, donnera lieu 4 tableaux (sexe des victimes et catgories dhomicide en fonction de lge de lagresseur et sexe des victimes et catgories dhomicide en fonction du sexe de lagresseur.

- 7.7 Labo 7 - Cri 1600

Loption Strates 1 sur 1 prsent dans le mme cran de dialogue permet pour sa part de faire intervenir des variables contrles. De la mme faon que pour les procdures prcdentes, vous devez choisir dans le rectangle de gauche une ou des variables que vous voudriez faire intervenir en tant que variables contrles. Ainsi, dans lexemple prcdent, le fait de faire ou non), comme variable contrle, double le intervenir la variable RESOLU (affaire rsolue

nombre de tableaux produits, les quatre tableaux dorigine tant produits dune part pour les homicides non rsolus (4 premiers tableaux) et dautre part pour les homicides rsolus (4 autres tableaux). Loption Supprimer les tableaux vous permet dobtenir les statistiques concernant la mise en relation de deux variables, sans que les tableaux croiss correspondant ne soient produits. Ceci peut-tre pratique si la seule chose qui vous est utile ce sont les statistiques, ou encore, si aprs avoir produit un tableau de frquences vous vous apercevez que vous avez besoin des statistiques et que vous avez oubli de demander SPSS de les produire. Si la mise en oeuvre de cette option nest pas prcise (il sagit pour la slectionner de cliquer dans le petit carr prcdant le nom de loption afin dy faire apparatre un x qui signale que loption est en vigueur), SPSS produit par dfaut les tableaux croiss demands.

Loption Statistiques...

Loption Statistiques permet de slectionner les coefficients dont vous avez besoin afin de prciser la relation entre les deux variables (sa significativit, dans certains cas sa force, dans certains cas encore sa direction).

- 7.8 Labo 7 - Cri 1600

Voici les statistiques les plus couramment utilises: Khi-deux (Khi-carr, 2): permet de dterminer s'il existe une relation statistiquement significative entre les variables. Seul coefficient qui, avec ses drivs (phi, C de contingence, V de Cramer), s'applique pour les variables de niveau de mesure nominal, et par consquent sapplique aussi pour toutes les variables de niveaux de mesure suprieur. SPSS nomme le 2 tel que nous avons appris le calculer le Khi-deux de Pearson. Les autres donnes affrentes au 2 sont des variantes que nous napprendrons pas interprter. Coefficient de contingence: Driv du 2 qui mesure la force de la relation. Sutilise le plus souvent dans le cas de variables de niveau nominal mais sapplique aussi dans le cas de variables de niveaux de mesure suprieurs. Utilis lorsque le tableau comprend le mme nombre de colonnes et de ranges. Phi et V de Cramer: Drivs du 2 qui mesurent la force de la relation. Sutilisent le plus souvent dans le cas de variables de niveau nominal mais sappliquent aussi dans le cas de variables de niveaux de mesures suprieurs. Phi s'applique dans le cas de tableaux de dimension 2 (colonnes) X 2 (ranges). V de Cramer s'applique quelle que soit la dimension du tableau.

Loption Cellules... Vous permet de slectionner les informations que vous dsirez voir apparatre dans les cellules du tableau crois.

Sous Effecif.. Observ prsente le nombre de cas, la frquence de deux caractristiques (lune concernant la variables dpendante lautre la variable indpendante) prises simultanment.

Thorique prsente les frquences espres (ou attendues ou thoriques) de chacun des points de rencontre (cellule) entre une valeur de la variable indpendante et une valeur de la variable dpendante si les variables mises en relation taient parfaitement indpendantes (premire tape du calcul du 2).

- 7.9 Labo 7 - Cri 1600

Sous Pourcentages Ligne Colonne Total donne le pourcentage calcul en ligne pour chacune des ranges (Nb de cas de la cellule / Nb de cas (frquence) de la range) * 100 donne le pourcentage calcul en colonne pour chacune des colonnes (Nb de cas de la cellule / Nb de cas (frquence) de la colonne) * 100 donne le pourcentage de cas qui appartient chaque cellule en rapport avec le nombre de cas total ltude (Nb de cas de la cellule / Nb total de cas) * 100

1.1. EXEMPLE DE TABLEAU CROIS Voici un exemple de tableau crois o la variable dpendante est le fait d'avoir commis un crime violent ou au contraire un dlit ne prsentant pas de violence et o la variable indpendante reprsente le fait d'avoir consomm ou non de l'alcool juste avant la commission du dlit. Ici, la sous-commande Statistiques, on a slectionn les options Khi-deux et Phi et V de Cramer tandis qu' la sous-commande Cellules les options retenues taient Effectif > Observ et la sous-commande Pourcentage > Colonne(s). Tableau 7.1: Relation entre la consommation d'alcool juste avant de dlit et le fait d'avoir commis un crime violent ou non

Alcool 19 70,3% 8 29,6% Non-violent 27 54,0% Total Aucune valeur manquante Crime violent Khi-Deux Pearson Phi Valeur 11,7681 ,48514

Sobre 5 21,7% 18 78,3% 23 46,0%

Total 24 48,0% 26 52,0 50 100,0%

ddl 1

Signification ,00060

1.2. EXEMPLE D'INTERPRTATION DE TABLEAU CROIS Un questionnaire pass 50 dtenus d'un pnitencier qubcois tend montrer l'existence d'une relation entre la consommation d'alcool et la violence des dlits. En effet, malgr qu'au total il y ait environ le mme nombre de crimes violent (24) et non-violent (26), on remarque que 70,3% des rpondants ayant consomm de l'alcool juste avant la commission du dlit ont commis des crimes violents, comparativement seulement 21,7% des dtenus affirmant qu'ils - 7.10 Labo 7 - Cri 1600

taient sobres au moment du passage l'acte. Un test du Khi carr a permis de confirmer la prsence d'une relation statistiquement significative entre les deux variables (P < .05). Le coefficient Phi (0.48) permet pour sa part d'affirmer que la relation entre la consommation d'alcool et les crimes violents semble tre relativement forte. Notons toutefois que ces tests ne nous permettent absolument pas d'affirmer que l'alcool pousse les gens faire usage de violence. On pourrait, en effet, tout aussi bien dire que les individus boivent souvent avant de commettre un crime violent, soit pour se donner du courage, soit pour se donner une excuse.

- 7.11 Labo 7 - Cri 1600

LABORATOIRE 8 Mettre en relation deux variables quantitatives


Le Le La Le R2 de Pearson (coefficient de dtermination) nuage de points rgression R de Pearson (coefficient de corrlation)

1. LE R DE PEARSON Le R2 de Pearson, appel aussi le COEFFICIENT DE DTERMINATION, est un nombre qui mesure l'intensit de la liaison linaire entre deux variables de niveau de mesure quantitatives. Le coefficient R2 varie toujours entre -1 et 1, "-1" reprsentant une relation linaire ngative parfaite (on dira aussi que les variables sont lies par une relation linaire parfaitement inversement proportionnelle); "0" reprsentant l'absence totale de relation linaire entre les variables; et "1" reprsentant une relation linaire positive parfaite (ou encore le fait que les variables sont lies par une relation linaire parfaitement directement proportionnelle). Entre ces valeurs extmes , le coefficient de dtermination indique si les variables sont plus ou moins bien linairement lies entre elles, dans un sens ou dans lautre. Ainsi, plus on sapprochera de -1 ou 1 plus on conclura que la force de la relation (inversement ou directement proportionnelle) est importante. linverse, plus le coefficient de dtermination tend vers zro, plus on sapproche dune situation dabsence de relation linaire entre les variables ltude. Plus prcisment encore, le coefficient de dtermination se lit comme tant le pourcentage de variance de la variable dpendante explique par sa mise en relation avec la variable indpendante. On dtermine donc ainsi, si la variable indpendante constitue un plus ou moins bon prdicteur des valeurs que prendra la variable dpendante.

Notez que les relations linaires parfaites ou trs leves (R2 >.80) doivent tre questionnes: il est possible qu'elles soient dues au fait qu'on mesure deux fois le mme phnomne. En d'autres mots, il est possible que les variables ne soient pas rellement distinctes. Par exemple, on mesure la peur du crime dans le quartier et en gnral et on met les deux variables en relation. On trouve une relation quasi parfaite entre les deux. Cest lindication, quen fait, la peur du crime dans le quartier et la peur du crime en gnral ne font quun. On avait toutefois raison, dans un premier temps, de vouloir sen assurer scientifiquement . Toutefois, pour la suite de ltude, on sera avis de ne conserver quun seul des deux indicateurs puisquon vient dtablir que les deux mesuraient finalement la mme chose.

N'oubliez pas qu'il peut y avoir une forte relation entre deux variables, sans que cette relation soit linaire. Pour que le coefficient de dtermination rende justice la relation, il faut absolument que la relation entre les variables soit positivement ou ngativement linaire. 1.1 QUELQUES EXEMPLES DE RELATIONS ENTRE VARIABLES ILLUSTRS LAIDE DE
DIAGRAMMES DE DISPERSION (OU NUAGE DE POINTS)

2. LE DIAGRAMME DE DISPERSION ou LE NUAGE DE POINT Le diagramme de dispersion, ou le nuage de points, constitue la reprsentation graphique de la relation entre deux variables de niveau de mesure proportionnel. Chaque point reprsente un couple d'observations (x,y) rapport sur un graphique en prenant pour abscisse (axe horizontal) la variable indpendante (x) et pour ordonne (axe vertical) la variable dpendante (y).

- 9. -

Labo 8 - CRI 1600

13

Graphique 8. 1: Relation entre le taux de famille vivant sous le seuil de pauvret et le taux de dlinquance dans les secteurs de recensement de Montral.
16

14

12

10

e c n a u q n i l d e d x u a T

-2 0 20 40 60 80 100

Taux de familles a faible revenu

Le diagramme de dispersion permet de dceler loeil que ces deux variables varient dans le mme sens, dans une relation linaire directement proportionnelle (ou positive). On doit nanmoins faire appel au calcul des coefficients de dtermination et de corrlation afin dtablir prcisment dans quelle mesure (avec quelle force) ces deux variables sont inter-relies, de manire linaire ou non. Procdure pour la production dun diagramme de dispersion (ou nuage de points) illustrant la relation entre deux variables de niveau proportionnel partir du menu dentte, choisir: "Graphes "Diagramme de dispersion... Lcran suivant apparat, vous offrant un choix doptions parmi lesquelles, lorsquil sagit de mettre en relation seulement deux variables, seule loption Simple sapplique.

- 9. -

Labo 8 - CRI 1600

14

Choisir donc: "Simple puis "Dfinir Un nouvel cran de dialogue apparat:

Slectionner la variable dpendante soumise lanalyse dans le rectangle de gauche qui vous prsente lensemble des variables contenues dans la banque de donnes et linscrire, en la faisant passer laide du rectangle flch prvu cet effet, dans le rectangle correspondant l'axe Y (axe vertical), lequel doit reprsenter les valeurs de la variable dpendante. Rpter lopration pour ce qui est de la variable indpendante laquelle sera pour sa part porte dans le rectangle reprsentant laxe des X (axe horizontal dans la reprsentation graphique).

- 9. -

Labo 8 - CRI 1600

15

P.S. Vous pouvez ds cette tape prciser les titres des axes et du graphique ( partir de loption TITRES... prsente en bas de la bote de dialogue, mais cette opportunit vous sera aussi donne, une fois le graphique constitu, et il est alors un peu plus ais de procder. Alors attendre avant de procder ces ramnagements esthtiques. " OK (prcise SPSS de procder la commande) Le graphique se cre et apparat dans la fentre Rsultats. Vous n'avez plus qu' cliquer afin d'amnager le graphique votre got. Vous tes alors guid par une srie de menus et sous-menus qui vous permettent dajouter des titres, des lgendes, de redimentionner les chelles des axes des x et des y... vous de jouer. Procdures pour l'analyse de corrlation: R de Pearson:

partir du menu dentte, choisir:


" Analyse ... " Corrlation " Bivarie Slectionner les variables pour lesquelles vous dsirez mesurer la corrlation. SPSS en traitera deux par deux. cette tape, SPSS ne vous demande pas de prciser quelle est la variable dpendante et quelle est celle indpendante parce que, quel que soit le sens dans lequel il effectue le calcul du coefficient de corrlation, celui-ci tant symtrique, il donnera le mme rsultat. " S'assurer que le coefficient Pearson est bien slectionn "OK (prcise SPSS de sexcuter) 1.2. EXEMPLE D'UN RSULTAT DE CORRLATION: R DE PEARSON: Notez bien que les coefficients de Pearson sont souvent prsents sous forme de matrice, donc qu'il n'y a que les chiffres en gras qui peuvent rellement servir.

- 9. -

Labo 8 - CRI 1600

16

Tableau 8.1: Corrlation entre le taux de famille pauvre et le taux de dlinquance dans 245 secteurs de recensement de l'le de Montral On a ici une matrice mettant en relation uniquement deux variables. TAUX_DEL TAUX_DEL 1,0000 ( 245) P= , ,4707 ( 244) P= ,000 PAUVRES ,4707 (r de Pearson) ( 244) (nombre de cas ayant servi au calcul) P= ,000 (niveau de significativit) 1,0000 ( 245) P= ,

PAUVRES

Interprtation possible du tableau 8.1: Il existe une relation statistiquement significative (p<.05) et directement proportionnelle (puisque le signe du coefficient nest pas ngatif) entre le taux de familles vivant sous le seuil de pauvret et le taux de dlinquance juvnile. De fait, on constate que plus il y a de familles pauvres dans un secteur de recensement donn, plus le taux de dlinquance y est lev. Ceci est confirm par un coefficient de corrlation R de Pearson de .47 (p 0,000) indiquant une relation statistiquement significative positive assez forte entre les deux variables. P.S. Dans le cadre dun article scientifique, lorsque seulement deux variables sont mises en relation, on se contentera de glisser la valeur du coefficient et le degr de significativit dans le texte lappui de notre analyse. Inutile de prsenter la matrice des rsultats de lanalyse de corrlation.

3. LA RGRESSION 3.1. LA DROITE DE RGRESSION SIMPLE La droite de rgression est la droite qui s'ajuste le mieux possible aux points d'un diagramme de dispersion mettant en relation deux variables. Formule de la droite de rgression: y=a+bx, o "y" = variable dpendante, "x" = variable indpendante "a" = l'ordonn l'origine (quon nommera aussi constante) "b" = la pente de la droite. Exemple de la relation entre le nombre de victimisations subies et la peur du crime, telle que mesure sur une chelle croissante de 1 7, 7 reprsentant le plus haut degr de peur que peut indiquer un rpondant.

- 9. -

Labo 8 - CRI 1600

17

Cas no. VICTIM PEUR

1 8 4

2 3 10 2 6 1

4 9 2

5 6 5

6 6 3

7 2 5

8 3 1

9 4 3

10 11 12 13 14 15 16 17 18 19 20 10 5 3 10 7 3 3 6 8 8 5 5 2 2 5 4 3 4 4 5 6 6

Ici, la droite de rgression s'inscrit: Indice de peur du crime = 2,01 + 0,30 (x = nombre de victimisations)
Tableau 8.2 Indice de la peur du crime en fonction du nombre d'expriences de victimisation subies par les rpondants 7 y = 2,0111 + 0,30320x R^2 = 0,269 6

5 Indice de la peur du crime

0 0 2 4 6 8 10 12

Nombre de victimisations

Le R2 de Pearson est ici de 0,27, cest--dire que le nombre de victimisations subies permet dexpliquer 27% de la variance observe en ce qui a trait au niveau de peur du crime exprim par les rpondants.

3.2. LE COEFFICIENT DE DTERMINATION: R2 Le coefficient de dtermination, le R2 de Pearson, reprsente la proportion de la variation totale que subie la variable dpendante qui est explique par la droite de rgression, lorsquune variable indpendante quelconque est prise en compte. Il s'exprime comme le rapport de la variation explique (par la prsence de la variable indpendante) la variation totale (lorsque la variable indpendante nest pas tenue en compte). En dautres mot, il sagit dun indice de lajustement de la droite au nuage de points dcoulant de la mise en relation de deux variables. Ainsi, on peut voir que le premier diagramme, qui reprsente une relation plus forte entre les deux variables, prsente un coefficient de dtermination plus lev que le second diagramme.

- 9. -

Labo 8 - CRI 1600

18

La procdure de rgression ralise par SPSS sert donc dterminer la prsence d'une relation statistiquement significative, cest--dire qui ne serait pas due au hasard, entre les variables (donn par le niveau de significativit; la direction de cette relation (donne par la pente positive ou native); ainsi que la proportion de variance de la variable dpendante explique par la prsence de la variable indpendante avec laquelle elle est mise en relation (R2). Procdres afin d'effectuer un test de rgression partir de lentte de dpart, choisir: " Analyse " Rgression " Linaire ... Slectionner les variables dpendantes et indpendantes que lon souhaite soumettre lanalyse. Ici il est important de bien dterminer et prciser SPSS quelles sont les variables indpendante et dpendante. " OK. (prcise SPSS de sexcuter) 3.3. EXEMPLE D'UN LISTING SPSS D'UNE ANALYSE DE RGRESSION:

Rgression
b Variables introduites/limines

Modle 1

Variables introduites PEUR Indice de la peur du a crime

Variables limines ,

Mthode Introduire

a. Toutes variables requises introduites b. Variable dpendante : VICTIM Nombre de victimes

- 9. -

Labo 8 - CRI 1600

19

Rcapitulatif du modle Erreur standard de l'estimation 1,4506

Modle 1

R ,537a

R-deux ,288

R-deux ajust ,249

a. Valeurs prdites : (constantes), PEUR Indice de la peur du crime


ANOVAb Somme des carrs 2878,398 37,875

Modle 1

ddl 1 18

Rgression Rsidu

Carr moyen 15,325 1193,624

F 7,283

Signification ,015a

a. Valeurs prdites : (constantes), PEUR Indice de la peur du crime b. Variable dpendante : VICTIM Nombre de victimisation

Coefficientsa Coefficien ts standardi ss Bta ,169 t 1,887 1,553 Signification ,015

Modle 1

(constante) VICTIM Nombre de victimisation

Coefficients non standardiss Erreur B standard 34,780 18,432 1,494 ,962

a. Variable dpendante : VICTIM Nombre de victimisation

Interprtation possible des coefficients et/ou de la droite de rgression et/ou du nuage de point: Nous constatons lexistence dune relation statistiquement significative (p = .01) et directement proportionnelle (signe de la pente = positif) entre le nombre de victimisations subies et la peur du crime telle que mesure par une chelle allant de 1 7, o 7 indique le niveau le plus lev de peur. Ainsi, plus une personne aura t victimise, plus elle aura tendance craindre la criminalit (R de Pearson: 0,54). La droite de rgression nous permet mme de dire que la variable indpendante nombre de victimisations permet dexpliquer prs de 30% de la variance observe au sujet de la variable dpendante peur du crime exprime par les rpondants (R2 = 0,288).

- 9. -

Labo 8 - CRI 1600

20