Vous êtes sur la page 1sur 99

ERIC LOONIS

les statistiques par lexemple

2 Stats pour les nuls les statistiques par lexemple

STATS POUR LES NULS1


les statistiques par lexemple
Par le Dr Eric Loonis

Eric Loonis, 2013.


Ce texte publi par Eric Loonis est protg par les lois et traits internationaux relatifs aux droits dauteur. Son impression sur papier est strictement rserve lacqureur et limite son usage personnel. Toute autre reproduction ou copie, par quelque procd que ce soit, y compris la mise disposition en ligne, constituerait une contrefaon et serait passible des sanctions prvues par les textes susviss et notamment le code franais de la proprit intellectuelle et les conventions internationales en vigueur sur la protection des droits dauteur.

Les marques cites : IBM, SPSS Statistics, Excel, Word appartiennent strictement leurs ayant droits.

Les exercices proposs en exemple dans cet ouvrage sont bass sur la version 21 de IBM SPSS Statistics en franais.

3 Stats pour les nuls les statistiques par lexemple

TABLE DES MATIERES


INTRODUCTION ........................................................................................................................................... 4 1. LA MTHODOLOGIE .............................................................................................................................. 6 1.1. LES TYPES DE RECHERCHE ....................................................................................................................... 6 1.2. LES VARIABLES INDPENDANTES ET DPENDANTES ............................................................................... 9 1.3. LES PLANS DE RECHERCHE ..................................................................................................................... 15 1.3.1. PLANS DE RECHERCHE GROUPES INDPENDANTS ............................................................................... 15 1.3.2. PLANS DE RECHERCHE MESURES RPTES........................................................................................ 18 1.3.3. PLANS DE RECHERCHE COMBINS ......................................................................................................... 21 1.4. LES TYPES DE VARIABLES ....................................................................................................................... 22 2. FAIRE UNE RECHERCHE .................................................................................................................... 25 2.1. LINTRODUCTION .................................................................................................................................... 25 2.2. LA PROBLMATIQUE ............................................................................................................................... 27 2.3. LES HYPOTHSES..................................................................................................................................... 28 2.4. LA MTHODE ........................................................................................................................................... 32 2.5. LES RSULTATS ....................................................................................................................................... 32 2.6. LA DISCUSSION ........................................................................................................................................ 33 2.7. LA CONCLUSION ...................................................................................................................................... 33 2.8. LES RFRENCES ..................................................................................................................................... 34 2.9. LA PUBLICATION ..................................................................................................................................... 37 3. FAIRE DES STATISTIQUES.................................................................................................................. 40 3.1. LTUDE FICTIVE..................................................................................................................................... 40 3.2. LE DOSSIER EXCEL .................................................................................................................................. 41 3.2.1. PRPARATION DEXCEL ......................................................................................................................... 41 3.2.2. DOSSIER EXCEL : LA FEUILLE PRINCIPALE ............................................................................................ 43 3.2.3. DOSSIER EXCEL : LA FEUILLE HAD....................................................................................................... 48 3.2.4. DOSSIER EXCEL : LES FEUILLES TEST-RETEST ....................................................................................... 51 3.3. PRPARATION DE SPSS........................................................................................................................... 53 3.4. CRATION DES FICHIERS SPSS .............................................................................................................. 57 3.5. LES STATISTIQUES DESCRIPTIVES .......................................................................................................... 66 3.6. LQUIVALENCE DES GROUPES .............................................................................................................. 78 3.7. EFFETS DES VARIABLES DESCRIPTIVES ................................................................................................. 85 3.8. LES STATISTIQUES INFRENTIELLES ..................................................................................................... 89 ANNEXE ........................................................................................................................................................ 97 COMMENT OBTENIR SPSS ?................................................................................................................... 98

4 Stats pour les nuls les statistiques par lexemple

Introduction
Vous vous sentez nul en statistiques et vous pensez ne jamais y arriver ? Vous vous dites que pour un littraire comme vous, un simple tudiant en psychologie, les stats cest trop. Et pourtant, ds le master et plus tard en thse, il vous faudra bien en faire, si vous voulez valider vos recherches et soutenir vos mmoires. Si vous tes thsard ou docteur, il vous faut encore des statistiques pour vos publications, nul ny chappe ! Alors cet ouvrage est l pour vous aider. Rassurez-vous, nous navons ni lintention, ni la prtention, de vous apprendre les arcanes de la statistique et vous ne trouverez ici aucune formule mathmatique. Le principe de cet ouvrage est de vous permettre, dabord, de bien comprendre ce que vous faites lorsque vous ralisez une recherche et de connatre les principales tapes de cet art admirable de la recherche scientifique. Ensuite, il suffit de savoir exactement ce que vous voulez entreprendre et ce manuel vous donnera la recette. Inutile de savoir comment fonctionne la recette pour pouvoir sen servir, il suffit de lutiliser avec le logiciel de statistiques IBM SPSS Statistics (que nous appelerons pour faire simple SPSS , version dvaluation limite 14 jours, que vous pouvez tlcharger gratuitement sur le site officiel de SPSS2). On na pas besoin de connatre la chimie pour faire de la cuisine ! Une fois la recette ralise avec le logiciel de statistiques, le manuel vous dira simplement comment il faut lire les rsultats des tests et comment les interprter. Quoi de plus simple ! Louvrage comporte trois parties : La mthodologie : dabord vous devez savoir quel niveau de recherche votre tude se place : recherche empirique, exprimentale, quasi exprimentale, thorique, clinique, cas unique ? Etape suivante : vous devez bien comprendre la diffrence entre variable indpendante (ce que vous manipulez) et variable dpendante (la rponse des sujets). Ensuite, il vous faut construire votre plan de recherche. Quallez-vous faire ? Comparer deux groupes, rpter des mesures, les deux la fois ? Enfin, vient la question des diffrents types de variables : quantitatives, qualitatives, nominales, ordinales, parasites... Faire une recherche : ici on vous explique en dtail et avec un tas de bons conseils, toutes les tapes dune recherche, qui forment en mme temps le plan de votre mmoire (ou de larticle destin la publication scientifique) : introduction, problmatique, hypothses, mthode, rsultats, discussion, conclusion, rfrences et publication. Ne vous lancez pas dans la recherche ou les statistiques sans avoir bien lu et compris cette partie de louvrage, cela afin de vous pargner les erreurs classiques que commettent la plupart des tudiants (comme confondre VI et VD). Faire des statistiques : louvrage est accompagn dune tude fictive qui vous est prsente au format Excel. Vous apprendrez prparer le dossier Excel pour saisir vos donnes, calculer les scores automatiquement, rapidement, sans effort et sans erreur ; puis, prparer les diffrentes pages Excel en prvision des diffrents calculs qui seront soumis SPSS. Aux tapes suivantes on vous dira comment paramtrer le logiciel SPSS et comment raliser vos fichiers de donnes SPSS partir
2

Voir la fin de ce document la dmarche suivre pour pouvoir obtenir SPSS gratuitement pour 14 jours.

5 Stats pour les nuls les statistiques par lexemple

du dossier Excel. Cest ensuite que vous entrerez dans le vif du sujet : statistiques descriptives, quivalence des groupes, effet des variables descriptives, statistiques infrentielles, lorsquon est certain que toutes choses sont gales par ailleurs . Chacune de ces tapes vous est explique trs simplement, avec un support visuel (captures dcran) tir de SPSS. On vous dit mme comment interprter et crire les tests statistiques. Un enfant de 10 ans saurait le faire ! A la fin, un synoptique mthodologique reprend toutes les mthodes en une seule page synthtique. Cet ouvrage de statistiques pour les nuls est sans prtention. Il est possible quil senrichisse au fil du temps et des versions, mais pas trop ! Il ne sagit pas den faire un outil compliqu danalyses statistiques de haut vol. Il sagit simplement de prsenter et de permettre lapplication de recettes statistiques simples, courantes, qui suffisent pour la plus grande partie des tudes en psychologie. Cet ouvrage revendique sa modestie, car son pari est que l o il ny aurait rien (lorsque ltudiant en psychologie nul en stats se sent incapable douvrir mme Excel), il y aura quelque chose, un peu de stats, pas trop, juste ce quil faut.

6 Stats pour les nuls les statistiques par lexemple

1. La mthodologie
1.1. Les types de recherche Diabolo de la recherche

Collection de faits F1 F2 F3 Problmatique F4


Ensemble dhypothses H1 H2

Lois gnrales

Modle

Plan (quasi) exprimental

H3 H4

Fn Analyse statistique Rsultats Discussion Conclusion Publication

Hn

Rafrachissement de la problmatique

Le graphique ci-dessus reprsente le Diabolo de la recherche , deux cnes relis par leur pointe. A partir dune problmatique, la dmarche empirique enqute sur une collection de faits [F1] [F2] [F3], dont elle va tirer, par convergence, certaines lois gnrales. La dmarche thorique va semparer de ces lois gnrales pour en tirer un modle (une thorie) et imaginer un plan exprimental. Ce plan reprsente le moyen rationnel de tester un certain nombre dhypothses [H1] [H2] [H3], par divergence partir du modle. Les rsultats de lexprience seront analyss un niveau statistique (effet de rptition qui donne la preuve du modle et de la loi gnrale quil organise), puis discuts et des conclusions en sont tires, qui valideront ou non les hypothses ou lensemble du modle. Tout cela donne gnralement lieu publication pour la communaut des chercheurs (et pour la socit qui finance les chercheurs) et vient enrichir la problmatique. Cet enrichissement sera son tour repris dans de nouvelles recherches et ainsi de suite... De temps autre, il est bon de relever un cas particulier [F1] dans la collection de faits et de ltudier en profondeur comme exemple, dans une confrontation directe avec le modle, cela pouvant illustrer et renforcer le modle, ou au contraire, le mettre en doute, ou lenrichir par le jeu des exceptions.

7 Stats pour les nuls les statistiques par lexemple

Recherche empirique Lactivit de recherche dbute gnralement par une dmarche empirique, dite aussi convergente. Une enqute, des observations, produisent une srie ou collection de faits. Ces faits sont organiss et on tente den tirer des rcurrences, des invariants, ou des variances systmatiques, partir desquels (dmarche convergence) on tirera une loi gnrale. Telle est la dmarche empirique, qui prend uniquement appui sur ce qui est observ dans la collection du particulier pour en tirer des lois gnrales. En principe, la dmarche empirique ne ralise aucune manipulation (agir sur des variables, choisir des groupes comparer...), tout au plus le chercheur va-t-il cibler telle ou telle population afin de cerner sa problmatique. Le mmoire ou larticle de niveau empirique est introduit par une revue de la littrature qui rend compte des tentatives antrieures dobservation et denqute et de leurs rsultats. Cette revue vient justifier la ncessit de la prsente tude. Puis, la mthode-observation denqute est prsente, avec ventuellement la rfrence des instruments valids repris pour cette tude. Les rsultats de lenqute sont prsents sous forme de tableaux statistiques (ici il sagira essentiellement de statistiques descriptives). Une discussion termine larticle, o lon dgage les grandes tendances montres par les rsultats, o lon prsente la validit cologique de lenqute, au sens o elle rvlerait quelques lois gnrales qui pourraient faire lobjet dhypothses dans le cadre de recherches plus exprimentales. Recherche thorique A partir des invariants, des rcurrences que le chercheur a cru tirer de ses observations et enqutes, il a pu formuler des lois gnrales, des principes, quil va organiser et systmatiser suivant une construction thorique, imaginaire, un modle. Ce modle, qui met en uvre des concepts nouveaux, reprsente une version imagine des phnomnes rels tudis, qui propose dexpliquer les lois observes par la suppose mise en jeu de mcanismes, de processus cachs. Ces suppositions feront lobjet dhypothses pour la recherche exprimentale. Le mmoire ou larticle de niveau thorique commence par une revue de la littrature qui rend compte des diffrents modles existants, en rapport avec la problmatique choisie, afin de montrer leur pertinence, mais aussi leurs limites. On avancera aussi les nouveaux faits qui peuvent rendre caduques les modles anciens et ncessiter la construction dun nouveau modle. On doit pour cela rappeler brivement les faits dobservation et les lois qui en ont t tires. De l, on forgera de nouveaux concepts qui seront articuls en un modle explicatif. Dans la discussion, on proposera un certain nombre dhypothses tester partir de ce nouveau modle et on en prcisera les limites. Recherche exprimentale A partir dun modle, dune thorie, un certain nombre dhypothses (ce qui correspond une dmarche divergente) sont poses, qui vont demander tre testes. Pour cela, un plan dexprience est mont. A la diffrence de la simple observation-enqute sur le terrain, qui se borne prendre des mesures pour en faire une analyse, le plan exprimental cherche manipuler des variables, en contrler dautres. Classiquement la manipulation porte sur les conditions environnementales ou daction des sujets ; mais la manipulation de base de toute recherche exprimentale est le

8 Stats pour les nuls les statistiques par lexemple

dcoupage de la population tudie en au moins deux sous-groupes que lon va comparer (par exemple, le groupe dtude et un groupe tmoin ou groupe de contrle). Ce que manipule le chercheur reprsente les variables indpendantes. Les hypothses sont des prdictions que le chercheur fait quant lissu de son exprience, en fonction du modle sur lequel il sappui (comment la variable indpendante, manipule par le chercheur comme constituer des groupes va influencer la variable dpendante que reprsente la rponse des sujets une exprience qui peut tre une rponse un questionnaire rtrospectif, ou une rponse comportementale dans une situation). Les rsultats de lexprience vont valider ou invalider les hypothses. Recherche quasi exprimentale Ce qui est dit ci-dessus vaut aussi pour la recherche quasi exprimentale ; et ce qui est dit au paragraphe suivant vaut aussi pour la recherche exprimentale. Ce qui distingue lexprimental du quasi exprimental, cest que dans le premier cas vous fates votre recherche dans un laboratoire (au sens physique du terme) : vos sujets viennent vous voir, ils sont placs dans une pice spciale, soumis des dispositifs adapts et vous contrlez un maximum de variables parasites. Une recherche est quasi exprimentale (cest le cas de la plupart des recherches en psychologie ralises par les tudiants) lorsque vous allez la rencontre de vos sujets, hors de tout laboratoire, et que vous tes soumis un grand nombre de variables parasites (comme les conditions dvaluation, le degr dauthenticit ou de vracit des rponses, une valuation rtrospective, un dfaut de contrle de certaines variables dmographiques, organismiques, un dfaut dappariement des groupes, etc.). Le mmoire ou larticle de niveau exprimental ou quasi exprimental doit commencer par bien poser le modle choisi pour ltude et justifier ce choix (pertinence du modle en regard des rsultats exprimentaux antrieurs). Une revue de la littrature rendant compte des expriences antrieures est alors ncessaire pour pouvoir justifier la prsente exprience et sa ncessit. Puis, la mthode exprimentale est prsente, avec ses diffrents instruments de mesure et leurs rfrences. Le plan dexprience est dcrit avec prcision (il doit pouvoir tre reproduit), les variables sont prcises : celles qui conditionnent lexprience (variables indpendantes), celles qui sont mesures (variables dpendantes) et les variables parasites quil faudra envisager (des variables un peu trop indpendantes ). Les hypothses sont exposes comme autant de prdictions quant aux rsultats. Enfin, aprs une brve prsentation statistique de la population tudie, les rsultats sont prsents sous forme de tableaux ou graphiques statistiques (rsultats comprenant dans lordre : quivalence des groupes, effets des variables statistiques sur les variables dpendantes et statistiques infrentielles validation/invalidation de vos hypothses). La discussion reprend les rsultats en regard des hypothses poses et valide ou invalide ces hypothses. Les variables parasites sont examines. A partir de l, le modle est discut, voire remis en question. En conclusion, de nouveaux concepts peuvent merger, un nouveau modle tre voqu, ou de nouvelles hypothses formules. Recherche clinique La dmarche clinique, ltude de cas, sapparentent la dmarche empirique au sens o le chercheur se contente dobserver, de glaner des mesures. La diffrence va porter sur lintention finale de la dmarche. Alors que la dmarche empirique cherche multiplier les observations sur un grand nombre de sujets afin de pouvoir en tirer des singularits statistiques, la dmarche clinique

9 Stats pour les nuls les statistiques par lexemple

borne ses observations quelques cas, qui seront observs en profondeur . Le but nest pas la recherche de la singularit statistique, mais lillustration. Il sagit de saisir quelques lments de la ralit et dexplorer en dtails ces lments afin de soutenir un modle par des exemples prcis. Le mmoire ou larticle de niveau clinique commence par rendre compte dobservations, dtudes de cas antrieurs, glans dans la littrature scientifique. Il faut aussi prciser dans quel modle on sinscrit, car le sujet sera observ diffremment selon le modle choisi. On prsentera ensuite le contexte et la mthode dobservation, les instruments utiliss. Le cas est enfin prsent : son identit, son histoire, son tat actuel. On pourra donner les rsultats des instruments valids (sur des populations de rfrence) utiliss (tests, chelles...). Ltude clinique peut aussi prendre un petit air exprimental en comparant deux ou plusieurs cas extrmes (entre diffrents troubles, entre le normal et le pathologique, entre diffrents types de personnalit...), sinon que lexigut de la population interdira toute infrence statistique. Gnralement, on conclura larticle clinique par une discussion sur les limites de lobservation de ce(ces) cas, sur les limites du modle choisi, sur sa pertinence, qui peut tre renforce ou affaiblie. A noter, que toute utile quelle soit pour exemplifier et illustrer lobservation, la recherche en psychologie ne peut se contenter de recherches cliniques. La validit dun modle et dhypothses ne peut tre teste qu partir dtudes exprimentales (ou quasi exprimentales). Il n y a pas non plus saffronter sur ces mthodes, elles sont complmentaires dans la dmarche globale de la recherche scientifique en psychologie.

1.2. Les variables indpendantes et dpendantes


Pour beaucoup dtudiants, cette distinction entre variable indpendante (VI) et variable dpendante (VD), est souvent un gros problme quils peuvent traner jusquau jour de soutenance de leur thse. Aussi, si vous ne deviez comprendre quune seule chose en mthodologie, cest bien cette diffrence entre VI et VD. La premire chose savoir est que ce qui distingue une VI dune VD nest pas dans la nature de la variable. Si vous prenez, par exemple, le niveau danxit mesur avec une chelle danxit, cette variable niveau danxit peut tre une mesure applique sur deux groupes alcoolique et non alcoolique et tre ainsi une variable dpendante (VD) de lalcoolisme (par exemple, les alcooliques sont plus anxieux que les non alcooliques, en rponse lchelle danxit). Cependant, vous pourriez aussi bien mesurer lanxit dans une population de buveurs en gnral et dichotomiser cette variable en deux groupes anxieux et non anxieux , lanxit devenant alors une VI. A partir de l, vous faites passer une chelle de consommation dalcool vos sujets, ce qui va reprsenter la VD (et non plus la VI) : le rsultat pouvant tre que les individus les plus anxieux sont ceux qui boivent le plus dalcool. Le tableau ci-dessous montre clairement que les protocoles 1 et 2 voient alcoolisme et anxit changer leurs rles en matire de VI et VD :

10 Stats pour les nuls les statistiques par lexemple

Protocole 1 Alcoolisme Anxit Lalcoolisme influence lanxit ou Hypothse lanxit dpend de lalcoolisme. Une tude pourrait montrer quaprs des effets positifs anxiolytiques, lalcool Exemple consomm long terme entrane une augmentation de lanxit sociale. VI VD

Protocole 2 Anxit Alcoolisme Lanxit influence lalcoolisme ou lalcoo-lisme dpend de lanxit. Une tude pourrait montrer que les personnes qui salcoolisent le plus sont aussi celles qui ont les niveaux danxit les plus levs.

Vous allez vous demander : o est la vrit ? En science, et surtout en science humaine, il ny a jamais de vrit absolue, ni de causalit linaire. Certes, le fait de boire trop dalcool peut jouer sur le niveau danxit (effets crbraux de lalcool), mais on peut aussi dire, en sens inverse, que plus on est anxieux et plus on prouve le besoin de se soulager en buvant. Les choses vont dans les deux sens, la causalit est circulaire, non linaire (un seul sens)3. De l, on peut imaginer faire de la recherche dans un sens ou dans lautre, cest pour cela que VI et VD sont interchangeables. VI et VD sont donc attribues aux mesures dune faon arbitraire, selon le projet de recherche du chercheur.

Lerreur qui tue !


Il sagit dun raisonnement trs commun, bas sur une confusion smantique, qui entrane une mauvaise perception de VI et VD. Un exemple : un tudiant tudie un trait de personnalit, la recherche de sensations , chez des adolescents fumeurs et non fumeurs. Concrtement, que fait ltudiant ? Dans ce cas prcis, il prend deux groupes dadolescents : des fumeurs et des non fumeurs , quil distingue avec une chelle dvaluation du tabagisme, et il leur fait passer une chelle de recherche de sensations (valuation du trait de personnalit). Voici son hypothse gnrale : Le trait de personnalit recherche de sensations chez les adolescents, affecte le degr et lintensit de leur dpendance tabagique. A la suite de cela, notre tudiant prsente ses variables et annonce que le trait de recherche de sensations est la VI et le tabagisme la VD. Car le raisonnement de ltudiant est le suivant : pour lui plus les scores de recherche de sensations sont levs et plus laddiction au tabac sera svre . Cest cette faon de dire les choses, quil tire directement du verbe affecter prsent dans son hypothse, qui le conduit voir les rponses lchelle de personnalit comme la VI et le tabagisme comme la VD. Pourtant, plus loin, au moment o il prsente linstrument de mesure de la recherche de sensations, ltudiant dira que : Nous nous attendons ce que les fumeurs aient de plus hauts scores de recherche de sensations que les non fumeurs . Ici nous voyons bien que ce que fait ltudiant est de
Cest dailleurs pour cela que les alcooliques, et tous les addicts en gnral, se retrouvent enferms dans un cercle vicieux (la spirale addictive) qui fait que leur solution la souffrance psychique entrane elle-mme une souffrance psychique secondaire.
3

11 Stats pour les nuls les statistiques par lexemple

comparer fumeurs et non fumeurs au point de vue de la rponse de trait recherche de sensations , et non de comparer la rponse tabagique de groupes de sujets selon leur niveau de sensation seeking. Voici comment on peut rsumer cela dans un tableau : Ce que ltudiant croit faire Recherche de sensations VI VD Tabagisme La recherche de sensation a une influence (affecte) sur le tabagisme. Do vient la confusion ? En fait, ce sont les verbes indiquant une causalit, une influence, comme affecter , influencer , agir sur et leurs quivalents, qui posent problme. A cause de ces verbes, deux types de causalit sont confondues : la causalit thorique et la causalit exprimentale. Nous lavons expliqu plus haut : la causalit thorique, celle du modle, nest pas linaire, mais le plus souvent circulaire. Un trait de personnalit affecte une conduite addictive, mais en retour, une conduite addictive, par son intensit et sa dure, peut aussi affecter la personnalit. Du ct de la causalit exprimentale, le chercheur choisit lun ou lautre sens dans cette circularit, car il ne peut pas travailler en disant une chose et son contraire. Il ne peut pas faire non plus, en mme temps, deux choses contradictoires. Le chercheur est contraint de choisir la variable quil va manipuler, ce qui dfinit les variables de rponse des sujets en fonction de cette manipulation. Cest l la base de tout protocole exprimental. Notre tudiant a en tte la thorie (la recherche de sensations a une influence sur le tabagisme) et se mlange les pinceaux en faisant le tabagisme a une influence sur la rponse lchelle de sensations . Son erreur a t dutiliser un verbe daction causale dans son hypothse gnrale. Au lieu de dire : Le trait de personnalit recherche de sensations chez les adolescents, affecte le degr et lintensit de leur dpendance tabagique. Il aurait mieux valu quil dise : Il existe un lien entre la recherche de sensations et le tabagisme. En omettant de donner un sens cette liaison (ne parler simplement que de lien ), son esprit serait rest libre dapprhender ce quil allait rellement faire. Or, il na pas fait des groupes de recherche de sensations (suivant le degr de recherche de sensations), pour en mesurer la svrit du tabagisme, mais il a fait deux groupes fumeurs et non fumeurs, pour en mesurer le trait de personnalit. Ce quil a manipul, cest la variable tabagisme , qui est la VI, et non la variable trait , qui est bien la rponse, la VD. Un protocole de recherche reprsente toujours la mesure dune rponse selon une variable manipule, cest la causalit exprimentale, quil ne faut pas confondre avec la causalit thorique. Ce quil fait rellement Tabagisme Recherche de sensations Le tabagisme a une influence sur la rponse lchelle de recherche de sensations.

12 Stats pour les nuls les statistiques par lexemple

A titre gnral, VI et VD peuvent tre dfinie ainsi : Variable Indpendante Variable Dpendante La VI (variable indpendante) est la variable La VD (variable dpendante) est la rponse des manipule par lexprimentateur. sujets aux instruments de mesure, aux tests, aux preuves, rponse qui dpend de la variable manipule, la VI. La variable indpendante est encore appele La variable dpendante est encore appele explicative ou invoque explique ou provoque Cest ce que manipule le chercheur : Exemples : - slection dune population ; - dcoupage en sous-groupes* ; - choix et regroupement des variables sociodmographiques et organismiques (ge, sexe...) ; - conditions exprimentales (situations, preuves, tches). Cest la rponse comportementale des sujets, attendue et produite : Exemples : - rponses comportementales gnrales, spcifiques ; - rponses aux tests, chelles, questionnaires.

* Attention : il arrive souvent que ce dcoupage en sous-groupes soit objectiv par lutilisation dun instrument de mesure (par exemple, une chelle dvaluation du tabagisme), mais cela ne veut pas dire quil sagit dune VD ! Vous utilisez simplement un instrument pour oprationnaliser votre manipulation (construction des groupes) au niveau de la VI (mais dans un autre protocole de recherche vous pourriez trs bien utiliser lchelle de tabagisme comme rponse exprimentale et, dans ce cas, elle correspondra bien une VD la VI pouvant tre, par exemple, le trait de personnalit). VI et VD sont articules lune avec lautre dans les hypothses, qui sorganisent hirarchiquement ainsi : Hypothse gnrale (ou thorique) : partir de la problmatique et du modle qui cherche lexpliquer, le principe, la loi gnrale, organiss par le modle, reprsentent lhypothse gnrale ou thorique. Dans cette hypothse, il est rare que les variables soient mentionnes. On y parle plutt de principes, dentits gnrales, qui forment un systme, remplissent des fonctions, fonctionnent entre elles, sans que soit clairement pose une causalit linaire (on se borne parler de liens , de liaisons ). Hypothses de travail : ici, les variables tudies apparaissent et sont articules entre elles comme VI et VD, mais sous une forme descriptive gnrale de linfluence de VI sur VD, dfinies selon des conditions et donnes gnrales.

13 Stats pour les nuls les statistiques par lexemple

Hypothses oprationnelles : suivant le plan dexprience (le protocole de recherche), VI est prcis (groupe, situation, traitement...) et une prdiction est faite de linfluence de cette VI (il peut y en avoir plusieurs) sur la VD (il peut y en avoir plusieurs) qui est elle-mme prcise (rponse une tche, une preuve, un apprentissage, un test, un questionnaire, une performance...). Hypothses statistiques : si les rponses (VD) prsentent des valeurs normalises (dautres expriences ont permis dtablir des normes de rponses), il est possible de reprendre de faon chiffre, quantifie, les hypothses de travail en prdisant des valeurs attendues. Sinon, on prdit des niveaux de rponse diffrencis, des carts de rponse, entre les sous-groupes dfinis par la VI.

Il ny a normalement quune seule hypothse gnrale (thorique) pour un protocole ; de cette hypothse gnrale dcoule le plus souvent plusieurs hypothses de travail, qui dfinissent des orientations dans le protocole, et chaque hypothse de travail donne naissance plusieurs hypothses oprationnelles, en gnral une par instrument de mesure utilis. Les hypothses oprationnelles, surtout si elles sont chiffres (statistiques) et si elles doivent poser des prdictions sur plusieurs groupes, ne sont pas obligatoirement rdiges de faon littraire, mais peuvent avantageusement tre prsentes sous la forme de tableaux, qui annoncent les valeurs, ou les niveaux attendus. Les variables intermdiaires Dans un modle simple de type S-R, les variables indpendantes (les stimuli S) et leurs influences sur les variables dpendantes (les rponses des sujets R), sont suffisantes et ce qui ce passe dans la boite noire de lorganisme est ignor. Cependant, il est possible dadopter une position plus complexe et considrer les variables, entre S et R, rattaches lorganisme, le schma devenant alors S-O-R. Ces variables de lorganisme, dites variables intermdiaires , correspondent en psychologie, des processus psychologiques ou des activits intrieures des sujets, processus et activits dclenchs par les VI et dont la prsence et les caractristiques sont rvles par infrences, partir de lobservation des comportements manifestes. Quelques exemples : la motivation, les processus cognitifs. Non observables directement, donc non mesurables, les variables intermdiaires doivent tre dfinies en regard de leurs rfrents empiriques. Cependant, elles gardent toujours le statut de construits hypothtiques. Elles se situent au-del de la statistique et ne font quaider la discussion des rsultats obtenus entre VI et VD. Les variables parasites Que la recherche soit confine au sein dun laboratoire, en tant purement exprimentale, ou quelle se droule dans la nature tant alors quasi exprimentale, il apparat toujours des variables qui sont non pertinentes pour les objectifs de la recherche, qui la parasitent et quil convient de contrler. Ces variables sont au mme rang que les variables indpendantes manipules par le

14 Stats pour les nuls les statistiques par lexemple

chercheur, au sens o elles peuvent influencer les variables dpendantes, les rponses des sujets. Plusieurs types de variables parasites sont considrer : Variables dmographiques : lieu de rsidence, situation familiale, socioprofessionnelle dappartenance, niveau dtudes, revenus, type culturel, etc. catgorie

Variables organismiques : sexe, ge, race, apparence, qualits physiques ou physiologiques, tat de sant, etc. Variables historiques : vnements significatifs de la vie, conditions dducation, trajectoire, par exemple, dune addiction, dun comportement problme, maladies passes, traitements passs, emprisonnement, placement familial, etc. Variables de dispositif : il sagit des variables parasites qui appartiennent au dispositif de la recherche elle-mme, comme le sexe ou la race de lexprimentateur sil entre en contact directement avec les sujets tudis, lenvironnement et lambiance au cours de lexprience, ltat des sujets au cours de lexprience (physiologique et mental), certains dtails exprimentaux comme la disposition des personnes, de lclairage, des instruments de contrle, la technique et la dure de passation des questionnaires et tests, etc.

Les variables parasites apparaissent systmatiquement dans la question de lquivalence des groupes, mais encore dans la constance des conditions exprimentales chaque mesure rpte. Comme le chercheur veut faire apparatre au mieux le seul effet des variables indpendantes quil a choisies selon la problmatique dont il traite, il souhaite liminer, neutraliser ou contrler les autres variables qui pourraient jouer sur les rsultats. Plusieurs moyens sont sa disposition, qui sappliquent selon les types de variables contrler : Maintien un niveau constant : vous faites en sorte que le niveau de la variable parasite reste constant. Par exemple, si vous ne pouvez liminer le bruit au cours de mesures exprimentales, vous essaierez de maintenir constant le niveau de ce bruit. Si le sexe des sujets peut jouer sur leur rponse, vous pouvez ne choisir que des sujets de sexe fminin ou masculin, afin de bien mettre en vidence leffet de votre variable indpendante. Variation systmatique : il sagit de reprer des niveaux reprsentatifs de la variable parasite et de les produire dune faon volontaire, systmatique, en respectant une distribution quivalente pour chaque niveau. Par exemple, vous essayez quil y ait le mme nombre de sujets dans chaque catgorie socioprofessionnelle, pour chaque niveau intellectuel ou niveau dtudes, autant dhommes que de femmes, et ainsi de suite. Pour une variable de dispositif, comme le degr dabstraction de mots mmoriser, vous pouvez considrer 5 niveaux dabstraction et rpartir galement les mots mmoriser sur ces 5 niveaux. Variation au hasard : vous pouvez laisser la variable parasite jouer librement, en la considrant comme une variable naturelle. Cependant, il est ncessaire que cela sapplique sur un nombre important de sujets afin que le hasard, justement, ne dtermine des niveaux trop particuliers de la variable. Il est aussi bon de contrler la normalit de cette variable, savoir si la distribution de ses niveaux est statistiquement normale, que les valeurs centrales ou

15 Stats pour les nuls les statistiques par lexemple

modres sont plus frquentes que les valeurs extrmes. Par exemple, pour la variable CSP (catgorie socioprofessionnelle), avec un grand nombre de sujets, ceux-ci peuvent se rpartir au hasard et dune faon quilibre entre toutes les catgories et vous pourriez vrifier la frquence de rpartition afin de contrler sil ny a pas une sur- ou sous-reprsentation dune catgorie sur les autres. Elimination : plus facile dire qu faire, llimination de certaines variables parasites, surtout celles lies au dispositif exprimental, est parfois une solution. Par exemple, le sexe de lexprimentateur, qui peut influer sur la rponse des sujets, peut faire lobjet dune variation systmatique (il faut quil y ait le mme nombre de sujets pour les deux genres dexprimentateurs), ou bien vous liminez compltement lexprimentateur en plaant les sujets face un ordinateur avec lequel ils passent leurs tests.

Bien entendu, dans le cadre des expriences sur ltre humain, on ne peut jamais tout contrler4. Il faut simplement faire le maximum et tre attentif viter les erreurs grossires. Prfrer aussi certaines mthodes dautres. Par exemple, si possible viter les mesures rtrospectives, car alors la variable mmoire peut vous jouer des tours. Et si vous devez faire du rtrospectif, vitez alors des empans temporels trop longs ou trop loigns dans le pass. Une variable nest vritablement parasite que selon son degr de pertinence par rapport votre protocole de recherche. Si, par exemple, les travaux antrieurs ont largement montr que la variable situation familiale navait aucune influence sur ce que vous voulez mesurer, alors vous pouvez sans doute ngliger le contrle de cette variable (sauf si vous escomptez remettre en question les travaux antrieurs). Vous ne devez pas oublier que si le contrle des variables parasites augmente la validit interne dune recherche, il peut en diminuer la validit externe ou cologique. Par exemple, si vous contrlez le sexe en ne choisissant que des hommes, vous ne pourrez prtendre que vos rsultats sappliquent aussi aux femmes. Enfin, vous verrez plus loin que les variables parasites sont contrles de faon statistique, par des tests destins mesurer le degr de leur influence, afin de sassurer de respecter le principe exprimental fondamental du toutes choses gales par ailleurs .

1.3. Les plans de recherche


1.3.1. Plans de recherche groupes indpendants
Le principe de toute recherche en psychologie consiste soumettre des groupes de sujets aux diffrents niveaux dune ou plusieurs variables indpendantes afin de mesurer les effets de cette(ces) variable(s) indpendante(s) sur la rponse comportementale des sujets qui y sont soumis. Par exemple, une variable indpendante peut tre une cure de sevrage alcoolique. Les deux niveaux de cette variable sont : 1) suivre une cure de sevrage et 2) ne suivre aucune cure de sevrage. On
4

Dj, on peine y parvenir avec lanimal !

16 Stats pour les nuls les statistiques par lexemple

divise la population des sujets en deux groupes quivalents par ailleurs et lon soumet le premier groupe la condition (1) de la variable indpendante (suivre la cure), tandis que le second groupe est laiss sa vie habituelle, le niveau (2) de la variable. Ensuite, on entreprend un certain nombre de mesures, comme le taux de consommation dalcool par jour, les niveaux de dpression et danxit. Ces mesures sont la rponse des sujets, cest--dire les variables dpendantes, qui vont dpendre, selon les hypothses poses, du niveau de la variable indpendante suivre ou non une cure de sevrage. Larticulation organise entre variable indpendante et variable dpendante sappelle un plan de recherche . Il existe trois grandes catgories de plans de recherche. Voyons la premire : les plans de recherche groupes indpendants. Des groupes diffrents de sujets sont soumis chacun un niveau de la variable indpendante. Le nombre de groupes va dpendre du nombre de variables indpendantes et du nombre de niveaux de chacune des variables indpendantes. Pour trouver le nombre de groupes ncessaire, il suffit de multiplier entre eux les nombres de niveaux de chaque variable indpendante (VI). Quelques exemples : Nombre de groupes = 1 variable x 2 niveaux = 2 Ex. : la variable cure de sevrage alcoolique (VI a) a deux niveaux : un groupe (Gr. 1) est soumis la cure (VI a1), lautre (Gr. 2) non (VI a2).

VI a1 VI a2

Gr. 1 Gr. 2

1 VI 2 niveaux

VI a1 VI a2 VI a3 VI a4

Gr. 1 Gr. 2 Gr. 3 Gr. 4

Nombre de groupes = 1 variable x 4 niveaux = 4 Ex. : la variable privation de sommeil (VI a) a quatre niveaux : les quatre groupes (Gr. 1, Gr. 2, Gr. 3, Gr. 4) sont respectivement soumis 2 heures (VI a1), 4 heures (VI a2), 6 heures (VI a3) et 8 heures (VI a4) de privation de sommeil.

1 VI 4 niveaux

VI b1 VI a1 VI a2 Gr. 1 Gr. 3

VI b2 Gr. 2 Gr. 4

Nombre de groupes = 2 variables x 2 niveaux = 4 Ex. : la variable privation de sommeil (VI a) a deux niveaux : avec privation (VI a1) ou sans (VI a2) ; la seconde variable est le sexe (VI b), avec naturellement deux niveaux : fminin (VI b1) et masculin (VI b2). On a donc : un groupe de femmes prives de sommeil, lautre non (Gr. 1 et Gr. 3), et la mme chose pour les deux groupes dhommes (Gr. 2 et Gr. 4), ce qui permet de contrler, par exemple, leffet sur la performance intellectuelle, la fois de lappartenance au sexe et de la privation ou non de sommeil.

2 VI 2 niveaux

17 Stats pour les nuls les statistiques par lexemple

VI a1 VI a2 VI a3 VI a4

VI b1 Gr. 1 Gr. 4 Gr. 7


Gr. 10

VI b2 Gr. 2 Gr. 5 Gr. 8


Gr. 11

VI b3 Gr. 3 Gr. 6 Gr. 9


Gr. 12

Nombre de groupes = 1 variable x 4 niveaux x 1 variable x 3 niveaux = 12 Ex. : la variable tranche dge a quatre niveaux : 21-25, 26-30, 31-35, 36-40 ans (de VI a1 VI a4) ; la seconde variable privation de sommeil 3 niveaux : 2, 4 et 6 heures de privation (de VI b1 VI b3).

1 VI 4 niveaux + 1 VI 3 niveaux

VI a1 VI a2

VI b1 VI b2 VI b3 VI b1 VI b2 VI b3

VI c1 Gr. 1 Gr. 5 Gr. 9


Gr. 13 Gr. 17 Gr. 21

VI c2 Gr. 2 Gr. 6
Gr. 10 Gr. 14 Gr. 18 Gr. 22

VI c3 Gr. 3 Gr. 7
Gr. 11 Gr. 15 Gr. 19 Gr. 23

VI c4 Gr. 4 Gr. 8
Gr. 12 Gr. 16 Gr. 20 Gr. 24

Nombre de groupes = 1 variable x 2 niveaux x 1 variable x 3 niveaux x 1 variable x 4 niveaux = 24 Ex. : la variable sexe (VI a, 2 niveaux) ; la variable tranche dge (VI b, 3 niveaux) et la variable privation de sommeil (VI c, 4 niveaux).

1 VI 2 niveaux + 1 VI 3 niveaux + 1 VI 1 niveau

Difficults poses par les plans de recherche groupes indpendants Le problme principal est celui de lquivalence des groupes. La question est de savoir si les effets observs sur les variables dpendantes, dpendent uniquement des niveaux de(des) variable(s) indpendante(s). En effet, il est possible que dautres variables, comme lge, le sexe, le niveau dtude, etc., aient un impact sur la rponse des sujets. Ces diffrences entre les groupes de sujets peuvent apparatre dj au niveau mme de la constitution des groupes (par exemple, vous recrutez les sujets dun groupe en tlphonant chez eux et ceux de lautre groupe en mettant une annonce dans un journal, au rsultat vous nobtiendrez pas tout fait les mmes types de sujets). Vous devez donc, avant toute manipulation de la variable indpendante, former des groupes qui soient au plus semblables. Plusieurs moyens sont possibles : vous pouvez chercher regrouper des sujets qui ont des caractristiques systmatiquement identiques (par exemple, vous vous dites que pour liminer linfluence du sexe, vous nallez prendre que des hommes ou que des femmes). Cependant, en faisant ainsi, vous limitez la validit de vos rsultats un type de sujets. La seconde mthode consiste faire appel au hasard pour slectionner les sujets dans la population plus globale. Le hasard neutralise ainsi les biais qui pourraient rsulter du fait de choisir vous-mmes les sujets, mme avec les meilleures intentions. Une troisime mthode consiste apparier5 les sujets deux par deux (par exemple, si vous avez un homme de quarante ans, niveau baccalaurat, mari avec enfants et au chmage dans un groupe, vous essaierez de trouver son homologue pour lautre groupe, avec des caractristiques les plus proches possibles).

Et non pas appareiller , comme on peut le lire dans certains mmoires !

18 Stats pour les nuls les statistiques par lexemple

Une dernire mthode consiste prendre un groupe homogne assez grand et de faire une sorte de pr-test sur une variable de caractristique ou sur une variable dpendante, puis de choisir le mme nombre de sujets aux deux extrmes de la distribution en rejetant ceux qui sont au milieu. Par exemple, vous voulez comparer le parcours de sevrage et aprs sevrage dalcooliques selon leur niveau de dpression au dpart. Vous allez faire passer une chelle de dpression 100 sujets, puis vous ne retiendrez pour la suite de ltude, que 20 de ceux qui sont le moins dpressifs (groupe faible dpression) et les 20 avec les plus hauts scores de dpression (groupe forte dpression). Vous obtenez ainsi deux groupes assez homognes par ailleurs, mais qui sont trs contrasts sur le plan de la variable intressante : la dpression. Bien entendu, toutes ces prcautions de slection et recrutement des sujets sont limites par le nombre de sujets disponibles et dautres contraintes. La constitution du groupe de contrle (celui qui nest pas soumis au niveau de la variable dont on veut mesurer les effets), par exemple, est souvent rendu trs difficile par la nature mme du groupe exprimental (celui qui va tre soumis au niveau deffet de la variable). Pour des toxicomanes en cure de sevrage, la variable indpendante tant cure-pas cure , le groupe de contrle est constitu de toxicomanes qui ne sont pas en cure. Mais, alors quil est facile de recruter les sujets en cure (on dit que cest une population captive , ils sennuient en centre de cure et attendent avec impatience de rencontrer ltudiant en psychologie qui va les couter et les distraire...), les toxicomanes chez eux, dans la rue, dans les associations daide, sont excessivement volatiles, ne viennent pas aux rendez-vous, nont que faire de rpondre vos questionnaires, etc. Sans parler du fait que certains peuvent avoir des traitements, des suivis psychologiques, qui font quils ne sont pas sans rien . A ces difficults sajoute le fait, quidalement, toute recherche devrait sappuyer sur un nombre le plus important possible de sujets, car les rsultats sont une sorte de loi gnrale que vous tirez de la rptition de lexprience, de la mesure, et plus on rpte et plus cest valable. Cette ncessit du grand nombre entre souvent en conflit avec la ncessit dliminer des sujets pour atteindre une quivalence des groupes. Aussi, on nobtient jamais une quivalence parfaite, on ne fait quy tendre et vous verrez dans les parties recherche et statistique du manuel quil existe des moyens de tester le degr de cette quivalence, que toutes choses sont gales par ailleurs .

1.3.2. Plans de recherche mesures rptes


Ici, cest un seul et mme groupe de sujets qui est confront tous les niveaux de la(les) variable(s) indpendante(s). Le premier niveau de la variable est souvent une situation de contrle, une ligne de base , partir de laquelle les autres niveaux seront valus en fonction de cette situation de base. Souvent aussi, la mesure rpte concerne la variable Temps : ce qui change cest la situation interne des sujets au cours du temps. Quelques exemples pour comprendre : VI a1 Gr. 11 Test VI a2 Gr. 12 Nombre de tests = 1 variable x 2 niveaux = 2 Ex. : la variable avant / aprs cure de sevrage (VI a, 2 niveaux). On mesure la dpression et lanxit (variables dpendantes), avant (Gr. 11, ligne de base) et aprs 1 mois de cure de sevrage Retest test, situation de contrle, alcoolique (Gr. 12, retest).

1 VI 2 niveaux (1 test 1 retest)

19 Stats pour les nuls les statistiques par lexemple

VI a1 VI a2 VI a3 VI a4 VI a5

Gr. 11 Gr. 12 Gr. 13 Gr. 14 Gr. 15

Nombre de tests = 1 variable x 5 niveaux = 5 Ex. : la variable avant / aprs cure de sevrage 1 mois / 6 mois / 12 mois / 18 mois (5 niveaux). On mesure la consommation dalcool (variable dpendante), avant (VI a1, test, situation de contrle, ligne de base) et aprs 1 mois de cure de sevrage alcoolique (VI a2, retest), puis 6 mois (VI a3), 12 mois (VI a4) et 18 mois aprs la fin de la cure Retest (retests). Test Retest Retest Retest

1 VI 5 niveaux (1 test + 4 retests)

VI b1 VI a1 VI a2 VI a3 VI a4
Gr. 11 Gr. 14 Gr. 17 Gr. 110

VI b2
Gr. 12 Gr. 15 Gr. 18 Gr. 111

VI b3
Gr. 13 Gr. 16 Gr. 19 Gr. 112

Nombre de tests = 1 variable x 3 niveaux x 1 variable x 4 niveaux = 12 Ex. : la variable bruit ambiant (3 niveaux : 1) pas de bruit (V b1) ; 2) faible bruit (V b2) ; 3) bruit fort (V b3)) est teste avec la variable difficult de la tche (4 niveaux : 1) facile (V a1) ; 2) un peu difficile (V a2) ; 3) difficile (V a3) ; 4) trs difficile (V a4)). Ainsi, chaque sujet est soumis aux 12 situations qui combinent les diffrents niveaux des deux variables indpendantes. Un tel plan o la variable temps ne joue pas (les 12 expriences peuvent tre menes dans la mme matine), peut concerner les deux exemples prcdents, avec une seule variable 2 ou 4 niveaux, teste dans un court lapse de temps.

1 VI 4 niveaux + 1 VI 3 niveaux (12 test)

Difficults poses par les plans de recherche mesures rptes Ici, le problme de lquivalence des groupes de sujets semble disparatre, puisque nous navons quun seul groupe de sujets. Cependant, mme si lon na plus quun seul groupe, il est bon que les sujets de ce groupe ne soient pas trop disparates, en ce qui concerne certaines de leurs caractristiques relies la variable dpendante, il faut une sorte dquivalence des sujets (chaque sujet avec son ensemble de test et retests forme bien une sorte de groupe ). Par exemple, si vous tudiez lanxit chez des alcooliques au cours du temps (avant et aprs sevrage), il est prfrable que ces alcooliques soient de faon prpondrante tous addicts lalcool et quil ny ait pas parmi eux des addicts aux drogues ou de gros consommateurs de mdicaments psychotropes. Car dans ce cas, le niveau danxit ne dpendrait pas seulement du niveau de consommation alcoolique, mais aussi des autres consommations psychotropes qui ne sont pas, a priori, contrles par ltude. Par contre, si vous avez votre disposition un trs grand nombre de sujets (par exemple, suprieur 300), vous pouvez faire confiance au hasard pour homogniser lensemble des consommations toutes confondues et, ce moment-l, aprs contrle des consommations, faire une tude, non plus sur laddiction alcoolique, mais laddiction aux substances en gnral (en prvoyant peut-tre un traitement statistique a posteriori sur des sous-groupes de consommateurs).

20 Stats pour les nuls les statistiques par lexemple

Un autre problme important de la rptition des mesures est le phnomne de rgression statistique. Il sagit, au fur et mesure des mesures (si vous faites un simple test et retest, donc seulement deux mesures, le problme ne se pose pas), dune tendance ce que les scores des sujets les plus extrmes se resserrent autour de la moyenne. Pour y pallier, il suffit dutiliser lenvers la technique de la constitution de groupes extrmes dcrite la page prcdente (Plans groupe indpendants) : ici nous ne voulons pas de sujets extrmes, donc sur 100 sujets dpressifs, vous ne gardez pour ltude que les 40 sujets au centre de la distribution des scores et vous rejetez les 30 moins dpressifs et les 30 plus dpressifs. Une autre difficult importante des plans mesures rptes est lattrition : la perte de sujets entre les mesures. Pour diverses raisons : mdicales, professionnelles, familiales, de convenance personnelle, parfois tout simplement le dcs, font quil nest plus possible de rencontrer certains sujets 3 mois plus tard pour un retest. Plus le temps passe entre deux mesures et plus il y a de mesures et plus le taux dattrition est important. Cest pour cette raison quil vous faut, ds le dpart, prvoir large, en comptant par exemple 5% ou 10% dattrition. Si le nombre de sujets au dpart nest pas assez important, vous risquez de ne plus en avoir suffisamment pour valider ltude, ou vous allez tre confronts des problmes dhtrognit que le hasard et le grand nombre avaient gomms, mais qui ressurgissent avec la rarfaction des sujets. Un autre problme est la variablit des caractristiques des sujets dans le temps. Au dpart, vous avez fait un effort pour obtenir un groupe le moins disparate possible. Cependant, si les mesures se rptent sur des mois ou des annes, cette homognit va peu peu disparatre. Par exemple, vous tudiez la dpression 3, 6, 12, 18 mois ; mais vos rsultats seront fausss, car entre temps certains sujets peuvent vivre des preuves (sparation, deuil, chmage, accident) qui peuvent affecter leur score de dpression, par rapport aux sujets qui nauront pas vcus ces preuves. A linverse, des sujets peuvent naturellement maturer , trouver un quilibre personnel, changer de vie (se marier, trouver un emploi, gagner un gain au loto), ce qui va influencer leur dpression dans le bon sens. L encore, seul le grand nombre peut gommer un peu ces disparits, ou permettre dliminer au fur et mesure les sujets non conformes sans que leffectif ne devienne statistiquement inintressant (car bien sr, vous ne pouvez pas comparer les 100 sujets au dpart, avec les 50 sujets la fin, vous ne pouvez retenir que les 50 sujets qui ont pu tre valus, et au dpart et la fin). Autre problme, lorsque la rptition des mesures sinscrit au contraire sur le cours terme : la dmotivation des sujets, qui peut rsulter de la fatigue (physique, nerveuse, intellectuelle, parfois motionnelle), de la lassitude, de lagacement. Passer une mtine repasser les mmes tests peut effectivement devenir trs pnible et cela va reprsenter une variable, difficile contrler, qui jouera sur les rponses des sujets. Cette dmotivation peut dailleurs apparatre au cours dun seul test, si le questionnaire est trop long ou si lon utilise trop de questionnaires et que le temps de passation dpasse lheure. De plus, cette dmotivation ne jouera pas de la mme manire selon les sujets : un tudiant lesprit vif et habitu lire et rflchir se fatiguera moins vite quun sujet qui ne lit jamais, parce que ses capacits de lecture sont trs faibles et lui demandent un grand effort (et dont le cerveau et les capacits seraient dtriores du fait de consommations psychotropes). Pour contrer ce problme de la dmotivation, plusieurs solutions, selon les cas : rduire la taille ou le nombre des questionnaires, des tests, amnager des pauses (avec petits gteaux et caf, mais attention aux interactions sociales entre sujets ou avec lexprimentateur pendant les pauses ou linfluence du caf !), choisir des sujets de mme performance (mais l attention au biais

21 Stats pour les nuls les statistiques par lexemple

cologique : vos rsultats seront difficilement gnralisables des populations plus larges), vous pouvez aussi rmunrer vos sujets pour les motiver, condition davoir le budget pour... Un autre problme peut apparatre dans leffet dordre. Dans le cadre dune rptition court terme, le fait de faire passer un test avant lautre peut jouer sur la rponse au second. Cela peut tre contr en alternant de faon alatoire ou systmatique lordre de passation des tests pour chaque sujet. Dans le mme registre, mais long terme, apparat le problme de lhabituation. Les sujets shabituent au test au fur et mesure des passations (cest le coup classique du vieux patient psychiatrique, qui sourit en coin, en voyant le jeune tudiant en psychologie dbarquer avec son Rorschach ou son TAT), de sorte que les rponses refltent davantage cette habitude que ltat du sujet lui-mme. Certains tests comportent deux versions diffrentes, mais quivalentes, pour le test et le retest (comme lEysenck Personality Inventory, formulaires A et B). Sans cela, il ny a gure de solution ce problme. La plupart des problmes prsents ci-dessus peuvent tre neutraliss par les plans combins.

1.3.3. Plans de recherche combins


Comme le nom lindique, les plans combins associent une comparaison entre groupes indpendants et une rptition de la mesure. En consquence, un plan combin fait appel au moins deux variables indpendantes : une variable Groupe et une variable Rptition . Cependant, le second exemple ci-dessous, vous montre quun plus grand nombre de variables indpendantes peuvent tre utilises : Nombre de groupes = 1 variable x 2 niveaux = 2 Nombre de tests = 1 variable x 2 niveaux x 1 variable x 2 niveaux =4 Ex. : au cours dune cure de sevrage alcoolique, la variable psychothrapie (VI b) deux niveaux, dfinit deux groupes (Gr. 1 et Gr. 2), respectivement avec (VI b1) et sans (VI b2) psychothrapie. Les variables dpendantes, par exemple, anxit et dpression, sont mesures suivant la variable indpendante Rptition (VI a) : au dbut de la cure (VI a1) et aprs 3 mois de cure (VI a2), ce qui donne les deux tests du groupe 1 (Gr. 11 et Gr. 12) et les deux tests du groupe 2 (Gr. 21 et Gr. 22).

VI b1

VI b2

VI a1

Gr. 11

Gr. 21

Test

VI a2

Gr. 12

Gr. 22

Retest

1 VI 2 niveaux (groupe) + 1 VI 2 niveaux (rptition)

22 Stats pour les nuls les statistiques par lexemple

VI a1 VI a2 VI a3 VI a4

VI b1 VI b2 VI b3 VI b4 VI b5 VI b6 VI b7 VI b8 VI b9 VI b10 VI b11 VI b12

VI c1 Gr. 11 Gr. 21 Gr. 31 Gr. 41 Gr. 51 Gr. 61 Gr. 71 Gr. 81 Gr. 91 Gr. 101 Gr. 111 Gr. 121 Test

VI c2 Gr. 12 Gr. 22 Gr. 32 Gr. 42 Gr. 52 Gr. 62 Gr. 72 Gr. 82 Gr. 92 Gr. 102 Gr. 112 Gr. 122 Retest

VI c3 Gr. 13 Gr. 23 Gr. 33 Gr. 43 Gr. 53 Gr. 63 Gr. 73 Gr. 83 Gr. 93 Gr. 103 Gr. 113 Gr. 123 Retest

VI c4 Gr. 14 Gr. 24 Gr. 34 Gr. 44 Gr. 54 Gr. 64 Gr. 74 Gr. 84 Gr. 94 Gr. 104 Gr. 114 Gr. 124 Retest

1 VI 4 niveaux (critre groupe 1) + 1 VI 3 niveaux (critre groupe 2) + 1 VI 4 niveaux (rptition)

Nombre de groupes = 1 variable x 4 niveaux x 1 variable x 3 niveaux = 12 Nombre de tests = 1 variable x 4 niveaux x 1 variable x 3 niveaux x 1 variable x 4 niveaux = 48 Ex. : la variable indpendante Mthode dapprentissage a quatre niveaux (VI a1 VI a4), dfinissant quatre super-groupes, qui sont eux-mmes subdiviss en trois sous-groupes selon la variable indpendante Dure dapprentissage (VI b, par exemple, 10, 20 et 30 minutes), ce qui donne en tout douze groupes (de Gr. 1 Gr. 12). De plus, ces douze groupes sont soumis une variable indpendante de Rptition (VI c) de la mesure de la rcupration mmorielle, quatre fois : 1 heure (VI c1, test), 1 jour (VI c2, retest), 8 jours (VI c3, retest) et 15 jours (VI c4, dernier retest). Ce qui nous donne bien 12 x 4 = 48 tests pour ce protocole. Les plans de recherche combins cumulent les problmes des plans de recherche par groupes indpendants et ceux mesures rptes (voir les pages les concernant). Plus gnralement, ces plans de recherche assez complexes (que lon peut dconseiller aux tudiants), ncessitent un trs grand nombre de sujets au dpart, afin de garder une valeur statistique des rsultats, malgr les invitables attritions au fil du temps...

1.4. Les types de variables


Hormis la distinction fondamentale entre variables indpendantes (VI) et dpendantes (VD), il est important de connatre les diffrentes qualits attribues aux variables, car de ces qualits peuvent dpendre le choix des recettes statistiques utilises et certains choix mthodologiques. Les variables, au point de vue de leur nature, se rangent en deux catgories, les variables quantitatives et qualitatives : 1) Variables quantitatives Les variables quantitatives (on peut dire aussi variables dchelle scale en anglais ou continues), correspondent une grandeur naturelle, une mesure. Elles sont aussi dites continues, car elles

23 Stats pour les nuls les statistiques par lexemple

peuvent prendre toutes les valeurs possibles dans un intervalle. Quelques exemples de variables quantitatives : La temprature indique par un thermomtre entre 0 et 100 centigrades : 12, 0,5, 24,8, 50, etc. Lge de sujets entre 18 et 65 ans : 5, 10, 23, 35, 54, 78 ans, etc. Les scores de dpression une chelle de dpression entre 0 et 13 : 5, 8, 6, 10, 11, etc. Les scores de performance une preuve de mmorisation entre 0 et 10 : 2, 7, 6, 5, 3, etc. 2) Variables qualitatives Les variables qualitatives (on peut dire aussi variables discrtes, ou discontinues, ou catgorielles) ne concernent que certaines valeurs ou tranches de valeurs dans un intervalle ou encore des catgories ou classes de qualits. Quelques exemples de variables qualitatives : Des classes dge : classe 1 entre 18-25 ans, classe 2 entre 26-35 ans, classe 3 entre 36-45 ans, classe 4 partir de 46 ans et au-dessus. Des niveaux de dpression : pas de dpression entre 0 et 3 ; dpression lgre entre 4 et 7 ; dpression srieuse entre 8 et 11 ; dpression grave partir de 11 et au-dessus. Les catgories de genre : Homme et Femme . Les catgories socioprofessionnelles (CSP) : Agriculteur , Cadre, profession intellectuelle suprieure , Profession intermdiaire , Employ , Ouvrier , Retrait , etc. Vous aurez remarqu que lon peut subdiviser les variables qualitatives en deux types : Les variables ordinales : il sagit des classes de mesures, comme les tranches dge, les niveaux de temprature ou de dpression. Pour simplifier le traitement dune variable numrique, ou pour la rendre plus parlante, on peut regrouper le caractre continu de la variable par tranches, qui sont rparties sur lintervalle dune faon ordonne (par exemple, tranches de 0 5, de 6 10, de 11 15, de 16 20, etc.). Les variables nominales : ne concernent en aucune faon des valeurs numriques, mais de vritables catgories, comme le fait dtre Homme ou Femme , Ouvrier ou Employ . Cependant, tout comme pour le choix de VI et de VD, il y a dans le choix de la qualit des variables une part de conventionnel : le chercheur dcide librement si telle variable est prise un niveau quantitatif ou qualitatif. Par exemple, si lon reprend le cas de la variable continue des tempratures entre 0 et 100, cette variable est vraiment continue si on accepte toutes les units de degrs entre 0 et 100 (12, 15, 5, 78, etc.). Dans certains cas, on peut aller plus loin et accepter toutes les

24 Stats pour les nuls les statistiques par lexemple

mesures jusquaux fractions de degr, les millimes (12,923, 56,047, etc.). Pourtant, il est toujours possible, pour un chercheur, de dcider quil mesure la temprature en millimes de degrs et de dcouper lintervalle entre 0 et 100 en 100 parties (ce ne sont plus des degrs, mais des noms de tranches), la variable devenant alors discontinue et ordinale (12 signifie entre 12,000 et 12,999 ; 13 signifie entre 13,000 et 13,999 ; et ainsi de suite). Un autre choix trs libre du chercheur rside dans le nom donn aux catgories dune variable qualitative catgorielle. Cette libert vous permet de transformer du texte en chiffre, en numros (qui ne sont pas des mesures quantitatives videmment). Cest ce qui arrive dans certains questionnaires ou inventaires, o le sujet doit rpondre laide dune chelle du type : Jamais , Parfois , Souvent , Trs souvent ; ce que le chercheur traduit en un score entre 0 et 3. Autres exemples : Oui , Non deviendront 1 et 0 ; Homme et Femme 1 et 2, etc.

25 Stats pour les nuls les statistiques par lexemple

2. Faire une recherche


Les pages de ce chapitre du manuel prsentent les diffrentes parties dune recherche, qui sont aussi les diffrentes parties dun mmoire ou dun article scientifique (la diffrence entre mmoire et article scientifique tient le plus souvent la taille du texte : dans un mmoire on peut davantage staler et entrer dans certains dtails ou reprendre des donnes antrieures pour en faire un expos assez tendu, alors que larticle est gnralement plus succinct. Cependant, cette notion de taille peut sestomper quelque peu, si lon considre que de plus en plus les enseignants (surbooks) exigent des mmoires courts et que certaines revues scientifiques acceptent des articles de fond et de haut vol plus ou moins importants en taille).

2.1. Lintroduction
Lintroduction votre tude doit commencer par des considrations assez gnrales, qui voquent la problmatique sur laquelle vous travaillez, et qui justifient en quelques sortes lintrt de votre tude. Pour introduire ainsi votre sujet, il est trs important de rfrencer chacune de vos affirmations, informations. Il est aussi important de commencer donner des donnes chiffres. Exemple : Ne pas crire : En gnral, le taux de rechute aprs un traitement est trs important. Mais crire : En gnral, le taux de rechute aprs un traitement varie entre 50% et 90% (Browell, Marlatt, Lichtenstein, & Wilson, 1986). Vous donnez ainsi une estimation chiffre du taux de rechute et cette estimation renvoie une tude valide et publie dans une revue scientifique officielle (renoncez aux citations issues de magazines de vulgarisation, ou pire de magazines tout court ! mme si cest le docteur Machin qui la dit). En donnant ainsi des chiffres et en les rfrenant, vous donnez au lecteur des informations prcises et fiables qui vont lclairer (et quil peut retrouver lui-mme et vrifier) et vous lui montrez que vous connaissez bien votre sujet, pour avoir lu (ou connu) les articles en question. Nota : en ce qui concerne le avoir lu . Bien sr, dans lidal, il est toujours bon et prfrable davoir lu les articles que lon cite. Cependant, dans la pratique, ltudiant, comme le chercheur confirm, se heurtent des limites de temps disponible pour lire, lnergie, parfois la motivation, ncessaires. Il existe aussi en science un souci dconomie de leffort que lon peut formuler ainsi : quelquun a dj fait leffort de lire un article et le cite avec un commentaire suffisant, donc pourquoi produire une redondance inutile de leffort dans la communaut scientifique et ne pas me contenter de reprendre la citation du prcdent auteur. Cest ce qui se passe, en fait, pour la plupart des citations : on se contente de reprendre la citation de lautre. Par exemple, vous navez jamais lu larticle de Browell, Marlatt, Lichtenstein et Wilson (1986) concernant les taux de rechute alcoolique, mais vous avez repris cette information dans un autre article. Parfois, lhonntet

26 Stats pour les nuls les statistiques par lexemple

entrane certains dire, entre parenthses (Dupont, 1985, cit dans Durand, 1999), mais le procd ne fait qualourdir le texte et accrotre artificiellement la bibliographie. Il est vrai que la citation de la citation ressemble un peu la blague de lhomme qua vu lhomme qua vu lhomme (...) qua vu la bte et cela peut conduire des effets pervers, dignes des dformations qui apparaissent dans une rumeur. Un exemple frappant, le fameux article de Goodman (1990) qui dfinit les critres de laddiction. Rares sont les personnes qui ont vraiment lu cet article (en anglais), mais par contre, nombreux sont celles qui y font rfrence et qui utilisent sans rflchir les critres de Goodman pour construire un instrument dvaluation ou slectionner leurs sujets. La lecture que Loonis6 a faite de cet article , a pu montrer quil ne sagissait que dun commentary (bien quil soit publi dans une revue srieuse), caractre simplement spculatif, et non dune vritable dmonstration des critres. Par contre, larticle explicite des implications pratiques et thoriques trs importantes, qui sont ignores, faute davoir t lues. En tout tat de cause, il faut sefforcer au fil des annes de recherche, de lire au moins les articles cls (et souvent clbres), afin de savoir exactement, et de premire main, de quoi lon parle. Exemple dintroduction : Dans de nombreux pays lalcoolisme est un srieux problme de sant publique. Ce problme est aggrav du fait que les traitements sont trop souvent suivis de rechute. En gnral, le taux de rechute aprs un traitement varie entre 50% et 90% (Browell, Marlatt, Lichtenstein, & Wilson, 1986). Daprs Chiauzzi (1989), entre 66% et 75% des abuseurs de drogues ou dalcool connatront une rechute dans les trois mois suivants le traitement. Armor, Polich et Stambul (1978) indiquent que seulement 10% des alcooliques traits maintiennent leur abstinence plus de 2 ans. Dans une tude de suivi sur 2 ans au Chili, aprs un traitement en centre de rhabilitation, 63% des individus retournent lalcool (Bunout, Maza, Hirsch, Petermann, Godoy, & Prez, 1997). Labandon du traitement, qui entrane ou est la consquence de la rechute alcoolique, prsente des taux semblables aux rechutes directes. Baekeland et Lundwall (1975) rapportent des taux dabandon prcoce de 52% 75%. Une tude de Laflamme-Cusson et Moisan (1993) fait ressortir des pourcentages comparables au Canada : 25% des patients abandonnent leur demande daide aprs lentrevue dvaluation, 50% poursuivent pendant plus de quatre semaines et seulement 15% persistent plus de 6 mois. Dans une autre tude conduite au Canada (Brochu, Landry, Bergeron, & Chiocchio, 1995), des taux dabandon semblables sont observs aux diffrentes phases de traitement : 17% des patients abandonnent leur demande daide aprs lentrevue dvaluation, 45% abandonnent avant la deuxime phase de traitement et seulement 12% persistent au-del de six mois. Toujours dans lintroduction, il ne faut pas vous contenter dune seule donne et dune seule rfrence. Vous devez avoir suffisamment explor la littrature scientifique (y compris et surtout internationale) pour pouvoir prsenter plusieurs donnes rfrences, qui sont souvent contradictoires ou sensiblement diffrentes. Vous devez donc dj esquisser ici une sorte de mini dbat. Car, la fin de la conclusion (de lintroduction), vous devez justifier lintrt de votre tude :
6

http://www.academia.edu/4313320/Larticle_dAviel_Goodman_10_ans_apres

27 Stats pour les nuls les statistiques par lexemple

parce que des donnes sont contradictoires, ou imprcises, ou mal produites, parce quil y a dbat, discussion dans la communaut scientifique, alors, votre recherche est utile pour... il est utile, ncessaire de... Voil par quoi une conclusion dintroduction devrait se terminer. Exemple de conclusion lintroduction : Nanmoins, linterprtation de lensemble des rsultats de ces tudes ne permet pas darriver des conclusions fermes et, bien quun certain nombre de variables pertinentes aient pu tre identifies, la principale critique qui peut tre adresse ces recherches porte sur labsence de modles thoriques et intgratifs dans ltude de ce phnomne. Aussi, il est ncessaire dutiliser un tel modle intgratif et den faire la dmonstration.

2.2. La problmatique
Un principe fondamental de la recherche scientifique en psychologie peut se formuler ainsi : voir large, faire troit (ou le principe de lentonnoir). Cela signifie que vous devez dabord ratisser large, puis, rduire votre problmatique et votre modle quelque chose de plus troit. Cette rduction, effet dentonnoir, est ncessaire pour deux raisons : dabord, vous ne pouvez pas traiter de toute la complexit du rel et vous serez amen faire des choix (choisir un modle parmi les modles, choisir une population dans la population gnrale, choisir vos hypothses, choisir vos variables VI et VD). La seconde raison est en continuit avec la premire, cest celle de la faisabilit : non seulement vous ne pouvez prtendre apprhender la complexit du rel humain (mme si vous tes une quipe de chercheurs), mais en plus, votre nergie, vos connaissances, vos moyens matriels, financiers, institutionnels, socioconomiques, voire politiques, sont limits. Votre temps et vos objectifs sont aussi limits : on ne vous demande pas dcrire une somme en 20 volumes sur 10 ans, on vous demande de faire une petite recherche en quelques mois et dcrire un petit mmoire, un article, ou au pire une grosse thse7. Dans la problmatique, vous devez survoler les diffrents modles qui ont tent dexpliciter votre problmatique. Puis, vous devez faire un choix (il est arbitraire, vous tes libre, ce qui ne doit pas vous empcher de justifier rationnellement votre choix), parmi les modles, vous emparer de lun deux comme base pour votre tude. Cest le modle de rfrence. Ensuite, vous devez vraiment montrer au lecteur quel point vous vous tes empar du modle de rfrence en formulant votre propre mini-modle, qui est une forme simplifie (pas forcment) et adapte du modle de rfrence, la problmatique concrte laquelle vous voulez apporter une rponse. Par exemple, si vous faites le choix daborder la problmatique de la rechute addictive au
Il y eut une poque (au 20e sicle) o raliser une thse en 10 ans tait la norme. Mais devant linflation des travaux scientifiques et lavalanche permanente de nouveaux rsultats, cette laboration sur le long terme est devenue impossible, la thse deviendrait interminable puisquil faudrait pratiquement chaque anne la reprendre la lumire des dcouvertes les plus rcentes. Aussi, une thse se droule-t-elle normalement en 3 ans : une anne pour prparer son sujet, explorer la littrature, reprer le terrain dtude et tablir la faisabilit ; une anne pour la ralisation du protocole de recherche sur le terrain ; une anne pour la rdaction et la soutenance. Not more !
7

28 Stats pour les nuls les statistiques par lexemple

travers du modle de rfrence de la thorie du renversement (Apter), vous pouvez rduire cette thorie complexe certains concepts et indicateurs (par exemple, la paire dtats mtamotivationnels tlique-paratlique) et imaginer (cest l votre mini-modle) des lments de processus explicatifs de la rechute partir de ces concepts. Vous ferez cela, tout en le reliant votre terrain de recherche (par exemple, des toxicomanes en postcure). Bien entendu, au passage, votre problmatique et votre mini-modle, peuvent tre tays par des travaux antrieurs ventuels que vous devez citer. Par exemple, vous pouvez en toute modestie reprendre un protocole exprimental (les fameuses tudes rplicatives replication studies , lun des grands principes de la recherche scientifique tant la reproductibilit, vous y contribuerez) et citer prcisment les rsultats antrieurs votre propre tude.

2.3. Les hypothses


La recherche scientifique consiste faire des prdictions... tout comme la voyante cartomancienne vous prdit lavenir, le turfiste les chevaux gagnants de la prochaine course ou le mtorologue le temps quil fera ce week-end. Cependant, les prdictions du chercheur sont tout fait diffrentes. Tout dabord, au contraire de la tireuse de cartes, nos prdictions sappliquent sur un modle plausible et rationnel (on ne peut pas dire que la correspondance entre le tirage alatoire de cartes jouer et des vnements futurs reprsente un modle plausible et rationnel, sauf le croire...). Ensuite, nos prdictions nont pas une valeur pragmatique, comme le bulletin mto, mais thorique : nous ne gagnons rien de concret dans le fait que nos prdictions soient exactes ou non, ni pour nous-mmes (le chercheur, sil est rmunr, touchera son salaire, que ses hypothses soient vrifies ou non), ni pour la socit dans le court terme (personne nattend le rsultat de nos prdictions pour le lendemain ou le week-end prochain, par contre, la socit est effectivement intresse par nos rsultats pour une action, une application, inscrites dans le long terme, par exemple, changer lapproche sanitaire de la problmatique de la dlinquance juvnile). Nos prdictions scientifiques sont plausibles, sappliquent sur un modle troit et rationnel et de plus, elles nont pas dorientation ! Nous voulons dire pas dorientation autre quarbitraire . Cela signifie que vous pouvez formuler vos hypothses en positif ou en ngatif. Par exemple, vous tes libres de poser : La cure de sevrage avec accompagnement psychologique aura un effet damlioration sur ltat psychologique (dpression et anxit) par rapport au groupe de contrle qui suit une cure de sevrage sans accompagnement psychologique. Ou le contraire : La cure de sevrage avec accompagnement psychologique namliorera pas ltat psychologique (dpression et anxit) tout comme le groupe de contrle qui suit une cure de sevrage sans accompagnement psychologique.

29 Stats pour les nuls les statistiques par lexemple

De plus, pour le chercheur, ses rsultats sont, nous lavons dit, pragmatiquement neutres, ce qui signifie que si une hypothse est valide, cest un rsultat ; mais si une hypothse nest pas valide, cest aussi un rsultat ! Pour le chercheur, que laccompagnement psychologique dans la cure de sevrage amliore ou non ltat psychologique des sujets est, dans les deux cas, un rsultat intressant : sil y a amlioration, alors il ajoute une pierre au modle qui dit que laccompagnement psychologique en cours de cure de sevrage est cliniquement intressant , et sil ny a pas amlioration, il najoute pas de pierre, voire, il en retire une et il faut alors envisager autre chose que laccompagnement psychologique au cours du sevrage. Cette libert dorientation, quant la formulation des prdictions, fait que le chercheur, entre larrive des rsultats et la publication, est libre de choisir dans quel sens il publiera ses rsultats : Sens 1 : le chercheur prsente les modles de sa problmatique, choisit parmi eux son modle de rfrence, en tire son mini-modle, partir duquel il construit des hypothses classiques ou orthodoxes , cest--dire qui vont dans le sens communment attendu. Et, dans le cas o les prdictions ne sont pas vrifies, le chercheur proposera la suite de la discussion de ses rsultats un modle alternatif , htrodoxe , rvolutionnaire (au sens de rvolution scientifique8). Sens 2 : le chercheur prsente les modles de sa problmatique, mais se dmarque demble de ces modles et propose, arguments scientifiques lappui, un mini-modle alternatif , htrodoxe , rvolutionnaire (au sens de rvolution scientifique8), partir duquel il construit des hypothses alternatives , htrodoxes , rvolutionnaires , qui vont contre-courant des hypothses classiques ou orthodoxes . Et comme dans ce cas, les prdictions du chercheur sont valides, dans la discussion des rsultats, il confortera son modle rvolutionnaire et tchera de lui apporter quelques rserves et critiques en toute modestie (de toute faon dautres se chargeront bien de le faire, croyez-moi !). Lune et lautre orientation sont scientifiquement indiffrentes, car comme on la dit, un rsultat est toujours un rsultat, quel que soit son orientation (quil valide ou pas lhypothse). Par contre, apparaissent ici des notions desthtique dans la prsentation des travaux et de satisfaction narcissique du chercheur lui-mme : dans le sens 1 , le chercheur sacrifie son plaisir narcissique (si ses hypothses ne sont pas valides) au profit dune prsentation classique ; dans le sens 2 , le chercheur se fait plaisir (Ouah ! quest-ce que je suis fort, mes prdictions moi se sont ralises !), au profit dune prsentation avantageuse. Entre tre classique, rvolutionnaire ou chercheur puril, cest chacun de se faire son opinion. Mais il est temps de parler de ces fameuses hypothses. Quest-ce quune hypothse ? Une hypothse ( cet endroit, il sagit dhypothse oprationnelle, voir le chapitre Les V.I. et les V.D. pour les diffrents niveaux dhypothses : gnral, de travail, oprationnel et statistique) est une prdiction (issue dun modle plausible et rationnel) qui pose une relation dinfluence entre une(des) variable(s) indpendante(s) et une(des) variable(s) dpendante(s) (les niveaux de la VI ont un effet sur sont explicatifs de la valeur de la VD). Par exemple, dans lhypothse ci-dessous :

Kuhn, T. S. (1972). La structure des rvolutions scientifiques. Trad. Franaise, Paris : Flammarion.

30 Stats pour les nuls les statistiques par lexemple

La cure de sevrage avec accompagnement psychologique (VI) aura un effet damlioration sur ltat psychologique (VD = dpression et anxit) par rapport au groupe de contrle qui suit une cure de sevrage sans accompagnement psychologique. La VI est laccompagnement psychologique, elle possde deux niveaux : avec (groupe exprimental) et sans (groupe de contrle, on dit aussi tmoin) accompagnement psychologique. La VD est ltat psychologique, oprationnalis comme scores des chelles de dpression et danxit. Linfluence est prdite de VI sur VD : laccompagnement psychologique influence ltat psychologique. Enfin, rappelez-vous au chapitre sur Les V.I. et les V.D., que le sens de la prdiction, de linfluence, entre ce qui est VI ou VD, vous appartient : ici le chercheur tudie linfluence de laccompagnement psychologique sur ltat psychologique, mais un autre chercheur pourrait tudier linfluence de ltat psychologique sur laccompagnement psychologique (par exemple, avec lhypothse plausible de ce que plus ltat psychologique est grave anxit et dpression et plus laccompagnement psychologique est inefficace du fait de la non compliance9 des sujets). La VI est bien ce que manipule le chercheur (il divise son chantillon de sujets en deux groupes : ceux qui reoivent et ceux qui ne reoivent pas laccompagnement psychologique) et la VD est bien la rponse des sujets aux questionnaires (dpression et anxit). A ce propos, notez bien cette subtilit de langage : quand vous faites une prdiction sur une amlioration dtat psychologique, sur un changement de comportement ou dattitude (sauf, dans ce cas, pouvoir observer vousmmes le comportement), cest par commodit langagire, simplification, que lon dit dans lhypothse que les niveaux de la VI ont une influence sur ltat ou le comportement ; car en ralit, la prdiction se borne porter sur la rponse aux instruments de mesure (questionnaires, inventaires, tests). Pour ce qui concerne le lien prdictif entre comportements, attitudes, tats psychologiques rels et la rponse aux instruments, cest une autre histoire (cela dpend videmment du degr de validit de linstrument de mesure). Rappel : voir le chapitre Les V.I. et les V.D. pour connatre les diffrents niveaux dhypothses : gnral, de travail, oprationnel et statistique. Les types dhypothses selon les types de recherche Au chapitre prsentant Les types de recherche, nous avions vu les quatre niveaux de la recherche : empirique, thorique, (quasi) exprimental et clinique. La possibilit de formuler des prdictions hypothtico-dductives varie selon ces niveaux de la recherche.

Terme qui vient de langlais et qui est de plus en plus utilis en franais faute dun mot quivalent et qui signifie : ladhsion et la conformit dun sujet un protocole de soin ou dtude (par exemple, respecter les rendez-vous, le cadre du travail, rpondre aux consignes, prendre le traitement et respecter la posologie, etc.).

31 Stats pour les nuls les statistiques par lexemple

Recherche empirique : ces recherches se situent en amont des tudes exprimentales, souvent dans une vise exploratoire. Il sagit dexplorer un nouveau terrain dtude, de connatre une population, dacqurir des indices et indicateurs de base. Dans ce cas, le chercheur peut ne faire que de lobservation systmatique (la description dtaille de tout ce quil observe) et ne formuler quune simple hypothse sur ce quil sattend observer (intensit, frquences, dures dun comportement, par exemple). Le chercheur peut aller un peu plus loin au plan empirique en portant des prdictions corrlationnelles entre deux variables et ses hypothses corrlationnelles, dans une vise simplement inductive, vont alors prdire une covariation entre ces deux variables (par exemple, entre lge et les comportements dimitation). Dans tous les cas, on ne peut pas vraiment parler de manipulation de variable indpendante par le chercheur et donc, de relation causale postule dans lhypothse. Recherche thorique : la recherche thorique, souvent place entre recherche empirique et recherche exprimentale, nest pas destine formuler des hypothses tester immdiatement. Il sagit dune tape au cours de laquelle, partir des rsultats des travaux empiriques (lobservation), un modle est construit, dans sa confrontation aux autres modles dj existants. Ce modle prvoit videmment des processus, qui donnent lieu hypothses, mais tout ce travail de pionnier se borne des hypothses trs gnrales (non encore oprationnelles), destines dfinir les grands axes dun programme de recherche venir. Recherche (quasi) exprimentale : cest dans ce type de recherche que lhypothse prend pleinement son essor, car nous sommes bien dans une vise hypothtico-dductive, pour laquelle le chercheur prdit les consquences causales de ses manipulations, selon le minimodle quil a choisi. Dans ce cas, il y a des VI (manipules) et des VD (en rponse de la part des sujets) et lhypothse prdit lobtention dune relation prcise, oprationnelle, entre les variations induites (VI) et les variations rsultantes (VD). Recherche clinique : ici, la recherche est du mme type que la recherche empirique, sinon que lexploration ne porte que sur un champ restreint, fouill en profondeur. Les seules hypothses formulables porteront sur ce que le chercheur sattend observer chez un ou quelques individus, cela en regard des observations antrieures et de son modle de rfrence. Ds que le chercheur commence manipuler quelque chose, sattendant alors un rsultat, il entre dans le champ exprimental. Dans ce cas, la porte de ce que le chercheur prdit et produit et reproduit, ne pourra dpasser le sujet quil tudie (gnralisation des rsultats) que sil se tourne vers un chantillon de population, de fait, il ne sagit plus de recherche clinique au sens o nous lentendons ici.

Dans votre article ou votre mmoire, cest ce stade que vous reliez oprationnellement votre minimodle la problmatique et que vous fates lexpos descriptif gnral de votre plan de recherche (les manipulations que vous allez faire et les rsultats que vous en attendez). En conclusion, vous prsentez vos hypothses (Voir le chapitre : Variable dpendantes et variables indpendantes).

32 Stats pour les nuls les statistiques par lexemple

2.4. La mthode
Dans cette partie de votre travail, vous devez exposer exactement la mthode (et non la mthodologie, qui est la science des mthodes) que vous avez suivie pour raliser votre tude (on doit savoir ce que vous avez fait et on doit pouvoir reproduire votre mthode). Cet expos comporte les lments suivants : Descriptif de votre population : il sagit dindiquer o et comment la population dtude t recrute, puis de la dcrire (nombre dhommes, de femmes, nombre total ; moyenne, cart type, minimum et maximum des ges). Vous devez dire exactement comment vous avez rencontr les sujets (dans une institution, quel type ; par une petite annonce, spontanment dans un lieu public, luniversit, par tlphone, par effet boule de neige une personne vous donne les coordonnes dune ou plusieurs autre(s) quelle connat et ainsi de suite , etc.). Vous pouvez utiliser des tableaux chiffrs pour prsenter certaines donnes. Notamment, lorsque vous prsenterez les donnes dmographiques. Prcisez si les personnes ont rempli une Feuille de consentement. Prcisez aussi vos critres dinclusion et de non inclusion dans la recherche. Descriptif de votre protocole : vous devez expliquer clairement comment vous avez procd : pour rpartir vos chantillons dans les groupes (les critres), dans quelles conditions vous avez assur vos variables indpendantes (dispositif exprimental, lieu, conditions, dure, contrle des variables parasites) ; quant, o, comment, vous avez enregistr vos variables dpendantes (le test, le retest ou le calendrier ou programme de rptition des mesures, etc.). Descriptif des instruments de mesure : celui qui tablit les critres de slection entre groupe exprimental et groupe tmoin (la VI) et ceux qui permettent de mesurer les variables dpendantes (VD), en donnant chaque fois la rfrence la plus rcente de validation de linstrument, dans la langue des sujets. Dites si vous avez choisi de prendre en compte les donnes normatives (par exemple, partir de quel seuil vous classez les sujets comme dpressifs ou non). Bien entendu, vous tes libre dadapter le choix des informations et leur ordre de prsentation selon le niveau de votre recherche et ses caractristiques propres.

2.5. Les rsultats


Les rsultats sont prsents en trois parties : 1. le contrle des variables descriptives (organismiques, dmographiques) sur lquivalence des groupes afin dassurer le lecteur que vous avez pris en compte le principe du toutes choses gales par ailleurs . Pour cela, vous donnez des tableaux chiffrs, qui prcisent les rsultats de vos tests statistiques sur ces variables (voir la partie Lquivalence des groupes du manuel). Normalement, vos tests ne doivent pas indiquer une diffrence significative des groupes au point de vue des variables descriptives. Dans le cas contraire, il faudra penser apporter des rserves vos rsultats dans la discussion.

33 Stats pour les nuls les statistiques par lexemple

2. le contrle des variables descriptives (organismiques, dmographiques) sur les variables dpendantes afin dassurer le lecteur que vous avez pris en compte le principe du toutes choses gales par ailleurs . Pour cela, vous donnez des tableaux chiffrs, qui prcisent les rsultats de vos tests statistiques sur ces variables (voir la partie Leffet des variables descriptives du manuel). Normalement, vos tests ne doivent pas indiquer une influence significative des variables descriptives sur vos rsultats (les VD). Dans le cas contraire, il faudra penser apporter des rserves vos rsultats dans la discussion. 3. la prsentation des rsultats proprement dits. Elle se fait sous la forme de tableaux chiffrs et comments. Les commentaires sont brefs et ne dpassent pas la description des points saillants relever dans le tableau (voir la partie Les statistiques infrentielles du manuel). Pour aller plus loin, attendez la partie suivante, la discussion des rsultats. Dans le chapitre Prparation de SPSS du manuel, vous verrez comment respecter les normes de prsentation des tableaux de rsultats.

2.6. La discussion
La discussion consiste analyser vos rsultats en regard de vos hypothses, en partant du dtail, pour aller progressivement vers le gnral. Pour chacune des hypothses, analysez dans quelle mesure elle est ou non vrifie. Analysez aussi lventuelle influence des variables descriptives, ainsi que linfluence de certaines conditions exprimentales, des limites deffectif de lchantillon, la disparit entre les groupes, lattrition entre test et retest, etc. Ensuite, dans la mesure o vos hypothses ont t plus ou moins valides, vous devez expliquer comment cela renforce le modle. Dans le cas contraire, vous devez trouver un quilibre entre ce qui limite la validit de vos rsultats et ce qui remet en question le modle : si vos rsultats sont excessivement solides (gros chantillon, protocole impeccable), le modle peut tre remis en question ; si ce nest pas le cas, vous vous contentez de porter des doutes sur le modle, en toute modestie et vous faites appel au souhait de recherches ultrieures, pour y voir plus clair. Vous pouvez aussi aller plus loin et commencer suggrer des modifications au modle, plus ou moins consistantes, ou carrment vous suggrez un nouveau modle et en produisez quelques lments. Vous assortissez le tout dhypothses gnrales ou de travail, qui vont inspirer et esquisser les recherches futures (mme si ce nest pas vous qui entreprendrez de telles recherches).

2.7. La conclusion
Dans la conclusion de votre mmoire, ou de votre article, vous devez rappeler et rsumer rapidement vos rsultats et les replacer dans la perspective de la problmatique initialement traite. Montrer comment vos rsultats clairent ou nclairent pas cette problmatique et quelles applications on pourrait ou pas envisager (une conclusion est gnralement courte, ce paragraphe en apporte la preuve...).

34 Stats pour les nuls les statistiques par lexemple

2.8. Les rfrences


A la fin de votre texte (mmoire ou article), vous devez lister vos rfrences bibliographiques. Evitez absolument les rfrences orphelines ! Celles cites dans le texte et que vous oubliez de lister la fin, ou encore celles que vous mettez dans la liste finale, pour gonfler artificiellement votre bibliographie, sans quelles correspondent une citation dans le texte. Si vous pensez que des rfrences orphelines de ce type sont utiles lister pour le lecteur, vous pouvez crer une seconde liste de rfrences intitule Bibliographie supplmentaire ou Pour en savoir plus (cette seconde liste est acceptable dans un mmoire ou mieux dans un ouvrage, mais elle sera refuse dans un article). Les rfrences bibliographiques en liste sont classes selon trois mthodes possibles : 1) Alphabtique auteur : cest la classification la plus commune et classique, cest aussi la plus simple raliser. Les rfrences dans le texte sont donnes avec nom dauteur suivi de lanne et, dans la liste, les rfrences sont classes par ordre alphabtique des auteurs. Exemple, mthode 1 : Dans le texte... Jusqu prsent luvre de Stanton Peele a t prsente dans la littrature franaise comme clectique et descriptive, empruntant au constructivisme social et recourant des concepts comportementaux et cognitifs (Pedinielli, Rouan & Bertagne, 1997). (...). Les dbats des spcialistes propos de la toxicomanie, aux tats-Unis comme en Europe (MacCoun & Reuter, 1997 ; Henrion, et al., 1995 ; Solal, 1997 ; Lucas, 1996) et les trs rcents rapports ministriels (Roques, 1998 ; Maestracci, 1999), montrent que les ouvrages de Peele (1975, 1985) et lensemble de son uvre, nont pas encore perdu une once dactualit et quil peut tre utile de les examiner nouveau.10 Dans la liste bibliographique finale... 1. Henrion, R., et al. (1995). Rapport de la commission de rflexion sur la drogue et la toxicomanie. Paris : La Documentation Franaise. 2. Lucas, B. (1996). Politique franaise en matire de drogue, la singularit du cas lyonnais. Psychotropes, 2, 75-95. 3. MacCoun, R. & Reuter P. (1997). Interpreting dutch cannabis policy: Reasoning by analogy in the legalization debate. Science, 278, 47-52. 4. Maestracci, N. (1999). Lutte contre la drogue et la toxicomanie. Rapport remis au premier ministre Lionel Jospin, janvier, confidentiel. 5. Pedinielli, J.-L., Rouan G., & Bertagne, P. (1997). Psychopathologie des addictions. Paris : Presses Universitaires de France, Nodules. 6. Peele, S. & Brodsky, A. (1975). Love and addiction. New York: Taplinger. 7. Peele, S. (1985). The meaning of addiction. Lexington: Lexington Press.
10

Extrait de : Loonis, E. (2001). Thorie gnrale de laddiction. Introduction lhdonologie. Paris : Publibook.

35 Stats pour les nuls les statistiques par lexemple

8. Roques, B. (1998). La dangerosit des drogues. Paris: Odile Jacob, La Documentation Franaise. 9. Solal, J. F. (1997). Abstinence et substitution : histoire et actualit des traitements aux toxicomanes. Pratiques Psychologiques, 4, 13-24. 2) Alphabtique numrote : ici, les auteurs sont classs dans la liste comme prcdemment, dans lordre alphabtique et vous numrotez chaque rfrence dans la liste (sous Word avec une puce de numrotation). Cependant, dans le texte, au lieu de mettre nom dauteur et anne de publication, vous mettez le numro de liste bibliographique. Problme : il faut dabord faire comme pour la mthode 1, puis, si vous tes certain davoir list toutes vos rfrences, remplacez dans le texte les (nom + anne) par le numro. Inconvnient : le procd est source derreur et fait perdre du temps inutilement, de plus, si vous souhaitez ajouter une rfrence, votre numrotation est compltement dcale et reprendre et, l encore, le risque derreur est grand. Exemple, mthode 2 : Dans le texte... Jusqu prsent luvre de Stanton Peele a t prsente dans la littrature franaise comme clectique et descriptive, empruntant au constructivisme social et recourant des concepts comportementaux et cognitifs (5). (...). Les dbats des spcialistes propos de la toxicomanie, aux tats-Unis comme en Europe (1, 2, 3, 9) et les trs rcents rapports ministriels (4, 8), montrent que les ouvrages de Peele (6, 7) et lensemble de son uvre, nont pas encore perdu une once dactualit et quil peut tre utile de les examiner nouveau. Dans la liste bibliographique finale... 1. Henrion, R., et al. (1995). Rapport de la commission de rflexion sur la drogue et la toxicomanie. Paris : La Documentation Franaise. 2. Lucas, B. (1996). Politique franaise en matire de drogue, la singularit du cas lyonnais. Psychotropes, 2, 75-95. 3. MacCoun, R. & Reuter P. (1997). Interpreting dutch cannabis policy: Reasoning by analogy in the legalization debate. Science, 278, 47-52. 4. Maestracci, N. (1999). Lutte contre la drogue et la toxicomanie. Rapport remis au premier ministre Lionel Jospin, janvier, confidentiel. 5. Pedinielli, J.-L., Rouan, G. & Bertagne, P. (1997). Psychopathologie des addictions. Paris : Presses Universitaires de France, Nodules. 6. Peele, S. & Brodsky, A. (1975). Love and addiction. New York: Taplinger. 7. Peele, S. (1985). The meaning of addiction. Lexington: Lexington Press. 8. Roques, B. (1998). La dangerosit des drogues. Paris: Odile Jacob, La Documentation Franaise. 9. Solal, J. F. (1997). Abstinence et substitution : histoire et actualit des traitements aux toxicomanes. Pratiques Psychologiques, 4, 13-24.

36 Stats pour les nuls les statistiques par lexemple

3) Numrotation incrmentale : ici, au fur et mesure que les rfrences apparaissent dans le texte, vous leur donn un numro croissant. Ensuite, la liste bibliographique est classe par numro, ce qui signifie que les rfrences bibliographiques ne sont pas listes dans lordre alphabtique dauteurs. Ici aussi, lajout de rfrences, aprs coup, dcale compltement le classement et est la source derreurs (sans compter quune consultation libre de la liste de rfrences est fortement gne par labsence dordre alphabtique des auteurs). Exemple, mthode 3 : Dans le texte... Jusqu prsent luvre de Stanton Peele a t prsente dans la littrature franaise comme clectique et descriptive, empruntant au constructivisme social et recourant des concepts comportementaux et cognitifs (1). (...). Les dbats des spcialistes propos de la toxicomanie, aux tats-Unis comme en Europe (2, 3, 4, 5) et les trs rcents rapports ministriels (6, 7), montrent que les ouvrages de Peele (8, 9) et lensemble de son uvre, nont pas encore perdu une once dactualit et quil peut tre utile de les examiner nouveau. Dans la liste bibliographique finale... 1. Pedinielli, J.-L., Rouan, G. & Bertagne, P. (1997). Psychopathologie des addictions. Paris : Presses Universitaires de France, Nodules. 2. MacCoun, R. & Reuter P. (1997). Interpreting dutch cannabis policy: Reasoning by analogy in the legalization debate. Science, 278, 47-52. 3. Henrion, R., et al. (1995). Rapport de la commission de rflexion sur la drogue et la toxicomanie. Paris : La Documentation Franaise. 4. Solal, J. F. (1997). Abstinence et substitution : histoire et actualit des traitements aux toxicomanes. Pratiques Psychologiques, 4, 13-24. 5. Lucas, B. (1996). Politique franaise en matire de drogue, la singularit du cas lyonnais. Psychotropes, 2, 75-95. 6. Roques, B. (1998). La dangerosit des drogues. Paris: Odile Jacob, La Documentation Franaise. 7. Maestracci, N. (1999). Lutte contre la drogue et la toxicomanie. Rapport remis au premier ministre Lionel Jospin, janvier, confidentiel. 8. Peele, S. & Brodsky, A. (1975). Love and addiction. New York: Taplinger. 9. Peele, S. (1985). The meaning of addiction. Lexington: Lexington Press. Cest videmment la mthode 1 que nous vous conseillons dans tous les cas. Nutilisez les autres mthodes que si la revue dans laquelle vous voulez publier (ou votre enseignant responsable) le demande. Pour crire les appels aux rfrences bibliographiques dans le texte, selon la mthode 1, suivez les exemples ci-dessous (dans le dernier exemple, plusieurs rfrences sont spares par un pointvirgule) :

37 Stats pour les nuls les statistiques par lexemple

(Peele, 1985) (Peele & Brodsky, 1975) (Henrion, et al., 1995) (Browell, Marlatt, Lichtenstein & Wilson, 1986) (Peele, 1985 ; Peele & Brodsky, 1975 ; Henrion, et al., 1995 ; Browell, Marlatt, Lichtenstein & Wilson, 1986)

En ce qui concerne les normes de rdaction des rfrences bibliographiques en liste, elles sont... trop nombreuses ! Nous vous conseillons de suivre la plus courante et internationalement reconnue, le style APA (American Psychological Association)11 : Pour un article : Murgatroyd, S., Rushton, C., Apter, M.J., & Ray, C. (1978). The development of the Telic Dominance Scale. Journal of Personnality Assessment, 42(5), 519-528. Pour un ouvrage : Apter, M. J., Kerr, J. H., & Cowles, M. P. (1988). Progress in reversal theory. Amsterdam: Elsevier. Pour un chapitre dans un ouvrage : Brown, R. I. F. (1988). Reversal theory and subjective experience in the explanation of addiction and relapse. In M. J. Apter, J. H. Kerr, & M. P. Cowles (Eds.), Progress in reversal theory (pp. 191212). Amsterdam: Elsevier. Remarques : soyez attentifs au jeu trs subtil des espaces, points, virgules, parenthses, italiques, etc., que vous devez respecter la lettre ! Pour les chapitres dans un ouvrage, le (Eds.) qui indique les diteurs de louvrage, devient (Ed.) sil ny a quun seul diteur.

2.9. La publication
En thorie, la publication des rsultats de la recherche est la juste contrepartie de largent que la socit donne au chercheur pour quil fasse son travail de recherche. En ralit, ltudiant, le thsard, non rmunrs, ou encore lenseignant-chercheur surbook par lenseignement et souspay, nont pas se sentir obligs de publier au profit dune socit qui les ignore ou les nglige12. En fait, la loi du publish or perish (publier ou crever !), toute gocentrique quelle soit, est
vitez, sauf si votre enseignant responsable vous en donne la consigne, la norme franco-franaise, vilaine, vieillotte et trique ! Mais de toute faon, pour publier vous devez vous plier aux normes de la revue et en tant qutudiant vous devez suivre les consignes de votre enseignant responsable. 12 Dans certains milieux privilgis de la recherche (laboratoires, instituts, comme le CNRS ou lINSERM) la situation est bien diffrente : avec un travail dquipe, des collaborations internationales, des changes incessants entre chercheurs, une concurrence entre quipes, un suivi au jour le jour des travaux, etc. Dans de tels contextes la publication scientifique des travaux a encore du sens. Ce qui nest pas le cas de la recherche universitaire, en France, et en psychologie
11

38 Stats pour les nuls les statistiques par lexemple

malheureusement la principale motivation la publication : publier pour grossir sa bibliographie personnelle, gonfler son C.V., son dossier de candidature aux concours et aux postes universitaires. Triste ralit, mais bon... cest comme a. En ce qui concerne la publication dans une revue scientifique. Vous devez tout dabord prendre connaissance des instructions aux auteurs et les lire attentivement afin de les suivre la lettre. Ces instructions sont imprimes gnralement la fin des numros des revues, mais vous pouvez aussi les trouver sur lInternet en recherchant le site officiel de la revue en question (utilisez linfaillible moteur de recherche Google. De plus, Google comporte un outil de traduction qui peut vous donner une base de dpart pour publier en anglais ; partir de l, la correction par un anglophone est toutefois indispensable). Si vous suivez correctement ces instructions aux auteurs pour rdiger votre article, il ne devrait pas y avoir de problme, seule la qualit de contenu de larticle sera en cause. Une chose trs importante et qui doit faire lobjet de votre attention, cest le titre de votre texte. Autant le titre dun ouvrage peut tre relativement fantaisiste et accrocheur, autant celui dun article scientifique doit-il tre le plus prcis et explicite possible. En fait, le principe est quen lisant le titre on sache dj de quoi parle larticle. Voici quelques exemples rels : Traitement de substitution par mthadone et buprnorphine pour la toxicomanie lhrone. Isolement sensoriel, tude psychopathologique et psychanalytique de la rgression et du schma corporel. How part-time work intensity relates to drug use, problem behavior, time use, and satisfaction among high school seniors: Are these consequences or merely correlates? Lalexithymie : valuation, donnes quantitatives et cliniques. Anxit-trait, anxit-tat, changement rel, changement apparent. Toxicomanie et dlinquance, une question de style de vie ? Metamotivational states of tennis players in a competitive situation: An exploratory study. Playing with emergency: A case study of reversal theory in artwork. The sensation of risk and motivational tendencies in sports: An empirical study. Factors affecting reversals: A laboratory study. Gambling and problem gambling in Washington State: A replication study. A replication study of obsessional followers and offenders with mental disorders. Etude longitudinale de la qualit de vie dune cohorte de patients psychotiques. Alcoolodpendance et sropositivit virale C : tude multicentrique descriptive de 684 malades.

39 Stats pour les nuls les statistiques par lexemple

Vous remarquerez, en fin de liste, comment certains titres voquent clairement le niveau de la recherche : tude exploratoire (exploratory study), tude de cas (case study), tude empirique (empirical study), tude de laboratoire (laboratory study), tude rplicative (replication study, qui refait une tude ou une exprience antrieure), tude longitudinale, tude multicentrique descriptive... Vous pouvez indiquer dans le titre dun article sil y a eu randomisation, groupe de contrle, le nombre de sujets tudis, etc.

40 Stats pour les nuls les statistiques par lexemple

3. Faire des statistiques


3.1. Ltude fictive
Pour vous permettre de vous entraner aux statistiques sous la direction du manuel, nous avons cr les donnes dune petite tude fictive (donnes contenues dans le fichier Excel Data.xls , livr avec louvrage lectronique)13. Cette tude consiste en un plan de recherche combin (donc, qui compare deux groupes, avec une rptition de la mesure, un test et un retest). Imaginez un chantillon de 40 patients dans une clinique. Vous randomisez (par tirage au sort) deux groupes gaux de patients (20 + 20). Le premier groupe, dit Exprimental suivra un traitement psychologique durant 8 semaines. Le second groupe, dit de Contrle , naura aucun traitement durant ces 8 semaines. Ainsi, la VI est le traitement, avec deux niveaux : traitement, pas de traitement. La problmatique de cette tude fictive est le devenir de la dpression et de lanxit sous leffet dun traitement psychologique. Les deux VD mesures seront lanxit et la dpression. La HAD est utilise (Hospital Anxiety Depression scale), qui comporte deux facteurs : anxit et dpression. Les travaux statistiques entrepris, aprs prparation du dossier Excel, seront : Prsentation des variables descriptives. Contrle de lquivalence des groupes. Contrle de leffet des variables descriptives. Comparaison des groupes entre eux S1 (premire semaine) et S8 (huitime semaine). Comparaison de chaque groupe avec lui-mme entre S1 et S8 (test-retest).

Si vous connaissez bien Excel vous pouvez sauter la partie Le dossier Excel du manuel et vous rendre directement aux tudes statistiques avec SPSS. Cependant, pour prparer les donnes de votre propre tude, il est ncessaire den passer par Excel. La raison en est quExcel est bien plus pratique pour saisir vos donnes que SPSS. SPSS est aussi un tableur et permet de saisir des donnes, mais son ergonomie reste toutefois bien limit ct dExcel. Ce dernier permet de plus de traiter le dpouillement des instruments dvaluation (chelles, inventaires, questionnaires), laide de formules appropries (ce que ne permet pas SPSS). Enfin, il est si facile douvrir ensuite un dossier Excel dans SPSS et dy choisir la page voulue, quon ne voit pas la raison de se priver du logiciel de Microsoft (ou de tout autre tableur quivalent).
Sur http://independent.academia.edu/EricLoonis/Teaching-Documents tlchargez le fichier Fichier archive de donnes Stats pour les nuls (Data.pdf). Changez son extension en zip (Data.zip) et dcompressez-le pour obtenir Data.xls et les fichiers SPSS .sav de ltude fictive.
13

41 Stats pour les nuls les statistiques par lexemple

3.2. Le dossier Excel


3.2.1. Prparation dExcel
Excel de Microsoft est un tableur14. Vous devez dj en connatre les rudiments, car nous nallons pas vous apprendre ici vous en servir, mais simplement amliorer son utilisation. La premire chose faire, si ce nest dj fait, est dajouter quelques boutons de commande aux barres doutils, afin de faciliter les travaux ultrieurs. En effet, bien quil soit possible de saisir des donnes directement dans le logiciel de statistiques SPSS, en passant dabord par Excel, on se simplifie grandement la tche, ceci grce aux fonctions et macro-commandes performantes de ce logiciel. Examinons les barres doutils telles quelles devraient tre.

Ces barres doutils comportent de nouveaux boutons (encadrs en rouge) que vous allez apprendre installer sur votre application personnelle (dautres boutons peuvent aussi vous surprendre, mais nous vous laissons libre de les dcouvrir par vous-mmes). Ces nouveaux boutons indispensables sont : Bouton pour crer une nouvelle feuille Excel Bouton pour coller seulement la valeur des cellules Bouton pour copier vers la droite Bouton pour copier vers le bas Boutons pour insertion-retrait lignes et colonnes Bouton pour mettre-enlever le volet

Pour ajouter ces boutons vos barres doutils, suivez les instructions suivantes. Allez au Menu <Outils><Personnaliser> et dans la fentre qui souvre cliquez sur longlet <Commande>, ce qui donne ceci :
Cette section ne concerne quExcel jusqu la version 2007, o lergonomie est encore souple et intelligente. Au-del, versions 2010 et suivantes, lauteur ne peut que compatir avec votre malheur.
14

42 Stats pour les nuls les statistiques par lexemple

Puis, slectionnez gauche les Catgories de commandes pour choisir droite les boutons insrer. Par exemple, slectionnez loption Edition dans la cellule Catgories gauche et descendez un peu lascenseur de la cellule Commandes droite, pour voir quelques-uns des boutons recherchs ( Coller une valeur , En bas , A droite ).

Pour placer un bouton dans une barre doutils, il suffit de le slectionner et draguer avec la souris jusqu lemplacement voulu (pour retirer un bouton dune barre, cest linverse, slectionner draguer hors de la barre le bouton, il disparat). Faites cette opration afin dinstaller les 9 nouveaux boutons utiles pour nos travaux ultrieurs. Maintenant, vous tes prt pour ouvrir et examiner le dossier Excel Data.xls qui contient les donnes de ltude fictive. Cette tude va vous permettre de bien comprendre tout le processus de

43 Stats pour les nuls les statistiques par lexemple

traitement des donnes numrique dans le cadre de la recherche scientifique. Data.xls est aussi un modle du dossier Excel que vous devrez laborer un jour avec vos propres donnes. Cependant, dans un premier temps, vous allez refermer Data.xls et partir dun dossier Excel vide. Le but est dapprendre construire un fichier de donnes, ce qui vous servira ensuite pour votre propre recherche, avec vos propres donnes.

3.2.2. Dossier Excel : la feuille principale


Avant tout chose, dans le dossier vide crez quatre feuilles (si elles ny sont pas dj), laide du bouton appropri. En double-cliquant en bas sur longlet de chaque feuille vous pouvez les renommer. De gauche droite les feuilles sappellent : Principale , HAD , Test-retest-1 et Test-retest-2 .

Positionnez-vous dans la feuille appele Principale . En statistique, la prsentation des tableaux de donnes se fait avec les variables en colonnes et les sujets en lignes. Premire opration, crez la colonne numero , elle permet didentifier chacun de vos sujets par un numro unique. Cela ne sert pas prcisment pour la statistique, mais pour prparer le fichier Excel et pour viter les confusions de donnes entre sujets (le numro doit tre report sur tous les documents, questionnaires, tests, qui concernent chaque sujet). Colonne A, ligne 1, entrez lintitul de colonne numero (Important : pour les intituls de colonne, ne donnait SPSS que des noms de 8 caractres maximum, sans lettres accentue, sans majuscules, sans point (.) ni tiret (-), sans caractres spciaux, juste lettres et chiffres). Dans la case en dessous entrez la formule Excel =ligne( et cliquez sur la premire cellule colonne B, B1 sinscrit entre les parenthses. Appuyez sur la touche clavier <Entre>. Le chiffre 1 sinscrit dans la cellule A2 et la parenthse fermante est automatiquement ajoute. Cliquez sur cette cellule : vous y voyez la formule =LIGNE(B1) . Cette formule donne tout simplement le numro de ligne de la cellule B1.

44 Stats pour les nuls les statistiques par lexemple

Slectionnez la souris la cellule A2 et en maintenant enfonc le bouton gauche de la souris, descendez vers le bas jusqu A20, par exemple.

Puis, cliquez dans la barre doutils sur le bouton copier vers le bas . La formule se reproduit de cellule en cellule, ce qui donne une numrotation croissante automatique.

Maintenant que vous avez compris, faites la mme opration de A20 jusqu A41 afin davoir les numros des 40 sujets de ltude fictive (un sujet par ligne). Maintenant, vous devez remplacer chaque formule =LIGNE(Bn) par sa valeur numrique (cest-dire supprimer les formules =LIGNE(Bn) ). Pour cela slectionnez les 40 cellules de A2 A41 et faites au clavier <Ctrl><C> (ou allez au menu <Edition><Copier>). Vous venez de mettre en mmoire tampon de lordinateur la valeur de toutes les cellules slectionnes. Sans dslectionner les cellules, cliquez maintenant dans la barre doutils sur le bouton Coller valeurs . Ce bouton colle dans les cellules, non pas les formules mises en mmoire tampon, mais leur valeur, de sorte que vous vous retrouvez avec simplement des nombres (ce qui fera plaisir

45 Stats pour les nuls les statistiques par lexemple

SPSS). Vrifiez-le, cliquez dans lune quelconque cellule de la colonne A, la formule a disparue, vous ne voyez plus que sa valeur. Crez prsent les intituls des autres colonnes, pour les autres variables, en commenant par les variables descriptives et en terminant par les VD. groupe (variable groupe Exprimental-Contrle) sexe (variable sexe Homme-Femme) age (variable ge) nivetude (variable niveau dtudes) csp (variable catgorie socioprofessionnelle) hadanxi1 (variable HAD anxit test) haddepr1 (variable HAD dpression test) hadanxi2 (variable HAD anxit retest) haddepr2 (variable HAD dpression retest)

Vous remarquerez que nous respectons toujours la syntaxe SPSS pour le nom des variables. De plus, notez que nous vous conseillons dutiliser la syntaxe suivante en ce qui concerne les VD : dabord les initiales de linstrument (had), puis les premires lettres du facteur concern (anxi), jusqu la limite de 8 caractres. Comme nous lavons fait, vous pouvez aussi intgrer un chiffre indiquant test ou retest (1 ou 2). Ce qui donne : had + anxi + 1 = hadanxi1 . Cette faon de faire (voir la liste ci-dessus) permettra de ne pas vous tromper une fois sur SPSS (pour mmoire, prenez note sur papier ou dans un fichier texte de la signification de ce codage, par exemple : hadanxi1 = HAD anxit test , hadanxi2 = HAD anxit retest , etc.). La saisie des donnes Si vous travaillez avec ltude fictive vous pouvez saisir les donnes simplement en copiantcollant les donnes, partir de Data.xls , dans votre dossier vide (qui commence se remplir). Dossier que pouvez dailleurs sauvegarder (nommez-le par exemple MonData.xls ). Si vous voulez vous lancer avec vos propres donnes dtude, vous pouvez commencer les saisir dans la feuille Principale , au moins en ce qui concerne les variables descriptives (organismiques et dmographiques). Un conseil pratique important : nattendez pas le dernier moment pour saisir vos donnes de recherche, la fin, dun coup. Pourquoi ? Parce quun tel travail devient vite fastidieux, pnible, ce qui peut occasionner des erreurs. De plus, la fin de votre recherche, vous aurez besoin de toute votre nergie pour les analyses statistiques et rdiger le mmoire. Aussi, nous vous conseillons de saisir vos donnes au fur et mesure des valuations effectues. Durant quelques semaines ou mois, vous entrerez chaque jour les donnes dun ou deux sujets et pour vous leffort ainsi tal sera imperceptible. Ne vous proccupez pas de lappartenance de groupe des sujets, entrez-les ligne par ligne comme ils viennent, nous verrons quExcel pourra trs facilement faire un tri sur la colonne groupe .

46 Stats pour les nuls les statistiques par lexemple

Lutilisation du volet horizontal : il sagit de bloquer lcran la premire ligne, celle qui porte le nom des variables. Cette opration vous permettra, en saisissant vos donnes, de dpasser le bas dcran tout en conservant la visibilit de lintitul des colonnes. Pour cela, cliquez sur la poignet juste au-dessus de lascenseur droite (carr rouge) ; puis, en maintenant le bouton gauche de la souris enfonc, draguez la poignet vers le bas, juste sous la ligne 1, vous obtenez une grosse ligne de sparation (rectangle rouge) ; enfin, cliquez dans la barre doutils sur le bouton Verrouiller les volets , il ne reste plus quune fine ligne noire (rectangle rouge).

Le codage des variables qualitatives-catgorielles Bien que SPSS puisse raliser certains calculs avec les valeurs alphabtiques des variables catgorielles (par exemple, avec les valeurs Homme et Femme ), il est prfrable de coder ces valeurs de faon numrique pour faciliter votre saisie. Pour cela, vous devez tablir un codage, qui est libre et arbitraire, mais que vous devez consigner sur une feuille de papier ou dans un fichier texte, pour mmoire, afin de ne pas vous embrouiller une fois sur SPSS. Le codage que nous vous proposons est le suivant (nota : tout ceci est arbitraire, nous aurions pu prendre, par exemple, groupe Exprimental = 0 et groupe de Contrle = 5). groupe (1 = Exprimental, 2 = Contrle) sexe (1 = Homme, 2 = Femme) nivetude (1 = Primaire, 2 = Collge, 3 = Lyce, 4 = Universit) csp (1 = Cadre, 2 = Employ, 3 = Ouvrier, 8 = Chmeur)

Nota : nous sommes dans un contexte fictif et les valeurs attribues sont fantaisistes (niveau dtudes et CSP). Pour votre tude personnelle, rfrez-vous aux valeurs officielles. Les autres variables (ge et VD) sont quantitatives et continues, on entre simplement les ges et les scores obtenus aux instruments (vous pourriez envisager de transformer lge en variable catgorielle ordinale, avec des tranches dge, mais condition davoir un trs grand nombre de sujets et quil y ait un intrt le faire, et pour ltude et pour la problmatique). En rsum Un tableau de donnes devrait comporter, de gauche droite, les lments suivants (voir image ciaprs, correspondant la feuille Principale du dossier dtude fictive Data.xls) :

47 Stats pour les nuls les statistiques par lexemple

En jaune : la variable didentification avec un numro, variable qui ne sert pas vraiment pour lanalyse statistique, mais pour le reprage et lindividualisation des sujets (contrler la saisie, par exemple) et ainsi construire correctement le tableau des donnes. La colonne numro permet aussi dappliquer un tri sur dautres variables (groupe, ge, sexe, valeurs croissantes dune VD, etc.) puis ultrieurement de retrouver lordre initial en appliquant le tri sur la variable numro). En vert : il sagit de la variable indpendante (VI) principale de rpartition des sujets en groupes, variable explicative principale, toujours qualitative, elle explique dans les hypothses les valeurs obtenues aux VD (vous pouvez aussi insrer sur la droite, dautres colonnes de groupes, afin de tester dautres modes de regroupement des sujets).

48 Stats pour les nuls les statistiques par lexemple

En bleu : les variables descriptives, qui sont des variables indpendantes secondaires ou parasites. Certaines sont qualitatives, comme le niveau dtudes, la CSP, dautres peuvent tre quantitatives, comme lge, le nombre de sevrages antrieurs, le nombre denfants. Ce sont ces variables dont il faut vrifier quelles sont quivalentes entre les groupes, afin de respecter le toutes choses gales par ailleurs , cest--dire que ces variables naffectent pas les VD. En orange : il sagit des variables dpendantes (VD), qui sont gnralement quantitatives. Cest la rponse des sujets aux instruments de mesure (questionnaires, tests, preuves et tches selon le dispositif exprimental mis en place). Parfois, ces variables peuvent tre qualitativescatgorielles, par exemple : vous transformez les scores continus lchelle de dpression en catgories ordinales (1 = pas de dpression, 2 = dpression lgre, 3 = dpression, 4 = dpression grave). Cependant, vous devez savoir que ces catgories, si elles sont pertinentes dans une vise clinique (pour comparer un individu une population de rfrence et poser ainsi un diagnostic), ne sont pas du tout pertinentes pour la recherche. En effet, vous allez ainsi perdre de linformation, car vous passez dune fine variation continue de grossires catgories qui regroupent, par exemple, tous les sujets qui ont eu un score entre 12 et 15.

Nota : les couleurs sont ici pour la dmonstration, vous navez pas en mettre dans votre fichier Excel, il ny en a pas dans le fichier Data.xls . Et de toute faon, Excel tout comme SPSS sont aveugle aux couleurs !

3.2.3. Dossier Excel : la feuille HAD


Lorsque le score total dun questionnaire se calcule simplement en additionnant le nombre de fois que le sujet rpondu Oui , il reste facile de dpouiller un grand nombre de questionnaires. Par contre, si les sujets rpondent une chelle 4 niveaux, si certains items sont inverss (il faut alors inverser le score litem : 0 devient 3, 1 devient 2, 2 devient 1 et 3 devient 0) et si, de plus, il vous faut calculer des sous-scores correspondants autant de facteurs, le travail devient trs vite fastidieux et source derreurs. Avec Excel vous pouvez grandement vous simplifier la tche en lui demandant de faire les inversions de valeurs et les calculs pour vous. Ce que vous allez faire dans cette seconde feuille HAD , du dossier Excel. La HAD (Hospital Anxiety Depression scale Echelle hospitalire danxit et de dpression) comporte 14 items que le sujet est invit coter entre 0 et 3 selon son prouv au cours de la semaine qui vient de scouler . Sept items concernent lanxit et 7 la dpression. Les items sont alterns : anxit, dpression, anxit, etc. Certains items sont inverss dans leur formulation : il faut inverser leur valeur comme cela est expliqu dans lexemple au paragraphe prcdent ( la HAD, litem 4 de lanxit est invers, ainsi que les items 1, 2, 3, 6 et 7 la dpression). Pour construire une feuille Excel capable de tout calculer votre place sans erreur ( condition vousmmes de ne pas faire derreur de saisie), voici la procdure. 1) Copiez-collez les deux colonnes numero et groupe de la feuille Principale, vers la feuille HAD. Ainsi, les deux premires colonnes de la feuille HAD , en partant de la gauche, sont numero et groupe . Ensuite, tapez lintitul des deux colonnes suivantes, pour les rsultats au test HAD : lanxit ( hadanxi ) et la dpression ( haddepr ). Laissez la colonne suivante

49 Stats pour les nuls les statistiques par lexemple

vide, rduisez quelque peu sa largeur et donnez-lui une couleur de fond, cela afin de bien sparer visuellement les colonnes de rsultats et celles des items qui vont venir. En effet, la suite vous entrez, toujours sur la premire ligne, les intituls des items : a1 (= item 1 de lanxit), d1 (= item 1de la dpression), a2 (= item 2 de lanxit), et ainsi de suite, jusquaux items a7 et d7. Faites alors une nouvelle colonne vide et colore comme sparation. Les 6 colonnes suivantes concernent les formules dinversion ditems. Pour lanxit, il faut inverser le score litem 4, vous intitulez la colonne inva4 . Pour la dpression, il sagit des items 1, 2, 3, 6 et 7, ce qui donne : invd1 , invd2 , invd3 , invd6 , invd7 . Maintenant, cliquez sur la cellule situe juste sous lintitul de la colonne inva4 et tapez (sans faire derreur) la formule conditionnelle suivante : =SI(L2=3;0;SI(L2=2;1;SI(L2=1;2;3))) puis tapez touche <Entre> (vous pouvez aussi copier-coller la formule ci-dessus, mais dans Excel, il vous faudra faire un collage spcial : menu <Edition><Collage spcial>, choisissez le format Texte). Comment comprendre cette formule Excel ? Dabord L2 : si vous allez sur la gauche de la feuille, colonne L2, vous verrez quelle correspond litem a4 (item 4 de lanxit, celui quil faut inverser). Pour lire la formule, vous dites en alternance alors et sinon chaque point-virgule, ce qui donne : si L2 = 3 alors L2 = 0 sinon si L2 = 2 alors L2 = 1 sinon si L2 = 1 alors L2 = 2 sinon L2 = 3, fastoche ! Une fois cette premire formule crite, slectionnez la cellule qui la contient et en maintenant le bouton de la souris press, draguez vers la droite de la cellule U2 Z2, puis, cliquez dans la barre . Il ne vous reste plus qu modifier la cellule de doutils le bouton Copier vers la droite rfrence pour chacune des formules. Pour invd1, la cellule tester est G2, pour invd2 cest I2, pour invd3 cest K2, pour invd6 cest Q2 et pour invd7 cest S2. Maintenant que les items inverss ont t pris en compte, il vous reste tablir les formules permettant dadditionner les points lanxit et la dpression. Pour cela, vous allez additionner les scores des items positifs et, lorsquun item est invers, prendre le score invers. Pour lanxit, la formule crire dans la cellule C2 est : =SOMME(F2;H2;J2;U2;N2;P2;R2) pour la dpression, cellule D2 est : =SOMME(V2;W2;X2;M2;O2;Y2;Z2) Les formules sexpliquent ainsi : il sagit dune formule Excel qui ralise la somme des valeurs des cellules places entre les parenthses, chaque cellule tant suivie dun point virgule. Pour raliser

50 Stats pour les nuls les statistiques par lexemple

cela, en prenant lexemple du score total lanxit, il suffit dentrer la formule de base dans la cellule C2 : =SOMME(), de placer le curseur entre les parenthses, puis de cliquer sur la premire cellule additionner, qui est F2 (correspondant litem a1), F2 sinscrit automatiquement entre les parenthses. Ensuite, maintenez enfonce la touche du clavier Contrle (<Ctrl>, en bas gauche du clavier) et cliquez sur les cellules suivantes, une une : H2 pour litem a2, J2 pour litem a3, attention U2 pour litem a4 sous sa forme inverse soit inva4, N2, P2 et R2 pour les trois derniers items de lanxit, relchez la touche <Ctrl> et tapez sur la touche <Entre>. Mme opration, en choisissant les cellules appropries, pour le score total de dpression en cellule D2. A prsent, la premire ligne de formules est fonctionnelle, ce qui veut dire que si vous entriez les 14 cotations dun sujet la HAD, sur la premire ligne sous les intituls, entre a1 et d7, vous obtiendriez au niveau de hadanxi et haddepr , les scores danxit et de dpression. Pour prparer de la mme faon les lignes pour les 39 autres sujets, il vous suffit de slectionner la deuxime ligne de la colonne F la colonne Z, puis tout en gardant press le bouton de la souris, de draguer vers le bas jusqu la ligne 81, enfin de cliquer sur le bouton Copier vers le bas . Pourquoi jusqu la ligne 81 et non 41 ? Tout simplement parce que vous allez placer la suite les 40 lignes pour le test des 40 sujets de 2 41, groupe Exprimental = 1 et groupe Contrle = 2 et les 40 lignes pour le restest des mmes 40 sujets de 42 81, groupe Exprimental = 11 et groupe Contrle = 22. Dernire opration, tout comme pour la feuille Principale , vous allez placer un volet horizontal juste sous la premire ligne des intituls (voir la page prcdente), ainsi quun volet vertical en procdant ainsi : allez en bas droite de lcran, juste langle des ascenseurs vertical et horizontal vous avez une poignet (rectangle rouge) ; vous cliquez dessus et en gardant press le bouton de la souris, vous draguez vers la gauche (rectangle rouge), vous draguez ainsi jusqu la colonne E, celle qui a le fond color (rectangle rouge), enfin vous cliquez sur le bouton Verrouiller les volets de la barre doutils, vous obtenez une fine ligne noire de sparation (rectangle rouge).

La page de saisie et calcul des scores la HAD est enfin prte, il ne vous reste plus qu entrer les cotations de vos sujets. Ctait un exemple, un modle, et cet exemple doit vous guider pour raliser pour vous toutes les pages de dpouillement ncessaires selon les questionnaires, chelles, que vous utiliserez lavenir. La fabrication dune telle page de dpouillement prend un peu de temps, mais lusage, si vous devez dpouiller 50 protocoles, vous vous y retrouverez rapidement et surtout, quelle tranquillit car, sauf vous tromper dans la saisie des cotations de vos sujets, si vos formules sont exactes, lordinateur ne fera aucune erreur de calcul et vous donnera immdiatement les rsultats (pour en avoir la preuve : copiez-collez dans votre dossier Excel dexercice, partir du

51 Stats pour les nuls les statistiques par lexemple

dossier Data.xls fourni avec le manuel, les donnes test-retest des sujets la HAD, soit entre les colonnes F et S et les lignes 2 81 feuille HAD naturellement. Ds le collage ralis, vous verrez safficher les rsultats dans les colonnes C et D, hadanxi et haddepr , les scores qui seront utiliss dans SPSS).

3.2.4. Dossier Excel : les feuilles test-retest


Nous esprons que cet entranement la construction de feuilles de calcul Excel vous sera utile pour votre propre tude. A prsent, nous ne pouvons plus avancer sans donnes, aussi, vous allez ouvrir dans lapplication Excel le fichier Data.xls , qui se trouve dans le rpertoire Data du cdrom. Dans ce fichier Data.xls , vous retrouvez les 4 feuilles : Principale , HAD , Test-retest1 , Test-retest-2 . Si vous les examinez, vous verrez quelles contiennent des donnes. Ces donnes fictives sont celles de ltude fictive qui va nous servir dexemple pour utiliser SPSS. Mais avant, vous devez comprendre comment sont organises les feuilles. Dans limage ci-dessous, est reprsent le groupement schmatique des donnes et leur transfert dune feuille lautre (flches bleues) par Copier-coller valeurs (sur ce schma, A = Anxit et D = Dpression, T = Test et RT = Retest et entre parenthses le nombre de sujets, 20 ou 40). Pour la feuille HAD groupe non tri, vous reconnaissez les 40 test (T), groupes 1 (Exprimental) et 2 (Contrle) mlangs ; et en dessous les 40 retest (RT), groupes 11 (Exprimental) et 22 (Contrle) mlangs.

52 Stats pour les nuls les statistiques par lexemple

A partir de la feuille HAD , vous Copiez-collez valeur 15 sur la feuille Principale (flches bleues partant vers la gauche) les donnes test (colonnes hadanxi1 et haddepr1 ) et ct, les donnes retest (colonnes hadanxi2 et haddepr2 ). Dans limage ci-dessus, vous voyez que la feuille HAD subit une opration de tri sur les groupes. Ce tri est destin sparer les groupes Exprimental test et retest et Contrle test et retest, afin de construire la feuille Test-retest. Pour raliser le tri, vous devez tout dabord slectionner entirement la feuille HAD . Pour cela il suffit de cliquer sur la case situe en haut gauche du tableur, langle de la ligne 1 et de la colonne A (cadre rouge).

Toute la feuille doit alors passer en vido inverse (fond bleu sur limage exemple). Ensuite, vous allez au menu <Donnes><Trier>. Dans la fentre, vous cochez en bas Ligne de titre Oui (ce qui veut dire que le tri se fera partir des intituls de variables sur la premire ligne) et vous choisissez Trier par groupe Croissant , puis bouton <OK>. Avec ce tri, vous obtenez ce qui est reprsent sur le schma plus haut : les uns sous les autres, le test des 20 sujets du groupe Exprimental (1) et du groupe Contrle (2), puis le retest des 20 sujets du groupe Exprimental (11) et du groupe Contrle (22). Vous pouvez alors raliser la feuille Test-retest-1 en Copiant-collant valeurs les donnes tries dans HAD. Pour les besoins de calcul de SPSS, pour les deux groupes ( Exprimental et Contrle ) les donnes test et retest sont ranges les unes sous les autres. Explication : vous avez 20 lignes pour le test du groupe Exprimental ( grexpe = 1) et dessous les 20 lignes pour le retest ( grexpe = 11). Idem pour le groupe de Contrle , test pour grcontr = 2 et retest pour grcontr = 22.

Prsentement et pour la suite, quand nous disons vous copiez-collez etc. cest ce que vous pourriez faire avec votre dossier Excel dexercice. Cependant, vitez de modifier le dossier original Data.xls qui lui est prt tre utilis avec SPSS : vous navez rien copier-coller !!!

15

53 Stats pour les nuls les statistiques par lexemple

Pour raliser la feuille Test-retest-2, le schma est le suivant :

Nous avons fait une copie de la feuille Principale (feuille HAD lcran, menu Excel <Edition><Dplacer ou copier une feuille...>, cochez Crer une copie , slectionnez dans la liste En dernier ). Copie renomme Test-retest-2 (si vous aviez dj une feuille vierge de ce nom, supprimez-l bien entendu). Dans cette nouvelle feuille, nous avons retir les colonnes des variables descriptives ( laide du bouton <Supprimer les colonnes> de la barre doutils). Puis, nous avons appliqu un tri sur la variable Groupe , ce qui nous a permis de sparer groupe Exprimental (1) de groupe Contrle (2). Nous renommons les intituls de variables ainsi : Pour le groupe Exprimental grexpe avec hadanxi1 et haddepr1 au test et hadanxi2 et haddepr2 au retest. Pour le groupe Contrle grcontr avec hadanxi3 et haddepr3 au test et hadanxi4 et haddepr4 au retest.

Retenez ainsi que, selon les calculs statistiques envisags, SPSS a besoin quon lui place les donnes dans des colonnes diffrentes, ou bien dans les mmes colonnes, les unes sous les autres. Il est temps, maintenant, de passer SPSS.

3.3. Prparation de SPSS


Avant toute chose, assurez-vous que vous tes bien en possession du dossier Excel Data.xls original, non modifi et qui contient les donnes fictives, saisies et organises en prvision du traitement statistique. Mais avant de vous lancer dans ce traitement statistique, il vous faut comprendre et prparer SPSS. SPSS est un logiciel de statistiques scientifiques performant. Avec ce prsent manuel, nous nutiliserons quune petite partie de ses possibilits. Vous devez avoir install SPSS sur votre

54 Stats pour les nuls les statistiques par lexemple

machine et vous avez 14 jours pour lutiliser (logiciel de dmonstration usage limit dans le temps). Ouvrez SPSS pour lexaminer16. A premire vue, vous vous retrouvez comme dans Excel, cest un tableur.

Il y a un menu, une barre doutils avec ses boutons, des lignes numrots (on placera un sujet par ligne, comme dans Excel) et des colonnes pour les variables (dailleurs, len-tte des colonnes sappelle dj var ). Maintenant, si vous regardez en bas gauche de la fentre SPSS, vous verrez deux onglets : <Affichage des donnes> et <Affichage des variables>.

Vous tes actuellement dans longlet Affichage des donnes , cest la partie tableur de SPSS, qui permet de voir les donnes. En cliquant sur longlet <Affichage des variables>, vous pourrez
Attention : si vous avez la version gratuite de SPSS fournie par lditeur du logiciel, cette version tant limite 14 jours, le compte rebours dutilisation dmarrera ds linstallation du logiciel. Donc, attendez le dernier moment pour linstaller, lorsque vous avez saisi toutes vos donnes dans votre data.xls (fichier Excel).
16

55 Stats pour les nuls les statistiques par lexemple

voir et surtout modifier les caractristiques de chaque variable. Ici, les variables sont en ligne et leurs caractristiques (ce sont les variables des variables en quelques sortes) sont en colonnes.

Il y a 10 caractristiques de variables, qui sont : Nom : le nom de la variable. Type : le type de la variable (de numrique chane de caractres). Largeur : le nombre de caractres pour la donne. Dcimales : le nombre de dcimales pour une variable numrique. Etiquette : le titre de la variable (diffrent du nom car plus explicite). Valeurs : les noms des niveaux de la variable qualitative (par exemple : 1 = Homme, 2 = Femme). Manquant : paramtrer les variables dont des donnes peuvent manquer. Colonnes : la largeur de la colonne du tableur. Align : lalignement laffichage ct tableur. Mesure : sous-type de variable (chelle, nominal, ordinal). Rle : non utilis dans le cadre de ce prsent manuel de statistiques.

La plupart des caractristiques sont rgles automatiquement par SPSS lorsquil ouvre un fichier Excel (oui, cest ce qui va bientt arriver !). Nous verrons que seules, vont nous intresser, les trois caractristiques en gras ( Etiquette , Valeurs et Mesure ).

56 Stats pour les nuls les statistiques par lexemple

Avant de commencer travailler avec SPSS, vous devez rgler certains paramtres. Pour cela vous cliquez nouveau dans le menu <Edition><Options>, ce qui vous donne la fentre suivante.

Vous pouvez explorer un peu les diffrents onglets de cette fentre. Il sagit ici de paramtrer le logiciel SPSS, pour lui donner certaines caractristiques de fonctionnement ou dapparence. En faisant des essais (allez-y, vous ne risquez rien dessayer !) vous pourrez, par exemple, en allant sur longlet <Rsultats>, dterminer les polices de caractre employer pour afficher les rsultats des calculs. Ce quil est important de rgler est le type daffichage des tableaux de rsultats. En effet, vous verrez bientt que SPSS, dans sa magnifique toute-puissance, en deux-trois clics de souris, fait les calculs statistiques demands et les affiche aussitt. En science, il existe un format daffichage pour les tableaux, dit acadmique , qui consiste ne tracer que les lignes horizontales (ouvrez une revue scientifique, vous verrez de quoi il sagit). Pour programmer ce format, cliquez sur longlet <Tableaux pivotants> pour obtenir ceci :

57 Stats pour les nuls les statistiques par lexemple

Dans la liste Modle de tableaux choisissez le modle Academic . Cliquez sur le bouton <OK>, SPSS est prt (nota : vous avez certainement remarqu que chaque fois que vous validez une modification doption, SPSS ouvre une fentre Rsultats . Vous pouvez chaque fois fermer cette fentre qui ne fait que vous donner un message sur lopration accomplie et confirmer que vous ne voulez pas Enregistrer le contenu du Viewer en cliquant sur <Non>. Cest cette fentre Rsultats (le Viewer en Anglais), qui souvrira aussi pour vous donner les rsultats des calculs statistiques de SPSS).

3.4. Cration des fichiers SPSS


A partir du fichier de base Data.xls (dExcel) vous allez crer trois fichiers au format .sav pour SPSS. Pour cela, vous ouvrez SPSS (si ce nest dj fait). Ensuite, vous cliquez menu <Fichier><Ouvrir><Donnes>, ou plus simplement, vous cliquez sur le bouton Ouvrir un

58 Stats pour les nuls les statistiques par lexemple

document de donnes dessous :

de la barre doutil. Vous obtenez la fentre Ouvrir les donnes ci-

Dans cette fentre, slectionnez le type de fichier Excel (.xls) et, bien sr, allez dans le rpertoire o vous avez plac le fichier Data.xls et ouvrez-le. Cration de Principale.sav Vous passez par une petite fentre qui vous permet de choisir la feuille du dossier Excel (qui en contient plusieurs, comme vous savez) que vous voulez.

59 Stats pour les nuls les statistiques par lexemple

Slectionnez la feuille Principale et cliquez <OK>. Dans <Affichage des variables> vous voyez le nom des 10 variables dans la colonne Nom : numero ; groupe ; sexe ; age ; nivetude ; csp ; hadanxi1 ; haddepr1 ; hadanxi2 ; haddepr2. Dans <Affichage des donnes>, vous allez retrouver toutes les donnes, avec en ttes de colonnes les noms de variables, comme dans Excel. Vous pouvez sauvegarder maintenant au format .sav (format des fichiers SPSS) en cliquant sur le bouton Enregistrer ce document de la barre doutils. Donnez un nom ce fichier dentranement, par exemple Principale.sav , en lenregistrant sur votre disque dur. Maintenant, cliquez nouveau sur longlet <Affichage des variables>. Les variables sont en lignes, leurs caractristiques en colonnes. Seules trois caractristiques sont intressantes modifier : Etiquette , Valeurs et Mesure . En renseignant Etiquette et Valeurs , au moment de laffichage des rsultats des calculs faits par SPSS, vous verrez explicitement les noms des variables et de leurs niveaux. Par exemple, fini nivetude , niveaux 1, 2, 3 et 4, vous allez pouvoir paramtrer Niveau dtudes : Primaire , Collge , Lyce , Universit et toutes ces informations seront clairement mentionnes dans les tableaux de rsultats. Pour Etiquette (intitul complet des variables), il suffit de cliquer chaque fois sur la cellule de la colonne Etiquette et de saisir le nom. Par exemple : Pour numero : Numro Pour groupe : Groupe Pour sexe : Sexe Pour age : Age Pour nivetude : Niveau dtudes Pour csp : Catgorie socioprofessionnelle Pour hadanxi1 : HAD anxit test S1 Pour haddepr1 : HAD dpression test S1 Pour hadanxi2 : HAD anxit retest S8 Pour haddepr2 : HAD dpression retest S8

Nota : pour crire dans une cellule il suffit de la slectionner et de saisir votre texte. Mais pour modifier ce que vous avez crit ou faire un copier-coller dans la cellule vous devez dabord faire un double-clic dessus pour la mettre en mode dition. Notez les dtails esthtiques : majuscules, lettres accentues, pour que ce soit bien fait. A prsent, passons aux noms des niveaux dans la colonne Valeurs . Ces noms des niveaux des variables nintressent, bien videmment, que les variables catgorielles : le Groupe , le Sexe , le Niveau dtudes et la Catgorie socioprofessionnelle . Pour faire cela, vous devez tenir compte du codage des niveaux choisi au moment de la saisie des donnes (si vous aviez choisi 1 = Homme et 2 = Femme, vous devez reprendre ce codage et non un autre ! Voir le chapitre Dossier

60 Stats pour les nuls les statistiques par lexemple

Excel : la feuille Principale au Codage des variables/Le codage des variables qualitativescatgorielles ). Commenons par la variable Sexe . Dans la colonne Valeurs , sur la ligne Sexe , cliquez sur la partie droite de la cellule marque Aucun .

Vous obtenez la fentre ci-dessous :

Dans la cellule Valeur entrez : 1, et dans la cellule Etiquette entrez : Homme, comme cidessous :

61 Stats pour les nuls les statistiques par lexemple

Puis cliquez sur le bouton <Ajouter>. Vous obtenez ce qui suit :

Faites de mme pour Valeur : 2, et Etiquette : Femme.

Cliquez sur <Ajouter> et vous obtenez ceci :

62 Stats pour les nuls les statistiques par lexemple

Il ne vous reste plus qu cliquer sur <OK>. Vous venez de nommer les deux niveaux de la variable Sexe . Il ne vous reste plus qu procder de la mme faon pour les autres variables qualitatives. Notez quen slectionnant les correspondances Valeur et Etiquette ainsi cres, vous pouvez aisment les supprimer ou les modifier. Rappel du codage des variables catgorielles groupe (1 = Exprimental, 2 = Contrle) sexe (1 = Homme, 2 = Femme) nivetude (1 = Primaire, 2 = Collge, 3 = Lyce, 4 = Universit) csp (1 = Cadre, 2 = Employ, 3 = Ouvrier, 8 = Chmeur)

La dernire opration va porter sur la caractristique Mesure et ne concerne, ici aussi, que les variables catgorielles. Pour chacune dentre elles ( Groupe , Sexe , Niveau dtudes , Catgorie socioprofessionnelle ), vous cliquez sur la partie droite de la cellule correspondante marque Echelle et vous choisissez Nominales , car il sagit de variables nominales ( Echelle concerne donc les variables numriques et Ordinales des variables ordinales). Marquez les autres variables avec Echelle . Au final, longlet <Affichage des variables> doit donner ceci :

63 Stats pour les nuls les statistiques par lexemple

Notez bien que dans la colonne Type , toutes les variables sont numriques. Ce qui est vrai, car le fichier Excel au dpart, ne contient que des chiffres (par exemple, pour une variable catgorielle/nominale comme sexe , les valeurs numriques sont 1 ou 2). Par contre, pour certaines variables, vous venez de les transformer de numrique , en catgoriel et nominal , en donnant une valeur nominale (Homme, Femme), la place de 1 et 2. Notez cependant, que ds le dossier Excel vous auriez pu saisir Homme ou Femme au lieu de 1 ou 2, car SPSS est tout fait capable de faire des calculs statistiques sur de telles tiquettes. Mais on ne procde pas ainsi, car il est plus facile et rapide, au moment de lenregistrement des donnes dans Excel de taper, par exemple, 1 ou 2 , plutt que Homme ou Femme . Si vous avez une population de 50, 100 ou davantage de sujets, vous comprendrez vite pourquoi lenregistrement dans Excel doit tre de prfrence numrique Vous avez termin, sauvez une dernire fois votre fichier SPSS Principale.sav et passons au second fichier. Cration de Test-retest-1.sav Recommencez ouvrir le dossier Data.xls . Cette fois vous allez choisir la feuille Excel Testretest 1 .

Vous reconnaissez les mmes dispositions que prcdemment, il ne vous reste plus qu accomplir les mmes oprations. Les tiquettes des variables sont ici : Pour grexpe : Groupe Exprimental test-retest Pour anxiexpe : Anxit test-retest (Ex) Pour deprexpe : Dpression test-retest (Ex) Pour grcontr : Groupe Contrle test-retest Pour anxcontr : Anxit test-retest (Co)

64 Stats pour les nuls les statistiques par lexemple

Pour depcontr : Dpression test-retest (Co)

Les noms des niveaux des variables qualitatives ne concernent ici que les Groupes. Pour le groupe Exprimental on a : 1 = test et 11 = retest. Pour le groupe Contrle on a : 2 = test et 22 = retest. Colonne Mesure , donnez la valeur Nominales aux deux variables de groupe. Donnez la valeur Echelle aux autres variables. Sauvez ce nouveau fichier SPSS (par exemple, sous le nom trs original de : Test-retest-1.sav).

Cration de Test-retest-2.sav Recommencez ouvrir le dossier Data.xls . Cette fois vous allez choisir la feuille Excel Testretest 2 .

Aprs avoir ouvert Data.xls et choisi la feuille Test-retest 2 . Les tiquettes attribuer aux variables sont les suivantes : Pour numero1 : Numro (Ex) Pour grexpe : Groupe Exprimental Pour hadanxi1 : Anxit Test (Ex) Pour haddepr1 : Dpression Test (Ex) Pour hadanxi2 : Anxit Retest (Ex)

65 Stats pour les nuls les statistiques par lexemple

Pour haddepr2 : Dpression Retest (Ex) Pour numero2 : Numro (Co) Pour grcontr : Groupe Contrle Pour hadanxi3 : Anxit Test (Co) Pour haddepr3 : Dpression Test (Co) Pour hadanxi4 : Anxit Retest (Co) Pour haddepr4 : Dpression Retest (Co)

Par ailleurs, vous navez aucun paramtrage de variable qualitative faire, puisque de telles variables nexistent pas ici ( grexpe et grcontr ne sont pas des variables car, justement, leur valeur ne varie pas voir dans longlet <Affichage des donnes>). Donc, dans la colonne Mesure attribuez la valeur Echelle toutes les variables. Au final, longlet <Affichage des variables> doit donner ceci :

Sauvez ce nouveau fichier SPSS (par exemple : Test-retest-2.sav). Les calculs vont pouvoir commencer, enfin ! Nota : vous vous tonnez peut-tre : Mais on ne fait rien avec la feuille HAD du dossier Excel ? . Allons, il faut suivre ! La feuille HAD ne sert qu traiter, dans Excel, les rponses au test HAD anxit-dpression auquel les sujets ont rpondu. La feuille HAD nest donc pas destine tre traite dans SPSS (dans le cadre de cette tude fictive). En rsum, vous devez avoir dsormais 3 fichiers SPSS (et leur utilisation entre parenthses) : Principale.sav (pour les statistiques descriptives, lquivalence des groupes, leffet des variables descriptives et les statistiques infrentielles). Test-retest-1.sav (pour les statistiques infrentielles). Test-retest-2.sav (pour les statistiques descriptives et les statistiques infrentielles).

66 Stats pour les nuls les statistiques par lexemple

3.5. Les statistiques descriptives


Nous lavons vu au chapitre Faire une recherche / Mthode, un moment donn il est ncessaire de dcrire votre population dtude, de comparer vos groupes, de montrer leur quivalence sur certaines caractristiques et parfois leur diffrence significative sur une variable que vous contrlez. Dcrire de faon statistique cest : indiquer des variables, prsenter leurs effectifs (le nombre de sujets concerns par ces variables), donner des moyennes, les cart types, les valeurs extrmes minimum et maximum. Les statistiques descriptives concernent les variables organismiques (sexe, ge) et dmographiques (niveau dtudes, catgorie socioprofessionnelle, revenue, situation familiale, etc.). Le choix et le nombre de ces variables dpendent du type de recherche, des moyens disponibles, des objectifs de ltude. Pour tous les traitements statistiques vous allez utiliser avec SPSS les 3 fichiers .sav que vous avez crs partir du dossier Excel Data.xls ( Principale.sav , Test-retest-1.sav et Test-retest-2.sav ). Groupe / sexe / ge

Ouvrir dans SPSS le fichier de donnes : Principale.sav


Dcrire votre population selon les groupes qui la subdivisent17, le sexe et lge, est un classique, un incontournable. Sexe et ge sont deux variables organismiques , il peut y en avoir dautres, si ncessaire, comme la race, la couleur de la chevelure ou des yeux, le handicap, le niveau dintelligence, etc. Procdure SPSS : Cliquez au menu : <Analyse><Rapports><Rcapitulatif des observations>, vous obtenez la fentre suivante :

Pour rappel, la variable Groupe est votre VI, cest--dire la variable manipule et explicative, par hypothse, des rsultats aux VD (les rponses aux questionnaires, par exemple).

17

67 Stats pour les nuls les statistiques par lexemple

Nous allons dcrire cette premire fentre de programmation de calculs statistiques. Nous ne le ferons plus par la suite, car toutes les fentres de SPSS, destines programmer des calculs, sont bties, peu ou prou, sur le mme modle. Dans la cellule de gauche vous retrouvez la liste de toutes les variables du fichier SPSS ouvert. A droite, vous avez une ou plusieurs cellules dans lesquelles vous glissez les variables ncessaires aux calculs, ceci en slectionnant la souris la variable choisie gauche et en cliquant sur le bouton flche appropri (le bouton inverse naturellement le dplacement). Ensuite, vous avez divers boutons <Statistiques....>, <Options>, ou autres, selon les fentres, boutons qui permettent de paramtrer les calculs effectuer sur les variables choisies. Ce que vous devez faire prsent : a. Glissez la variable Age dans la cellule Variables (ici lon place la variable quantitative dont on veut prsenter les valeurs). b. Glissez les variables Groupe et Sexe dans la cellule Variable(s) de regroupement (ici lon place les variables qualitatives de groupement sur lesquelles les diffrentes valeurs de la variable quantitatives sont rparties). c. Dcochez Afficher les observations (il est inutile dafficher tous les sujets (les cas) en liste).

68 Stats pour les nuls les statistiques par lexemple

d. Bouton <Options> : dans la petite fentre, entrez le titre du tableau Tableau des caractristiques Groupe/Sexe/Age dans la cellule Titre , puis cliquez bouton <Poursuivre>. e. Bouton <Statistiques> : dans la petite fentre (dont vous pouvez rgler les dimensions), de la cellule Statistiques gauche, glissez dans lordre, dans la cellule Statistiques de cellules droite, les lments suivants : Nombre dobservations (dj prsent droite) Moyenne Ecart-type Minimum Maximum

Puis, cliquez sur le bouton <Poursuivre>, vous venez de commander au menu de SPSS les calculs que vous souhaitez. Au final vous devez obtenir la fentre suivante :

Il ne vous reste plus qu cliquer sur le bouton <OK>, SPSS excutera les calculs demands et affichera les rsultats dans la fentre Rsultats (cette fentre, le SPSS Statistics Viewer, ou Viewer , est tout simplement un programme annexe daffichage, reli SPSS qui lui est un tableur et un calculateur de statistiques , qui souvre dans une seconde fentre et qui est destin afficher les rsultats des calculs). Le rsultat est visible dans le tableau ci-dessous (le premier

69 Stats pour les nuls les statistiques par lexemple

tableau Observation Calculer Rcapituler nest quun tableau de contrle qui vous permet de vrifier que toutes les donnes ont t prises en compte, quil ny a donc pas danomalies dans ces donnes).
Tableau des caractristiques Groupe/Sexe/Age Age Groupe Exprimental Sexe Homme Femme Total Contrle Homme Femme Total Total Homme Femme Total N 12 8 20 8 12 20 20 20 40 Moyenne 34,83 33,50 34,30 34,25 33,58 33,85 34,60 33,55 34,07 Ecart-type 12,231 7,856 10,479 6,541 8,415 7,541 10,122 7,983 9,014 Minimum 21 22 21 26 22 22 21 22 21 Maximum 56 44 56 45 52 52 56 52 56

Les possibilits du Viewer Le Viewer est un programme daffichage complet, qui vous permet dafficher les calculs issus de SPSS, douvrir des fichiers de rsultats au format .spv dj crs et de sauvegarder les rsultats sous ce format .spv. Vous pouvez, dailleurs, tout de suite, sauver le prsent rsultat descriptif en cliquant sur le bouton Enregistrer ce document exemple, le nom Statistiques-descriptives.spv. de la barre doutil, donnez-lui, par

Lorsque vous avez dmarr SPSS avec un fichier de donnes, vous pouvez ouvrir un fichier .spv dj existant, de sorte que les rsultats des prochains calculs se placeront la suite dans ce mme fichier .spv. Le Viewer est spar en deux fentres (dont vous pouvez ajuster la taille) : la fentre de droite o saffichent les rsultats et la fentre de gauche qui prsente larborescence (le menu) des diffrents rsultats et qui vous permet dy accder facilement, comme dans la table des matires dun livre. Vous devez savoir que tout ce que vous voyez affich dans ces deux fentres peut trs facilement tre modifi ou supprim. Il suffit de cliquer une fois sur llment, ensuite en appuyant sur la touche <Suppr> de votre clavier, vous supprimez cet lment. En cliquant une seconde fois sur llment ainsi slectionn, il se met en position ddition, ce qui signifie que vous pouvez le renommer. Cette possibilit de renommer, de modifier le texte, existe aussi dans les tableaux de rsultats : vous double-cliquez sur le tableau, un encadrement apparat, vous double-cliquez alors sur llment concern, par exemple le titre du tableau et vous le modifiez votre guise. Cliquez lextrieur du tableau et le mode dition disparat.

70 Stats pour les nuls les statistiques par lexemple

Dans le fichier Statistiques-descriptives.spv qui vient dtre cr, vous pouvez par exemple supprimer le tableau Observation Calculer Rcapituler : cliquez dessus, touche supprimer et cest fait. Modifiez le titre Rcapituler (en gras) en double-cliquant dessus et saisissez le nouveau titre : Statistiques descriptives . Vous pouvez faire la mme chose dans la partie gauche, afin davoir une table des matires explicite, dans laquelle il est facile de naviguer. Dans cette table des matires, vous pouvez trs facilement, avec la souris, dplacer des lments verticalement ou, pour certains, horizontalement (changement de niveau dans larborescence) en draguant avec la souris. Vous pouvez aussi ouvrir ou fermer cette arborescence, comme dans lexplorateur Windows, en cliquant sur les petits carrs + ou -. Enfin, vous pouvez ajouter tout ce que vous voulez dans votre page de rsultats, en allant au menu <Insrer>. Par exemple, ajouter un titre, un en-tte, du texte, des images... Tout cela peut bien sr tre imprim. Une particularit du Viewer : si vous ne slectionnez aucun lment, tout sera imprim ; par contre, si vous slectionnez un ou plusieurs lments, seuls ces lments slectionns seront imprims. Donc, attention, si vous ne voyez, par exemple, quun titre simprimer, cest tout simplement parce que ce titre est slectionn et que tout le reste est ignor. Pour dslectionner, cliquez simplement lextrieur de tout lment.

Poursuite des statistiques descriptives Remarque : pour le premier calcul, vous tes parti du tableur SPSS. Mais prsent, vous pouvez raliser de nouveaux calculs indiffremment, soit de lditeur de SPSS, le tableur (soit de longlet Affichage des donnes ou Affichage des variables ), soit du Viewer. Cette possibilit est, aussi bien, valable pour les boutons de la barre doutils (toutefois, menus et boutons peuvent tre sensiblement modifis selon lapplication en cours, SPSS ou Viewer). Retenez aussi, que vous pouvez tester et retester tous les calculs que vous voulez, jusqu trouver le bon, car chaque fois, vous pouvez effacer le dernier calcul ralis et recommencer autant de fois que vous le voulez. Donc, un auto-apprentissage par essai erreur est tout fait possible. A ce propos, un truc, le trs pratique bouton Rappeler toutes les botes de dialogue rcemment utilises qui vous permet daccder, en deux clics, lun des 12 derniers calculs raliss. A utiliser sans retenue ! (ce que nous ne manquerons pas de faire dsormais). Nous venons de voir comment produire des statistiques descriptives concernant une variable quantitative (comme lge) par rapport une ou plusieurs variables qualitatives (comme le groupe dappartenance et/ou le sexe). Maintenant, en ce qui concerne les autres variables qualitatives qui dcrivent votre population (niveau dtudes, catgorie socioprofessionnelle, etc.), une autre mthode doit tre utilise pour pouvoir les prsenter, il sagit des Tableaux croiss .

71 Stats pour les nuls les statistiques par lexemple

Procdure SPSS : variable Niveau dtudes Cliquez au menu : <Analyse><Statistiques descriptives><Tableaux croiss>, vous obtenez la fentre suivante :

La faon de procder est toujours la mme (quelques clics de souris) afin de transfrer : a. La variable dcrire ( Niveau dtudes ) dans la cellule Ligne(s): . b. La variable de regroupement ( Sexe ) dans la cellule Colonne(s): . c. La variable de sous-regroupement ( Groupe ) dans la cellule Strate (vous pouvez mettre plusieurs strates, mais la lecture du tableau risque de ne plus tre trs claire...). Ce qui donne ce qui suit :

72 Stats pour les nuls les statistiques par lexemple

Ensuite, au niveau du bouton <Statistiques...>, pour le moment vous ne demandez rien (inutile de le cliquer). Par contre, cliquez sur le bouton <Cellules...> pour slectionner laffichage des pourcentages par Ligne, Position et Total. Cliquez sur <Poursuivre>.

Il ne vous reste plus qu cliquer sur <OK> pour obtenir ceci (vous pouvez changer le titre par : Tableau des caractristiques Groupe / Sexe / Niveau dtudes ) :
Tableau crois Niveau d'tudes * Sexe * Groupe Groupe Sexe Homme Exprimental Niveau d'tudes Primaire Effectif % compris dans Niveau d'tudes % compris dans Sexe % du total Collge Effectif % compris dans Niveau d'tudes % compris dans Sexe % du total Lyce Effectif % compris dans Niveau d'tudes % compris dans Sexe % du total Universit Effectif 83,3% 50,0% 0 37,5% 15,0% 1 65,0% 65,0% 1 8,3% 5,0% 10 76,9% 50,0% 20,0% 3 23,1% 25,0% 25,0% 13 100,0% 8,3% 5,0% 1 20,0% ,0% ,0% 4 80,0% 5,0% 5,0% 5 100,0% 1 100,0% Femme 0 ,0% Total 1 100,0%

73 Stats pour les nuls les statistiques par lexemple

% compris dans Niveau d'tudes % compris dans Sexe % du total Total Effectif % compris dans Niveau d'tudes % compris dans Sexe % du total Contrle Niveau d'tudes Primaire Effectif % compris dans Niveau d'tudes % compris dans Sexe % du total Collge Effectif % compris dans Niveau d'tudes % compris dans Sexe % du total Lyce Effectif % compris dans Niveau d'tudes % compris dans Sexe % du total Universit Effectif % compris dans Niveau d'tudes % compris dans Sexe % du total Total Effectif % compris dans Niveau d'tudes % compris dans Sexe % du total

,0%

100,0%

100,0%

,0% ,0% 12 60,0%

12,5% 5,0% 8 40,0%

5,0% 5,0% 20 100,0%

100,0% 60,0% 1 25,0%

100,0% 40,0% 3 75,0%

100,0% 100,0% 4 100,0%

12,5% 5,0% 3 30,0%

25,0% 15,0% 7 70,0%

20,0% 20,0% 10 100,0%

37,5% 15,0% 3 75,0%

58,3% 35,0% 1 25,0%

50,0% 50,0% 4 100,0%

37,5% 15,0% 1 50,0%

8,3% 5,0% 1 50,0%

20,0% 20,0% 2 100,0%

12,5% 5,0% 8 40,0%

8,3% 5,0% 12 60,0%

10,0% 10,0% 20 100,0%

100,0% 40,0%

100,0% 60,0%

100,0% 100,0%

74 Stats pour les nuls les statistiques par lexemple

Procdure SPSS : variable Catgorie socioprofessionnelle Pour notre dernire variable Catgorie socioprofessionnelle , la procdure est identique. Cliquez maintenant sur le bouton Rappeler toutes les botes de dialogue et choisissez loption Tableaux croiss . Dans la fentre, placez Catgorie socioprofessionnelle au lieu de Niveau dtudes dans la cellule Ligne(s) . Pour changer, nous allons ne considrer que la variable de regroupement Groupe , donc vous retirez (remettre dans la liste gauche) de Colonne(s) la variable Sexe , de Strate la variable Groupe et vous mettez dans Colonne(s) la variable Groupe . Bouton <Cellules...>, vous dcochez les pourcentages (pourquoi pas !). Bouton <OK>, ce qui donne :
Tableau crois Catgorie socioprofessionnelle * Groupe Effectif Groupe Exprimental Catgorie socioprofessionnelle Cadre Employ Ouvrier 8 Total 0 7 9 4 20 Contrle 1 9 6 4 20 Total 1 16 15 8 40

Transferts vers dautres applications Les statistiques descriptives de notre tude fictive sont termines. Vous avez pu constater la fois la simplicit de SPSS, sa souplesse et la grande libert que vous avez pour choisir de faire exactement ce que vous voulez faire. Tout ceci sapplique tous les calculs que nous aborderons plus loin. Se pose prsent la question de la prsentation finale de vos statistiques, cest--dire dans le mmoire ou dans larticle. Ici aussi, le Viewer de SPSS vous autorise plusieurs solutions pratiques et intressantes. Tout dabord, la premire tape commune toutes ces solutions est lopration classique en informatique qui consiste slectionner lobjet que lon veut copier et le mettre en mmoire tampon. Par exemple, vous voulez transfrer dans un fichier .doc de Word (votre mmoire) le tableau intitul Tableau des caractristiques Groupe/Sexe/Age , aprs avoir ouvert lapplication Word, vous fates les oprations suivantes : a. Dans le fichier de Rsultats (le Viewer) Statistiques-descriptives.spv , vous slectionnez (cliquez sur) le tableau en question. b. Ensuite, soit vous allez au menu <Edition><Copier>, soit vous appuyez en mme temps sur les touches <Ctrl+C>, dans les deux cas vous placez le tableau slectionn en mmoire tampon. c. Vous allez dans Word et l vous avez le choix entre :

75 Stats pour les nuls les statistiques par lexemple

faire <Ctrl+V> ou menu <Edition><Coller> pour obtenir un tableau de Word contenant les donnes de rsultats, quil ne vous reste plus qu arranger (taille, police de caractres, etc.). faire menu <Edition><Collage spcial> et choisir loption Image (mtafichier amlior) (les autres options textes sont quivalentes au <Ctrl+V>), vous obtenez une image du tableau parfaitement identique sa version SPSS, sinon que vous ne pouvez plus modifier le tableau, sauf utiliser un logiciel de graphisme, ce qui nest gure pratique pour du texte. Mais cest la solution esthtiquement la plus intressante, si vous tes certain de ne pas devoir modifier les donnes dans le tableau et si vous ne craignez pas dalourdir votre fichier Word par des images

Contrle de la distribution des frquences Nous verrons quun test (lANOVA) ncessite une certaine normalit des variables testes. Questce que cela signifie ? Une variable est dite normale lorsque la distribution de ses frquences suit une courbe... normale. Cela veut dire que si lon considre la frquence (le nombre de fois) quapparaissent chacune des valeurs cette variable, on doit obtenir une tendance centrale, o se regroupent la plupart des individus de lchantillon et peu dindividus aux extrmits (valeurs les plus basse et les plus leves). Aussi, avant de se lancer dans une ANOVA, il vous faut vrifier la normalit de la distribution. Un exemple (presque parfait) ci-dessous :

Aplatissement

Asymtrie

76 Stats pour les nuls les statistiques par lexemple

Ouvrir dans SPSS le fichier de donnes : Test-retest-2.sav


Tout dabord, vous allez ouvrir une nouvelle base de donnes (un nouveau fichier .sav de SPSS), le fichier Test-retest-2.sav, de faon avoir isol dans des variables diffrentes les donnes test et retest pour chacun des groupes. La procdure de contrle de la distribution des frquences consiste : menu <Analyse><Statistiques descriptives><Effectifs>, ce qui ouvre la fentre suivante (noubliez pas que vous pouvez la redimensionner pour mieux voir les tiquettes des variables) :

Glissez toutes les VD (les rsultats des tests que vos sujets ont pass) dans la cellule Variable(s): (un truc : vous slectionnez la variable Anxit Test (Ex) , vous tenez presse la touche <Maj> du clavier et vous cliquez sur Dpression Retest (Co) en fin de liste, ce qui slectionne toutes les variables entre ces deux-l, puis vous retirez Numro (Co) et Groupe Contrle ), ce qui donne :

77 Stats pour les nuls les statistiques par lexemple

Bouton <Statistiques...>, ne cochez que Skewness et Kurtosis , bouton <Poursuivre>. Pensez dcocher, si ncessaire, Afficher les tableaux deffectifs , moins que vous ne vouliez vraiment y jeter un coup dil). Puis, bouton <Diagrammes>, vous choisissez dans la petite fentre loption Histogrammes et vous cochez Avec courbe gaussienne (lhistogramme avec le trac de la courbe normale). Bouton <Poursuivre>. Cest prt, bouton <OK>. En plus des histogrammes, le Viewer de rsultats vous affiche le tableau suivant :
Statistiques Anxit Test (Ex) N Valide Manquante Asymtrie Erreur std. d'asymtrie Aplatissement Erreur std. d'aplatissement 20 0 ,482 ,512 -,584 ,992 Dpression Test (Ex) 20 0 ,025 ,512 -,554 ,992 Anxit Retest (Ex) 20 0 ,511 ,512 -1,228 ,992 Dpression Retest (Ex) 20 0 ,836 ,512 ,229 ,992 Anxit Test (Co) 20 0 -,311 ,512 -1,077 ,992 Dpression Test (Co) 20 0 -,060 ,512 -,278 ,992 Anxit Dpression

Retest (Co) Retest (Co) 20 0 -1,222 ,512 1,097 ,992 20 0 -1,138 ,512 1,127 ,992

Certes, on peut voir parfois quelques tendances en regardant un histogramme et une courbe, mais pour tre prcis, il vaut mieux se rfrer deux valeurs, qui caractrisent une distribution : lasymtrie (Skewness), cest--dire le fait que la tendance centrale de la courbe (le point le plus haut, qui correspond la plus grande frquence des valeurs) est au centre ou dcale vers la gauche ou la droite ; laplatissement (Kurtosis), cest--dire le fait que la courbe est plus ou moins haute ou basse, pointue ou crase. Ces deux caractristiques ont pour valeur dans le cadre dune courbe dite normale : Asymtrie (Skewness) = 0,000 Aplatissement (Kurtosis) = 0,263 Ce qui correspond une jolie courbe, bien centre et ni trop haute, ni trop basse. Si lon reprend le tableau ci-dessus, les caractristiques de frquences de nos variables sont : Variable Anxit Test Dpression Test Exprimental Anxit Retest Dpression Retest Anxit Test Dpression Test Contrle Anxit Retest Dpression Retest Groupe Commentaires Symtrie Aplatissement 0.482 -0.584 Non normale 0.511 -1.228 Non normale 0.025 -0.554 Seulement symtrie 0.836 0.229 Seulement aplatissement -0.311 -1.077 Non normale -1.222 1.097 Non normale -0.060 -0.278 Non normale -1.138 1.127 Non normale

78 Stats pour les nuls les statistiques par lexemple

Comme nous sommes dans un contexte de donnes fictives, il nest pas utile de stendre en commentaires sur lanormalit de ces distributions. Aprs avoir prsent les variables descriptives, cest--dire aprs avoir dcrit en chiffres votre population, vous devez vrifier que vos groupes sont quivalents (ou du moins montrer dans quelle mesure ils ne divergent pas trop), sauf, bien entendu, en ce qui concerne la variable indpendante que vous manipulez.

3.6. Lquivalence des groupes


Lquivalence des groupes est tablie en ralisant des tests statistiques entre la variable Groupe et les autres variables descriptives. Ces tests sont de deux types, selon la nature qualitative ou quantitative de la variable descriptive teste. 1. Tester une variable qualitative La variable Groupe tant elle-mme une variable qualitative, le test entre ces deux types de variables est un Khi-deux 18. Nous vous rappelons ici que la philosophie de ce document est de faire simple et classique , aussi, dautres tests existent, mais nous nous garderons bien de vous encombrer lesprit en vous en parlant. Procdure SPSS : test de Khi-deux Groupe-Sexe - Niveau dtudes - Catgorie socio-professionnelle

Ouvrir dans SPSS le fichier de donnes : Principale.sav


Au dpart, la procdure est identique celle de la prsentation des variables descriptives qualitatives, il sagit dun Tableau crois. Cliquez au menu : <Analyse><Statistiques descriptives><Tableaux croiss>, ou plus rapidement, prenez Tableaux croiss aprs avoir cliqu sur le bouton de rappel des botes de dialogue , vous obtenez la fentre suivante :

18

2 l'expression Khi-deux est normalement errone, il sagit bien dun carr, square en Anglais, donc de Khicarr , mais on dira Khi-deux , puisque cest le choix de traduction en Franais dans PASW.

79 Stats pour les nuls les statistiques par lexemple

Glissez la variable Groupe dans la cellule Colonne(s) . Cette fois, nous allons voir comment SPSS peut tre trs rapide, une fois que lon a bien compris comment a marche. Au lieu de traiter les variables tester une par une, il vous est tout fait possible de faire les choses dun seul coup. Aussi, vous allez glisser dans la cellule Ligne(s) les trois variables qualitatives tester : Sexe , Niveau dtudes , Catgorie socioprofessionnelle (pour slectionner plusieurs variables qui ne se suivent pas dans la liste, maintenez enfonc la touche <Ctrl> du clavier et slectionnez la souris chaque variable), ce qui donne :

80 Stats pour les nuls les statistiques par lexemple

Ensuite, cliquez sur le bouton <Statistiques...>...

Cochez loption Chi-deux (tiens, maintenant cest Chi et non Khi ), bouton <Poursuivre>. Eventuellement, si vous aviez demand afficher les pourcentages, allez faire un tour sur le bouton <Cellules...>, pour les enlever, ils ne feront quencombrer laffichage. Il ne reste plus qu cliquer <OK>. Vous obtenez un rappel descriptif des variables (les effectifs), utile pour pouvoir rflchir, et les Khi-deux, pour le sexe :
Tests du Khi-deux Signification asymptotique Valeur Khi-deux de Pearson Correction pour la continuit Rapport de vraisemblance Test exact de Fisher Association linaire par linaire Nombre d'observations valides 1,560 1 ,212
b

Signification exacte (bilatrale)

Signification exacte (unilatrale)

ddl
a

(bilatrale) 1 1 1 ,206 ,343 ,204

1,600

,900 1,611

,343

,172

40

a. 0 cellules (,0%) ont un effectif thorique infrieur 5. L'effectif thorique minimum est de 10,00. b. Calcul uniquement pour un tableau 2x2

81 Stats pour les nuls les statistiques par lexemple

Pour le niveau dtudes :


Tests du Khi-deux Signification asymptotique Valeur Khi-deux de Pearson Rapport de vraisemblance Association linaire par linaire Nombre d'observations valides 8,565
a

ddl 3 3 1

(bilatrale) ,036 ,030 ,052

8,983 3,764

40

a. 4 cellules (50,0%) ont un effectif thorique infrieur 5. L'effectif thorique minimum est de 1,50.

Pour la catgorie socioprofessionnelle :


Tests du Khi-deux Signification asymptotique Valeur Khi-deux de Pearson Rapport de vraisemblance Association linaire par linaire Nombre d'observations valides 1,850
a

ddl 3 3 1

(bilatrale) ,604 ,524 ,784

2,241 ,075

40

a. 4 cellules (50,0%) ont un effectif thorique infrieur 5. L'effectif thorique minimum est de ,50.

A part le Khi-deux de Pearson , vous notez quil y a dautres informations et quelques petites diffrences. Cela est d aux caractristiques propres chaque variable, mais dans le cadre de ce manuel, nous ne retiendrons que le Khi-deux de Pearson (donc la premire ligne dans chaque tableau). Si lon fait une synthse, le contrle de lquivalence des groupes Exprimental et Contrle , donne le tableau suivant :

82 Stats pour les nuls les statistiques par lexemple

Variables Sexe Niveau dtudes Catgorie socioprofessionnelle Interprtation du Khi-deux (2)

2 et Signification 2 = 1,600 ; P = 0,206 2 = 8,565 ; P = 0,036 2 = 1,850 ; P = 0,604

Cette interprtation est trs simple. Plus le 2 est lev et plus la diffrence entre les groupes est significative. Mais comme cette valeur du 2 a un ct un peu relatif , il est bon de considrer en mme temps (et nous avons envie de dire surtout) le Signification asymptotique (bilatrale). , cest--dire le coefficient de signification du 2, que lon crit aussi P. Pour P, cest linverse, plus il est petit et plus la diffrence entre groupes est significative pour la variable considre. Retenez quhabituellement on utilise un seuil de 0,05 pour P. Cela signifie que lon considre une diffrence significative pour P <= 0,05, la diffrence ntant pas significative pour P > 0,05. Forts de ces prcisions, examinons nos 2. Nous voyons quil ny a pas de diffrence significative entre les groupes pour le sexe (2 = 1,600 ; P = 0,206) et pour la catgorie socioprofessionnelle (2 = 1,850 ; P = 0,604), dans les deux cas P est suprieur 0,05. Lexamen des effectifs montre queffectivement, les effectifs sont peu prs semblables entre les deux groupes. Par contre, il y a une diffrence significative entre les groupes en ce qui concerne le niveau dtudes (2 = 8,565 ; P = 0,036), P est ici bien infrieur 0,05. Lorsquon souhaite une quivalence, constater une diffrence est gnant, car cela signifie que la diffrence attendue pour nos VD au retest (ici anxit et dpression) pourrait tre due ce fameux niveau dtudes et non pas tant au suivi psychologique (en tout cas il serait difficile de distinguer les deux influences). Cependant, souvent un examen des chiffres permet de relativiser cet effet. On voit bien au niveau des effectifs (voir le tableau descriptif dans le fichier des rsultats, le Viewer) que la diffrence est surtout due au fait que le groupe Exprimental a 5 Collge et 13 Lyce , tandis que le groupe de Contrle a les effectifs inverses, 10 Collge et 4 Lyce . Si la diffrence stait joue aux deux extrmits des niveaux dtudes (par exemple, un nombre considrable de niveau primaire lExprimental et un nombre tout aussi considrable de niveau universitaire au groupe de Contrle ), nous pourrions nous affoler. L, entre collge et lyce, on peut considrer cette variable, mme si elle diffrencie les groupes, comme ngligeable sur les niveaux danxit et de dpression, lis la prsence ou non de suivi psychologique (on pourrait neutraliser cette diffrence en remplaant les catgories Collge et Lyce par Enseignement secondaire ). Notez que la syntaxe entre parenthses, par exemple, de (2 = 1,600 ; P = 0,206) est celle que vous devez utiliser dans votre mmoire ou article. Exemple de phrase : On ne trouve pas de diffrence significative entre les groupes pour le sexe (2 = 1,600 ; P = 0,206) et pour la catgorie socioprofessionnelle (2 = 1,850 ; P = 0,604).

83 Stats pour les nuls les statistiques par lexemple

2. Tester une variable quantitative Pour tester une variable quantitative, continue, comme lge, face une variable qualitative, comme le groupe, on emploi une analyse de variance (ou ANOVA, de langlais ANalysis Of VAriance). Dans le cadre de notre recherche fictive, nous devons tester lquivalence des groupes en ce qui concerne lge, mais aussi en ce qui concerne ltat psychologique (anxit et dpression) au test, S1. Car un effet du suivi psychologique sur anxit et dpression ne pourrait tre affirm si dj, au dpart, un groupe est plus ou moins anxieux ou dpressif quun autre. Procdure SPSS : test ANOVA Groupe-Age-HAD anxit et dpression Au menu allez <Analyse><Comparer les moyennes><ANOVA 1 facteur>, ce qui ouvre la fentre suivante :

Glissez dans la cellule Liste Variables dpendantes les variables quantitatives qui nous intressent : Age , HAD anxit test S1 et HAD dpression test S1 . Puis, glissez la variable Groupe dans la cellule Critre , ce qui donne :

84 Stats pour les nuls les statistiques par lexemple

Bouton <Options>, slectionnez Caractristique , puis, bouton <Poursuivre>. De retour dans la fentre de base de lANOVA, cliquez sur le bouton <OK> pour lancer le calcul des trois ANOVA en mme temps. Le rsultat donne :
ANOVA Somme des carrs Age Inter-groupes Intra-groupes Total HAD anxit test S1 Inter-groupes Intra-groupes Total HAD dpression test S1 Inter-groupes Intra-groupes Total 2,025 3166,750 3168,775 2,500 213,100 215,600 3,025 305,350 308,375 ddl 1 38 39 1 38 39 1 38 39 3,025 8,036 ,376 ,543 2,500 5,608 ,446 ,508 Moyenne des carrs 2,025 83,336 F ,024 Signification ,877

Interprtation de lANOVA : LANOVA sinterprte partir des valeurs de F et Signification dans le tableau de rsultats. Tout comme le 2, plus F est grand et plus la diffrence entre les groupes est significative. En parallle, plus Signification (P) est petit et plus la diffrence entre groupes est significative. Cela signifie, comme au 2, que lon considre une diffrence significative pour P <= 0,05, la diffrence ntant pas significative pour P > 0,05. Les tests ANOVA donnent : Variables Age HAD anxit test S1 HAD dpression test S1 ANOVA : F et Signification F(1,38) = 0,024 ; P = 0,877 F(1,38) = 0,446 ; P = 0,508 F(1,38) = 0,376 ; P = 0,543

Nous constatons quil ny a pas de diffrence significative entre les groupes (ce qui est confirm en regardant les moyennes au tableau des statistiques descriptives), en ce qui concerne lAge (F(1,38) = 0,024 ; P = 0,877), la HAD anxit test S1 (F(1,38) = 0,446 ; P = 0,508) et la HAD dpression test S1 (F(1,38) = 0,376 ; P = 0,543), tous les F sont faibles, infrieurs zro et les P bien suprieurs 0,05. Les groupes sont donc bien quivalents pour ces variables S1. Notez que la formule syntaxique, par exemple, de (F(1,38) = 0,024 ; P = 0,877) est celle que vous devez suivre pour parler des tests ANOVA dans votre mmoire ou article. Le 1,38 entre parenthses nest pas un nombre rel, mais lindication des degrs de libert (ddl) de lANOVA : 1 entre les groupes (Inter-groupes) et 38 dans les groupes (Intra-groupes).

85 Stats pour les nuls les statistiques par lexemple

3.7. Effets des variables descriptives


Maintenant que nous savons que les groupes sont peu prs quivalents, avant de voir leffet groupe au retest S8 nous devons nous assurer que les autres variables descriptives nont pas dj un effet sur les VD au test S1. En ce qui concerne les variables qualitatives, on considre que chaque variable produit des sous-groupes (autant quil y a de niveaux la variable considre, cest-dire 2 pour le sexe, 4 pour le niveau dtudes et la CSP). Il suffit alors de comparer ces sousgroupes avec une ANOVA. La procdure SPSS reprend celle prcdemment dcrite pour lquivalence des groupes. Dans la fentre ANOVA 1 facteur on place dans la cellule Liste Variables dpendantes les deux VD S1 HAD anxit test S1 et HAD dpression test S1 . Et dans la cellule Critre , on placera tour tour les variables Sexe , Niveau dtudes et Catgorie socioprofessionnelle . Les rsultats sont : Pour le sexe :
ANOVA Somme des carrs HAD anxit test S1 Inter-groupes Intra-groupes Total HAD dpression test S1 Inter-groupes Intra-groupes Total ,100 215,500 215,600 1,225 307,150 308,375 ddl 1 38 39 1 38 39 1,225 8,083 ,152 ,699 Moyenne des carrs ,100 5,671 F ,018 Signification ,895

Pour le niveau dtudes :


ANOVA Somme des carrs HAD anxit test S1 Inter-groupes Intra-groupes Total HAD dpression test S1 Inter-groupes Intra-groupes Total 8,729 206,871 215,600 2,046 306,329 308,375 ddl 3 36 39 3 36 39 ,682 8,509 ,080 ,970 Moyenne des carrs 2,910 5,746 F ,506 Signification ,680

86 Stats pour les nuls les statistiques par lexemple

Pour la catgorie socioprofessionnelle :


ANOVA Somme des carrs HAD anxit test S1 Inter-groupes Intra-groupes Total HAD dpression test S1 Inter-groupes Intra-groupes Total 9,929 205,671 215,600 15,837 292,538 308,375 ddl 3 36 39 3 36 39 5,279 8,126 ,650 ,588 Moyenne des carrs 3,310 5,713 F ,579 Signification ,632

Au final, on constate quil ny a aucune diffrence significative en ce qui concerne anxit et dpression la HAD, que la population soit regroupe selon le Sexe (anxit : (F(1,38) = 0,018 ; P = 0,895) dpression : (F(1,38) = 0,152 ; P = 0,699)), selon le Niveau dtudes (anxit : (F(1,38) = 0,506 ; P = 0,680) dpression : (F(1,38) = 0,080 ; P = 0,970)) ou selon la Catgorie socioprofessionnelle (anxit : (F(1,38) = 0,579 ; P = 0,632) dpression : (F(1,38) = 0,650 ; P = 0,588)). Ainsi, Sexe , Niveau dtudes et Catgorie socioprofessionnelle nont pas dinfluence sur les VD (anxit et dpression) S1, au test. Corrlations avec lge Lge est une variable quantitative continue, les scores danxit et de dpression sont aussi des variables quantitatives et continues. Dans ce cas, le test de comparaison est un coefficient de corrlation de Pearson (vous savez la fameuse corrlation entre lge et le poids...). La procdure SPSS est la suivante. Rendez-vous au menu <Analyse><Corrlation><Bivarie>, vous obtenez ceci :

87 Stats pour les nuls les statistiques par lexemple

Il suffit alors de glisser les variables quantitatives corrler ( Age , HAD anxit test S1 , HAD dpression test S1 ) dans la cellule Variables , ce qui donne :

Cliquez bouton <Options> et slectionnez Moyennes et carts-types . Bouton <Poursuivre> et bouton <OK>, le rsultat est l :

88 Stats pour les nuls les statistiques par lexemple

Corrlations HAD anxit test HAD dpression Age Age Corrlation de Pearson Sig. (bilatrale) N HAD anxit test S1 Corrlation de Pearson Sig. (bilatrale) N HAD dpression test S1 Corrlation de Pearson Sig. (bilatrale) N **. La corrlation est significative au niveau 0.01 (bilatral). 40 ,137 ,399 40 ,092 ,571 40 40 ,448
**

S1 1 ,137 ,399 40 1

test S1 ,092 ,571 40 ,448


**

,004 40 1

,004 40 40

SPSS affiche dans le Viewer une table des corrlations qui prsente, au croisement entre chaque ligne et colonne, le coefficient de corrlation de Pearson, ainsi que le niveau de signification, pour les deux variables concernes (attention, tableau double entre, les rsultats sont affichs deux fois). Interprtation du coefficient de corrlation : La valeur dun coefficient de corrlation se situe entre -1 et +1. En thorie, 0 il ny a aucune corrlation. Tandis qu -1 ou +1 il y a une parfaite corrlation (une corrlation ngative signifie simplement que la relation est inverse, par exemple : si vous trouvez une corrlation de +0,55 entre ge et nombre de cheveux blancs, vous trouverez aussi bien une corrlation de -0,55 entre ge et cheveux pas blancs exemple fictif !). En sciences humaines, on considre gnralement comme significatif un coefficient de corrlation de 0,30 et au-dessus, 70% ou plus de la variance expliquant la relation. Le coefficient de corrlation r est gnralement suivi de son indice de signification P qui, comme vous le savez prsent, plus il est petit (<= 0,05) et plus il y a corrlation. Les rsultats observs pour nos donnes fictives sont : entre lAge et lAnxit il ny a pas de corrlation (r = 0,137 ; P = 0,399), non plus entre Age et Dpression (r = 0,092 ; P = 0,571). Donc la variable descriptive Age na pas dinfluence sur les VD S1. Remarquez quil y a une significative corrlation entre Anxit et Dpression (r = 0,448 ; P = 0,004). Il est normal que ces deux VD soient lies, puisque toutes les deux ne le sont pas avec lAge . Notez que la syntaxe, par exemple, (r = 0,092 ; P = 0,571), est celle que vous devez employer dans vos crits. Vous pouvez aussi prciser : (r = 0,092 ; P(bilatral) = 0,571).

89 Stats pour les nuls les statistiques par lexemple

Remarque
Nous venons de voir comment vrifier lquivalence des groupes et la non influence des variables descriptives sur les VD. Dans lidal, pour que les statistiques infrentielles (celles qui sont destines valider ou pas les hypothses de ltude) soient valides, il faut que les groupes soient quivalents (le fameux toutes choses gales par ailleurs ), cest--dire quil ny ait pas, au dpart, de diffrences telles entre les groupes que ces diffrences pourraient expliquer elles seules les rsultats aux VD sans faire appel lhypothse de travail. Il faut aussi que les variables descriptives naient aucun effet sur les VD, car sinon, l encore, les rsultats se trouveront entachs. Aussi, que se passe-t-il pour le chercheur lorsquil ne peut obtenir ni une quivalence des groupes , ni une neutralit des variables descriptives ? H bien, si vous tes dans ce cas, inutile de perdre davantage votre temps, votre recherche est compromise et il vous faut recommencer sur une autre population, avec une meilleure slection et rpartition de vos sujets dans les groupes (en pratique, pour un mmoire universitaire, avec une limite de temps, le mieux est de poursuivre malgr tout votre travail, tout en prcisant bien ses faiblesses en matire de statistiques, car ce quon vous demande, en tant qutudiant, nest pas vraiment de valider correctement une hypothse, mais de montrer votre savoir faire, en tant quexercice. Ce qui ne serait pas le cas dans le cadre dune publication scientifique o l vous devez utiliser une mthode de recherche rigoureuse).

3.8. Les statistiques infrentielles


Rsum : Aprs avoir accompli les oprations suivantes : dcrit la population (statistiques descriptives), vrifi que les groupes (la variable indpendante et manipule) sont quivalents, vrifi que les variables descriptives nont pas deffet sur les VD,

nous pouvons ENFIN (!) faire des statistiques infrentielles, cest--dire vrifier si notre hypothse que le suivi psychologique a un effet, au bout de 8 semaines de traitement, sur lanxit et la dpression (mesures avec la HAD), est valide ou non. Comparaison des groupes au retest S8 Cette comparaison se fait de la mme faon que la comparaison des groupes la HAD au test S1, qui tait destine vrifier leur quivalence. Nous avons une variable qualitative Groupe et deux variables quantitatives HAD anxit et HAD dpression , la mthode employer est donc... une ANOVA.

Ouvrir dans SPSS le fichier de donnes : Principale.sav

90 Stats pour les nuls les statistiques par lexemple

La procdure est la mme que prcdemment : cliquez sur le bouton de rappel des botes de dialogue et choisissez loption ANOVA 1 facteur . Dans la cellule Liste Variables dpendantes glissez les deux variables dpendantes S8 ( HAD anxit retest S8 et HAD dpression retest S8 ) et dans la cellule Critre glissez le Groupe . Bouton <Options> cochez Caractristiques , bouton <Poursuivre>, ce qui donne :

Bouton <OK>, les rsultats saffichent :


ANOVA Somme des carrs HAD anxit retest S8 Inter-groupes Intra-groupes Total HAD dpression retest S8 Inter-groupes Intra-groupes Total 1334,025 270,350 1604,375 950,625 155,750 1106,375 ddl 1 38 39 1 38 39 950,625 4,099 231,934 ,000 Moyenne des carrs 1334,025 7,114 F 187,509 Signification ,000

Nous constatons une diffrence trs significative entre le groupe Exprimental qui a eu un suivi psychologique durant les 8 semaines et le groupe de Contrle qui na pas eu un tel suivi, en ce qui concerne lanxit (F(1,38) = 187,509 ; P = 0,000) et la dpression (F(1,38) = 231,934 ; P = 0,000). Bien entendu, lhypothse fictive de cette tude fictive est confirme, le suivi psychologique a un effet sur lanxit et la dpression (dans la ralit, il est rare quun effet se produise avec autant dvidence...).

91 Stats pour les nuls les statistiques par lexemple

Comparaison des groupes eux-mmes Sil est possible de comparer les groupes entre eux S8, on peut affiner le rsultat en comparant les groupes eux-mmes entre S1 et S8. Pour cela, ouvrez dans SPSS le fichier Test-retest-1.sav. Rappel : ici nous avons deux variables groupe indpendantes ( grexpe pour le groupe Exprimental et grcontr pour le groupe de Contrle ). Chaque groupe a ses deux colonnes de donnes test-retest, pour lanxit et pour la dpression. Comme nous nous retrouvons dans la situation dune variable qualitative dterminant des variables quantitatives, la mthode est toujours une ANOVA.

Ouvrir dans SPSS le fichier de donnes : Test-retest-1.sav


La procdure est habituelle : cliquez sur le bouton de rappel des botes de dialogue et choisissez loption ANOVA 1 facteur . Dans la cellule Liste Variables dpendantes glissez les deux variables dpendantes S8 ( Anxit test-retest (Ex) et Dpression test-retest (Ex) ) et dans la cellule Critre glissez le groupe Exprimental test-retest . Bouton <Options> cochez Caractristiques , bouton <Poursuivre>.

Bouton <OK>, les rsultats pour le groupe Exprimental saffichent :


ANOVA Somme des carrs Anxit test-retest (Ex) Inter-groupes Intra-groupes Total Dpression test-retest (Ex) Inter-groupes Intra-groupes Total 1334,025 290,350 1624,375 837,225 226,550 1063,775 ddl 1 38 39 1 38 39 837,225 5,962 140,431 ,000 Moyenne des carrs 1334,025 7,641 F 174,593 Signification ,000

92 Stats pour les nuls les statistiques par lexemple

Mme procdure en changeant ce qui doit tre chang, pour le groupe Contrle :

Rsultats :
ANOVA Somme des carrs Anxit test-retest (Co) Inter-groupes Intra-groupes Total Dpression test-retest (Co) Inter-groupes Intra-groupes Total 2,500 193,100 195,600 13,225 234,550 247,775 ddl 1 38 39 1 38 39 13,225 6,172 2,143 ,151 Moyenne des carrs 2,500 5,082 F ,492 Signification ,487

Cette comparaison test-retest montre une diffrence significative au point de vue anxit (F(1,38) = 174,593 ; P = 0,000) et dpression (F(1,38) = 140,431 ; P = 0,000) pour le groupe Exprimental qui a eu un suivi psychologique ; alors que le groupe de Contrle na pas eu dvolution : anxit (F(1,38) = 0,492 ; P = 0,487), dpression (F(1,38) = 2,143 ; P = 0,151). Autres tests pour petits chantillons En principe, une ANOVA est plutt rserve des chantillons suprieurs 30 (N > 30). Dailleurs, dans le cadre de notre tude fictive, nous voyons quavec N = 20 pour chaque groupe, cette condition nest pas remplie. De plus, lANOVA demande aussi ce que les diffrentes valeurs de la variable se rpartissent sur une courbe de distribution normale. L encore, nous avons vu aux Statistiques descriptives que cette condition nest pas non plus remplie. Lorsquil y a petits effectifs et distribution non normale (ce qui est le lot des petits effectifs), deux autres tests sont possibles : le test-T de Student et le test de Wilcoxon (qui est un test non-paramtrique, donc rserv pour les petits effectifs).

93 Stats pour les nuls les statistiques par lexemple

Tout dabord, il vous faut ouvrir une nouvelle base de donnes, le fichier Test-retest-2.sav , de faon pouvoir isoler dans des variables diffrentes les donnes test et retest pour chacun des groupes.

Ouvrir dans SPSS le fichier de donnes : Test-retest-2.sav


Ici, point de variable de groupe, donc, car nous allons simplement comparer des sries de donnes deux par deux et, finalement, le choix des groupes se fera au travers du choix des variables. Nous comparerons : Pour le groupe Exprimental : lAnxit Test (Ex) lAnxit Retest (Ex) ; Pour le groupe Exprimental : la Dpression Test (Ex) la Dpression Retest (Ex) ; Pour le groupe Contrle : lAnxit Test (Co) lAnxit Retest (Co) ; Pour le groupe Contrle : la Dpression Test (Co) la Dpression Retest (Co) ;

Procdure pour le test-T de Student Allez au menu <Analyse><Comparer les moyennes><Test-T pour chantillons apparis> (dans la comparaison des moyennes, le test-T pour chantillons apparis est utilis, comme ici, dans le cas dun mme chantillon avec test et retest). La fentre obtenue est la suivante :

Le jeu consiste glisser dans la cellule Variables apparies des paires de variables, cest--dire la mme variable au test et au retest, cela respectivement pour le groupe Exprimental et pour le groupe Contrle . Par exemple, vous cliquez pour slectionner Anxit Test (Ex) (anxit du groupe Exprimental au test) et, tout en tenant la touche <Ctrl> du clavier presse, vous

94 Stats pour les nuls les statistiques par lexemple

slectionnez Anxit Retest (Ex) (anxit du groupe Exprimental au retest). Puis, vous cliquez sur le bouton flche pour le transfert dans la cellule Variables apparies .

Comme nous avons 2 VD (anxit et dpression) pour 2 groupes ( Exprimental et Contrle ), cela fait bien 4 paires de variables programmer, soit : Anxit Test (Ex) + Anxit Retest (Ex) Dpression Test (Ex) + Dpression Retest (Ex) Anxit Test (Co) + Anxit Retest (Co) Dpression Test (Co) + Dpression Retest (Co)

Ce qui donne:

Bouton <OK>, le rsultat obtenu est le suivant :


Test chantillons apparis Diffrences apparies Intervalle de confiance 95% de la diffrence Moyenne Paire 1 Anxit Test (Ex) Anxit Retest (Ex) Paire 2 Dpression Test (Ex) Dpression Retest (Ex) Paire 3 Anxit Test (Co) Anxit Retest (Co) Paire 4 Dpression Test (Co) Dpression Retest (Co) 11,550 9,150 ,500 -1,150 Ecart- Erreur standard Infrieure Suprieure type moyenne 4,571 3,787 3,220 3,870 1,022 ,847 ,720 ,865 9,411 7,377 -1,007 -2,961 13,689 10,923 2,007 ,661 t 11,301 10,804 ,694 -1,329 ddl 19 19 19 19 Sig. (bilatrale) ,000 ,000 ,496 ,200

95 Stats pour les nuls les statistiques par lexemple

Le test-T sinterprte comme une ANOVA : le t doit tre lev et le P =< 0,05 pour avoir une diffrence significative entre test et retest pour un mme groupe. On observe une diffrence significative entre test et retest pour le groupe Exprimental lanxit (t(19) = 11,301 ; P = 0,000), comme la dpression (t(19) = 10,804 ; P = 0,000). Alors que pour le groupe de Contrle , il ny a pas de diffrence : anxit (t(19) = 0,694 ; P = 0,496), dpression (t(19) = 1,329 ; P = 0,200). Remarque : (19) entre parenthses indique (comme au F de lANOVA) les degrs de libert (ddl). Procdure pour le test de Wilcoxon Allez au menu <Analyse>< Tests non paramtriques><Boite de dialogue ancienne version><2 chantillons lis>, ce qui donne :

Une fentre qui ressemble beaucoup celle du test-T et qui fonctionne de faon identique. Sur le mme principe que le test-T ci-dessus, vous placez les paires test-retest de variables dans la cellule Paires tester , jusqu obtenir ceci :

96 Stats pour les nuls les statistiques par lexemple

Bouton <Options> vous cochez Caractristique , bouton <Poursuivre>. Pour le Type de test , cochez le Signe (test de signifiance) en plus du Wilcoxon . Bouton <OK>, cela donne :
Test
c

Dpression Anxit Retest (Ex) - Anxit Test (Ex) Z Signification asymptotique (bilatrale) a. Base sur les rangs positifs. b. Base sur les rangs ngatifs. c. Test de Wilcoxon -3,923
a

Dpression Anxit Retest (Co) - Anxit Test (Co)


a

Retest (Ex) Dpression Test (Ex) -3,829

Retest (Co) Dpression Test (Co)


a

-,570

-1,225

,000

,000

,569

,221

Le Z du test de Wilcoxon sinterprte comme lANOVA : plus il est lev et plus son coefficient de signification est bas et plus la diffrence entre les moyennes est significative. Dans notre cas de figure, nous avons pour le groupe Exprimental une diffrence significative entre test et retest lanxit (Z = -3,923 ; P = 0,000) et la dpression (Z = -3,829 ; P = 0,000). Par contre, pas de diffrence significative pour le groupe de Contrle : anxit (Z = -0,570 ; P = 0,569), dpression (Z = -1,225 ; P = 0,221). Pour en terminer avec les statistiques infrentielles et en ce qui concerne ce que vous devez prsenter dans votre mmoire. Dans le corpus du mmoire vous ne mettez que le strict ncessaire pour prsenter votre travail. Vous pouvez mme ignorer les moyennes et ne prsenter que les rsultats aux tests statistiques (2, ANOVA, corrlation de Pearson, test-T ou Wilcoxon). Vous rservez donc les tableaux dtaills fournis par SPSS pour les annexes auxquelles le lecteur peut se reporter pour en savoir plus. Pour un article, faite comme pour le corpus du mmoire, tout est dans la concision.

* *

97 Stats pour les nuls les statistiques par lexemple

Annexe
SYNOPTIQUE DES METHODES STATISTIQUES
Types de variables

Qualitative

Quantitative ANOVA Procdure : <Analyse> <Comparer les moyennes> <ANOVA 1 facteur> Liste Variables dpendantes : variables quantitatives Critre : variable de regroupement <Options> : Caractristiques Rsultat : (F(1,38) = 0,506 ; P = 0,680) ( (1,38) = degrs de libert : Inter-groupes,Intra-groupes) Interprtation : diffrence significative si F lev et P <= 0,05 Qualitative Khi-deux Procdure : <Analyse> <Statistiques descriptives> <Tableaux croiss> Lignes : variables Colonnes : variable de regroupement <Statistiques> : Khi-deux Rsultat : (2 = 8,565 ; P = 0,036) Interprtation : diffrence significative si 2 lev et P <= 0,05 Quantitative Corrlation Procdure : <Analyse> <Corrlation> <Bivarie> Variables : variables quantitatives <Options> : Moyennes et carts-types Rsultat : (r = 0,448 ; P = 0,004) Interprtation : corrlation si r = 0,30 et P <= 0,05 Quantitative Test-T de Student (petits effectifs <=30 et distribution non normale) Procdure : <Analyse> <Comparer les moyennes> <Test-T pour chantillons apparis> Variables apparies : paires de variables (ex. : test-retest) Rsultat : (t(19) = 10,804 ; P = 0,000) ( (19) = degrs de libert) Interprtation : diffrence significative si T lev et P <= 0,05 Quantitative Test de Wilcoxon (petits effectifs <=30 et distribution non normale) Procdure : <Analyse> < Tests non paramtriques> <Boite de dialogue ancienne version> <2 chantillons lis> Variables apparies : paires de variables (ex. : test-retest) Type de test : Wilcoxon et Signe <Options> : Caractristique Rsultat : (Z = -3,923 ; P = 0,000) Interprtation : diffrence significative si Z lev et P <= 0,05

Types de variables

Qualitative

Types de variables

Quantitative

Types de variables

Quantitative

Types de variables

Quantitative

98 Stats pour les nuls les statistiques par lexemple

Comment obtenir SPSS ?


Cest un peu la croix et la bannire, mais bon quand on est motiv et que cest gratuit Allez sur cette page : http://www14.software.ibm.com/download/data/web/en_US/trialprograms/W110742E06714B29.ht ml Slectionnez votre systme (par exemple : Windows XP) et cliquez sur le bouton Continue . Dans la nouvelle page cliquez dans New Visitors sur Proceed without an IBM ID . Dans la nouvelle page, remplissez tous les champs du formulaire. Vous ntes mme pas oblig de donner des informations relles ! Aprs avoir soumis le formulaire vous obtenez une nouvelle page dans laquelle vous allez choisir votre version de SPSS. En rgle gnrale vous devez choisir, en fonction de votre ordinateur, la premire version : IBM SPSS Statistics Client for Trial 32-bit 21.0 Microsoft Windows Multilingual. Pensez cocher en bas votre accord pour la licence (I agree). Cliquez enfin sur le bouton I confirm . A ce point, une fentre popup va souvrir, qui lance un plugin Java pour effectuer le tlchargement. Il faut esprer que vous ayez Java install sur votre machine (en gnral cest dj fait, sinon faudra le faire et tout recommencer !). Si cest bon pour Java, il se peut alors que, par scurit, votre navigateur (Chrome, Firefox, Iexplorer) vous demande de confirmer que vous autorisez lutilisation de Java pour ce site, cliquez que vous acceptez, refermez la fentre popup et cliquez nouveau sur le bouton I confirm ). Choisissez un chemin sur votre disque dur dans la nouvelle petite fentre et lancez (ENFIN !) le tlchargement. Attention, cest 980 Mo, soit presque 1 Go tlcharger, autant dire que vous devez avoir une ligne Internet avec un bon dbit. Attention : une fois le logiciel SPSS tlcharg sur votre disque dur, pas de prcipitation pour linstaller : ninstallez pas ce logiciel avant davoir rempli votre fichier Excel de toutes vos donnes et den tre vraiment au stade de faire vos statistiques. Car une fois install, ce logiciel nest valable que 14 jours ! (sinon, il vous faudra le retlcharger). Nota : lemplacement du tlchargement de SPSS lessai peut changer sur Internet au fil du temps, si vous ne trouvez plus SPSS cet endroit, cherchez, car qui cherche trouve !

99 Stats pour les nuls les statistiques par lexemple

STATS POUR LES NULS


les statistiques par lexemple
Vous vous sentez nul en statistiques et vous pensez ne jamais y arriver ? Vous vous dites que pour un littraire comme vous, un simple tudiant en psychologie, les stats cest trop. Et pourtant, ds le master et plus tard en thse, il vous faudra bien en faire, si vous voulez valider vos recherches et soutenir vos mmoires. Si vous tes thsard ou docteur, il vous faut encore des statistiques pour vos publications, nul ny chappe ! Alors cet ouvrage est l pour vous aider. Rassurez-vous, nous navons ni lintention, ni la prtention, de vous apprendre les arcanes de la statistique et vous ne trouverez ici aucune formule mathmatique. Le principe de cet ouvrage est de vous permettre, dabord, de bien comprendre ce que vous faites lorsque vous ralisez une recherche et de connatre les principales tapes de cet art admirable de la recherche scientifique. Ensuite, il suffit de savoir exactement ce que vous voulez entreprendre et ce manuel vous donnera la recette. Inutile de savoir comment fonctionne la recette pour pouvoir sen servir, il suffit de lutiliser avec le logiciel de statistiques IBM SPSS Statistics (version dvaluation limite 14 jours, que vous pouvez tlcharger gratuitement sur le site officiel de SPSS). On na pas besoin de connatre la chimie pour faire de la cuisine ! Une fois la recette ralise avec le logiciel de statistiques, le manuel vous dira simplement comment il faut lire les rsultats des tests et comment les interprter. Quoi de plus simple ! Ce manuel est livr avec une tude fictive, comme exemple, qui vous permettra de vous entraner dans lutilisation dExcel et de SPSS pour la recherche scientifique. Illustr de nombreuses copies dcran, louvrage vous guidera pas pas dans lanalyse statistique de vos donnes. Le manuel comporte aussi un vritable guide pour comprendre les concepts fondamentaux de la recherche scientifique et pour rdiger un mmoire universitaire ou un article destin la publication. Auteur de nombreux ouvrages et articles scientifiques, Eric Loonis est psychologue clinicien et docteur en psychopathologie.

Eric Loonis, 2013.