Vous êtes sur la page 1sur 76

CM Formation Recherche Master 1 Epistmologie et dispositifs quantitatifs : Lattitude exprimentale

Frederic.martinez@univ-lyon2.fr

Pr requis dutilisation de lattitude exprimentale


Mener une recherche avec pour objectif dapporter une rponse base sur des faits (= approche empirique) Lempirisme est une pistmologie qui privilgie lexprience ou lobservation comme mthode de validation (des thories, des hypothses, ). En cela, elle est distinguer du rationalisme qui, lui, insiste sur la prsance darguments logiques faisant appel la raison Soucis de preuve, attitude scientifique, quest ce que la science

Points de vue sur la science Cest dans le rapport observation / thorie que se construit le savoir. Selon C. Bernard : la simple constatation des faits ne pourra jamais parvenir constituer une science. On aura beau multiplier les faits ou les observations que cela napprendrait pas davantage. Pour sinstruire, il faut ncessairement raisonner sur ce que lon a observ, comparer les faits et les juger par dautres faits qui servent de contrle (in MichielsPhilippe, 1984, p. 106)

1. Conception classique de la science : Primat de lobservation Empirisme logique (Vienne, 1920 ; USA, 1930 ) = origine de toute connaissance les donnes sensorielles puis des lois induites par de multiples observations puis des thories puis des hypothses puis test puis de nouvelles thories puis dautres hypothses Raisonnement inductif Critique = Pas dobservation pure, problme de linsertion dans un communaut scientifique

2. Popper et la conception critique de la science : Rfutabilit de lhypothse Problme de la preuve = Une observation ne confirme jamais une thorie, elle ne peut que linfirmer, la rfuter, montrer quelle est fausse

Ainsi, selon Popper est scientifique toute affirmation rfutable, cest--dire telle quon soit capable dimaginer un tat du monde qui amnerait conclure quelle est fausse (Ghiglione & Richard, 1992, p. 641)
Les critiques portent sur le caractre trop strict de la notion de rfutabilit le critre de rfutabilit, sil parat trop strict pour dfinir la science ou la distinguer nettement de ce qui ne lest pas, constitue, si on ne lapplique pas de faon rigide, un excellent lment dhygine intellectuelle (Ghiglione & Richard, 1992, p. 648)

3. Kuhn et la stabilit des visions du monde (plus fonde sur ce qui se fait que sur ce qui doit se faire ) Activit du scientifique ne vise pas mettre lpreuve des hypothses mais rsoudre des problmes visant les enrichir. Un scientifique travaille lintrieur dun paradigme, savoir un ensemble de thories, de mthodes, de rsultats acquis, de prsupposs, partags par une communaut de scientifiques qui travaille sur un domaine spcifique. Le bon scientifique serait celui, qui tant dans lobservation que dans lexprimentation, est ouvert aux imprvus, prt orienter sa recherche dans une direction nouvelle, parfois trs diffrente de celle quil a dabord entreprise La science est cration, et en cela participe des mmes sources que lart, et comme lui fait surgir la nouveaut travers la matrise rigoureuse dun matriau et de loutil

CLAUDE BERNARD : OBSERVATION ET EXPRIENCE Claude Bernard dfinit la dmarche scientifique en trois tapes : Observation > Hypothse > Exprience L'observation vise dcrire la ralit telle qu'elle est, inventorier, classer les faits remarquables, les connatre avec prcision. Elle joue un rle capital dans les sciences jeunes et les problmes nouveaux. En psychologie, la plupart des recherches ne sont encore qu' la phase de l'observation systmatique. L'hypothse vise imaginer des relations possibles entre faits, l'exprience vrifier l'hypothse.

1. Lobservation

- Occasionnelle et systmatique
- Naturaliste et clinique - Lobservation obt aux principes de la perception. Lobservateur slectionne et interprte les donnes 2. Lhypothse - Une hypothse nest pas une suggestion alatoire concernant la survenue dun vnement mais une affirmation claire sur ce que lon sattend obtenir, observer, mesurer, constater. - Hypothtique que parce que nous ne savons pas, lavance, si elle sera vrifie ou pas mais cela reste une affirmation par anticipation - Induite et dduite

3. Lexprience
Exprimenter c'est "intervenir activement pour raliser les conditions ncessaires la vrification des hypothses relatives aux causes ou aux proprits des phnomnes tudis" (Ghiglione & Richard p.273). Pour C. Bernard (1865, cit par Reuchlin, 1992, p. 21), "La seule preuve qu'un phnomne joue le rle de cause par rapport un autre, c'est qu'en supprimant le premier, on fait cesser le second" . Ainsi, l'exprience vise vrifier l'existence d'une relation entre deux classes de faits. Le principe est toujours le mme, faire varier un fait pour observer ses consquences sur l'autre.

Remarques sur ce modle observation hypothse exprience:

1. lobservation systmatique est galement un moyen de tester des hypothses


Ex : lastronomie et la mthode dexploration critique de Piaget

"L'exprience n'est au fond qu'une observation provoque" (Claude Bernard)


Pour C. Bernard (Michiels-Philippe, 1984) "un savant complet est celui qui embrasse la fois la thorie et la pratique exprimentale. 1 Il constate un fait ; 2 propos de ce fait, une ide nat dans son esprit ; 3 en vue de cette ide, il raisonne, institue une exprience, en imagine et en ralise les conditions matrielles 4. De cette exprience rsultent de nouveaux phnomnes qu'il faut observer, et ainsi de suite. L'esprit du savant se trouve en quelque sorte toujours plac entre deux observations : l'une qui sert de point de dpart au raisonnement, et l'autre qui lui sert de conclusion.

2. Il existe dautres types de recherche qui ne mettent pas en vidence une relation causale mais toutes aussi importantes

Il sagit de la mthode corrlationnelle qui ne permet pas dtablir une relation de cause effet mais dtablir un lien entre deux variables Par exemple, constater que des enfants nourris plus longtemps au sein ont un QI plus lev lge adulte ne signifie pas ncessairement que le lait maternel explique cet effet. Il est possible que les femmes qui nourrissent plus longtemps leur enfant ont des particularits qui affecteront leur comportement avec leur enfant et que ces particularits affecteront le QI de ce dernier jusqu un ge avanc (Gueguen, 2007, p. 61)
Ouvre donc des pistes de recherches ou de rflexion sur le poids de tel ou tel facteur sans rien dmontrer

Les tapes dune recherche 1. Principes gnraux Etude scientifique si la question "Pourquoi devrais-je vous croire ?" le chercheur peut rpondre "Voil ce que j'ai fait et ce que j'ai observ. Vous pouvez faire la mme chose, et vous arriverez aux mme conclusions." (Ghiglione & Richard, 1992, p.270-271 )

Caractre public, reproductible et communicable


La gnralisation : L'intrt du chercheur n'est pas de savoir ce qui se passe ici et maintenant, mais de savoir ce qui pourrait se passer sur d'autres individus, sous d'autres conditions et en d'autres moments laide de statistiques infrentielles

Un problme = La reprsentativit des individus

Ncessit de de procder par tapes chacune prcisant la prcdente pour structurer le raisonnement

1. La question de dpart
2. Lexploration 3. La problmatique et lhypothse 4. La construction du dispositif dobservation 5. Lobservation ou recueil de donnes

6. Lanalyse des donnes


7. Discussion

Les tapes de mthode exprimentale de recherche


1. La question de dpart Objectif : Se donner un but atteindre Sources : Demande sociale Observations occasionnelles Rsultats antrieurs

2. Lexploration

Objectif : Prciser la question


Sources : Analyse bibliographique Entretiens exploratoires Observations exploratoires Description objective de la situation

3. La problmatique et hypothses

Objectif :
Dfinir l'approche thorique adopte Trois temps : 1. Rpertorier des approches du problme 2. Slectionner (ou construire) une problmatique 3. Prciser la problmatique adopte : Poser et justifier lhypothse gnrale (directrice). C'est - - dire Prvoir des relations entre faits observables qui confirment ou non la thorie.

4. Construction dun dispositif exprimental -Imaginer une situation dans laquelle un facteur (la condition) varie et fait varier lui seul un comportement donn (effet). toutes choses tant gales par ailleurs Une hypothse ? Exprience, observation, questionnaire, mthode clinique : Piaget Variable Dpendante (VD) Comportement que l'exprimentateur observe. Il varie en fonction de la VI Variable Indpendante (VI) (Manipulation check) Facteur que l'exprimentateur fait varier Variable Parasite (VP) Facteur que lexprimentateur neutralise ou contrle Variables.

Le dispositif exprimental Exemple d'oprationnalisation d'une variable Hypothse gnrale :

Plus les sujets jugent une tche intressante, plus ils participent cette tche.
Procdure envisage : Comptabiliser le nombre d'tudiants qui rpondent une offre de participation une exprimentation en laboratoire VD Participation la tche : Indicateur NB d'tudiants se proposant pour participer une exprience

B. Le dispositif exprimental VI : Intrt pour la tche 2 modalits : - Forte - Faible Oprationnalisation :Thmes annoncs de l'exprience 2 modalits : -Thme 1 : sexualit -Thme 2 : la perception de la relativit Hypothse oprationnelle :

Il y aura plus d'tudiants qui se proposeront pour participer une exprimentation sur la sexualit que pour une exprimentation sur la perception de la relativit

B. Le dispositif exprimental Variables Indpendantes Variables provoques et invoques La variable provoque est manipule par l'exprimentateur La variable invoque (ou tiquette) correspond des phnomnes existants (ex : caractristiques des sujets) Variables indpendantes confondues Pour conclure que la VI affecte la VD, il faut viter que les modalits de la VI tudie recouvrent les modalits d'une autre VI cache.

B. Le dispositif exprimental Exemple de variables indpendantes confondues Hypothse : L'apprentissage de l'arithmtique dpend de la mthode pdagogique. Procdure : Trois enseignants forms l'une des mthodes pdagogiques. Chaque enseignant prend une des trois classes diffrentes. Rsultat : La performance varie d'une classe l'autre. VI confondues : caractristiques individuelles des enseignants, Niveau des classes, ...

B. Le dispositif exprimental

Variables parasites On contrle les Variables Parasites dont on sait (ou on prsume) l'effet sur la VD Neutralisation : on l'empche de varier (une seule modalit) Manipulation : on la fait varier comme une variable indpendante VP frquemment contrles: les caractristiques du sujet la variable exprimentateur : lorsque plusieurs exprimentateurs recueillent les donnes ; l'ordre de passation : lorsque un sujet fait plusieurs tches ou, plus gnralement, appartient plusieurs groupes exprimentaux Variable imprativement neutralise Instructions donnes aux sujets : CONSIGNE

B. Le dispositif exprimental Exercice : Identifier les variables Hypothse : Au cours d'un procs, plus un jur estime qu'un accus est beau, moins il le juge coupable. Dans les lments qui suivent, dfinir la VI, la VD, les VP : A- l'estimation de la beaut de l'accus B- L'ge de l'accus C- Le jugement de culpabilit de l'accus D- Le genre du jur E- Le genre de l'accus F- La beaut du jur

B. Le dispositif exprimental (Validit)


Rappel : Pour faire la preuve d'une relation causale, il faudrait ne manipuler qu'un seul facteur (VI) Mais, risque de mettre en vidence un cas particulier ou d'introduire des biais mthodologiques (VI confondues) Le choix du nombre de facteurs dpend du but vis : Montrer sans ambigut l'effet d'un facteur (VI) Renforcer la validit interne de l'exprimentation, en neutralisant le maximum de facteurs potentiels. -Montrer la gnralit, la pertinence du facteur (VI) Renforcer la validit cologique de l'exprimentation, en manipulant plusieurs facteurs. -Toutefois, la validit cologique d'une exprience n'est pas proportionnelle au nombre de facteurs manipuls : Si plus de 3 facteurs, c'est la validit de l'exprimentation elle-mme qui est remise en cause.

Groupe Contrle
. Hypothse : Les patients atteints d'un syndrome de Korsakoff prsentent une dgradation du stockage en MLT.

-On fait passer un test de mmorisation des patients et on constate que les patients retiennent en moyenne 2 mots sur une liste de 30. -Ce rsultat n'est interprtable que si on a une valeur de comparaison chez des sujets normaux. -Ce groupe de sujets normaux, qui on fera passer le mme test, constitue le groupe contrle.

Groupe Contrle
.

-Un autre exemple : Dans une exprience sur la perception, on veut montrer que l'identification d'une image ambigu dpend du contexte dans lequel l'image est prsente. -L'exprimentateur utilise une image ambigu donnant lieu deux catgories de rponses : vieille femme ou jeune femme. -Cette image est associe un texte qui traite soit de la jeunesse, soit de la vieillesse. - L'exprimentateur s'attend obtenir plus de rponses jeune femme quand l'image est associe un texte sur la jeunesse et plus de rponse vieille femme quand l'image est associe un texte sur la vieillesse. Admettons qu'il obtienne des rsultats ci-dessous :

Groupe contrle L'exprimentateur sera tent de conclure que seul le contexte jeunesse a un effet sur la rponse. Mais si on ajoute un groupe de sujet auquel on prsente l'image seule, et qu'on obtienne 75% de rponse jeune femme et 25% de rponse vieille femme. Dans ce cas, seul le contexte vieillesse aurait eu un effet sur la rponse. Ainsi, l'effet du contexte ne peut tre valu qu'en rfrence aux rsultats obtenus sur un groupe contrle qui n'est pas soumis un contexte.

Jeune femme Veille femme

jeunesse 75%
25%

vieillesse 50%
50%

Manipu check Fiabilit indicateur

3/ Effet de confirmation dhypothses : - tendance des gens chercher confirmer leurs hypothses plutt qu en prouver la valeur relle

3/ 2-4-6
Quelle est la rgle, proposez des suites de 3 nombres 2-4-7, informative car infirme l hypothse -Snyder et Swann (1978), introversion ou extraversion

- Test extraversion = questions extraverties; test intraversion =questions intraversties


- TROP confiance en nous ; cherche donc pas savoir si les infos dispo vont confirmer et non infirmer notre opinion.

La tche de slection de Wason

Quatre cartes. une lettre sur un ct et un nombre sur l'autre


E C 5 4

Indiquer quelle(s) carte(s) il vous faut tourner pour vrifier l'affirmation suivante : Si une carte porte une voyelle d'un ct, alors elle porte un nombre impair de l'autre ct

Solution Tourner E : assure la vrit de la rgle Tourner 4 : assure que la rgle nest pas contredite Mais tourner 5 ne prouve pas que la rgle est respecte !

Les cartes ci-aprs contiennent des renseignements sur quatre personnes assises une table dans votre bar. Sur un ct de chaque carte se trouve la nature de la consommation et sur l'autre, l'ge de la personne. N'identifiez que les cartes que vous devez absolument retourner pour savoir si l'une de ces personnes enfreint la loi.

Bire

coca

16 ans

25 ans

Solution vidente (75% de succs vs 25%) Pourquoi ?

Effet simple
Admettons que l'on souhaite tudier l'effet de la familiarit d'une tche sur la mmoire. On va, par exemple, prsenter trs rapidement des mots aux sujets : 100 relatifs une tche trs familire 100 autres relatifs une tche peu familire.
Type de Tche Nombre de mots reconnus sur les 100 mots 80 30 Les rsultats montrent que les sujets reconnaissent plus de mots lorsque la tche est trs familire que lorsque la tche est peu familire. = Effet simple de la familiarit dune tche sur la mmoire

Trs familire Peu familire

Effet dinteraction
. Cependant on peut se demander si l'intrt pour la tche

modifie l'effet de la familiarit de la tche. Dans cet objectif, on va tudier l'effet de l'interaction entre familiarit de la tche et intrt pour la tche. Par exemple, on prsentera 4 catgories de mots aux sujets : (a)100 mots relatifs une tche trs familire et trs intressante, (b) 100 mots relatifs une tche trs familire et peu intressante (c)100 mots relatifs une tche peu familire et trs intressante, (d)100 mots relatifs une tche peu familire et peu intressante.

Effet dinteraction
. On peut obtenir diffrents types de rsultats :

Tche trs familire Tche peu familire

Fort intrt Faible intrt pour la tche pour la tche 80 80


30 30

a) il n'y a pas effet d'interaction entre les facteurs car l'effet de l'intrt ne modifie pas l'effet de la familiarit. Quel que soit l'intrt pour la tche.

Effet dinteraction
.

Fort intrt Faible intrt pour la tche pour la tche Tche trs familire 80 80 Tche peu familire 50 10

Effet d'interaction entre les facteurs car l'effet de l'intrt pour la tche modifie l'effet de la familiarit sur la performance -Lorsque la tche est trs familire, l'intrt pour la tche ne modifie pas la performance.
- Inversement, lorsque la tche est peu familire, le fort intrt pour la tche amliore la performance, alors que le faible intrt pour la tche inhibe la performance.

Variable modulatrice versus mdiatrice


Familiarit performance

Intrt Effet dinteraction nous permet que lintrt est une variable modulatrice car elle module leffet de la familiarit sur la performance. Autrement dit, leffet de la familiarit sur la performance est diffrent selon les niveaux de la variable modulatrice

Variable modulatrice versus mdiatrice


X M Y

- Une variable mdiatrice (M) est en revanche une variable qui intervient entre la variable indpendante (X) et la variable dpendante (Y) de sorte que la variable indpendante exerce un effet sur la variable mdiatrice et la variable mdiatrice exercice un effet sur la variable dpendante.

Leffet de la variable indpendante sur la variable dpendante est indirect car il transmis par la variable mdiatrice
Intrt supplmentaire = Si lon liminait leffet de la variable mdiatrice, on nobserverait plus de relation entre X et Y

En rsum : - Une variable modulatrice (effet dinteraction) explique quand et sous quelle conditions un effet se produit - Une variable mdiatrice nous renseigne sur comment et pourquoi un certain effet a lieu.

Plan dexprience et relation entre variables


.

-Les facteurs ( VI) sont reprsents par une lettre majuscule quelconque.

-Le facteur sujet est toujours reprsent par la lettre S.


- Le nombre de modalits associ chaque facteur est indic la lettre le reprsentant. Par exemple, un facteur quelconque "X" 3 modalits sera not X3. Les VI peuvent tre combines de diffrentes faons. Ces combinaisons dfinissent les plans dexprience.

Le plan factoriel
- Un plan factoriel est un plan dans lequel chaque modalit dune variable indpendante est combine avec chaque modalit des autres variables indpendantes pour constituer une condition exprimentale ou un groupe exprimental - Dans un plan factoriel, le nombre de conditions exprimentales (ou de groupes) est gal au produit du nombre de modalits de variables indpendantes.

Le plan factoriel
-Ex Rossi et Pierandre (1984) sintressant au format du lexique ont voulu vrifier que les sigles stocks en mmoire le sont sous une forme spcifique -2 hypothses gnrales : - lidentification du sigle est difficile sil est crit en minuscule (forme inhabituelle) - lidentification mots (rare ou frquent) est indpendante du type de lettres (majuscules ou minuscules)

- 2 hypothses oprationnelles :
- le seuil didentification des sigles est plus lev lorsquils sont crits en minuscules que lorsquils sont crits en majuscules

- le seuil didentification des mots (rares ou frquents) est indpendant du type de lettre utilis (majuscules ou minuscules)

Le plan factoriel complet


- variables indpendantes : -T3, type de stimuli : T1, mots frquents T2, mots rares T3, sigles -L2, type de lettres : L1, minuscules L2, majuscules

Type de stimuli Type de lettre


Minuscules Majuscules

T1 T2 T3 Mots frquents Mots rares Sigles


1 4 2 5 3 6

A) Croisement.
On dit de ces deux facteurs type de stimuli et type de lettes quils sont croiss.
Deux facteurs sont croiss (on dit aussi contrebalancs) lorsque chaque modalit de l'un se retrouve dans chaque modalit de l'autre. Par exemple (Abdi, 1987), dans une exprience sur l'apprentissage on donne ou non une rcompense (facteur R2) trois moments de la journe (M3), le facteur "Rcompense" est dit crois avec le facteur "Moment de la journe", le plan s'crit R2* M3 , ou M3*R2 car la relation est symtrique et se lit "R2 croix M3".

Groupes appareills versus groupes indpendants


Groupes appareills = plan mesures rptes Les sujets passent dans toutes les conditions exprimentales

Exemple : tude du rle de la frquence dusage sur le seuil didentification


VI : frquence

F2, 2 modalits : mots rares et mots frquents


Groupes appareills si pour chaque sujet sont enregistrs les seuils didentification pour les mots rares et les mots frquents

Groupes appareills versus groupes indpendants


Groupes indpendants = diffrents sujets sont affects aux diffrentes conditions exprimentales

Autant de groupes de sujets que de conditions exprimentales


Affectation soit tirage au sort ou utilisation de groupes quivalents

Dterminer les seuils des mots rares pour un groupe de sujets et les seuils des mots frquents pour un autre groupe de sujets

Lexprience de Monteil (1993)

Regardez bien cette figure car je vais la cacher et vous demander de la reproduire

Monteil (1993)
La figure de Rey propose des lves de 5me bons et mauvais La tche est propose comme tant une preuve de dessin pour la moiti et comme une preuve de gomtrie pour lautre moiti

Monteil (1993)

Dessin

Mauvais lves

Gomtrie

Avoir une difficult


Cest avoir un statut de mauvais lve Cest avoir appris chouer Cest tre persuad que lon va chouer

Principe de linfrence statistique


1. Gnralisation
Principe : En partant dobservations ralises sur un nombre limit dindividus, savoir dans quelle mesure, on pourra, moyennant des risques connus, gnraliser lensemble de la population les caractristiques observes

Imaginons que vous essayiez de savoir si les hommes sont meilleurs que les femmes en mathmatiques. Vous soumettez un test de mathmatiques 30

tudiantes et 30 tudiants de psychologie et comparez leurs scores


Moyens ce test. Vous constatez, grce un test t pour chantillons indpendants qu'il est significatif .04 et que les hommes obtiennent des scores plus levs que les femmes. Mais qu'est-ce que cela signifie rellement?

Le principe gnral de l'infrence statistique consiste tirer des conclusions concernant un groupe auquel on ne peut pas accder directement (gnralement parce qu'il est trop grand. Ici, les hommes et les femmes, soit 3 milliards d'individus dans chaque cas; ou plus modestement les "tudiants" et les "tudiantes") partir d'un sous-groupe auquel on a accs et que l'on considre comme un chantillon alatoire provenant de cette population. Le groupe "tendu" sur lequel on veut tirer des conclusions s'appelle la "population" et le groupe restreint auquel on a accs l' "chantillon". Les tests de comparaison de moyennes fonctionnent selon un raisonnement par l'absurde: Ils partent du principe que nos deux chantillons proviennent de la mme population du point de vue de la variable dpendante qui nous intresse. En d'autres termes que les hommes et les femmes ont les mmes niveaux de comptences en mathmatiques. Mme si on tire deux chantillons au hasard partir d'une mme population, il est peu probable que ces deux chantillons aient exactement la mme moyenne (ou obtiennent le mme score moyen un test de mathmatiques). Il est galement peu probable que les moyennes observes soient trs diffrentes. Grce une distribution thorique (celle du t), on peut connatre exactement la probabilit d'obtenir chaque diffrence possible en fonction de son ampleur et de la variance observe dans chaque chantillon.

On calcule donc cette probabilit et si on constate qu'elle est trs basse (infrieure .05) on en conclut qu'il est peu probable que les deux chantillons proviennent de la mme population. Ils doivent provenir donc de deux populations aux moyennes diffrentes, les hommes et les femmes La logique est donc la suivante: - Je pars du principe que les deux chantillons proviennent de la mme population du point de vue de la variable dpendante.

- J'examine les implications de cette supposition par rapport la probabilit d'obtenir les diffrences de moyenne observes.
- Si cette probabilit est trs basse, j'en conclus que les deux chantillons proviennent de deux populations diffrentes et donc que les deux populations dont ils sont issus (les hommes et les femmes) ont des moyennes diffrentes. - Si cette probabilit est trs basse, je ne rejette pas ma supposition de base (hypothse nulle), savoir que les deux chantillons proviennent de la mme population

Comme ce raisonnement est statistique, et non purement logique, on ne peut jamais tre certain que notre dcision d'accepter ou de rejeter l'hypothse nulle (c'est-dire notre supposition de dpart) soit exacte et reflte adquatement la ralit. On peut donc effectuer deux types d'erreurs: -L'erreur de premire espce consiste rejeter l'hypothse nulle (par exemple dcider que les hommes ont des comptences diffrentes des femmes en mathmatiques) alors qu'en ralit elle est vraie (les hommes ne diffrent pas des femmes au niveau de leur aptitudes en mathmatiques). On accepte gnralement ce risque a hauteur d'un seuil (alpha) de .05. En d'autres termes, on accepte d'ventuellement se tromper si on a moins de 5% de chances que ce soit le cas. Formul encore d'une autre faon, si l'hypothse nulle est vraie, il reste 5% de chances qu'on la rejette tort.
- L'erreur de seconde espce consiste ne pas rejeter l'hypothse nulle bien qu'elle soit fausse. La probabilit d'effectuer cette erreur (appele beta) est inversement proportionnelle la puissance du test (1-beta): c'est--dire la probabilit de rejeter, raison, l'hypothse nulle. La relation entre la puissance et le seuil que l'on choisit (alpha) est en revanche positive: plus on choisit un seuil exigeant (donc faible), moins on a de chance de dtecter une diffrence significative.

Suite la passation d'une exprience, une fois que l'on dispose enfin de ses donnes, on est souvent quelque peu dmuni. Comment faire face cette masse de variables? Voici les tapes que je vous recommande de suivre dans l'analyse de donnes exprimentales ou quasi-exprimentales. Pour ce faire, il vous faudra disposer du logiciel d'analyses de donnes SPSS Les grandes tapes dans l'analyse de donnes exprimentales: 1. Encodage: Numrotation des protocoles (un par sujet) On veillera encoder les donnes dans SPSS en mnageant une premire colonne pour le numro du sujet, une colonne correspondant chaque facteur manipul, une dernire colonne rapportant les problmes ou observations ventuelles propos du sujet.

- Dans la dnomination des variables, il est souvent prfrable de nommer les variables en fonction de ce qu'elle sont censes mesurer, suivies d'un numro. Par exemple, si vous utilisez quatre items mesurant l'extraversion perue d'une cible, vous pourrez les nommer extr1, extr2, extr3, extr4. Par ailleurs, vous attribuerez dans SPSS un label chacune d'elle correspondant la formulation exacte de l'item. En outre, je vous conseille de vous munir d'un questionnaire (si votre tude a t mene par questionnaire) sur lequel vous noterez ct de chaque item le nom de la variable associe dans SPSS.

- En ce qui concerne les variables nominales, vous attribuerez chaque valeur un nombre ("0" = femme, "1" = homme par exemple) et non seulement vous attribuerez un label la variable mais galement chaque valeur. Ceci est particulirement important en ce qui concerne les facteurs manipuls, qui sont gnralement nominaux (par exemple, "0" = "Contrle", "1" = "Condition forte", "2" = "Condition faible", etc.). -Pour dnommer les variables, il est recommand d'utiliser des chanes de caractres de maximum 8 caractres sans accent ni espace et ce afin que le fichier soit facilement transfrable d'une version de SPSS une autre. 2. crmer l'chantillon: - Je vous conseille d'ensuite vous centrer sur une variable dpendante la fois. Gnralement, dans un questionnaire, vous aurez conu plusieurs chelles afin de mesurer de manire valide les variables dpendantes qui vous intressent. Chacune de ces chelles est compose de plusieurs items. Dans la section suivante, nous verrons comment regrouper ces items de faon tudier non pas chaque item individuellement mais des scores correspondant aux regroupement de ces items (et qui constituent vos vritables variables dpendantes). Avant de regrouper des items, il est toutefois prfrable d'liminer certaines donnes que l'on juge peu exploitables et ce sur diffrentes base.

Sur base des valeurs observes: On peut examiner la distribution des variables individuelles et ce, notamment, afin d'ventuellement liminer les sujets qui auraient de nombreuses valeurs extrmes. A cet gard, une convention largement partage consiste liminer des sujets dont les observations se situeraient plus de 4 cart-types de la moyenne (McClelland, 2000). Cela permettra galement de dtecter d'ventuelles erreurs d'encodage qui auraient donn lieu des valeurs aberrantes. A ce stade, je suis relativement rserv quant la lgitimit d'liminer des sujets qui n'auraient qu'une valeur extrme (non due une erreur d'encodage). Aprs tout, celle-ci peut tre lgitime et devrait n'avoir que peu d'influence une fois les items agrgs sous formes d'chelles. - Sur base du droulement de la session: On pourra galement liminer des observations juges caduques pour des raisons mthodologiques (par exemple, une alarme a sonn pendant que le sujet passait l'exprience; le sujet n'a pas rpondu certaines consignes, etc.) - Sur bases dmographiques: le sujet se distingue du reste de l'chantillon par des critres jugs pertinents quant l'interprtation des rsultats - par exemple, il est maghrbin alors que l'tude porte sur les prjugs vis--vis des personnes d'origine nord-africaine - ou quant sa capacit correctement interprter les consignes - par exemple, s'il ne matrise pas bien l'idiome dans lequel est formul le questionnaire.

3.Simplification des donnes et regroupement des items: Gnralement, dans un questionnaire, vous aurez conu plusieurs chelles afin de mesurer de manire valide les variables dpendantes qui vous intressent. Chacune de ces chelles est compose de plusieurs items. Avant de tester si vos manipulations exprimentales ont eu un effet sur ces variables, il importe donc de les agrger, de les regrouper afin de disposer d'une mesure unique. Ceci dans un souci de simplification (il serait extrmement fastidieux d'effectuer et de devoir lire des analyses item par item si les items portent tous sur le mme objet) et de validit interne (l'erreur de mesure diminuant lorsque plusieurs items mesurant la mme dimension sont agrgs). - Deux stratgies sont envisageables pour regrouper les items. Elles dpendent de la mesure dans laquelle vous vous attendez ce que vos donnes soient uni- ou multi-dimensionnelles. Prenons l'exemple d'une srie de questions portant sur l'impression que l'on se fait d'une cible - est-il comptent, chaleureux, sympathique, etc. Les rponses ces questions peuvent soit tre "multidimensionnelles" ce qui signifie que plusieurs dimensions organisent la perception de la cible (par exemple, la dimension "comptence intellectuelle" et la dimension "sociabilit"), soit tre unidiemensionnelles (par exemple un facteur gnral "positivit" organise cette reprsentation). Dans le premier cas, il serait pertinent de construire deux chelles, mesurant la perception de la cible sur chaque dimension. Dans le second cas, une seule chelle suffira.

- Si vous n'tes pas sr que vos donnes sont unidimensionnelles, ou si vous vous attendez ce qu'elles soient multidimensionnelles, il importe de faire une analyse factorielle en composantes principales (ACP) afin de s'en assurer:

Les indices de dispersion


Comparaison de deux notes :
Dans une preuve A dont les caractristiques sont M = 10 et s = 1.5, un candidat obtient la note 8. Dans une preuve B dont les caractristiques sont M = 150 et s = 10, un candidat obtient 133.5 Dans quelle preuve est-il le plus faible ? Transformation des notes brutes sur une chelle commune, Z, note centre rduite :

Z = (X-M)/S soit
Z A = (8-10)/1.5 = -1.33 et Z B = (133.5-150)/10 = -1.45 Cest donc lpreuve B que le candidat est le plus faible, le plus loign de la moyenne

Les indices de dispersion


Comparaison des notes de deux candidats X et Y nots par des professeurs diffrents A et B lors dune mme preuve :
Le candidat x obtient la note 15, M = 10, s = 2.5 Le candidat Y obtient la note 18, M = 10, s = 5 Quel est le meilleur candidat ?

Transformation des notes brutes sur une chelle commune, Z, note centre rduite :
Z = (X-M)/S soit Z X = (15-10)/2.5 = 2 et Z Y = (18-10)/5 = 1.6 X est en ralit meilleur que Y

L'alpha de Cronbach
-Lorsque l'on mesure un construit psychologique (par exemple une
attitude, le niveau d'identification, l'orientation politique, le strotype d'un groupe, etc.) -on recourt souvent des questionnaires regroupant de nombreuses questions portant sur un mme sujet.

-Effectivement, disposer de plusieurs questions pour valuer un mme concept permet souvent de limiter l'erreur de mesure et de l'valuer de faon plus prcise et gnrale.
-Par exemple, pour mesurer l'orientation politique (le degr auquel on est de "gauche" ou "de droite"), on pourrait poser des questions comme -"Dans quelle mesure tes-vous favorable l'conomie de march?"; - "Dans quelle mesure tes-vous favorable un contrle de l'Etat sur le fonctionnement de l'conomie?"; etc. - sur des chelles 7 points (1="pas du tout d'accord", 7 = tout fait d'accord).

-Aprs avoir encod les rponses des sujets et les avoir transformes de faon ce que les valeurs leves reprsentent la mme orientation politique, on pourrait tre tent de calculer leur moyenne ou leur somme afin d'obtenir un "score" correspondant l'orientation politique des sujets. -Toutefois, d'un point de vue mthodologique, on ne peut pas combiner les rponses des items diffrents si l'on ne dispose pas d'arguments empiriques suggrant que ces items mesurent effectivement la mme chose. -Cela n'aurait pas de sens de combiner des items qui mesurent en ralit des choses diffrentes. Or si deux items mesurent la mme chose, les rponses devraient tre corrles l'une l'autre. -Ainsi si, dans l'exemple prcdent, les deux items mesurent bien l'orientation politique, les personnes qui sont fort favorables la premire affirmation devraient tre dfavorable la seconde.

-Toutefois, les corrlations ne peuvent tre calcules que sur deux items la fois. -Que faire lorsqu'on utilise plus de deux items pour mesurer un concept? -C'est cela que sert l'alpha Cronbach qui varie entre 0 et 1 e t constitue un indice de "consistance" de l'chelle, c'est--dire du degr auquel l'ensemble des items qu'elle inclut mesurent bien la mme chose. -A partir de quelles valeurs l'alpha est-il suffisamment satisfaisant pour que l'on puisse calculer un score correspondant l'ensemble de l'chelle (en effectuant la moyenne ou la somme des items)? - Entre 0 et .50: Valeurs insuffisantes. - Entre .50 et .70: Valeurs Limites. - Entre .70 et 99: Valeurs leve ou trs leves. Attention: l'alpha ne peut se calculer que sur des donnes continues.

A prsent que vous avez regroup vos variables sous forme de scores, il peut tre utile d'examiner la distribution de ces variables globalement ainsi qu'en fonction des facteurs manipuls. Vous pourrez ainsi examiner si elle est raisonnablement normale, ce qui vous autorise utiliser des techniques paramtriques. A ce stade, il devient encore plus lgitime d'liminer des sujets qui auraient des valeurs extrmes. Celles-ci refltant cette fois des scores agrgs sur plusieurs items, elles sont d'autant plus susceptible de reflter le caractre atypique du sujet.

- Si la distribution est suffisamment "normale", il devient pertinent d'examiner les moyennes. A vue d'oeil, cela vous permettra d'examiner si les rsultats semblent se conformer aux hypothses ????

Moyenne : Un indicateur non Fiable ?

- En 1991, salaire net moyens des salaris franais temps complet du priv et du semi public (11.8 millions de personnes) = 9 492 F Salaire mdian = 7 750 F, soit un cart 1742 F On utilisera pour les test de comparaisons de moyennes dautres indicateurs : des indicateurs de dispersion tels que la variance et lcart type La variance et lcart type sont des indices de dispersion qui permettent de voir comment les donnes sont rparties autour de la moyenne. Ces 2 paramtres sont de mme nature puisque la variance est le carr de lcart type (ou lcart type est la racine carr de la variance).

Les indices de dispersion


Les indices de dispersion sont des mesures de lamplitude de la variation du phnomne autour de la moyenne

Avoir 8 na pas la mme signification si les notes vont de 2 18, avec une moyenne de 10 que si elles vont de 8 12 toujours avec une moyenne de 10
Notion de variance et cart-type :

Supposons que dans une distribution, on calcule pour chaque donne par rapport la moyenne (soit X M)
Ces diffrences seront soit positives soit ngatives et la somme = 0

Les indices de dispersion


Pour viter ce problme, on lvera au carr et les diffrences devenues positives pourront sadditionner pour exprimer la dispersion

Pour rendre la comparaison possible avec dautres distributions deffectifs diffrents. On divisera par N (taille chantillon). Cest la variance (v) Autre Indice souvent utilis cart type ( soit racine carr de la variance)

Dans le cas contraire, deux solutions au moins s'offrent au chercheur: -Solution 1 - Transformation: selon la distribution, il peut tre pertinent de "transformer" les variables de faon ce que leur distribution soit plus normale. Par exemple, pour des distributions fortement asymtriques, une transformation logarithmique peut s'avrer bnfique. Ceci exigera d'utiliser la fonction transform/compute dans SPSS et de dfinir une fonction correspondant la nouvelle variable. - Solution 2 - Approche non paramtrique.

5. Infrence statistique -Votre tche suivante consistera dterminer s'il existe des diffrences statistiquement significatives entre vos conditions exprimentales. Ceci implique de recourir l'infrence statistique.

-Quelle stratgie adopter? Tout d'abord, examinez bien votre plan exprimental. Pour chaque facteur impliqu, examinez s'il est rpt-intra-sujets ("within-subjects") ou s'il est intersujets ("between subjects"). Une fois ceci tabli, vous passerez des analyses les plus globales aux analyses les plus spcifiques. Par exemple, imaginez que votre plan exprimental comprenne un facteur intersujets deux modalits (A) et un facteurs intra-sujets trois modalits (B). Vous effectuerez d'abord une analyse de variance mixte.

Imaginons que cette analyse ne rvle pas d'interaction mais uniquement deux effets principaux de A et de B. Vous examinerez ces effets principaux. Comme A a deux modalits vous pourrez identifier directement la nature de ces effets (un niveau est plus lev que l'autre). Pour B, par contre, vous devrez effectuer des comparaisons post hoc ou des contrastes afin de dterminer entre quelles conditions une diffrence a t observe (car un effet principal ne spcifie pas l'origine de la diffrence observe). Imaginons en revanche que l'on observe une interaction. Dans ce cas, il faut dcomposer l'interaction entre les deux facteurs, par exemple en examinant pour chaque modalit de B, si l'effet de A est significatif (ce qui exigera d'effectuer un test t pour chantillons indpendants). Inversement, on pourra examiner si, pour chaque valeur de A, l'effet de B est significatif (ce qui impliquera d'effectuer une analyse de variance un facteur aprs avoir "splitt" le fichier selon les niveau de A). Si ces analyses de variance se rvlent concluantes, il faudra ensuite nouveau effectuer des tests a posteriori afin d'examiner d'o proviennent les diffrences observes.

6. criture des rsultats: Celle-ci sera guide par les hypothses. Nous verrons les consignes aprs

Quelle mthode choisir? Tout dpend de votre Variable dpendante, la variable dont vous souhaitez observer les variations en fonction d'un autre facteur. 1. Est-elle nominale? 2 Variables: Chi carr Plus de 2 Variables: Analyse log-linaire. Type de question: "Est-ce que la proportion de sujets qui font/pensent/disent x varie en fonction des variables indpendantes"? 2. Peut-elle tre considre comme continue? Par exemple, les rponses une chelle de Likert sont souvent considrees comme continues de mme que les temps de raction. Design 1 Facteur: Inter-sujets: Oneway ANOVA (si plus de deux niveaux), suivi de comparaisons mutliples ou contrastes. Test t pour chantillons indpendants (Si deux niveaux). Intra-sujets: Analyse de variance mesures rptes (si plus de deux niveaux), suivi de comparaisons multiples (Bonferroni) ou de contrastes. Test t pour chantillons apparis (Si 1 niveau).

Plus d'1 facteur: Tous Inter-Sujets: Analyse de variance factorielle suivie de comparaisons multiples, contrastes ou/et analyses des effets simples. Certains inter, d'autres intra: Analyse de variance mixte suivie de comparaisons multiples, contrastes ou/et analyses des effets simples. Tous intra: Analyse de variance mesures rptes (si plus de deux niveaux), suivi de comparaisons mutliples (Bonferroni) ou/et analyses des effets simples. Types de questions auxquels ces analyses rpondent: "Est-ce que la moyenne observe sur la variable X varie en fonction des facteurs A, B et de leur interaction?" (ANOVA)? "Si oui, Entre quelles conditions y a-t-il des diffrences?" (Comparaisons multiples, contrastes) Quand effectue-t-on des contrastes? Si on dispose hypothses prcises concernant des comparaisons entre conditions Quand effectue-t-on des comparaisons multiples? Quand analyse-t-on les effets simples? Lorsqu'on souhaite examiner l'effet d'un facteur un niveau prcis d'un autre facteur. Si on ne dispose pas d'une hypothse prcise concernant les comparaisons entre les conditions. Si on souhaite comparer tous les groupes entre eux.

Niveau de mesure de la variable dpendante Nombre et Type de Facteur(s) 1 Facteur

Nominal

Intervalle ou Continu

Tests Globaux Test T pour chantillons indpendants (si facteur deux niveaux) Analyse de Variance un Facteur Test T pour chantillons apparis (si facteur deux niveaux) Analyse de Variance mesures rptes (un facteur)

Comparaisons Spcifiques Contrastes (si plus de deux niveaux) Tests de comparaisons multiples

Inter-Sujets

Chi Carr

Intra-Sujets

Contrastes: Tests T pour chantillons apparis Comparaisons multiples: Tests T apparis avec correction de Bonferroni

2 Facteurs ou + Chi Carrs ou Analyse loglinaire Analyse de Variance Factorielle Contrastes Comparaisons Multiples Effets Simples Contraste: Tests T pour chantillons apparis Comparaisons multiples: Tests T apparis avec correction de Bonferroni Effets Simples

Inter Sujets

Intra-Sujets

Analyse de Variance mesures rptes (plusieurs facteurs)

Mixte

Analyse de Variance mixte (plusieurs facteurs dont au moins un inter-sujets et au moins un intra-sujets).

Effet Simples du facteur rpt ou du facteur intersujets Contrastes Comparaisons multiples: Tests T apparis avec correction de Bonferroni