Vous êtes sur la page 1sur 18

MÉTHODOLOGIE

MISE EN PLACE D’UNE MÉTHODOLOGIE


EXPÉRIMENTALE : HYPOTHÈSES ET VARIABLES
Françoise ANCEAUX, Ph.D.
Pascal SOCKEEL, Ph.D.

RESUMÉ A B S T R AC T
Cet article méthodologique se propose de pré- In this methodological paper, we present the
senter ce qui, dans le cycle d’une recherche, elaboration of the experimental design, central
concerne la mise en place du plan de recherche. stage of the research cycle. First, we focus on
Il se focalise tout particulièrement sur la formu- the hypothesis elaboration from the research
lation des hypothèses à partir de la question de question. Then, we detail the hypothesis opera-
recherche ainsi que sur leur opérationnalisation tionalisation by the means of the choice of
et la manière de les mettre à l’épreuve par le variables. Finally, the experimental controls and
biais du choix des variables. Les contrôles expé- the factorial designs are presented.
rimentaux, ainsi que les plans factoriels, plans
d’expérience les plus utilisés, sont ensuite pré-
sentés.

Mots clés : démarche scientifique, méthode Keywords : scientific approach, experimental


expérimentale, théories, hypothèses, variables. method and design, theory, hypothesis, variables.

INTRODUCTION fondées sur des relations objectives vérifiables ». Cette


définition insiste sur l’utilisation d’une démarche
scientifique qui permet de découvrir des régulari-
La recherche en soins infirmiers présente de nom- tés dans son objet d’étude.
breuses ressemblances avec la recherche en sciences
humaines et sociales dans la mesure où elle s’inté- De manière générale, un certain nombre de pos-
resse, entre autres, à des sujets comme l’anxiété, tulats sous tendent l’utilisation de la démarche
l’écoute, l’empowerment et l’autonomie, ou encore scientifique. Les deux premiers concernent l’exis-
la formation, les compétences et les habiletés. Elle a tence de lois générales organisant le monde
également des liens privilégiés avec les sciences de la et le déterminisme des phénomènes naturels,
vie, en particulier, la biologie et les sciences médi- qu’ils concernent l’homme ou son environnement.
cales. Ces diverses disciplines peuvent avoir des On ne peut en effet pas parler de connaissances
points de vue quelquefois radicalement différents sur d’une valeur universelle si l’on n’admet pas l’exis-
les phénomènes naturels. Toutefois, pour élaborer tence d’un ordre logique dans l’univers et de prin-
les connaissances de leurs domaines respectifs, elles cipes organisateurs dans la nature. C’est sur cette
ont en commun de mettre en œuvre une approche affirmation élémentaire essentielle que repose la
scientifique qui permet que ces connaissances à notion de prédictibilité des phénomènes. La science
propos des phénomènes étudiés soient basées sur va donc principalement s’intéresser aux régulari-
des preuves accumulées au travers de recherches. tés dans les faits et, même si les causes des phé-
nomènes peuvent être multiples, ce qui est le cas
Pour Rey (1990), la science est un « … ensemble de sitôt que l’on s’intéresse au fonctionnement
connaissances, d’études d’une valeur universelle, carac- humain, le chercheur partira du principe qu’il est
térisées par un objet et une méthode déterminés, et possible de les connaître ou de les déterminer.

66 RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006


MISE EN PLACE D’UNE MÉTHODOLOGIE EXPÉRIMENTALE :
HYPOTHÈSES ET VARIABLES

Les postulats suivants portent sur le caractère « empi- chercheur de raisonnements explicites et valables pour
rique » de l’acquisition des connaissances scienti- tous. C’est en effet, par la reproduction systématique, à
fiques, sur leur intégration au sein de systèmes d’autres moments, dans d’autres conditions et chez d’autres
théoriques et, enfin sur le caractère réfutable de sujets, d’un fait ou d’un phénomène que l’on arrive à géné-
ces derniers. En effet, l’approche première de toute dis- raliser les résultats le concernant, à mieux le comprendre
cipline scientifique consiste à identifier, nommer, compa- et à faire émerger les lois qui le régissent.
rer, décrire et classer les faits. De cette activité, naissent
les hypothèses qui visent à expliquer les faits et l’exis- Enfin, une caractéristique centrale de cette démarche est
tence des régularités dégagées. Ces hypothèses seront d’être itérative et dynamique. En effet, les sciences,
ensuite confrontées aux faits pour que leur pertinence en tant qu’ensemble de connaissances, progressent de
soit évaluée. Enfin, les faits ainsi mis en évidence pour- manière itérative, c’est-à-dire qu’elles procèdent par
ront être expliqués et structurés ou intégrés au sein de essais et erreurs et par approximations successives. Ceci
théories, de modèles ou de lois. Les théories, en inté- leur permet de cerner peu à peu un problème et de lui
grant plusieurs relations entre les faits, relations qui donner une solution de plus en plus précise. Les sciences
étaient jusque là indépendantes, permettent ainsi d’amé- passent donc par une remise en cause permanente de
liorer la compréhension d’un ensemble de faits et d’en- leurs conclusions, postulats, théories. Cette progression
gendrer, par déduction, de nouvelles hypothèses de itérative fait que chaque solution est dépendante de la
recherche. Leur caractéristique essentielle est d’être réfu- solution proposée au cycle précédent qu’elle consolide,
tables, sinon elles ne sont pas scientifiques. Cette notion contredit ou améliore. La dynamique et le caractère ité-
de réfutabilité (Popper, 1978) signifie qu’il doit être pos- ratif de la démarche scientifique sont bien mis en évi-
sible de déduire des énoncés de base pouvant être dence dans le schéma du cycle de la recherche présenté
confrontés aux observations. dans la Figure 1.

Par exemple, l’énoncé « tous les cygnes sont blancs » est Le cycle de la recherche est déclenché par une question
réfutable puisqu’il suffit d’en trouver un d’une autre couleur que se pose le chercheur. Il tentera d’y répondre en
pour montrer qu’il est faux. Par contre, l’énoncé « il existe confrontant diverses propositions de réponses provisoires
des cygnes blancs » n’est pas réfutable. (hypothèses) à des observations empiriques. Les conclu-
sions qui découlent de cette confrontation sont suivies d’un
La fausseté éventuelle des énoncés entraîne donc logique- retour au point de départ qui permet de modifier la ques-
ment la fausseté de la théorie dont ils sont issus. Si les impli- tion initiale ou d’en poser de nouvelles. On déclenche ainsi
cations contenues dans les énoncés sont acceptables ou un nouveau cycle.
confirmées, la théorie a provisoirement résisté au test et
on n’a aucune raison de l’écarter. Dans le cas contraire, on Figure 1 : cycle de la recherche (adapté de Beaugrand, 1988)
peut dire que, puisque l’énoncé n’est pas confirmé, la théo-
rie est réfutée. Toutefois, ce n’est pas aussi « simple que
cela », comme nous le verrons dans les paragraphes sui-
vants.

Outre les postulats de base que nous venons de présen-


ter, la démarche scientifique présente un certain nombre
de caractéristiques qu’il convient de rapidement signaler
ici (pour plus de détails, cf. Sockeel, & Anceaux, 200X ;
Robert, 1988 ; Matalon, 1994a, 1994b ; ou encore Myers
& Hansen, 1997).

Un trait essentiel de la démarche scientifique est de repo-


ser sur la notion de preuve, ce qui signifie que les argu-
ments du scientifique doivent être acceptables par tous.
Ce souci de la preuve (Matalon, 1994b) est fondé par des
observations empiriques publiques, ce qui signifie que
les observations, les résultats et les conclusions d’expéri-
mentations doivent être rendus publics. En effet, une
démarche n’est scientifique que si elle autorise d’autres
chercheurs à reproduire les observations, à vérifier à leur
tour les hypothèses et bien évidemment à les réfuter éven-
tuellement. La reproductibilité et l’éventuelle réfuta-
tion des résultats reposent sur la mise en œuvre par le

RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006 67


Selon Beaugrand (1988), le cycle de la recherche com- les sujets d’étude (étudier l’impact d’un fonctionnement hos-
prend quatre sous-cycles: pitalier en dehors de l’hôpital n’a aucun sens). Dans de nom-
• le sous-cycle préparatoire à la production des obser- breux cas, nous serons donc contraints d’utiliser des
vations et des mesures ; méthodes plus descriptives comme la méthode d’ob-
• le sous-cycle de production des observations ; servation ou le questionnaire.
• le sous-cycle d’analyse et d’interprétation des données
et de reformulation du modèle ; Dans le cadre de cet article, nous nous centrerons sur la
• le sous-cycle de publication. méthode expérimentale dans la mesure où, même si elle
est quelquefois difficile à appliquer, elle est la seule qui per-
Nous nous centrerons ici sur le premier sous-cycle et mette la mise en évidence de liens causaux entre
plus précisément sur la seconde étape de ce sous-cycle, les événements étudiés, la prise de décision quant à la
celle relative à l’élaboration du plan de recherche. notabilité des effets observée et, par voie de consé-
L’énoncé du problème est bien évidemment une étape quences, l’extraction de lois générales. On appelle
cruciale puisque l’ensemble de la recherche en décou- méthode expérimentale celle qui emploie la démarche
lera. Toutefois, dans le cadre de cet article, il nous a sem- définie par Claude Bernard (1856), c’est-à-dire celle qui
blé intéressant de nous focaliser sur cette seconde étape consiste à « collecter des faits », pour en extraire des hypo-
dans laquelle on va transposer les concepts théoriques thèses qui vont ensuite être soumises à vérification. Ce qui
et les hypothèses générales ou questions de recherche la caractérise, c’est le souci primordial d’apporter la
dans le cadre d’une recherche particulière. preuve et de valider de manière empirique et systéma-
tique les systèmes théoriques par le biais des hypothèses.
Dans un premier temps, il nous faut choisir une
méthode d’acquisition des connaissances. Cette Dans un deuxième temps, une fois choisie la méthode
étape consiste à se demander quelle est la meilleure d’acquisition, ici la méthode expérimentale, on passe à
méthode permettant de répondre aux questions posées, l’étape d’opérationnalisation. On va définir, à par-
la méthode choisie devant permettre la mise en évi- tir de la question de recherche, les hypothèses de tra-
dence des phénomènes que l’on veut étudier. Il est vail ou opérationnelles ainsi que les variables, également
extrêmement difficile de classer les différentes méthodes en terme opérationnel, et spécifier les relations qu’elles
utilisables pour acquérir des connaissances scientifiques. entretiennent.
On peut par exemple les classer selon les conditions de
l’observation : on opposera alors expériences de labo- Le plan de recherche ainsi élaboré doit servir à la pro-
ratoire et expériences de terrain. On peut également duction de données empiriques systématiques valides.
les classer selon le type de questions que l’on se pose : Ceci nécessite une opération de mesure, c’est-à-dire
on parlera de recherches à visée descriptive ou à visée une phase où l’on regarde, reconnaît et compte. Dans
explicative. Cette classification recouvre en partie celle cette étape, on doit donc: (1) choisir des instruments
de Reuchlin (1971) qui classe les méthodes utilisées en (listes de comportements, échelles, questions....) ; (2)
sciences humaines et sociales sur un continuum heuris- éliminer au mieux les sources d’erreurs ; (3) vérifier la
tique, c’est-à-dire en fonction de leur capacité à faire pertinence des techniques et des variables utilisées en
progresser les connaissances scientifiques. En effet, pour faisant éventuellement une pré-expérience ou une simu-
cet auteur, il existe quatre classes de méthodes dont les lation des données permettant de tester la validité du
capacités heuristiques vont croissant : l’introspection, plan. Ce sont ces activités que nous allons aborder de
les méthodes historiques, les méthodes descriptives et manière détaillée dans la suite de cet article.
comparatives (dont l’observation, les questionnaires et
les enquêtes) puis enfin, la méthode explicative « par
excellence », la méthode expérimentale.
LES HYPOTHÈSES
Il n’y a pas dans cette classification d’opposition entre ces
différentes méthodes, mais simplement des différences de
puissance heuristique. En fait, ce sont d’une part les objec- Théories et hypothèses
tifs des recherches et, d’autre part, les contraintes dues
aux situations étudiées qui détermineront le choix de la Il est très difficile d’aborder la question de l’hypothèse
méthode. Par exemple, certaines questions ne peuvent sans parler des théories. En effet, recueillir des faits, des
faire l’objet d’études expérimentales pour des raisons données empiriques n’est pas une fin en soi. Encore faut-
déontologiques (on ne « provoque » pas une maladie pour il les expliquer, les structurer : c’est à cela que servent les
pouvoir l’étudier dans les « meilleures conditions expérimen- lois, les théories et les modèles qui sont des instruments
tales »), techniques (certains concepts, tel l’empowerment, de synthèse des connaissances renvoyant à trois niveaux
sont trop composites et trop subjectifs pour pouvoir être, pour d’explication des données empiriques bien différenciés :
le moment tout au moins, étudiés par des mesures quantita- • les lois ont un statut très général et s’appliquent à un
tives objectives), ou encore parce qu’elles dénatureraient ensemble très varié de situations ;

68 RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006


MISE EN PLACE D’UNE MÉTHODOLOGIE EXPÉRIMENTALE :
HYPOTHÈSES ET VARIABLES

• les théories reposent sur un regroupement de connais- l’établissement de lois scientifiques que si elle s’ac-
sances dans un domaine particulier ; compagne d’une étape déductive qui permet d’éprou-
• les modèles sont des regroupements de connaissances ver la valeur des hypothèses qu’elle a permis de
qui concernent quelques faits expérimentaux bien déli- poser. L’induction sert alors à dégager les premières
mités. régularités, et ne permet au mieux que de formuler de
bonnes hypothèses à vérifier par un grand nombre de
Une théorie permet de synthétiser les généralisations recherches. C’est ce que Popper (1978) appelle la
empiriques relatives à une classe de phénomènes et de méthode déductive de contrôle.
formuler les règles applicables à d’autres phénomènes
de cette classe. Elle permet également de prédire et de La validation des hypothèses
contrôler et, de ce fait, d’expliquer. Elle n’est pas sta-
tique, elle est un outil scientifique dynamique qui guide Pour expliciter les principes sous jacents à l’élaboration
le travail de recherche et se modifie pour s’accommo- ainsi qu’à la validation des hypothèses, il est nécessaire
der aux faits nouveaux. Elle est constituée d’énoncés de détailler la relation existant entre théorie et hypo-
hypothétiques, donc elle est toujours partiellement thèses.
fausse a priori.
De ce fait, elle doit pouvoir être, directement ou indi- Élaboration
rectement, confrontée à des données empiriques. Pour Une théorie peut être décrite de façon formelle
ce faire, elle doit donner lieu à des prédictions ou hypo- (Beaugrand, 1988) : T = { H → t } avec
thèses vérifiables, c’est-à-dire qui peuvent être mises à
l’épreuve des faits. T la théorie.
H les prémisses, c’est-à-dire l’ensemble des postu-
Origine des hypothèses lats de base et des hypothèses intermédiaires.
→ l’implication logique qui relie une ou plusieurs pré-
L’élaboration des hypothèses est certainement l’étape la misses et des conclusions par le biais d’une règle
plus difficile du travail expérimental. Nous avons vu, dans d’inférence du type « Si a alors b ».
le paragraphe précédent que les hypothèses sont la plu- t= l’ensemble des « théorèmes déductibles », c’est-
part du temps issues des connaissances théoriques. Elles à-dire les hypothèses résultantes de la déduction
peuvent également découler de l’observation de l’ap- logique effectuée à partir des prémisses.
parition régulière d’un ou plusieurs ensembles de faits,
d’évènements. Ces deux mécanismes correspondent à Les hypothèses obtenues par déduction (t), les hypo-
deux types différents de raisonnement permettant la thèses théoriques, peuvent ensuite être traduites en pro-
création d’hypothèses : le raisonnement par induction, positions empiriques, que l’on appelle les hypothèses de
non fondé sur le plan logique, et le raisonnement par recherche ou opérationnelles (t*) qui peuvent être confron-
déduction, fondé sur le plan logique, le débat sur le choix tées directement aux faits et données empiriques et ce,
du meilleur raisonnement étant lancé depuis très long- surtout en construisant des expériences.
temps (Popper, 1978). Si l’on reprend le formalisme proposé ci-dessus, on peut
décrire le processus de déduction des hypothèses à par-
Le raisonnement par induction est le processus qui tir des théories de la manière suivante :
permet de formuler des hypothèses générales à partir
de faits particuliers. A partir d’observations concrètes, T = { H → t } → t*
le chercheur élabore des structures théoriques per-
mettant de classer et d’expliquer. Dans cette approche, Vérification
ce sont les faits observés qui suggèrent les variables La vérification est l’épreuve qui débouche sur la confir-
importantes, les régularités, les lois et éventuellement mation ou l’infirmation d’une hypothèse et
les théories. d’une théorie à partir de la confrontation de ses impli-
cations avec les données empiriques. Une théorie est
La méthode déductive procède à l’inverse. A partir confirmée aussi longtemps que ses énoncés de base ne
d’une théorie, donc de principes généraux, on formule sont pas en contradiction avec la réalité. C’est donc par
des prédictions concernant des cas concrets, plus spé- l’infirmation potentielle de ses implications qu’une théo-
cifiques. On recueille ensuite des données (des faits), rie est réfutable.
afin de voir s’ils concordent avec ces prédictions et donc La logique de la vérification des hypothèses est la sui-
s’ils confirment l’hypothèse. vante (Grünbaum, 1963):
Les hypothèses opérationnelles (t*) sont confrontées
Seule, l’induction ne peut pas être utilisée dans la aux données recueillies lors d’expérimentations (e*).
démarche scientifique puisque, d’un point de vue On peut donc formuler la chaîne déductive par :
logique, toute conclusion effectuée de cette manière
peut se révéler fausse. L’induction ne peut contribuer à T = { H → t } → t* → e*.

RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006 69


Ce qui sera vérifié lors de l’expérimentation est la rela- Les hypothèses générales
tion entre les hypothèses opérationnelles et les impli- On les appelle également hypothèses de travail, ou
cations empiriques (les données recueillies lors de l’ex- hypothèses théoriques.
périence), à savoir : L’hypothèse générale est une ligne directrice générale
qui prévoit une relation de type abstrait entre deux
t* { antécédent(s) } → e* { conséquence(s) } classes de faits. C’est une représentation abstraite expli-
cative et/ou prédictive de l’existence d’une relation non
S’applique alors le principe de vérification d’une impli- encore établie entre deux faits ou deux ensembles de
cation logique. Si la conséquence est nécessaire alors, il faits. Une telle hypothèse n’est pas directement véri-
suffit de montrer que : fiable ou plutôt, il y a plusieurs façons de la vérifier. Pour
• lorsque l’antécédent est vrai, alors la conséquence est chacun de ces cas, il faut une recherche spécifique, avec
vraie ; une hypothèse de recherche elle même spécifique: l’hy-
• lorsque la conséquence est fausse, alors on n’observe pothèse opérationnelle. Elle est non contingente, c’est-
pas l’antécédent. à-dire qu’elle doit être vraie quelle que soit la situation
dans laquelle elle sera étudiée.
Si ces deux cas sont réunis, on a montré la validité
logique des hypothèses. Les hypothèses de recherche ou hypothèses
Lorsque nous avons vérifié t* → e*, nous avons l’assu- opérationnelles
rance que l’ensemble des prémisses (H, postulats de base Comme nous venons de le voir, les hypothèses géné-
et hypothèses intermédiaires) est vrai. C’est dans le cas rales peuvent être opérationnalisées de différentes
inverse que se pose le problème de l’invalidation. En effet, manières (dans différentes situations ou expériences).
on ne pourra pas dire avec certitude ce qui, dans l’en- Les hypothèses opérationnelles sont alors leur traduc-
semble H des prémisses, est vrai ou faux. Ainsi, l’obten- tion dans un cadre concret, celui d’une recherche par-
tion de résultats défavorables peut ne pas conduire à ticulière. Elles permettent ainsi aux hypothèses géné-
l’abandon définitif d’une théorie et ce, surtout parce la rales d’être vérifiables.
réfutation ne permet pas d’indiquer si l’ensemble de la
théorie est fausse ou si une seule partie l’est, et laquelle. On parle d’hypothèses opérationnelles dans la mesure
où d’après Charbonneau (1988):
D’autre part, il se peut que les techniques mises en • elles se réfèrent aux opérations concrètes à effectuer
œuvre pour la réalisation de l’expérience aient été plus pour voir apparaître les comportements que l’on veut
ou moins maîtrisées, que les moyens de mesure utilisés mesurer ;
comportent des biais ou des défauts et, plus générale- • elles peuvent donner une indication sur le mode de
ment, que les choix méthodologiques n’aient pas été mesure, sur le mode d’évaluation du comportement ;
judicieux. Ces conditions auxiliaires de l’expérience, mal • elles précisent, la plupart du temps, les variables expé-
contrôlées, peuvent avoir «contaminé» l’effet attendu. rimentales mises en jeu pour révéler l’effet prévu.
Si tel est le cas, on formulera ce que l’on appelle une
hypothèse ad hoc, qui va mettre en cause l’un ou l’autre Les hypothèses statistiques.
de ces défauts dans le but de sauver les hypothèses d’ori- Dans les recherches où l’objet d’étude est l’humain, plus
gine. De telles hypothèses ad hoc ne doivent bien généralement le biologique par opposition aux sciences
entendu pas être utilisées systématiquement et sans pré- physiques, on se trouve très souvent confronté à une
cautions : il faut qu’elles soient vraisemblables, explica- importante variation intra et inter individuelle des
tives et conformes aux autres théories connues pour mesures effectuées et ce, même si les mesures sont
qu’elles aient une quelconque valeur. Il faut également quantitatives et objectives (voir plus bas). Cette carac-
pouvoir les mettre elles-mêmes à l’épreuve. téristique nous incite d’ailleurs à répéter les mesures,
ce qui produit des masses de données difficilement inter-
La question de recherche prétables sans l’aide des statistiques.
et la formulation des hypothèses
Il faut donc, pour prouver le bien fondé des hypothèses
A partir de la problématique de la recherche, éga- opérationnelles, (1) trouver l’indice pertinent permettant
lement appelée question de recherche, on déduit des d’exprimer la tendance générale des mesures effectuées
hypothèses qui seront confrontées aux données empi- sur les groupes de sujets (le plus utilisé est un indice de
riques. Une phase d’opérationnalisation de ces tendance centrale, moyenne ou médiane), et (2) trou-
hypothèses est nécessaire pour permettre la confron- ver l’outil statistique adéquat pour analyser ces résul-
tation aux faits, ce qui nécessite la mise en œuvre d’un tats et nous aider à vérifier la relation causale.
processus en trois étapes conduisant à l’élaboration d’hy-
pothèses générales, puis d’hypothèses de recherche et C’est ainsi que l’on distingue les statistiques descriptives
enfin de prédictions expérimentales et d’hypothèses sta- des statistiques inférentielles. Les statistiques inféren-
tistiques. tielles nous aident à vérifier l’existence d’une relation

70 RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006


MISE EN PLACE D’UNE MÉTHODOLOGIE EXPÉRIMENTALE :
HYPOTHÈSES ET VARIABLES

entre causes et conséquences. Ces outils nous per- Par exemple, une probabilité critique de .05 signifie que
mettent de prendre des décisions sur la base d’une ques- si l’on reproduisait 100 fois l’expérience, on ne trouve-
tion prototypique du genre « Y a-t-il une différence dans rait des résultats non conformes à H1 que dans seule-
la mesure recueillie lorsqu’une condition particulière de ment 5 cas. Ce seuil de risque de 5 % est souvent consi-
l’expérience est présente ou absente ? ». déré comme le maximum acceptable. Toutefois, certains
préfèrent n’affirmer l’existence d’une différence qu’avec
Ces méthodes statistiques inférentielles, basées sur des un risque maximum de 1 %.
lois de probabilités, procèdent donc par comparaison
et sont elles aussi soumises aux principes de la logique,
selon le système alternatif suivant :
(1) soit les variations observées entre les mesures sont L’OPÉRATIONNALISATION DES
dues au hasard : l’hypothèse statistique est dite HYPOTHÈSES : ÉLABORATION
« hypothèse nulle » ou « hypothèse de non diffé- DU PLAN DE RECHERCHE
rence » (H0) ;
(2) soit les variations des mesures témoignent de l’in-
fluence des variations de l’environnement mises en Mesure et évaluation
jeu dans le cadre de l’étude : l’hypothèse statistique
est dite « hypothèse alternative » ou « hypothèse Dès lors qu’on se propose de classer des faits dans les
de différence » (H1). sciences qui étudient le fonctionnement humain dans
ses composantes biologiques, psychologiques ou
Si la relation trouvée se situe dans les limites des valeurs sociales, on se trouve confronté au problème de la qua-
attribuables au hasard, on ne pourra réfuter l’hypothèse lification ou de la quantification des phéno-
de non différence (non rejet de H0). Si la relation trou- mènes. Une première classification des phénomènes
vée se situe hors de ces limites, on pourra rejeter cette rencontrés peut s’établir en fonction de la manière dont
hypothèse de non différence (rejet de H0) et accepter on a pu les observer et en mesurer les états. Une telle
l’hypothèse alternative de différence (acceptation de classification s’articule principalement autour de la dif-
H1). On pourra ainsi conclure qu’il est fort probable férence existant entre les notions de mesure et d’éva-
que les variations observées soient bien la conséquence luation.
des variations de l’environnement contrôlées dans l’ex-
périence. Le dictionnaire définit habituellement la mesure
comme «l’évaluation d’une grandeur par comparaison
Il est à noter que le fait de ne pas pouvoir réfuter l’hy- avec une autre grandeur de la même espèce, prise
pothèse de non différence ne signifie pas que l’on puisse comme terme de référence (l’étalon, l’unité) » ou
conclure à une non différence. On peut seulement dire comme «le produit de cette action».
qu’il n’a pas pu être mis en évidence de traces de notre
intervention. Ce processus de décision statistique est Munis, par exemple, d’un étalon de grandeur telle que
du même type que le statut d’un accusé dans le droit le mètre ou le centimètre, nous pouvons sans contesta-
français : il faut faire la preuve de sa culpabilité (hypo- tion possible relever et nous communiquer des tailles et
thèse alternative) mais en l’absence de preuve irréfu- longueurs diverses.
table, on ne pourra le condamner, même s’il subsiste un
doute (hypothèse nulle) : un accusé dont on n’a pas pu Pourquoi mesurer dans notre domaine? Si elle est sou-
prouver la culpabilité n’est pas considéré comme « inno- vent difficile, la quantification apporte une réponse
cent », mais comme « non coupable ». objective et facilement communicable quand on se
demande si un objet ou un individu possède un attri-
Ce système de raisonnement à deux hypothèses alter- but, une caractéristique particulière. Elle permet égale-
natives, caractéristique des statistiques inférentielles, va ment l’obtention de résultats plus détaillés et plus pré-
permettre d’évaluer le bien-fondé des hypothèses opé- cis rendant les jugements plus objectifs. La mesure
rationnelles, de tirer des conclusions sur les relations autorise enfin le recours à des méthodes mathématiques
causales entre les différents faits. S’il est intéressant de et statistiques puissantes basées sur la propriété des
montrer que notre expérience a bien fonctionné, l’ob- nombres.
jectif final des recherches est de pouvoir expliquer, voire
prédire, une gamme plus étendue de situations natu- Pour garantir l’objectivité de l’observateur, toute mesure
relles. Se pose donc la question de la généralisabilité des doit être associée à un procédé purement descriptif et
résultats. La probabilité critique associée à l’hypothèse comparatif, sans jugement de valeur. Le terme de
H1, ou seuil de significativité, nous renseigne sur la géné- mesure doit donc être distingué de celui d’évaluation.
ralisation possible de la différence observée, compte tenu Ce dernier processus se réfère en effet plutôt à l’action
du nombre de sujets utilisés, du nombre de mesures et de tirer des conclusions, de faire des inférences ou
de l’ampleur des variations inter et intra individuelles. prendre des décisions sur le phénomène à l’étude.

RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006 71


En bref, je peux vous dire que la température de l’eau Quels sont les instruments utilisés ? Ils peuvent être variés :
du torrent dans lequel je me suis baigné était très froide, des questionnaires, des tests psychologiques, une perfor-
ceci est le fruit d’une évaluation, de mon interprétation, mance simple en termes de bonnes réponses, des com-
de mon jugement, qui peut ne pas être partagé par les portements observés ou classés sur des grilles d’observa-
autres, selon les époques, les régions de la planète, les tion, mais aussi des données livrées par des instruments
sociétés et la résistance de chacun au froid. Lorsque je mesurant certaines caractéristiques physiques des réponses,
dis que l’eau du torrent était à 16,5 degrés, il s’agit par exemple un temps de réponse, la vitesse de retour à
d’une mesure dont l’unité est le degré Celsius, mesure la norme d’une composante sérologique, etc. Dans tous
spécifiée et connue, incontestable et sans jugement de les cas, on établit une correspondance entre les caracté-
qualité. ristiques à étudier et une réponse ou un comportement
discriminable sans ambiguïté : il faut donc vérifier les capa-
Néanmoins, les grandeurs qui concernent les faits cités de l’instrument à fournir une mesure stable (on uti-
sociaux ou psychologiques sont parfois difficiles à saisir lise le terme de fidélité ou de fiabilité pour désigner cette
sans recours aux principes de l’évaluation. Il est alors qualité) et adéquate à la question posée (le terme de vali-
nécessaire de définir précisément le système d’évalua- dité est alors utilisé). Mais avant tout, un instrument de
tion que l’on utilise, surtout pour mesurer la portée des mesure doit révéler efficacement les changements de gran-
conclusions et leur généralisabilité. On peut procéder deur ou de qualité de l’objet (du phénomène) mesuré.
en choisissant un critère - c’est-à-dire une référence à
partir de laquelle on se base pour évaluer la grandeur en La sensibilité
question -: ce choix est alors particulièrement délicat L’instrument de mesure doit être capable de réaliser des
et doit être fait en fonction du caractère indéniable du distinctions fines entre les différentes valeurs de la gran-
critère. L’évaluation est alors dite « critérée ». Dans deur à mesurer. La sensibilité renvoie à la capacité diffé-
d’autres cas, une référence, une norme peut-être utili- renciatrice ou “pouvoir séparateur” de l’instrument. Une
sée, à laquelle les autres mesures sont comparées. épreuve ou une mesure qui ne permettrait pas de diffé-
L’évaluation est alors « normative ». rencier les sujets ou les phénomènes n’aurait tout sim-
plement pas d’intérêt. En contrepartie, trop sensible, un
Un exemple dans le domaine familier de la docimologie instrument témoignera d’une certaine instabilité et
– l’évaluation scolaire et universitaire, à laquelle nous pourra produire des variations spontanées, sans rapport
avons été ou sommes tous confrontés - peut faire com- avec le phénomène. De plus, l’erreur aléatoire (la fluc-
prendre cette nuance : pour noter les compétences en tuation spontanée du phénomène) sera trop fréquente
mathématiques, l’examen de fin de semestre est une ou trop importante au regard de la grandeur à mesurer.
épreuve notée sur 20. Avec l’habitude – nous dirions son
sens « clinique » -, un enseignant est à même de dire si L’objectivité
12/20 est une note satisfaisante au regard des connais- L’utilisation d’un instrument de mesure ne doit pas
sances attendues ou minimale pour pouvoir progresser générer des résultats variant d’un utilisateur à l’autre.
sans difficulté dans le cursus. L’enseignant utilise alors Ce problème est particulièrement sensible lorsque la
une évaluation critérée. On peut également comparer définition d’un comportement, d’une réponse ou d’un
cette note de 12/20 à celles des autres étudiants. Si la concept n’est pas suffisamment précise et opération-
note moyenne est de 9/20, 12 est une bonne note. Elle nelle pour que chacun comprenne exactement la même
devient mauvaise si la note moyenne est de 17/20. Ce chose. Des procédés méthodologiques et statistiques
jugement se fait par rapport à une norme qui est ici la existent, qui assurent l’objectivité ou mesurent le degré
moyenne de la promotion. d’entente entre plusieurs observateurs ou utilisateurs
d’un même instrument de mesure. Une des précau-
Qualités métrologiques tions minimale pour assurer l’objectivité d’une mesure
des instruments renvoie au concept de standardisation, bien connu
dans le domaine des tests mentaux. On standardise un
Cette réflexion autour du problème de la mesure et de instrument lorsqu’on fixe définitivement les conditions
l’évaluation est spécifique des disciplines des sciences d’utilisation afin de limiter les interprétations lorsque
humaines, biologiques et sociales, à l’inverse des sciences la mesure contient une part de subjectivité. Cette stan-
dites « dures », comme la physique, pour lesquelles la dardisation concerne la situation, les instructions
simple observation ou la technologie assurent des données aux sujets et enfin la cotation des
mesures fiables, incontestables, sans recours nécessaire réponses ou la mesure de la performance. En
aux inconvénients de l’évaluation. Pour cette raison, les effet, si la situation est parfaitement définie à l’avance
sciences humaines et sociales, et particulièrement la psy- et identique pour tous les sujets, si les consignes don-
chologie, ont développé des compétences dans l’élabo- nées sont strictement semblables pour tous les sujets,
ration de moyens de mesure originaux, mais également si enfin la manière d’apprécier le comportement est la
d’une méthodologie permettant de vérifier les qualités même pour tous les sujets et tous les utilisateurs de
des instruments mis au point. l’instrument, on pourra interpréter les variations de

72 RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006


MISE EN PLACE D’UNE MÉTHODOLOGIE EXPÉRIMENTALE :
HYPOTHÈSES ET VARIABLES

mesures comme conséquences des seules caractéris- de la même technique de mesure. De manière classique,
tiques ou spécificités des sujets, dans le domaine on utilise la méthode du «test-retest» pour évaluer la
mesuré. stabilité d’un instrument de mesure. Cette méthode
consiste en l’application deux fois de suite de la même
Parfois cependant, c’est cette appréciation du compor- mesure au même contingent de sujets.
tement des sujets qui est particulièrement délicate. On
pourra alors utiliser une des techniques de confronta- L’homogénéité est le degré de constance qu’offrent
tion des juges : plusieurs personnes observent un même toutes les réponses d’un individu aux questions variées
événement et on mesure le degré d’accord entre les d’un même test mesurant une dimension psycholo-
différents juges. Ce dernier, souvent mesuré par corré- gique particulière. La méthode d’évaluation de l’ho-
lations lorsque la dimension mesurée est continue, doit mogénéité la plus habituelle est la technique moitié-
être élevé. Cette technique de confrontation des juges moitié ou “split-half” : on étudie la corrélation existant
est particulièrement utilisée lorsque le recueil des don- entre les mesures obtenues à deux sous-ensembles
nées s’appuie sur l’observation. d’items ou de questions issues du même test ou ques-
tionnaire. Si cette corrélation est forte, quel que soit
Par exemple, on n’acceptera de considérer l’émission le partage par moitié réalisé, on peut dire que l’ins-
d’un comportement que si l’ensemble des observateurs trument mesure bien, au travers de ses différentes
est d’accord. questions, une même caractéristique (dimension) du
sujet et non des caractéristiques différentes en fonc-
La fidélité ou fiabilité tion des questions.
On considère qu’une technique de mesure est fidèle – le
concept de fiabilité est sans doute plus adéquat - lorsque La validité
son utilisation sur les mêmes objets à mesurer entraîne des Lors de la mise en place d’un processus de mesure, une
résultats identiques. Si on peut déterminer la proportion des questions primordiale est de savoir si ce que nous
de variation attribuable aux influences du hasard, l’instru- livre l’instrument utilisé est en adéquation avec le pro-
ment est d’autant plus fidèle que cette influence est faible. blème posé, en bref s’il nous a été utile. Les données
Comme cette notion de fidélité est apparue d’abord dans résultant de son emploi reflètent-elles les différences
le contexte de la mesure de qualités relativement stables réelles entre les personnes, objets, situations ou phé-
(surtout la mesure de l’intelligence), on attribuait autre- nomènes étudiés telles que définies dans le cadre d’une
fois toute instabilité des résultats à des erreurs de mesure. théorie ? Cette question renvoie au problème de la vali-
Maintenant, nous nous sommes rendus à l’évidence que dité. Cependant, le concept de validité est générique et
ce n’est pas la seule source de variation : la caractéristique concerne les problèmes relatifs à plusieurs types d’in-
à mesurer peut varier en fonction du temps ou des évé- terrogations dont les principaux sont :
nements rencontrés par les sujets. Une telle instabilité - quelles sont les grandeurs, les dimensions mesurées
n’est pas forcément un signe d’erreur. par l’instrument ?
- quelles interprétations peut-on faire des résultats ou
Les spécialistes de la chronobiologie par exemple ont pu de la performance ?
montrer l’existence de variations « naturelles » du taux - qu’est-ce qui peut être prédit à partir de ces résultats,
de glycémie dans la journée qu’il ne faut bien sûr pas qui concerne les situations habituelles, hors du contexte
prendre pour des erreurs de mesure (de dosage). de la mesure ou de l’expérience?
- quelle est l’efficacité de l’instrument pour quantifier
On identifie trois aspects principaux de la fiabilité: les faits en référence à l’état actuel des personnes, per-
l’équivalence, la stabilité, et l’homogénéité des met-il en plus d’établir une relation avec un état anté-
mesures. rieur ou la prédiction d’états ultérieurs, par exemple
Deux instruments destinés à la mesure de mêmes gran- en termes d’évolution pathologique ou de retour à un
deurs donnent-ils le même résultat ? L’équivalence état de santé ?
est calculée sur la base du degré de concordance des
résultats obtenus avec deux instruments distincts. Cette Le problème de la généralisabilité est ici posé à nou-
méthode dite des formes parallèles utilise la plupart veau, mais cette fois sous l’angle de la représentativité
du temps un calcul de corrélation qui représente ce de la mesure en tant que marqueur du phénomène
degré de concordance : une corrélation forte indique étudié.
une bonne équivalence entre les deux instruments.
Cette méthode permet également de comparer l’effi- Par exemple, la température est-elle un bon indice de la
cacité d’un nouvel instrument par rapport à une tech- présence d’une infection ? La présence d’une infection
nique déjà éprouvée qui sert alors d’étalon. est-elle la seule cause d’une dynamique inhabituelle de
la température?
La stabilité se détermine sur la base de la constance Est-ce qu’un questionnaire de satisfaction proposé au
des résultats obtenus à la suite d’applications répétées patient est suffisant pour évaluer la qualité des soins ?

RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006 73


Nous ne développerons pas ici l’ensemble de ces Les variables dépendantes
notions, plus spécifiquement réservées à l’élaboration Une catégorie de faits se réfère au comportement ou
des tests mentaux. Il nous semble cependant que la aux réponses des sujets On parlera alors de facteur
question la plus importante ici fasse référence à la vali- modifié ou de variable dépendante. Une fois l’étude
dité théorique : existe-t-il bien une relation entre les réalisée, les valeurs de ces variables dépendantes (VD),
mesures recueillies et le processus à l’étude, une adé- souvent résultant des mesures et appelées données
quation entre la théorie et les moyens méthodologiques brutes, peuvent éventuellement être transformées, ce
mis en œuvre pour la vérifier ? On peut en faire une qui les rend plus lisibles.
estimation en comparant la compatibilité des mesures
avec d’autres faits recueillis auxquels on peut apporter Le temps de réponse à une question peut par exemple
crédit, parce qu’ils nous viennent d’instruments éprou- être un bon indice de la compétence d’une personne
vés ou d’experts reconnus. Il s’agit d’un jugement prag- dans un domaine ; cette mesure n’a pas besoin d’être
matique qui nous permettra de nous prononcer sur la transformée. Par ailleurs, on peut compter dans un ques-
validité empirique de nos outils et qui souligne à nouveau tionnaire le nombre de fois où le sujet a bien répondu. Il
l’importance de l’investissement bibliographique. est alors possible d’exprimer ces occurrences en pour-
centages de bonnes réponses, ce qui permet une
L’ensemble de ces qualités métrologiques est théori- meilleure représentation de la performance des sujets.
quement requis pour apprécier la qualité d’un système
de mesure. Leur étude est un travail long et difficile, d’au- Les variables indépendantes
tant que ces qualités peuvent être indépendantes ou, On parlera de facteurs manipulés par l’expérimen-
dans d’autre cas, interdépendantes. Nous ouvrons ici tateur ou de variables indépendantes pour désigner
des pistes qui pourront le cas échéant être poursuivies les éléments que l’expérimentateur va faire varier
ou susciteront simplement une réflexion au moment du et dont il analysera les effets sur les variables dépen-
bilan d’une recherche. Nous en reprendrons quelques dantes. Ces variables indépendantes ou facteurs expé-
éléments plus spécifiquement associés à la démarche rimentaux peuvent provenir du contexte ou apparte-
expérimentale en abordant le problème des variables. nir aux caractéristiques propres des sujets, peuvent
varier indépendamment ou sous le contrôle de l’expé-
La notion de variable rimentateur.

L’approche scientifique d’un problème nécessite une Lorsque les variables indépendantes (VI) sont extraites
opérationnalisation qui passe par la mise en correspon- des caractéristiques personnelles des sujets telles que
dance de faits, afin d’étudier leurs relations potentielles. l’âge, le sexe, la personnalité, le milieu social (variables
L’idée générale consiste à catégoriser ces évène- individuelles ou de « personnalité »), il s’agit de
ments selon qu’on les range parmi les causes ou parmi variables indépendantes invoquées. Il est en géné-
les effets, à repérer leurs origines (venant des sujets, de ral difficile de les maîtriser réellement, puisqu’elles appar-
l’environnement, de l’instrument de mesure utilisé, etc.), tiennent aux sujets ; l’expérimentateur doit se conten-
puis à quantifier ces phénomènes au travers de variables. ter de sélectionner la(les) modalité(s) qui l’intéresse(nt)
Le but ultime sera d’exprimer les relations entre ces et doit être alerté de l’éventuelle subjectivité de leurs
variables selon un système formel logicomathématique, modalités :
ou une fonction qui modélise la théorie de référence.
Pour synthétiser, on cherche une relation du type par exemple y a-t-il une frontière objective entre normal
Conséquence = f {Cause(s)} où f est une relation (une et pathologique, névrose ou pas, sujets intelligents et
« fonction ») qui découle directement des prédictions sujets « moyens ».
de la théorie.
D’autres variables indépendantes, dites provoquées,
Une variable est donc une dimension caractéristique sont des caractéristiques de la situation : les diffé-
de notre environnement physique ou social, une dimen- rents aspects d’une épreuve, la complexité de la tâche,
sion d’un ou de plusieurs comportements, dont les le mode de présentation des stimuli, etc. (variables de
manifestations peuvent être classées en catégo- type situationnel). Il peut s’agir aussi de variables de type
ries ou mesurées, et prendre plusieurs valeurs environnemental que l’expérimentateur peut contrô-
ou états différents (on parle également de degrés ou ler directement, comme l’intensité lumineuse ou l’éclai-
de modalités) dans un domaine de variation particulier. rement, le bruit, etc.
Nous constatons qu’il nous faut ici aussi opérationnali-
ser, c’est-à-dire passer du domaine de l’abstrait à celui A ce niveau, on peut donc enrichir notre modèle de
de la mesure physique. D’autre part, il nous faut préci- relation Conséquence = f {Cause(s)} par la prise en
ser le rôle de la variable dans le dispositif de recherche. compte de ces catégories de variables et on pourra
Nous rencontrerons donc plusieurs catégories de écrire : VD = f {VIS, VIP} ce qui s’énoncerait de la
variables. manière suivante : « le (changement du) comportement

74 RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006


MISE EN PLACE D’UNE MÉTHODOLOGIE EXPÉRIMENTALE :
HYPOTHÈSES ET VARIABLES

révélé par les variables dépendantes est fonction de dant puisque l’expérimentateur ne peut rien à cet état de
changements provoqués ou sélectionnés soit dans la fait. Quand la variable indépendante possède un statut
situation, soit dans les caractéristiques mêmes des per- provoqué (variables environnementales ou situation-
sonnes, soit dans ces deux secteurs ». nelles), le niveau de contrôle de l’expérimentateur sur les
variables est plus important et les groupes de mesures
Comment, de manière opérationnelle, allons nous résultant peuvent avoir l’un ou l’autre statut. Il est pré-
rendre compte de ce processus de changement ? C’est férable, chaque fois que cela est possible, d’utiliser des
en construisant des plans d’expériences ou proto- groupes de mesures appariés, c’est-à-dire d’utiliser les
coles expérimentaux, dont nous parlerons ensuite, mêmes sujets dans les différentes conditions expéri-
que notre modèle causal sera testé. Les variables indé- mentales ce qui permet, quand on compare les différents
pendantes détermineront par l’intermédiaire de leurs groupes de mesures, d’effectuer des comparaisons dites
modalités ou degrés autant « d’occasions » de mesurer «intra-sujet». Cette utilisation de groupes de mesures
la variable dépendante. Ces différentes occasions de appariés permet de réduire les variations interindivi-
mesures reçoivent le nom de groupes de mesures duelles, souvent incontrôlables, chaque sujet étant son
puisque, comme nous l’avons dit, pour réduire les varia- propre contrôle dans les différents groupes de mesures.
tions intra et inter individuelles des mesures, nous nous Ainsi, on détecte mieux les éventuels effets de la variable
efforçons de répéter les mesures au sein de chaque indépendante sur la mesure. Ceci permet également
condition expérimentale. d’économiser le nombre de sujets et donc d’éviter cer-
tains biais d’échantillonnage. Toutefois, cette pratique des
Souvent, le terme de groupe de mesures recouvre celui groupes appariés n’a pas que des avantages et peut au
de groupe de sujets : chaque sujet est l’occasion d’une contraire engendrer des phénomènes pernicieux à
mesure dans la condition de passation de l’expérience comptabiliser parmi les effets d’une catégorie de variables
dans laquelle il a été désigné. Ceci nous permet de résu- dites parasites, dont nous parlerons maintenant.
mer en disant qu’en principe, il y a autant de
groupes de mesures que de situations expéri- Les variables parasites
mentales différentes et autant de groupes de sujets D’autres faits ou d’autres facteurs, invisibles, mal identi-
que de groupes de mesures. De plus, si on affecte le fiés ou plus ou moins bien contrôlés, peuvent intervenir
même effectif de sujets dans chaque groupe, le nombre dans notre modèle de relation causale, pervertir le sens
de sujets à recruter est directement proportionnel au des résultats et réduire la portée explicative de la ou des
nombre de groupes de mesures, lui-même déterminé par variables indépendantes. Ces déterminants ou variables
le nombre de degrés des variables indépendantes. parasites (VP) peuvent provenir des caractéristiques de
Quand l’expérience possède plusieurs variables indé- la population étudiée, de l’organisation des tâches dans
pendantes, nous verrons que souvent, le nombre total lesquelles on l’engage, et plus généralement des consé-
de groupes de mesures sera déterminé par le nombre quences du pluri ou multi déterminisme des comporte-
de combinaisons des différents degrés des variables ments : on considère en effet qu’il est impossible de faire
indépendantes. l’inventaire exhaustif des causes multiples qui détermi-
nent un état biologique complexe ou un comportement.
Recruter un nombre important de sujets est donc néces-
saire pour répéter la mesure, mais également pour per- Toutes ces variables parasites doivent, dans la mesure du
mettre une distribution équitable des participants dans possible, être neutralisées pour que soit conservée une
chaque groupe de mesures. Cependant, c’est également bonne validité expérimentale. La solution idéale consiste
favoriser la probabilité d’une plus grande variation inter- bien évidemment à les supprimer, ce qui est quelque-
individuelle. Une autre stratégie consiste alors à « réuti- fois très difficile voire impossible. La solution la plus sou-
liser » les mêmes sujets en les affectant successivement vent utilisée consiste à faire en sorte que leur influence
aux différentes situations expérimentales générées par se fasse sentir de manière identique dans les différentes
les modalités d’une variable indépendante, c’est-à-dire situations expérimentales. Cette dernière solution ne
aux différents groupes de mesures. C’est ainsi que, fina- permet pas d’éliminer l’erreur de mesure mais produit
lement, les groupes de mesures peuvent se voir attri- une erreur systématique, identique dans l’ensemble des
buer deux types de fonctionnement : leur statut est dit conditions expérimentales. Cette procédure est donc
« apparié » lorsque les mêmes sujets sont soumis valable toutes les fois que la valeur absolue de la variable
à toutes les modalités d’une variable indépen- dépendante n’est pas importante et que l’on se centre
dante particulière ; à l’inverse, on parle de groupes sur la comparaison des valeurs de la variable dépen-
de mesures indépendants lorsque les groupes de dante selon les situations. Différentes techniques géné-
mesures sont constitués de sujets différents. rales de neutralisation sont couramment utilisées.

Lorsque la variable indépendante est de type invoqué Le maintien à un niveau constant consiste à ne
(variables individuelles ou de personnalité), les groupes considérer qu’une des modalités de la variable parasite
de mesures ont obligatoirement un statut indépen- dont on soupçonne un effet. Cette variable interviendra

RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006 75


donc de la même manière ou dans les mêmes propor- La meilleure procédure d’affectation des sujets est théo-
tions pour tous les niveaux de la variable indépendante. riquement la répartition aléatoire. L’idée est que les
Son effet sera ainsi maintenu constant. différences inter individuelles s’annulent si elles sont équi-
tablement réparties dans les différents groupes.
Par exemple, on sait que le sexe des sujets a une influence Toutefois, il est nécessaire d’avoir un grand échantillon
différentielle sur la structure psychophysiologique du som- et des groupes de sujets d’effectif important pour que
meil et l’on sait que les modifications hormonales associées cet équilibrage « naturel » s’effectue.
au cycle menstruel de la femme provoquent des modifica-
tions importantes de la qualité du sommeil. Si l’on s’intéresse On peut également utiliser comme technique d’appa-
à l’effet de la qualité de l’alimentation sur la qualité du som- riement des sujets dans les groupes de mesures une
meil, on ne sélectionnera que des sujets masculins pour évi- répartition par quotas qui respectera, dans chacun
ter que les modifications dues aux modifications hormo- des groupes de sujets, les quotas observés dans la popu-
nales ne masquent celles dues aux différentes alimentations. lation d’origine sur les caractéristiques à contrôler telles
que le sexe, l’âge, l’antériorité de la pathologie, les trai-
Si on peut neutraliser le facteur parasite par son tements subis, les prévalences de tel ou tel trouble, etc.
absence totale, on se retrouve dans le cas « idéal » Une autre technique d’affectation ou d’appariement
présenté précédemment, c’est-à-dire la suppression repose sur l’utilisation d’un pré-test adapté à la
totale de l’effet parasite. recherche ou qui mesure une performance en relation
Lorsque les différents états que peut prendre la VP sont avec l’objet de la recherche. Cette « pré-mesure » per-
représentés dans chacune des conditions expérimen- met d’obtenir la performance moyenne de l’échantillon
tales, on applique la technique de variation systéma- et les sujets sont ensuite affectés dans les différents
tique. On procède ainsi à l’équilibrage des groupes de groupes de manière à ce que ces groupes aient une per-
mesures, puisque l’amplitude des variations de la variable formance moyenne identique.
parasite est la même pour toutes les modalités de la
(des) variable(s) indépendante(s). On neutralise ainsi les Nous procèderons de cette manière si, par exemple, le
possibles effets différentiels de la variable parasite. poids du patient est une caractéristique décisive pour la
réussite d’une prise en charge thérapeutique. Une
Par exemple, à chaque fois que, dans une recherche, on mesure du poids est effectuée au recrutement des
utilise deux ensembles de sujets, un de sujets féminins et patients et avant toute affectation à un groupe.
un autre de sujets masculins, on effectue une variation
systématique de la variable « sexe ». Une amélioration de cette technique est la méthode
d’appariement par groupes pairés ou par couplage
L’aléatoirisation ou variation par le hasard de sujets. Elle repose sur la passation d’un pré-test ou
consiste, quant à elle, à laisser faire un équilibrage « natu- l’utilisation d’une mesure pré existante suffisamment
rel » des degrés de la variable indépendante, partant du fiable et précise. Chacun des sujets d’un groupe est
postulat que ces valeurs se répartiront équitablement jumelé, dans chacun des autres groupes de sujets, avec
dans les différentes conditions expérimentales. Cette un sujet présentant exactement les mêmes caractéris-
technique présente deux inconvénients majeurs : (1) elle tiques que lui, c’est-à-dire le même score au pré-test.
n’est généralement utilisable que dans le cas d’échan-
tillons de grande taille et (2) on ne peut jamais être sûr Quand les groupes de mesures ont un statut
que la répartition s’est effectivement réalisée de manière apparié, c’est-à-dire donnent lieu à l’utilisation d’un seul
équilibrée et que le hasard n’a pas favorisé l’un des groupe de sujets, les mêmes sujets passent par toutes les
degrés de la variable à neutraliser. situations expérimentales. Une fois l’échantillon consti-
D’autres contrôles, qui renvoient aux potentiels effets tué, l’expérimentateur n’a pas à répartir les différents
parasites découlant de l’organisation des groupes de sujets et le problème d’équivalence de groupes cités pré-
mesures au sein des plans d’expérience, doivent être cédemment n’existe pas.
effectués. Nous étudierons séparément le cas des
groupes de mesures de statut indépendant et des En contre partie, plusieurs sources d’erreurs spécifiques
groupes de mesures de statut apparié. à la situation peuvent apparaître. Des effets de
fatigue peuvent se produire si l’expérience est longue
Lors de la constitution des groupes de mesures provoquant une modification progressive de la perfor-
indépendants, il faut s’assurer que les variations de la mance. Pour éviter ces effets, on aménagera des pauses
mesure (de la variable dépendante) ne puissent être entre les différentes passations.
imputées à des variations existant entre les groupes de
sujets avant même l’intervention expérimentale. Il faut Des effets d’entraînement peuvent également intervenir :
donc, au préalable de la recherche, effectuer un contrôle au fur et à mesure que le sujet réalise l’épreuve, il se fami-
de l’équivalence des groupes de sujets. Pour ce faire, liarise avec le matériel expérimental. Il apprend à utiliser
plusieurs méthodes sont possibles. le matériel et commence à développer des stratégies

76 RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006


MISE EN PLACE D’UNE MÉTHODOLOGIE EXPÉRIMENTALE :
HYPOTHÈSES ET VARIABLES

pour réaliser la tâche et la performance risque de ce dra un minimum de 5! sujets, soit 120 sujets. Dans ce
fait de s’améliorer. Les groupes de mesures appariés ne cas, on ne pourra pas toujours effectuer de contre-
sont donc pas conseillés si on soupçonne comme par- balancement complet et on ne choisira, de manière aléa-
ticulièrement important un tel effet de transfert d’ap- toire, que quelques arrangements. Il s’agira alors d’un
prentissage. contre-balancement partiel aléatoire.

Enfin, il faut signaler les effets d’ordre ou de dépendance En conclusion, il serait plus « honnête » de réécrire
séquentielle quand l’administration de plusieurs degrés notre relation symbolique en la complétant : VD = f
de la variable indépendante aux mêmes sujets risque de {VIS, VIP, VP}. Cette formulation permet maintenant de
produire une modification de la mesure, par effet d’en- développer des stratégies et une organisation interne
traînement, d’incompatibilité ou simplement de conta- de la recherche maximisant les chances de faire émer-
mination entre les différentes tâches réalisées par le ger les relations VD/VI en minimisant l’influence des VP.
sujet. Ceci s’opérationnalise par la construction d’un plan
d’expérience ou plan de protocole ou plan de
La méthode la plus efficace pour éviter cette « erreur recherche qui indique les différents degrés de la (des)
progressive » est le contre-balancement, qui consiste variable(s) indépendante(s) et la confrontation des sujets
à diviser l’erreur progressive de telle sorte qu’elle soit avec ces degrés de manière à évaluer, ou mieux à mesu-
la même pour tous les sujets et dans toutes les condi- rer sans ambiguïté, leur influence sur la performance.
tions. La technique de contre-balancement ou de rota-
tion consiste à répéter les essais en les présentant à des Plans d’expérience
sujets ou groupes de sujets différents selon des ordres ou plans de protocole
modifiés. Ce contre-balancement est dit complet
lorsque tous les ordres possibles sont représentés. Les plans d’expérience sont nombreux, certains sont com-
pliqués à mettre en œuvre ou spécifiques de situations
Par exemple, dans une épreuve visuo-spatiale, on demande particulières ; il est donc impossible d’en faire l’inventaire
à des enfants de retrouver un item parmi un ensemble de exhaustif dans le cadre de cet article (pour plus de détails,
figures. Il s’agit soit de figures géométriques simples (s), cf. Sockeel et Anceaux, 2000). Nous nous contenterons
soit de figures à textures complexes (t), soit enfin des figures d’énoncer des principes généraux puis nous fixerons notre
représentant des objets en trois dimensions (3d). On fait attention sur un seul type de plan, le plus efficace, dont
l’hypothèse que les processus psychologiques mis en jeu nous tirerons les principales caractéristiques.
pour répondre à chacune de ces tâches ne sont pas iden-
tiques (au moins leur niveau de complexité est différent) Les plans d’expérience les plus simples comportent une
et on se pose donc la question de l’influence mutuelle entre seule variable indépendante. Les modalités de celle-ci déter-
les trois modalités de ce facteur, qu’on symbolisera par F3 minent directement le nombre de situations différentes
= {s, t, 3d}. Pour contrebalancer l’ordre de présentation de dans lesquelles des mesures de la variable dépendante
ces trois modalités, il nous faudra 3! sujets ou groupes de seront prises (le nombre de groupes de mesures). Ces
sujets soit 6 groupes. Le plan de contre-balancement est plans découlent d’une seule hypothèse théorique. Celle-ci
résumé dans le Tableau 1. Nous recruterons donc un prédit que les différentes modalités de la variable indé-
nombre de sujets multiple de 6 pour effectuer ce plan de pendante engendreront des variations dans les mesures
contre-balancement complet. de la variable dépendante. Un exemple nous permettra de
nous représenter concrètement les situations.
Tableau 1 : exemple de plan de contre-balancement
Nous devons déterminer quel est le dosage optimal d’un
Position de présentation 1 2 2 certain médicament sensé réduire les arythmies car-
Groupe 1 s t 3d diaques. Avec toutes les précautions associées aux
recherches sur les sujets humains (cf. la loi Huriet-Sérusclat
Groupe 2 t s 3d et de bioéthique), nous allons recruter une série de patients
Groupe 3 3d s t présentant le même tableau clinique ou un tableau proche
et les affecter dans plusieurs groupes qui correspondent à
Groupe 4 3d t s plusieurs dosages différents de la substance à l’étude.
Groupe 5 s 3d t L’hypothèse de recherche peut s’énoncer ici par cette affir-
mation : il existe un dosage optimal de la substance
Groupe 6 t 3d s permettant de maintenir au minimum ou de faire dis-
paraître cette pathologie de l’arythmie cardiaque.
Le contre-balancement complet est une méthode très L’opérationnalisation de cette hypothèse nécessite
lourde quand la variable indépendante concernée pos- de définir les doses exactes de la substance (sans doute
sède un grand nombre de modalités. Par exemple, avec avec l’aide des praticiens qui utilisent le remède ou qui
une variable indépendante de 5 modalités, il nous fau- connaissent l’effet de la molécule).

RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006 77


Par exemple, nous choisirons ici pour la variable indé- Effet principaux
pendante « Dosage » 4 modalités (0, 1, 2 et 4 mg), C’est l’analyse des données, associée à l’utilisation de
dont une modalité « spéciale », 0 mg, permet d’obtenir statistiques inférentielles – ici l’analyse de variance, par
un niveau de base « sans médicament ». Le groupe de exemple – qui va permettre de juger de l’efficacité du
sujets associé à cette modalité est nommé groupe produit et de répondre favorablement ou non à la rela-
contrôle puisqu’on lui affecte le niveau zéro ou « sans tion causale qu’on pourrait formuler par :
effet » de la variable indépendante. Les autres groupes
sont dits expérimentaux puisqu’ils représentent l’in- VDnombre d’évènements atypiques = f {VIdosage}.
tervention de l’expérimentateur1.
Les différents sujets (ici il y en avait 8 par groupe soit
La variable dépendante pourrait être une mesure un total de 32 sujets) affectés aux quatre groupes de
du nombre d’évènements atypiques sur le tracé élec- mesures ont été enregistrés après la pose d’électrodes
trocardiographique (ECG) d’une séquence d’enregis- sur le thorax selon un protocole d’examen cardiopa-
trement de 30 minutes. Notre hypothèse opération- thologique défini. Le nombre d’évènements atypiques
nelle stipule cette fois que nous devons assister à une a été relevé sur les tracés ECG de chacun des sujets
réduction du nombre d’évènements ECG aty- par un spécialiste du domaine. On peut alors étudier
piques en fonction de l’augmentation du dosage l’évolution moyenne du nombre de ces évènements
du médicament à l’étude. Cette hypothèse peut éven- selon le dosage administré. Le terme d’effet principal est
tuellement en générer d’autres dont la plus « pru- retenu pour désigner l’analyse de l’effet d’une seule
dente » qui prédit une réduction des évènements aty- variable indépendante sur une mesure ou variable
piques entre 0 mg et les trois conditions {1, 2 et 4 mg} dépendante (cf. Figure 2).
ensembles. Une autre hypothèse dérivée, nécessitant L’évolution générale des ECG atypiques suggère une dimi-
une connaissance préalable du produit, pourrait sug- nution du nombre des anomalies qui est globalement
gérer l’impossibilité de prouver une amélioration de confirmée par l’analyse de variance (cf. Tableau 2) : l’ef-
l’ECG au-delà de 2 mg. fet principal est significatif à p<.000 .

Figure 2 : Effet principal du dosage de la substance sur les évènements ECG atypiques

Effet du dosage sur les évènements cardiaques atypiques


Les barres verticales représentent les intervalles de confiance à 0.95

24

22

20

18
ECG (nombre)

16

14

12

10

2
0 1 2 4

Dose (mg)

1 Le groupe contrôle recevra sans doute un placebo pour réduire l’effet potentiel de cette variable parasite associée à la présence ou l’absence
de médication.

78 RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006


MISE EN PLACE D’UNE MÉTHODOLOGIE EXPÉRIMENTALE :
HYPOTHÈSES ET VARIABLES

Pour affiner les conclusions, il est possible de fraction- Les plans de recherche les plus efficaces lorsque nous
ner cet effet principal en plusieurs effets principaux par- disposons de plusieurs variables indépendantes sont
tiels. dits plans factoriels. Le principe de base de ces plans
factoriels consiste à combiner de manière systématique
Nous avons choisi dans cet exemple de confirmer l’effet tous les degrés de tous les facteurs expérimentaux, ce
global par une comparaison entre groupe contrôle (0 mg) qui permet d’obtenir autant de groupes de mesures
et groupes expérimentaux (1, 2 et 4 mg). Cet effet est que le produit des modalités des facteurs mis en jeu.
significatif également à p<.000. Deux questions d’impor-
tance doivent également être éclaircies : 1) la diminution Nous reprendrons l’exemple des pathologies cardiaques
des évènements atypiques entre 1 et 2 mg est-elle statis- en y ajoutant un autre facteur expérimental : imaginons
tiquement significative et à l’inverse 2) peut-on dire qu’il n’y qu’il soit vraisemblable que la sensibilité à la substance
a plus d’amélioration entre 2 et 4 mg ? L’examen des soit dépendante de l’âge du patient, ce qui peut avoir
effets de contraste confirme qu’entre 1 et 2 mg, l’amélio- une conséquence sur le dosage. C’est ce que nous ten-
ration est significative à p < .02 alors qu’il n’est pas pos- terons de découvrir en appliquant un protocole expéri-
sible de mettre en évidence une quelconque variation mental dont le plan peut se résumer par le Tableau 3.
moyenne de la variable dépendante entre 2 et 4 mg : p Nous aurons à recruter maintenant deux types de
> 0.8 NS. Ainsi, on peut dire que dans le cadre de patients : des seniors [< 60 ans] et des vétérans [>=
cette étude et pour les patients considérés, un opti- 60 ans] à qui nous proposerons les doses déterminées
mum dans la posologie a été trouvé à 2 mg. précédemment.
Nous devrons disposer maintenant de 8 groupes de
Effets d’interaction sujets qui sont autant d’occasions de mesurer les épi-
Une des conséquences de notre conviction en un pluri- sodes ECG atypiques. Le terme de groupes de mesures
déterminisme des phénomènes naturels est que le désigne ces « cases expérimentales » du protocole.
recours à des recherches utilisant une seule variable
indépendante est de plus en plus rare : une importante Tableau 3 : plan d’expérience factoriel
proportion de recherches met en jeu deux ou plusieurs
Dose
variables indépendantes dont les états (les modalités) 0 mg 1 mg 2 mg 4 mg
sont combinés systématiquement. Il n’y a théorique- Age
ment pas de limite, ni au nombre de facteurs mis en jeu Senior a b c d
dans un plan d’expérience, ni à la complexité des rela-
tions existant entre la variable dépendante et les fac- Vétéran e f g h
teurs expérimentaux. Mais, la difficulté rencontrée
lorsque l’on utilise plusieurs facteurs est de déterminer Le traitement des résultats de ce plan va nous permettre
quelle est la part de chacun des facteurs dans les varia- de distinguer deux effets principaux : l’effet de la dose
tions observées sur la variable dépendante. Ceci ne sur la performance (comme précédemment) et l’effet
pourra être effectué qu’en analysant tous les effets principal de l’âge, qui pourrait répondre à la question
potentiels des différentes variables. Il faut savoir cepen- générale « sans ou sous traitement, dénombre-t-on plus
dant que, assez rapidement (au-delà de 4 facteurs, par d’évènements atypiques chez les vétérans que chez les
exemple), nous pouvons rencontrer des problèmes à la seniors ? » et enfin un effet combiné entre ces deux fac-
fois dans la décomposition des effets à étudier, quoique teurs expérimentaux que l’on nomme interaction Age X
cette décomposition utilise toujours les mêmes prin- Dose et qui répond à une interrogation du type : « le
cipes, mais surtout dans l’interprétation des relations profil de régression des symptômes d’arythmie en fonc-
entre les facteurs et particulièrement des interactions, tion du dosage est-il le même chez les vétérans que chez
c’est-à-dire, non plus des effets principaux, mais des les seniors ? » ou « assiste-t-on à une effet de la dose
effets combinés entre les facteurs. identique chez les vétérans et chez les seniors ? ».

Tableau 2 : Analyse de variance de l’effet principal de la variable « Dosage »

Effet SC ddl MC F p
Dose (Effet principal) 595.75 3 198.58 19.561 0.0000
Dose 0 contre 1,2, 4 mg 522.67 1 522.67 51.485 0.0000
Dose 1 mg contre 2 mg 60.06 1 60.06 5.9164 0.0216
Dose 2 mg contre 4 mg 0.56 1 0.5625 0.0554 0.8156
Erreur 284.25 28 10.15

RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006 79


L’expression formelle de cette nouvelle expérience pour- Effets simples, effets simples partiels et effets
rait être représentée par l’expression partiels d’interaction
L’interaction est un phénomène complexe, d’autant plus
VDnombre d’évènements atypiques = f {VIdosage * VIAge } ; difficile à analyser qu’elle implique des degrés de variables
nombreux. Cette complexité est encore plus manifeste
le symbole « * » indique la relation de croisement entre lorsqu’elle provient de plus de deux variables indépen-
les deux variables indépendantes et la possibilité d’étu- dantes. Il est donc nécessaire de pouvoir morceler les
dier en conséquence les deux effets principaux et l’effet effets d’interaction pour approcher le phénomène par
d’interaction. La Figure 3 représente un scénario possible parties successives. Nous nous réfèrerons à la Figure 4
de cette expérience. pour décrire plusieurs de ces stratégies.

Nous constatons visuellement un effet de la dose qui pro- Un effet simple représente la liaison d’une variable
duit chez les deux types de sujets une correction des évè- indépendante et d’une variable dépendante en tenant
nements cardiaques atypiques (effet principal de « Dose ») compte d’un seul degré de l’autre variable indépen-
et on peut également constater une différence de niveau dante impliquée dans l’interaction. Comme nous
entre les sujets, qui nous porte à croire que les sujets les observons l’effet d’interaction pour une modalité par-
plus âgés manifestent globalement plus d’évènements aty- ticulière, nous pourrons donc étudier autant d’effets
piques que les patients plus jeunes (effet principal « Age »). simples qu’il y a de modalités à ce deuxième facteur.
Cependant, le profil de diminution du nombre d’évène- Mettre en évidence que les effets simples d’une variable
ments atypiques est le même chez les deux catégories indépendante sont différents selon les différents degrés
de sujets. L’analyse de variance, dans ce cas, ne permet de l’autre variable indépendante est une autre manière
pas de mettre en évidence un effet combiné des deux d’exprimer un effet d’interaction.
variables indépendantes (F(3.59) = 0.396 ; ns) .
Dans notre exemple, nous pourrions nous intéresser aux
Le cas est différent dans l’exemple simulé qui corres- deux effets simples de la variable indépendante « Dose »
pond à la Figure 4 et à l’analyse de variance présentée dans sur la variable dépendante pour chacun des degrés de la
le Tableau 4. variable « Age », et mettre en évidence une décroissance
régulière des anomalies ECG pour les sujets « vétérans »
L’analyse de variance signale la significativité des deux et une décroissance de ces anomalies « en plateau » chez
effets principaux de la Dose (F(3.56) = 34.16, p <.001) et les seniors. Ces questions sont naturellement d’impor-
de l’Âge des patients (F(1.56) = 29.48, p <.001). Il indique tance lorsqu’il faudra définir des stratégies thérapeutiques
également un effet significatif de la combinaison des deux en fonction de l’âge du patient. En se référant à l’identifi-
variables (de l’interaction) (F(3.56) = 4.36, p <.001) qui cation des groupes de mesures apparaissant au Tableau 3,
se concrétise sur le graphique par une différence de pro- le premier effet simple – ou effet de la dose pour les
fil de sensibilité entre les deux types de patients. « vétérans » – tentera de mettre en évidence une dimi-
nution progressive des anomalies ECG en comparant glo-
Tableau 4 : analyse de variance du plan à deux variables balement les performances associées aux groupes de
Effet SC ddl MC F p mesure e, f, g et h. Le second effet simple – ou effet de
la dose pour les « seniors » devra être décomposé en deux
Age 268.14 1 268.14 29.4790 0.0000 effets simples partiels, l’un mettant en évidence la décrois-
sance de l’indice de performance dès la première dose
Dose 932.30 3 310.77 34.1652 0.0000
(entre les groupes a et b) et l’autre montrant l’impossibi-
Age*Dose 119.05 3 39.68 4.3626 0.0000 lité de prouver une variation des anomalies entre les
groupes de mesures b, c et d. Le Tableau 5 montre les
Erreur 509.37 56 9.096 résultats statistiques associés à l’analyse de ces différents
effets simples.
Cette différence peut s’expliquer de la manière suivante :
pour les patients les plus jeunes, la dose de 1 mg semble Ces résultats font apparaître un effet massif de la variable
suffire au rétablissement d’un tracé ECG proche de la « Dose » pour les sujets vétérans (F(1.56) = 53.87,
normale et des doses supérieures n’améliorent manifes- p <.000). Chez les seniors, l’effet simple partiel qui oppose
tement pas la performance. Pour les sujets les plus vieux, la performance du groupe témoin à celles des autres
il semble y avoir une amélioration des tracés ECG jus- groupes ayant reçu la substance montre également un
qu’à y compris 4 mg (peut-être plus, mais le protocole de effet de la variable « Dose » (F(1.56) = 61.11, p <.000) ;
l’expérience n’a pas prévu de tester les effets au-delà de par contre, les comparaisons entre les groupes b, c et d
4 mg). Nous constatons donc que, comme pour les effets ne permettent pas de mettre en évidence ce type de dif-
principaux, et en présence d’un effet d’interaction qui férences (pour toutes les comparaisons prises deux à deux
s’avère significatif, il est possible de formuler des hypo- F(1.56) < 1, ns ) et ces deux types de comparaisons cor-
thèses supplémentaires destinées à préciser cet effet. roborent l’effet de plancher observé sur la Figure 4.

80 RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006


MISE EN PLACE D’UNE MÉTHODOLOGIE EXPÉRIMENTALE :
HYPOTHÈSES ET VARIABLES

Figure 3 : Exemple d’absence d’interaction


Interaction Age*Dose
Les barres verticales représentent les intervalles de confiance à 0.95
26

24 Age s
Age v
22

20

18
ECG (nombre)

16

14

12

10

2
0 1 2 4
Dose (mg)

Figure 4 : Exemple de présence d’interaction


Interaction Age*Dose
Les barres verticales repr sentent les intervalles de confiance 0.95

24

22 Age s
Age v
20

18
ECG (nombre)

16

14

12

10

2
0 1 2 4

Dose (mg)

RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006 81


Tableau 5 : Analyse statistique de quelques effets simples de la variable « Dose » sur les anomalies ECG

Effet SC ddl MC F p
Effet de « Dose » pour les vétérans (e, f, g, h) 490.00 1 490.00 53.87 0.00
Comparaison a contre b + c + d pour les seniors 555.84 1 555.84 61.11 0.00
Comparaison b contre c pour les seniors 1.0000 1 1.00 0.11 0.74
Comparaison b contre d pour les seniors 1.5625 1 1.56 0.17 0.68
Comparaison c contre d pour les seniors 0.0625 1 0.06 0.007 0.93
Erreur 509.37 56 9.0960

Une autre manière d’aborder les effets simples serait véracité de ces dernières dans le cadre d’une nouvelle
d’effectuer des comparaisons entre groupes d’âge diffé- expérience, après enrichissement de la théorie d’origine.
rents pour chaque dosage : cela nous amènerait à étu- Un nouveau cycle de la recherche sera alors initié.
dier quatre effets simples de l’âge sur les anomalies ECG,
et ce, successivement pour les doses, 0, 1, 2 et 4 milli-
grammes. Quoique représentant le même effet global
d’interaction, cette stratégie permet de répondre à CONCLUSION
d’autres types de questions. Nous en avons choisi trois à
titre d’exemple : 1) les sujets témoins présentent-ils un
nombre d’anomalies ECG différent en fonction de l’âge ? L’objectif de cet article était de présenter les éléments
2) A des fins de simplification de la posologie, peut-on centraux de la mise en place d’une recherche reposant
assimiler la réaction des deux populations de patients sur l’utilisation de la méthode expérimentale. Nous nous
pour des doses de 2 mg et 3) de 4 mg ? sommes focalisés sur le premier sous-cycle, celui de l’éla-
boration du plan de recherche, dans la mesure où la per-
Tableau 6 : Analyse statistique d’effets simples tinence et la validité des résultats d’une recherche dépen-
associés à la variable « Age » dent de la rigueur avec laquelle elle a été construite. Ceci
apparaît clairement dans la Figure 1 présentant le cycle
Effet SC ddl MC F p de la recherche où l’on voit que la flèche qui conduit de
Effet de l’age 22.56 1 22.56 2.48 0.1209 ce sous-cycle au suivant, celui de la « production des
pour 0 mg observations », est unidirectionnelle. Cette flèche indique
qu’une fois les observations commencées, il n’est plus
Effet de l’age 68.06 1 68.06 7.48 0.0083 possible de revenir en arrière. Si on le fait, parce qu’on
pour 2 mg s’aperçoit que le plan d’expérience est inadéquat ou que
Effet de l’age 7.56 1 7.56 0.83 0.3658 les variables ne mesurent pas ce que l’on veut observer,
pour 4 mg on est obligé de recommencer tout le cycle, en perdant
ainsi toutes les observations déjà obtenues.
Erreur 509.37 56 9.09
Comme nous l’avons détaillé dans l’article, nous avons
Le Tableau 6 rend compte de notre incapacité à distin- choisi la méthode expérimentale parce qu’elle est la
guer les deux groupes de sujets témoins selon leur âge seule à permettre la mise en évidence de liens de cau-
(F(1.56) =2.48, p>.12 ns) : du point de vue des ano- salité entre des événements. Elle est également celle qui
malies ECG enregistrées, la pathologie des sujets est iden- permet la meilleure « validité interne » des résultats. La
tique. S’agissant de la posologie, les résultats chez les validité interne est directement sous la dépendance de
« vétérans » sont différents de ceux des « seniors » à 2 l’existence ou non de facteurs associés à l’expérimen-
mg (F(1.56) =7.48, p < 0.01), mais potentiellement iden- tation, tels que les variables parasites présentées plus
tiques avec 4 mg de substance (F(1.56) <1, ns). haut. En multipliant les contrôles, la méthode expéri-
mentale permet d’obtenir une bonne validité interne,
Ces quelques exemples montrent que dans le cadre d’un sans laquelle les résultats d’une recherche ne peuvent
plan factoriel, il est possible d’étudier en détail les effets être considérés comme probants.
combinés des variables, d’une part en posant des hypo-
thèses basées sur notre compréhension du phénomène Toutefois, et c’est là le paradoxe, plus la validité interne
lorsque nous sommes guidés par un modèle théorique, d’une recherche est importante, plus elle risque de perdre
et, d’autre part, en examinant les propriétés des données de la validité externe qui, elle, est relative à la possibilité
qui peuvent susciter des hypothèses exploratoires. Si tel de généralisation des résultats, c’est-à-dire à leur valeur
est le cas, il est néanmoins nécessaire de contrôler la en dehors du contexte strict de la recherche en cours. Ce

82 RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006


MISE EN PLACE D’UNE MÉTHODOLOGIE EXPÉRIMENTALE :
HYPOTHÈSES ET VARIABLES

risque provient en général de deux sources de contrôle : BIBLIOGRAPHIE


l’échantillonnage des sujets et le contexte expérimental.
Le protocole expérimental est appliqué à un échantillon
d’individus qui a été « sujet » de l’expérience et nous
aimerions que les résultats soient applicables à la popu- Beaugrand, J. P. (1988). Démarche scientifique
lation parente. Cette possibilité de généralisation pose et cycle de la recherche. In M.Robert (Ed.),
alors le problème de la « représentativité » des individus Fondements et étapes de la recherche scienti-
de l’échantillon : ont-ils toutes les caractéristiques trou- fique en psychologie (3° édition) (pp. 1-35).
vées dans la population parente, les pathologies retenues St Hyacinthe, CA: Edisem - Maloine.
sont-elles prototypiques des pathologies rencontrées ? Il
en est de même pour la validité « écologique » de la Charbonneau, C. (1988). Problématique et hypo-
recherche qui elle, renvoie à la généralisation à d’autres thèses d’une recherche. In M.Robert (Ed.),
situations ou à d’autres matériels. Cette validité écolo- Fondements et étapes de la recherche scienti-
gique sera d’autant moins élevée que la situation expéri- fique en psychologie (3° édition) (pp. 59-77).
mentale sera « artificielle », réalisée en laboratoire, « trop St Hyacinthe, CA: Edisem - Maloine.
contrôlée », très loin de la réalité.
Grünbaum, A. (Eds.) (1963). The philosophy of
Il est clair que les recherches effectuées en « situation space and time. New York: A.A. Knopt.
naturelle », comme c’est la plupart du temps le cas dans
le cadre des soins infirmiers, la validité écologique ainsi (a) Matalon, B. (1994a). Epistémologie des sciences
que la validité externe de la recherche sont préservées. humaines. In R.Ghiglione & J. F. Richard (Eds.),
Par contre, la validité interne est souvent difficile à main- Cours de Psychologie - Tome 2: Bases, Méthodes,
tenir dans la mesure où certaines variables parasites Epistémologie (pp. 617-733). Paris: Dunod.
sont difficiles à neutraliser, où il est très difficile de répli-
quer à l’identique une situation pour l’ensemble des (b) Matalon, B. (1994b). Les conceptions du
sujets et où il existe un problème d’échantillonnage dans développement scientifique. In R.Ghiglione & J.
la mesure où les « sujets » potentiels des recherches F. Richard (Eds.), Cours de Psychologie. 2. Bases,
appartiennent à des groupes présentant des caractéris- Méthodes, Epistémologie (pp. 631-676). Paris:
tiques particulières. Ce problème est commun à l’en- Dunod.
semble des recherches dites de terrain, mais il est tout
de même possible d’élaborer des plans de recherche Myers, A. & Hansen, C. H. (Eds.) (1997).
qui, s’ils ne présentent pas tous les contrôles possibles Experimental psychology (4° ed.). Pacific Grove,
en laboratoire, respectent le maximum des contraintes CA: Brooks/Cole Publishing Company.
présentées ici.
Popper, K. L. (Eds.) (1978). La logique de la
Nous avons voulu nous centrer sur la méthode de base découverte scientifique. Paris: Payot.
de toutes les recherches, celle à partir de laquelle il est
possible de justifier des liens causaux existants entre Reuchlin, M. (1971). Naissance de la psychologie
variables. Nous sommes bien conscients que le présent appliquée (pp. 11-52). In M. Reuchlin, Traité de
article ne recouvre pas tout ce que l’on aurait pu dire. psychologie appliquée, volume 1. Paris : PUF
Par exemple, il existe des plans d’expérience spéciale-
ment adaptés aux situations de terrain. L’étude de ces Rey, A. (1990). Le Grand Robert de la Langue
derniers, qui ne sont que des extensions des plans fac- Française. Paris : Les Dictionnaires le Robert
toriels, permet de montrer comment appliquer certains
contrôles supplémentaires qui vont assurer une bonne Robert, M. (1988). Fondements et étapes de la
validité interne et externe tout en se satisfaisant de situa- recherche scientifique en psychologie (3° édi-
tions particulières, d’un nombre extrêmement restreint tion). St Hyacinthe, CA. Edisem-Maloine
de sujets (un seul sujet dans certains cas), de l’impossi-
bilité de croiser toutes les situations expérimentales ou Sockeel, P. & Anceaux, F. (2002). La démarche
encore de l’intervention de phénomènes d’évolution expérimentale en psychologie. Paris : In Press
spontanée des mesures. Editions

RECHERCHE EN SOINS INFIRMIERS N° 84 - MARS 2006 83