Vous êtes sur la page 1sur 84

Développement et validation du Questionnaire de

connaissances sur l’asthme destiné aux patients


adultes (QCA-PA)

Mémoire

Daniel Beaurivage

Maîtrise en administration et évaluation en éducation


Maître ès arts (M.A.)

Québec, Canada

© Daniel Beaurivage, 2015


Résumé

S’appuyant sur la démarche d’élaboration de questionnaire proposée par Dussault, Valois


et Frenette (2007) inspirée par DeVellis (2003), ainsi que sur le processus d’accumulation
de preuves de validité préconisé par Downing (2003) et inspiré de Messick (1994), cette
étude vise à développer et obtenir des preuves de validité pour un questionnaire de
connaissances sur l’asthme. Cette démarche comprend six étapes : 1- détermination de
l’objet de mesure à la lumière d’une revue de littérature, 2- génération d’items, 3-
détermination d’un format de mesure, 4- vérification de la clarté des items, 5- prétest, 6-
preuves de validité. Le Questionnaire de connaissances sur l’asthme destiné aux patients
adultes (QCA-PA) a été validé auprès de 101 adultes asthmatiques fréquentant la clinique
spécialisée en asthme de l’Institut universitaire de cardiologie et de pneumologie de
Québec. Plusieurs éléments de preuves de validité (contenu, processus de réponse,
structure interne, relation avec d’autres variables, conséquences) ont été accumulés. Le
QCA-PA présente un bon niveau de cohérence interne et est mieux représenté par une
structure unidimensionnelle. Utilisé en clinique, ce questionnaire pourrait augmenter
l’efficacité des interventions éducatives des professionnels de la santé.

iii
iv
Table des matières

Résumé ............................................................................................................................... iii


Liste des tableaux .............................................................................................................. vii
Liste des figures ................................................................................................................. ix
Abréviations ....................................................................................................................... xi
Remerciements ................................................................................................................. xiii
Avant-propos..................................................................................................................... xv
Introduction ......................................................................................................................... 1
Cadre de référence .............................................................................................................. 5
1. Les instruments de mesure ....................................................................................... 5
2. Les fonctions de l’évaluation et les types d’interprétations ..................................... 6
3. L’élaboration d’un instrument de mesure ................................................................ 7
4. Phase d’élaboration .................................................................................................. 8
4.1. Détermination de l’objet de mesure à la lumière d’une revue de littérature ........ 8
4.2. Génération d’items ............................................................................................... 9
4.3. Détermination d’un format de mesure ............................................................... 10
4.4. Vérification de la clarté des items ...................................................................... 11
4.5. Prétest ................................................................................................................. 12
5. Phase de validation ................................................................................................ 13
5.1. Preuves de validité ............................................................................................. 14
5.1.1. Validité de la structure interne ...................................................................... 14
5.1.1. Validité de la relation avec d’autres variables .............................................. 16
5.1.2. Validité de conséquences .............................................................................. 17
Présentation de l’article..................................................................................................... 19
Article scientifique ............................................................................................................ 21
Résumé .......................................................................................................................... 22
Abstract ......................................................................................................................... 23
Introduction ................................................................................................................... 24
Méthodologie ................................................................................................................ 27
Phase de développement ........................................................................................... 27
1. Détermination de l’objet de mesure à la lumière d’une revue de littérature . 27

v
2. Génération d’items ........................................................................................ 28
3. Détermination d’un format de mesure .......................................................... 29
4. Vérification de la clarté des items ................................................................. 29
5. Prétest ............................................................................................................ 30
Échantillon pour la phase de validation .................................................................... 31
Déroulement .............................................................................................................. 33
Phase de validation ................................................................................................... 34
6. Analyse d’items (Preuves de validité de la structure interne) ....................... 34
7. Preuves de validité (relation avec d’autres variables, conséquences)........... 35
Analyses statistiques ..................................................................................................... 36
Résultats ........................................................................................................................ 38
Indice de discrimination ............................................................................................ 38
Cohérence interne ..................................................................................................... 40
Modèle de Rasch ....................................................................................................... 40
Analyse de la structure factorielle............................................................................. 41
Validité concomitante ............................................................................................... 43
Reproductibilité et réponse aux changements........................................................... 43
Discussion ..................................................................................................................... 45
Conclusions ................................................................................................................... 48
Remerciements .............................................................................................................. 49
Conclusion ........................................................................................................................ 51
Bilan .............................................................................................................................. 51
Forces et limites de l’étude ........................................................................................... 52
Perspectives de recherches futures................................................................................ 54
Annexe 1 ........................................................................................................................... 55
Annexe 2 ........................................................................................................................... 59
Bibliographie..................................................................................................................... 63

vi
Liste des tableaux
Tableau 1 : Caractéristiques des participants (n=101) à la validation du QCA-PA ......... 32

Tableau 2 : Résultats de l'analyse d'items au T0 pour chacun des items du QCA-PA ..... 39

Tableau 3 : Cohérence interne (KR-20) ............................................................................ 40

Tableau 4 : Indices d'ajustement des modèles testés à T0 ................................................ 42

Tableau 5 : Coefficients de corrélation QCA-PA vs QCALF .......................................... 43

Tableau 6 : Scores moyens (écart-type) au QCA-PA et au QCALF ................................ 44

vii
viii
Liste des figures

Figure 1 : Développement et de validation de questionnaire (Dussault et al., 2007) et


preuves de validité associées ............................................................................ 26

Figure 2 : Solution standardisée de l'analyse factorielle confirmatoire du modèle


unidimensionnel (M4) ...................................................................................... 42

Figure 3 : Scores moyens au QCA-PA à chacun des temps de mesure ............................ 45

Figure 4 : Adaptation de la méthode de développement et de validation de questionnaire


(Dussault et al., 2007) et preuves de validité associées ................................... 52

ix
x
Abréviations

AERA : American Educational Research Association

AFC : Analyses factorielles confirmatoires

AFE : Analyses factorielles exploratoires

ANOVA : Analyse de la variance

APA : American Psychological Association

DIF : Differential Item Funtionning

GINA : Global Initiative for Asthma

GMF : Groupe de médecine familiale

IUCPQ : Institut universitaire de cardiologie et de pneumologie de Québec

KR-20 : Formule 20 de Kuder-Richardson

MPOC : Maladie pulmonaire obstructive chronique

NCME : National Council of Measurement in Education

QCALF : Questionnaire de connaissances sur l’asthme en langue française

QCA-PA : Questionnaire de connaissances sur l’asthme destiné aux patients adultes

SPLF : Société de pneumologie de langue française

TCT : Théorie classique des tests

TRI : Théorie de réponse aux items

xi
xii
Remerciements

Ce mémoire est le résultat d’efforts combinés de plusieurs personnes que je tiens à


remercier.

Tout d’abord, je tiens à souligner la contribution de mes deux directeurs de maîtrise.


Monsieur Eric Frenette, je vous remercie pour votre temps, votre patience et votre
dévouement pour vos étudiants. Vos conseils sont judicieux et votre confiance en nous
nous amène à nous dépasser. Dr Louis-Philippe Boulet, je vous suis très reconnaissant de
m’avoir accueilli dans votre équipe de recherche et de m’avoir permis de découvrir un
domaine aux possibilités infinies. Votre passion est contagieuse. La grandeur d’un
homme se mesure à sa capacité de faire briller les gens autour de lui et vous m’avez tous
les deux donné envie d’être meilleur.

Mesdames Marie-Ève Boulay, Julie Turmel et Françoise Proust, toutes trois


professionnelles de recherche, je vous remercie d’avoir facilité mon adaptation dans le
domaine de la recherche en santé et d’avoir toujours été présentes pour répondre à
chacune de mes questions.

Finalement, je remercie tout spécialement Mesdames Lyne Ringuette et Christiane


Balizet, infirmières, pour avoir rencontré chacun des participants à cette étude pour une
formation individualisée sur l’asthme.

xiii
xiv
Avant-propos

Ce mémoire est présenté sous forme de publication. Vu sa forme, il est possible qu’une
certaine redondance soit présente au fil des pages. L’article inclus dans ce texte a été
soumis à la Revue des maladies respiratoires et est présentement en cours d’évaluation.
L’auteur principal de l’article est l’auteur de ce mémoire.

La nature de la contribution des autres auteurs de l’article est la suivante :

Marie-Ève Boulay : conception et mise au point de l’étude, approbation finale de la


version soumise après relecture critique.

Eric Frenette : conception et mise au point de l’étude, analyse et interprétation des


données, analyse critique amenant des modifications significatives au contenu
intellectuel, approbation finale de la version soumise après relecture critique.

Louis-Philippe Boulet : conception et mise au point de l’étude, analyse et interprétation


des données, analyse critique amenant des modifications significatives au contenu
intellectuel, approbation finale de la version soumise après relecture critique.

xv
Introduction

Le domaine médical fait souvent appel à des instruments de mesure traitant des
connaissances des patients, que ce soit dans un but diagnostique ou de suivi
thérapeutique, à plus forte raison dans le cas de maladies chroniques qui engendrent un
poids considérable sur le système de santé et des enjeux plus élevés. L’asthme, qui se
caractérise par une inflammation et un resserrement des bronches, est l’une des maladies
chroniques les plus répandues dans le monde, affectant entre 1 % et 18 % de la
population (FitzGerald, Reddel et Boulet, 2014). Avec un taux de prévalence de 14 %, le
Canada est l’un des pays les plus touchés par cette maladie (Masoli, Fabian, Holt,
Beasley et Global Initiative for Asthma, 2004).

Des études ont montré que l’asthme est souvent mal contrôlé (Bateman, Bousquet et
Braunstein, 2001; Boulet et al., 2006). L’une des raisons expliquant cette situation est le
manque de connaissances des patients envers la maladie et son contrôle, aussi appelé
maîtrise (Boulet, Boulet et Milot, 2002; Soriano, Rabe et Vermeire, 2003). Par exemple,
alors que la principale cause de l’asthme est l’inflammation des voies respiratoires,
Soriano et al. (2003) ont montré que seulement 7,8 % des personnes asthmatiques
l’identifiaient correctement.

Des connaissances de base de la maladie et de son traitement constituent les fondements


servant à développer des capacités d’autocontrôle et une plus grande autonomie dans la
gestion de l’asthme. Une méta-analyse de 17 études effectuées auprès de 7442 patients
atteints de maladies chroniques comme l’asthme ou la maladie pulmonaire obstructive
chronique (MPOC), deux maladies aux symptômes similaires, a conclu que des
programmes d’éducation basés sur l’autocontrôle amélioraient à court terme le sentiment
d’autoefficacité des participants, l’autoévaluation de leur état de santé, leur gestion des
symptômes cognitifs par des pratiques de relaxation et de visualisation ainsi que la
fréquence de leurs activités physiques (Foster, Taylor et Elridge, 2007). Les bénéfices de
l’éducation sur l’asthme ont donc été démontrés, mais trop peu de patients asthmatiques
profitent d’interventions éducatives adaptées à leur situation (Gibson, Ram et Powell,

1
2003). L’importance d’évaluer les connaissances des patients dans le but d’augmenter
l’efficacité des interventions éducatives des professionnels de la santé est donc réelle.

Plusieurs questionnaires de connaissances sur l’asthme ont été développés et validés


(Pink, Pink et Elwyn, 2009), mais ils s’avèrent souvent complexes ou adaptés à des
populations précises. La majorité de ces questionnaires est en anglais et plusieurs
apparaissent comme désuets, car non basés sur les lignes directrices nationales ou
internationales publiées par des regroupements de médecins et de chercheurs spécialisés
dans le domaine. Dans une revue systématique portant sur 18 questionnaires de
connaissances sur l’asthme, Pink et al. (2009) ont montré qu’aucun de ces questionnaires
n’obtenait une note satisfaisante pour chacun des quatre critères fixés (validité de
contenu, validité de construit, cohérence interne et reproductibilité).

Le but de la présente étude consiste à développer et obtenir des preuves de validité pour
le Questionnaire de connaissances sur l’asthme destiné aux patients adultes (QCA-PA),
eu égard au processus proposé par Dussault, Valois et Frenette (2007), inspiré de
DeVellis (2003). Cet instrument en français vise une évaluation diagnostique à
interprétation critériée des connaissances des patients sur leur maladie. Contrairement
aux questionnaires existants, il est basé sur les derniers rapports internationaux du Global
Initiative for Asthma (GINA), un organisme réunissant certains des plus grands
spécialistes en asthme au monde et publiant périodiquement ce que tout professionnel de
la santé et tout patient devraient savoir sur cette maladie (FitzGerald et al., 2014).

Dans un contexte clinique, ce questionnaire permettra aux professionnels de la santé de


recueillir de l’information sur les connaissances de base des patients asthmatiques à
propos de leur maladie. Le questionnaire permettra d’indiquer aux professionnels de la
santé dans quelles sphères se situent les lacunes quant aux connaissances de leurs
patients, espérant ainsi d’améliorer l’efficacité de leurs interventions auprès d’eux. Par
conséquent, chaque patient bénéficiant d’une formation personnalisée à sa situation et à
ses besoins pourra augmenter l’autocontrôle de sa maladie.

Les sections suivantes ont pour but d’établir le cadre de référence ayant servi à
développer et à valider le QCA-PA. Elles expliquent les étapes à suivre et les analyses à

2
effectuer. Par la suite, un article scientifique est présenté, reprenant l’ensemble des étapes
énoncées de même que les résultats des analyses. Une conclusion, faisant le bilan du
projet de recherche et donnant des pistes de recherches futures termine ce mémoire.

3
4
Cadre de référence

Cette section présente les concepts de mesure et d’instrument de mesure. Y sont


également exposés les fonctions de l’évaluation et les types d’interprétation, ainsi que les
étapes d’élaboration d’un instrument de mesure pour présenter ensuite les diverses
preuves de validité qui permettent de supporter l’interprétation des résultats. Ces étapes
seront reprises dans l’article qui suivra afin de présenter la marche à suivre pour créer un
instrument de mesure des connaissances des patients sur l’asthme.

1. Les instruments de mesure

Un instrument de mesure peut se présenter sous plusieurs formes : questionnaire, examen,


grille d’observation, test physique, etc. Il ne constitue pas une fin en soi, mais plutôt un
outil servant à obtenir de l’information sur une ou des personnes à un moment précis afin
de porter un jugement sur leur état, leur personnalité ou leurs capacités (Kubiszyn et
Borich, 1990; Laurier, Tousignant et Morissette, 2005; Tousignant et Morissette 1989).
Comme le mentionne Urbina (2004), un outil comme un marteau peut s’avérer dangereux
s’il est mal construit ou mal utilisé; il en est de même pour un instrument de mesure.
Devant faire l’objet d’un processus rigoureux, le développement d’un tel instrument doit
être basé sur le but de l’évaluation et des inférences qu’il permettra d’établir (American
Educational Research Association [AERA], American Psychological Association [APA]
et National Council of Measurement in Education [NCME], 2014). Il s’avère donc
judicieux d’accorder de l’importance à la façon dont ils sont conçus et interprétés. Le
développement d’instruments de mesure constitue une discipline scientifique
relativement récente, bien que leur utilisation soit plus ancienne et remonte même à
l’Antiquité (Anastasi, 1968).

Au début du XXe siècle, les travaux statistiques de Pearson et Spearman ont donné de la
crédibilité aux assises de la mesure (DeVellis, 2003). À partir de corrélations, ils ont
permis d’examiner de façon systématique les relations entre les variables. Par la suite, les
travaux de Stevens (1951), portant sur les différentes échelles de mesure en
psychophysique, appliqués ensuite aux sciences humaines par Thurstone et Byrne (1951),

5
ont fourni la légitimité scientifique dont la mesure en sciences humaines avait besoin,
s’appliquant d’abord aux tests mentaux, puis aux autres types d’instruments comme les
questionnaires et les examens (DeVellis, 2003). La mesure était alors perçue comme
l’assignation de nombres à des objets ou des phénomènes selon des règles (Bertrand et
Blais, 2004). De tels instruments de mesure sont désormais grandement utilisés dans le
domaine des sciences de la santé, de la psychologie et des sciences sociales.

2. Les fonctions de l’évaluation et les types d’interprétations

Un instrument de mesure peut être utilisé pour diverses fonctions d’évaluation, à


différents moments du processus d’évaluation-apprentissage, en utilisant divers types
d’interprétation. Laurier et al. (2005) proposent une catégorisation en sept fonctions
d’évaluation, présentes à différents moments du processus d’évaluation-apprentissage,
ainsi que trois types d’interprétation. Se situant généralement en amont du processus
d’évaluation-apprentissage, la fonction classement a pour but la création de groupes
composés des répondants présentant des niveaux de connaissances ou d’aptitudes
similaires par rapport à un contenu (Laurier et al., 2005). Pour sa part, la fonction
sélection a comme objectif d’identifier les répondants ayant les meilleures chances de
réussite. Elle se situe avant le processus d’évaluation-apprentissage et elle est surtout
utilisée dans le milieu scolaire par les écoles désirant sélectionner les meilleurs candidats
pour intégrer leur établissement (Laurier et al., 2005). Quant à la fonction pronostique,
parfois appelée diagnostique, elle vise à informer l’évaluateur de l’état initial du
répondant avant toute intervention éducative, de manière à guider celle-ci (Laurier et al.,
2005). La fonction régulation, aussi connue sous le nom d’évaluation formative, peut
survenir à tout moment au cours du processus d’évaluation-apprentissage. Elle a pour but
de vérifier l’efficacité de l’enseignement et de renseigner l’évaluateur comme le
répondant sur l’évolution de ce dernier afin qu’il puisse, autant que l’évaluateur, revoir
ses façons de faire (Laurier et al., 2005). La fonction bilan et la fonction certificative se
rattachent toutes deux au concept d’évaluation sommative puisqu’elles se situent
généralement en fin de processus. La première, surtout liée au domaine scolaire, informe
l’élève et son parent de l’état de ses connaissances à la suite de l’intervention éducative
(Laurier et al., 2005). La seconde, revêtant un rôle davantage social, concerne

6
l’attribution d’un diplôme certifiant l’acquisition de connaissances dans un domaine
donné (Laurier et al., 2005). Finalement, la fonction pilotage vise l’évaluation des
éducateurs, des moyens d’enseignement, des programmes et des établissements dans le
but d’en améliorer l’efficacité (Laurier et al., 2005).

Ces fonctions d’évaluation peuvent être abordées à travers trois types d’interprétation.
L’interprétation normative s’appuie, comme son nom l’indique, sur la comparaison à une
norme. Celle-ci est fixée en fonction du comportement ou du rendement normal du reste
du groupe d’où est tiré le répondant (Laurier et al., 2005). Elle vise à classer les
répondants les uns par rapport aux autres selon leur degré d’habileté. L’interprétation
critériée porte sur l’atteinte, par le répondant, d’un ou des objectifs d’apprentissage fixés
à l’avance. Le répondant n’est donc plus comparé au reste du groupe, mais est plutôt jugé
par rapport à l’atteinte d’un seuil de réussite identique d’une personne à l’autre (Laurier
et al., 2005). L’interprétation dynamique compare les résultats du répondant entre eux à
divers moments du processus d’évaluation-apprentissage (Laurier et al., 2005). Le but est
d’en apprécier l’évolution. Le choix d’une fonction d’évaluation et d’un type
d’interprétation peut avoir une incidence plus ou moins grande sur le répondant. L’enjeu
peut être élevé, comme dans le cas de la fonction certificative, ou bas, comme dans le cas
de la fonction pronostique. Plus l’enjeu d’un instrument de mesure est élevé, plus les
inférences qui en sont tirées doivent s’appuyer sur des preuves fiables et valides, et donc
nécessite un processus rigoureux d’élaboration (AERA et al., 2014).

3. L’élaboration d’un instrument de mesure

Plusieurs spécialistes des domaines de la psychologie, de l’éducation, de la statistique, de


la mesure et de la médecine se sont penchés sur l’élaboration, et par conséquent la
validation de questionnaires (AERA et al., 2014; Brancato et al., 2006; DeVellis, 2003;
Furr, 2011; Marquis, 2003; Rattray et Jones, 2005; Shum, O’Gorman et Myors, 2006;
Urbina, 2004). Chacun propose une méthode comportant un nombre variable d’étapes
ayant pour but d’assurer à l’instrument de mesure une certaine valeur, pour ne pas dire
une valeur certaine, en fait de validité.

7
Dans la prochaine section, seront présentées les étapes de développement et de validation
de questionnaires telles que proposées par Dussault et al. (2007), inspirées de DeVellis
(2003), qui sont appliquées au QCA-PA. Les cinq premières étapes correspondent à la
phase d’élaboration, alors que les deux dernières composent la phase de validation (1-
détermination de l’objet de mesure à la lumière d’une revue de littérature, 2- génération
d’items, 3- détermination d’un format de mesure, 4- vérification de la clarté des items, 5-
prétest, 6- analyse d’items, 7- preuves de validité de construit). Suivant les avancées sur
l’obtention de preuves de validité, les étapes 6 et 7 seront combinées. Comparativement à
d’autres méthodes, celle-ci comprend un nombre limité d’étapes suivant un ordre logique
et permettant des allers-retours pour en modifier le contenu en cours d’élaboration. Elle
comporte comme avantage de considérer les preuves de validité de construit, souvent
négligées par d’autres auteurs.

4. Phase d’élaboration

4.1. Détermination de l’objet de mesure à la lumière d’une


revue de littérature

Dussault et al. (2007) et DeVellis (2003) s’accordent avec une majorité d’experts en
mesure et évaluation pour faire de la détermination de l’objet de mesure la première étape
à la base de l’élaboration d’un questionnaire. Des auteurs mentionnent le manque de
précision sur les concepts abordés par un instrument de mesure comme un problème
fréquent (DeVellis, 2003; Furr, 2011; Marquis, 2003; Shum et al. 2006, Urbina 2004). La
consultation d’experts du domaine étudié, de même qu’une revue de littérature portant
sur le ou les concept(s) à évaluer, sont recommandées. Brancato et al. (2006) ajoutent
l’utilisation de groupes de discussion choisis parmi la population cible. Ces actions
permettent de bien circonscrire l’objet d’évaluation en différenciant le concept à l’étude
de concepts similaires. Pour ce faire, Downing (2003) et Osterlind (2010) suggèrent
l’emploi d’un tableau de spécifications qui identifie les dimensions du concept et les
sous-dimensions s’y rattachant, de même que l’importance relative de chacune pour sa
compréhension. Finalement, cette étape mène également à déterminer les caractéristiques
de la population cible et à confirmer les objectifs de l’évaluation, tels que les concepts

8
abordés ainsi que la fonction et le type d’interprétation de la mesure, que certains auteurs
définissent comme des étapes distinctes (AERA et al., 2014; Brancato et al., 2006; Furr,
2011; Marquis, 2003; Urbina, 2004).

Dans la présente recherche, le développement du QCA-PA s’est amorcé sous la


supervision d’un pneumologue chercheur. La revue de littérature s’est d’abord attardée au
rapport GINA (FitzGerald et al., 2014). Ce consensus international a permis d’établir les
caractéristiques de la population cible, soit les adultes asthmatiques, ainsi que la fonction
pronostique du questionnaire et son interprétation critériée. La consultation a également
permis de retenir les cinq catégories proposées par GINA relatives aux connaissances sur
l’asthme, soit 1- l’aspect biomédical de la maladie, ce qui la définit et la distingue
d’autres maladies respiratoires, 2- les facteurs déclenchants, qui amènent à développer de
l’asthme ou à en provoquer des symptômes, 3- le diagnostic et le contrôle, qui regroupent
les moyens dont un médecin dispose pour diagnostiquer et déterminer le niveau de
contrôle de l’asthme chez le patient, 4- le traitement de l’asthme, soit les connaissances
sur la médication qui y est associée et 5- les connaissances générales qui concernent ce
que cela signifie que de vivre avec l’asthme (FitzGerald et al., 2014). De plus, la
consultation d’une revue systématique évaluant les questionnaires de connaissances sur
l’asthme déjà existants et leurs qualités psychométriques a permis de rendre compte de
l’état des travaux en la matière (Pink et al., 2009). La majorité était destinée à une
fonction diagnostique à travers une interprétation critériée. Il a également été convenu
d’opter pour un questionnaire autoadministré qui permet une plus grande standardisation
dans sa complétion par les participants (Laveault et Grégoire, 1997).

4.2. Génération d’items

La deuxième étape du développement d’un instrument de mesure est la génération des


items (DeVellis, 2003). Suivant des règles précises de rédaction, elle vise la création
d’une grande banque d’items. Par exemple, celles-ci se doivent d’éviter de comporter des
indices qui les rendraient acceptables ou inacceptables pour l’ensemble de la population
comme en employant les adverbes « toujours » ou « jamais ». De plus, il est nécessaire
que les items ne comportent qu’une seule idée pour éviter que le répondant n’endosse une

9
partie de l’item tout en rejetant l’autre. Le niveau de langage et le vocabulaire utilisés
doivent être adaptés à la population cible et il convient d’éviter les questions négatives, et
les doubles négations (pour plus de détails, consulter Lakhal et Frenette, sous presse).
Des items peuvent aborder la même notion, mais avec une formulation différente. Une
redondance bien effectuée, c’est-à-dire qui reformule les mêmes idées avec suffisamment
de différences, permet de constater la permanence d’une idée chez le répondant par la
répétition des mêmes réponses malgré des formulations différentes (DeVellis, 2003).

Dans la présente recherche, des discussions entre plusieurs spécialistes du domaine donc
le pneumologue chercheur, d’autres pneumologues québécois et des pneumologues
anglophones ont mené à la génération d’une banque de 52 items basée sur les
recommandations de GINA concernant ce que tout patient asthmatique devrait savoir sur
sa maladie et respectant ces règles. De plus, les items ont été regroupés en cinq catégories
comme le propose GINA, soit cinq items portant sur l’aspect biomédical, 16 sur les
facteurs déclenchants, 18 sur le diagnostic et le contrôle, 10 sur les traitements et trois sur
les connaissances générales liées à l’asthme, en fonction de l’importance accordée à
chacune dans ce consensus international.

4.3. Détermination d’un format de mesure

La génération d’items doit être suivie par l’étape de la sélection d’un format de mesure,
soit la forme que prendra l’échelle de réponse (DeVellis, 2003). Plusieurs choix s’offrent
au développeur de questionnaires comme les questions de type « vrai ou faux », les
questions à choix multiples et les questions à réponses construites courtes ou élaborées
dans le cas des questionnaires de connaissances et les échelles de type Likert, Thurstone
ou Guttman pour les questionnaires d’attitudes (DeVellis, 2003). Cette étape et la
précédente doivent toujours refléter les objectifs de l’évaluation quant à l’objet de
mesure, la fonction et le type d’interprétation, mais se présentent différemment d’un
auteur à l’autre. Les Standards for Educational and Psychological Testing (AERA et al.,
2014) et Urbina (2004) suggèrent l’ordre inverse, soit de choisir l’échelle de mesure
avant de générer les items, alors que Furr (2011), Marquis (2003) et Shum et al. (2006)
ne voient là qu’une seule étape. De leur côté, Brancato et al. (2006) intègrent à cette

10
étape la détermination du mode de collecte de données, qui semble toutefois implicite
chez les autres auteurs.

Dans le cas du QCA-PA, il a été convenu d’opter pour des items de type « vrai ou faux »
puisque ce genre d’items s’avère souvent plus rapide à répondre pour le participant
(Tousignant et Morissette, 1989) et plus facile à analyser pour le professionnel de la santé
en situation clinique. L’option « Ne sais pas » a été ajoutée aux choix de réponse afin
d’éviter les données manquantes. Toutefois, au moment de l’analyse, les réponses ont été
transformées selon une dichotomie bonne réponse/mauvaise réponse où l’option « Ne
sais pas » a été considérée comme une mauvaise réponse puisqu’elle ne démontrait pas
une connaissance acquise par le patient.

4.4. Vérification de la clarté des items

Pour Dussault et al. (2007) et DeVellis (2003), la vérification de la clarté des items
constitue une étape à part entière. Brancato et al. (2006) et Urbina (2004) abondent en ce
sens, contrairement aux Standards for Educational and Psychological Testing (AERA et
al., 2014), Furr (2011) et Shum et al. (2006) qui l’associent à l’étape précédente. Elle
consiste en l’accumulation des premières preuves de validité soit la validité apparente et
la validité de contenu, bien que des auteurs n’incluent généralement qu’une seule des
deux formes de validité (Marquis, 2003; Urbina, 2004). La validité apparente concerne la
vérification par un échantillon de la population cible de sa compréhension des items et de
leur lien avec les concepts (Laveault et Grégoire, 1997). La validité de contenu vise la
vérification des mêmes éléments par des experts du domaine et ajoute la vérification de la
couverture de l’ensemble du concept par les items (Laveault et Grégoire, 1997). Quelle
que soit la façon d’aborder cette étape, elle nécessite un retour vers les étapes précédentes
à la suite des commentaires des répondants de la population cible et des experts du
domaine.

Le QCA-PA a ainsi été soumis à un groupe de 20 patients adultes asthmatiques afin


d’obtenir leurs commentaires sur leur compréhension des questions. Des questions leur
étaient posées concernant leur compréhension des termes utilisés et des formulations
adéquates des questions. Il a aussi été soumis à un ensemble d’experts composé de trois

11
pneumologues, trois éducatrices en asthme, un psychologue, un pharmacien et deux
médecins généralistes. Ils étaient questionnés à l’effet que selon eux, l’ensemble des
connaissances qu’un patient asthmatique devrait avoir de sa maladie étaient présentes.
Leurs commentaires concernant exclusivement la formulation des items ont permis
d’arriver à une version préliminaire de 52 items du QCA-PA qui a été soumise à un
prétest.

4.5. Prétest

La dernière étape de la phase d’élaboration d’un questionnaire est celle du prétest. Elle
consiste à soumettre le questionnaire dans sa version préliminaire à un échantillon de la
population cible différent de celui de l’étape précédente afin de procéder à l’analyse des
caractéristiques psychométriques de l’instrument de mesure. Plusieurs théories sont
avancées quant au nombre de participants idéal que devrait compter un échantillon, mais
un élément leur est commun : plus l’échantillon est grand, moins les résultats sont soumis
à des erreurs de mesure (DeVellis, 2003). Le nombre de répondants requis dépend
beaucoup du nombre d’items que comporte l’instrument de mesure ainsi que du nombre
de dimensions du concept évalué (Nunnally et Berstein, 1994). Il faut aussi tenir compte
des réalités de la recherche et de la faisabilité, par exemple la taille de la population visée
et l’accès à cette population. Shum et al. (2006) estiment qu’un échantillon comportant
une centaine de personnes environ est adéquat. Kline (2000), pour sa part mentionne que,
lorsque des analyses factorielles sont effectuées, un ratio répondants/items de 2 pour 1
peut être toléré si les facteurs sont bien définis. Plusieurs approches pour estimer la taille
d’un échantillon font référence au nombre de paramètres à estimer. Pour les analyses
factorielles confirmatoires, un ratio de 10 : 1 est privilégié (Tabachnick et Fidell, 2007).
Au-delà de la taille de l’échantillon, c’est sa représentativité de la population cible qui
doit être visée (DeVellis, 2003; Kline, 2000).

Les analyses proposées pour cette étape sont celles liées aux preuves de validité de la
structure interne du questionnaire, notamment l’indice de difficulté, l’indice de
discrimination, les corrélations inter-items, les analyses de fiabilité et les analyses
factorielles exploratoires (AFE) ou confirmatoires (AFC) (Downing, 2003). Si, pour

12
plusieurs auteurs, l’étape du prétest est essentielle et permet l’ajustement du questionnaire
(AERA et al., 2014; DeVellis, 2003; Urbina, 2004), d’autres passent outre cette étape et
vont directement à la phase de validation (Brancato et al., 2006; Furr, 2011; Marquis,
2003; Shum et al., 2006). Pour sa part, Urbina (2004) suggère de répéter le prétest
jusqu’à l’obtention d’une version acceptable. Le remodelage de l’instrument de mesure à
la suite de ces analyses permet d’obtenir une version finale du questionnaire pour laquelle
des preuves supplémentaires quant à la validité seront recherchées auprès de la
population cible ou, si elle s’avère trop grande et donc impossible à tester dans son
entièreté, par un nouvel échantillon représentatif différent de celui du prétest.

Le QCA-PA a fait l’objet d’un prétest où une version préliminaire comportant 52 items
divisés en cinq catégories, a été complétée par un échantillon composé de 84 adultes
asthmatiques. Ces répondants ont rempli le QCA-PA une première fois, à la suite de quoi
ils ont tous reçu une session d’éducation personnalisée sur l’asthme. Entre quatre et six
semaines plus tard, 76 de ces personnes étaient disponibles pour remplir à nouveau le
QCA-PA. Ces deux administrations ont permis non seulement des analyses de la
structure interne qui s’est avérée bonne et la vérification de la structure factorielle (telles
que proposées aux sections 5.1.1 et 5.1.2), mais ont également procuré une preuve de la
fiabilité du test par la réponse au changement à la suite de l’enseignement, où une
augmentation significative des scores pouvant être mesurée. Ces analyses ont amené les
chercheurs à identifier les items problématiques de l’instrument de mesure. La version
finale du QCA-PA comporte désormais 54 items, à la suite de la suppression d’items
redondants et l’ajout d’un ensemble d’items portant sur les conséquences d’un asthme
mal contrôlé. La division en catégories n’est conservée qu’à titre visuel, les AFC ayant
montré que les données du prétest s’ajustaient mieux à un modèle unidimensionnel où
tous les items sont liés au concept unique des connaissances sur l’asthme.

5. Phase de validation

Tant pour Dussault et al. (2007) et DeVellis (2003) que pour la majorité des chercheurs,
la validité est considérée comme une qualité psychométrique cruciale (Furr, 2011;
Laveault et Grégoire, 1997; Shum et al., 2006). Elle constitue le degré avec lequel le

13
questionnaire mesure bien ce qu’il prétend mesurer (Messick, 1994). La validité est
aujourd’hui abordée comme un concept unifié regroupant cinq types de preuves :
contenu, processus de réponse, structure interne, relation avec d’autres variables et
conséquences (Downing, 2003; Messick, 1994). Plutôt qu’une dichotomie valide/non-
valide, la validité est plutôt perçue comme un processus continu d’accumulation de
preuves visant à déterminer le degré de validité des inférences qu’il est possible de tirer
des données recueillies par l’instrument (Laveault et Grégoire, 1997).

Dans le cas du QCA-PA, des preuves de validité apparente et de contenu (revue de


littérature, vérification des items par un groupe de répondants et un groupe d’experts) et
de la validité du processus de réponse (sélection d’un format de mesure, du calcul des
scores et d’un questionnaire autoadministré, prétest) ont déjà été amassées à la phase
d’élaboration. Par conséquent, les deux étapes de la phase de validation d’un instrument
de mesure proposées par Dussault et al. (2007) et DeVellis (2003), soit l’analyse d’items
et la vérification de la structure factorielle, peuvent être incluses dans une seule étape
visant l’accumulation de preuves de validité (Downing, 2003; Messick, 1994); ces deux
dernières étant reliées à la structure interne. Par la suite, les deux autres preuves de
validité (relation avec d’autres variables et conséquences) seront présentées.

5.1. Preuves de validité

5.1.1. Validité de la structure interne

Pour l’ensemble des auteurs consultés, la phase de validation d’un questionnaire passe
d’abord par l’étape de l’analyse d’items qui consiste en l’accumulation de preuves de la
validité de la structure interne. À cette fin, la théorie classique des tests (TCT) et la
théorie de réponse aux items (TRI) proposent un ensemble de procédures statistiques
permettant d’accumuler des preuves de validité quant à la structure interne d’un
instrument de mesure. La première permet d’établir la fiabilité des items d’un
questionnaire. Le caractère différent de chaque concept à l’étude est fourni par le
coefficient de cohérence interne. Mesuré par le coefficient alpha de Cronbach (ou le KR-
20 dans le cas de données dichotomiques, comme dans la présente recherche), le
coefficient de cohérence interne est considéré comme satisfaisant s’il se situe entre 0,7 et

14
0,9 (Juniper, Svensson, Mork et Stahl, 2005). Une deuxième forme de fiabilité consiste à
évaluer la stabilité dans le temps. Elle est souvent appelée reproductibilité et se mesure en
comparant les résultats des répondants au même questionnaire, à deux temps de mesure,
sans qu’il n’y ait d’intervention entre les deux. Une analyse des corrélations entre les
résultats des différents temps de mesure de même qu’une analyse de variance (ANOVA)
à mesures répétées permet de vérifier cette forme de fiabilité. L’indice de discrimination,
aussi appelé corrélation item-total, peut également servir à indiquer le degré de
pertinence de chaque item à l’intérieur de sa dimension. Diverses valeurs pouvant être
acceptables dépendamment des objectifs poursuivis par le questionnaire et de l’enjeu de
celui-ci (Crocker et Algina, 1986; Laveault et Grégoire, 1997). Nunally et Bernstein
(1994) indiquent qu’un item présentant un bon indice de discrimination (r > 0,3) ajoute à
la cohérence interne d’un instrument de mesure et qu’un item avec un indice modéré (r >
0,2) peut quand même y contribuer positivement. Pour sa part, l’indice de difficulté
indique le taux de réussite de chaque item. Il permet, d’identifier les items qui risquent
d’être plus ou moins réussis. Plus l’indice de difficulté est élevé, plus l’item risque d’être
échoué par un plus grand nombre de répondants. Le coefficient de corrélation intra-classe
peut également être utilisé pour attester de la fiabilité test-retest d’un instrument de
mesure en se basant sur l’analyse de variance. Il est surtout utilisé pour vérifier la fiabilité
inter-juges. Le biais de mesure différentiel (Differential Item Functionning DIF) identifie
les items d’un test qui peuvent réagir différemment d’un groupe de répondants à l’autre,
en contrôlant pour le niveau d’habileté, lorsque ceux-ci présentent un trait latent
commun. La TRI, pour sa part, amène une analyse plus approfondie des items. En plus de
comparer les items entre eux, elle inclut dans l’analyse les répondants au questionnaire.
Elle se base sur le postulat que la performance d’un sujet est attribuable à un trait latent
plutôt qu’aux caractéristiques de l’échantillon dont il fait partie (Laveault et Grégoire,
1997). Différents modèles de mesure de la TRI peuvent être utilisés en fonction de la
qualité de l’information que l’on cherche à retirer de chaque item. Le plus simple et le
plus couramment utilisé du fait de sa simplicité étant le modèle à un paramètre (Bertrand
et Blais, 2004). Un cas spécial de ce modèle à un paramètre, le modèle de Rasch, postule
qu’un seul trait latent est responsable de la variance des items et que tous les items
possèdent le même degré de discrimination (Bertrand et Blais, 2004; Laveault et

15
Grégoire, 1997). La mesure est alors considérée invariante dans les échantillons de
répondants et peut être analysée de façon plus spécifique. Les statistiques d’ajustement
produites sont une indication de l’adéquation entre le modèle unidimensionnel de Rasch
et les données.

Un autre moyen d’attester de la validité de la structure interne est par des analyses
factorielles. Elles permettent de vérifier la validité de construit, considéré comme le type
de validité le plus important par plusieurs spécialistes de la psychométrie (DeVellis,
2003; Furr, 2011; Osterlind, 2010). Elles peuvent être de nature exploratoire (AFE),
cherchant à découvrir des traits latents qui émergent de regroupements se basant sur les
données recueillies, ou alors de nature confirmatoire (AFC). Les analyses factorielles de
nature exploratoire se basent soit sur les covariances entre les variables, soit sur l’analyse
en composantes principales qui s’appuie davantage sur l’analyse de la variance des
variable indépendantes afin d’en réduire le nombre et ainsi rendre l’information d’un
instrument de mesure moins redondante. Les AFC, quant à elles, permettent d’établir
dans quelle mesure les données recueillies s’ajustent au modèle théorique sur lequel
s’appuie l’élaboration du questionnaire (Laveault et Grégoire, 1997). Elles s’effectuent à
l’aide de logiciels permettant d’effectuer des analyses par équations structurelles, tel EQS
(Bentler, 1995), utilisé dans le cas du QCA-PA, mais également LISREL (Jöreskog et
Sörbom, 1996-2001) et Mplus (Muthén et Muthén, 1998-2010), entre autres.

5.1.1. Validité de la relation avec d’autres variables

Diverses preuves de la validité de la relation avec d’autres variables peuvent être


apportées, soit la validité concomitante du questionnaire, les corrélations convergentes ou
divergentes ou des analyses de généralisabilité. La première a été retenue dans le cas du
QCA-PA puisqu’un autre instrument mesurant le même concept existe. En comparant le
QCA-PA avec une mesure étalon, l’analyse des corrélations permet de déterminer le
degré d’adéquation entre le nouvel instrument de mesure et la mesure étalon et donc de
montrer que le nouvel instrument mesure bien le concept étudié (Downing, 2003;
Laveault & Grégoire, 1997). Une corrélation modérée était attendue entre les deux

16
instruments, car une corrélation élevée aurait montré une trop grande similarité entre le
QCA-PA et la mesure étalon et donc le manque de pertinence du nouvel instrument.

5.1.2. Validité de conséquences

Enfin, une analyse de variance multivariée des scores obtenus permet d’apporter une
preuve supplémentaire de réponse aux changements de l’instrument de mesure. À long
terme, l’augmentation des connaissances des participants constitue une conséquence
positive de l’usage du questionnaire sur les répondants (Messick, 1994). Il peut en être
autrement si la complétion du questionnaire entraîne chez le répondant un niveau de
stress trop élevé ou quelque autre complication. Dans ce cas, les conséquences négatives
du test surpasseraient les conséquences positives. Une ANOVA à mesure répétées
comparant les temps de mesure permet de déterminer si une différence significative des
résultats est présente d’un temps à l’autre, avant et/ou après l’intervention éducative.

Pour le QCA-PA, les analyses suivantes ont été retenues puisqu’elles sont celles qui sont
les plus présentes dans la littérature pour ce genre de recherche. L’analyse du coefficient
de cohérence interne, l’indice de discrimination des items, l’indice de difficulté, la
reproductibilité, l’analyse par le modèle de Rasch et les AFC ont été retenus comme
preuves de validité de la structure interne. L’analyse de la validité concomitante du QCA-
PA a constitué quant à elle une preuve de la relation avec d’autres variables. Le
Questionnaire de connaissances sur l’asthme en langue française (QCALF) (Nguyen et
al., 2003), le seul autre questionnaire en français évaluant le même concept et ayant déjà
recueilli certaines preuves de validité, a été utilisé comme mesure étalon. Cependant,
comme le QCA-PA se veut une amélioration par rapport aux instruments de mesure déjà
existants, un coefficient entre 0,4 et 0,8 a été jugé acceptable pour démontrer une bonne
validité concomitante (Streiner et Norman, 1995). Une analyse de variance (ANOVA) à
mesures répétées a finalement été effectuée sur les scores du QCA-PA à chacun des
quatre temps de mesure. Elle avait pour but d’établir la fiabilité du QCA-PA, mais
également sa validité de conséquences.

La section qui suit présente un article scientifique reprenant l’essentiel de la


méthodologie présentée de même que les résultats des analyses de validité du QCA-PA.

17
18
Présentation de l’article

Les pages qui suivent présentent un article soumis à la Revue des maladies respiratoires,
revue officielle de la Société de pneumologie de langue française (SPLF). Depuis 1887,
cette revue publie des articles originaux, des éditoriaux, des recommandations d’experts
et des fiches techniques en lien avec les pathologies pulmonaires sous forme de 10
fascicules réguliers par année et en ligne. L’article qui suit présente la méthode de
développement et de validation utilisée pour l’élaboration du QCA-PA. Il poursuit deux
objectifs. Premièrement, offrir aux professionnels de la santé un nouvel instrument de
mesure des connaissances de leurs patients asthmatiques sur leur maladie afin
d’augmenter l’efficacité de leurs interventions éducatives. Deuxièmement, proposer une
méthode simple et rigoureuse de développement d’instruments de mesure applicable à
plusieurs autres domaines de la santé.

19
20
Article scientifique

Développement et validation d’outils de mesure des connaissances du


patient : le modèle du Questionnaire de connaissances sur l’asthme
destiné aux patients adultes (QCA-PA)
Daniel Beaurivage
Université Laval
Département des fondements et pratiques en éducation
2320, des Bibliothèques, TSE 446
Université Laval
Québec, Canada, G1V 0A6
Courriel : daniel.beaurivage.1@ulaval.ca

Eric Frenette
Université Laval,
Département des fondements et pratiques en éducation
2320, des Bibliothèques, TSE 454
Université Laval
Québec, Canada, G1V 0A6
Courriel : eric.frenette@fse.ulaval.ca
Tél. : 418-656-2131 #3759

Louis-Philippe Boulet
Institut de cardiologie et de pneumologie de Québec (IUCPQ)
2725, chemin Sainte-Foy
Québec, Canada, G1V 4G5
Courriel : lpboulet@med.ulaval.ca
Tél : 418 656-4747

Marie-Ève Boulay
Institut de cardiologie et de pneumologie de Québec (IUCPQ)
2725, chemin Sainte-Foy
Québec, Canada, G1V 4G5
Courriel : marie-eve.boulay@criucpq.ulaval.ca
Tél : 418 656-8711 #2617

21
Résumé

Introduction : Chez le patient asthmatique, une mauvaise connaissance de sa maladie est


une des causes d’un mauvais contrôle de cette dernière. L’éducation du patient est
prioritaire, mais requiert au préalable une bonne évaluation de ses connaissances.

But : Décrire une méthode d’élaboration de questionnaires de connaissances par


l’exemple du Questionnaire de connaissances sur l’asthme destiné aux patients adultes
(QCA-PA).

Méthodes : Le QCA-PA a été développé et validé selon sept étapes proposées par
Dussault, Valois et Frenette (2007) et comporte 54 items « vrai/faux/ne sais pas ». Un
total de 101 adultes asthmatiques a répondu au questionnaire à quatre reprises lors de
trois visites en milieu hospitalier sur une période d’environ un mois. À la deuxième
visite, il était complété avant et après une session d’enseignement individualisée sur
l’asthme.

Résultats : Le QCA-PA démontre diverses preuves de validité : apparente et de contenu,


processus de réponse, structure interne, relations avec d’autres variables et conséquences.
Il serait représenté par une structure unidimensionnelle et le niveau de consistance interne
est considéré satisfaisant.

Conclusions : Le QCA-PA est un questionnaire de connaissances développé et validé de


manière rigoureuse et basé sur les recommandations internationales les plus récentes. Il
permettra de mieux cibler les interventions éducatives offertes au patient asthmatique.

Mots-clés :

Asthme – Connaissances – Validation – Questionnaire – Patient

22
Abstract

Introduction: Poor asthma knowledge of asthmatic patients contributes to poor control


of the disease. Education is a priority, but needs a good patient’s knowledge assessment.

Aim: To give a patient’s knowledge questionnaire development method using the


example of the Questionnaire de connaissances sur l’asthme destiné aux patients adultes
(QCA-PA).

Methods: The QCA-PA was developed according to Dussault, Valois and Frenette
(2007) seven steps. It includes 54 “true/false/don’t know” items. A total of 101 asthmatic
adults completed the questionnaire four times during three visits over a period of about
one month. It was answered twice on the second visit, before and after an individualized
education session on asthma.

Results: QCA-PA shows different proofs of validity: face and content, response process,
internal structure, relationship to other variables and consequences of testing. It is
represented by a unidimensional factor structure and its internal consistency appears to be
satisfying.

Conclusions: QCA-PA is a new validated knowledge questionnaire which could help


health professionals to better target their educational interventions with asthmatic
patients.

Key words:

Asthma – Knowledge – Validation – Questionnaire – Patient

23
Introduction

L’asthme est une des maladies chroniques les plus répandues dans le monde et les coûts
qui y sont associés sont élevés (FitzGerald et al., 2014; Masoli et al., 2004). Les
conséquences de l’asthme peuvent être minimisées par un bon contrôle de la maladie et
l’éducation du patient est considérée comme un des éléments les plus importants pour
optimiser le contrôle. Malheureusement, l’asthme est souvent mal contrôlé (Bateman et
al., 2001; Boulet et al., 2006). Parmi les raisons expliquant cette situation, on retrouve le
manque de connaissances du patient sur sa maladie et les critères de contrôle de celle-ci
(Boulet, Phillips, O’Byrne et Becker, 2002; Soriano et al. 2003). Par exemple, Soriano et
al. (2003) ont montré que lorsqu’ils étaient questionnés sur les causes et le traitement de
l’asthme, seuls 7,8 % des patients asthmatiques mentionnaient l’inflammation des voies
respiratoires et seulement 17,6 % savaient que les corticostéroïdes inhalés étaient la
médication la plus efficace pour réduire l’inflammation bronchique.

Des connaissances de base de la maladie et de son traitement sont essentielles pour


permettre au patient de développer ses capacités d’autocontrôle et une plus grande
autonomie dans la gestion de son asthme. Une méta-analyse de 17 études effectuées
auprès de 7442 patients atteints de maladies chroniques comme l’asthme ou la maladie
pulmonaire obstructive chronique (MPOC) a conclu que des programmes d’éducation
basés sur l’autocontrôle amélioraient à court terme le sentiment d’autoefficacité des
participants, l’autoévaluation de leur état de santé et la gestion de leur anxiété face à leurs
symptômes (Gibson et al., 2003). De plus, ces programmes d’éducation contribuaient à
augmenter la fréquence de leurs activités physiques.

Les bénéfices de l’éducation sur l’asthme ont été démontrés, mais trop peu de patients
asthmatiques profitent d’interventions éducatives adéquates (Cowie, Cicutto et Boulet,
2001; Gibson et al., 2003). Dans le but d’améliorer l’efficacité des interventions des
professionnels de la santé, il convient d’abord d’évaluer les connaissances du patient sur
sa maladie, afin de lui fournir l’information la plus appropriée sur laquelle les bases des
suggestions sur les changements de comportement seront établies.

24
Pour être de qualité, un instrument de mesure de connaissances des patients, tel un
questionnaire, doit présenter diverses preuves de validité de contenu, du processus de
réponse, de la structure interne, des relations avec d’autres variables et de conséquences
(Downing, 2003; Messick, 1994). Ces preuves sont accumulées tout au long du processus
d’élaboration et de validation et elles permettent de juger du niveau de validité des
inférences pouvant être tirées des réponses au questionnaire (Messick, 1990).

Plusieurs questionnaires de connaissances sur l’asthme ont été développés et certaines


preuves de validité ont été obtenues (Pink et al., 2009), mais ils s’avèrent souvent
complexes ou adaptés à des populations particulières. De plus, ils apparaissent souvent
désuets et ne s’appuient pas toujours sur les lignes directrices nationales ou
internationales. Dans une revue systématique portant sur 18 questionnaires de
connaissances sur l’asthme, des auteurs ont montré qu’aucun de ces questionnaires
n’obtenait une note satisfaisante pour chacune des preuves de validité retenues (validité
de contenu, validité de construit, cohérence interne et reproductibilité) (Pink et al., 2009).
De plus, selon les recommandations des Standards for Educational and Psychological
Testing, tout outil de mesure doit faire l’objet d’un processus de développement et de
validation rigoureux basé sur les finalités auxquelles on le destine (AERA et al., 2014).

Le but du présent article est de présenter les étapes de développement et de validation


d’outils d’évaluation des connaissances des patients, en prenant pour exemple le
Questionnaire de connaissances sur l’asthme destiné aux patients adultes (QCA-PA),
basé sur les plus récents rapports du Global Initiative for Asthma (GINA) (FitzGerald et
al., 2014). Cet article se veut aussi un guide méthodologique pour les chercheurs et les
professionnels de la santé désirant développer de nouveaux instruments de mesure
respectant les normes élevées de qualité.

25
1. Détermination de l’objet
de mesure
- Validité de contenu

2. Génération d’items
- Validité de contenu

3. Détermination du
format de mesure
Phase de développement - Validité du processus de
réponse

4. Vérification de la clarté
des items
- Validité du processus de
réponse (apparente)
- Validité de contenu

5. Prétest
- Validité de la structure
interne
- Validité du processus de
réponse

6. Analyse d’items
- Validité de la structure
interne

Phase de validation 7. Preuves de validité de


construit (et
concomitante, fiabilité)
- Validité de la structure
interne
- Validité de la relation
avec d’autres variables
- Validité de conséquences

Figure 1 : Développement et de validation de questionnaire (Dussault et al.,


2007) et preuves de validité associées

26
Méthodologie

Dussault et al. (2007) proposent une méthode simple et rigoureuse de développement et


de validation de questionnaire en sept étapes inspirée de DeVellis (2003), tel qu’illustré à
la figure 1. Les cinq premières correspondent au développement et les deux dernières, au
processus de validation : 1- détermination de l’objet de mesure à la lumière d’une revue
de littérature, 2- génération d’items, 3- détermination d’un format de mesure, 4-
vérification de la clarté des items, 5- prétest, 6- analyse d’items, 7- preuves de validité de
construit auxquelles seraient ajoutées celle de validité concomitante, de reproductibilité et
de réponse aux changements.

Phase de développement

1. Détermination de l’objet de mesure à la lumière d’une revue de


littérature

Avant d’entreprendre tout travail de développement d’un outil de mesure, il convient


d’abord de circonscrire ce qui sera et ne sera pas évalué (DeVellis, 2003). Dans cette
optique, une revue de la littérature pertinente au sujet traité doit être effectuée afin de
différencier les concepts abordés. La population cible doit également être déterminée à
cette étape.

Dans le cas du QCA-PA, un spécialiste du domaine étudié était responsable du projet. Ses
connaissances sur l’asthme et son expérience clinique ont fourni les bases théoriques du
questionnaire. De plus, la consultation des documents de l’organisme GINA sur les
connaissances que tout patient asthmatique devrait posséder a fortement inspiré
l’élaboration du QCA-PA (FitzGerald et al., 2014). Les auteurs se sont donc attardés aux
recommandations émises pour les asthmatiques adultes et ont ciblé les cinq dimensions
proposées par GINA, soit biomédical, facteurs déclenchants, diagnostic et contrôle,
traitements ainsi que connaissances générales.

La revue systématique de Pink et al. (2009) a ensuite permis de consulter 18


questionnaires de connaissances sur l’asthme dans le but de prendre connaissance des

27
instruments de mesure déjà existants. Aucun questionnaire ne respecte l’ensemble des
preuves de validité à accumuler. Un seul questionnaire en français existant et répondant à
certaines preuves de validité, soit le Questionnaire de connaissances sur l’asthme en
langue française (QCALF) (Nguyen et al., 2003) sera utilisé comme mesure étalon dans
le cadre de l’analyse de validité concomitante de l’étape 7. Il comporte 38 items à
l’origine, mais l’un de ces items s’adressant à une population française a été retiré.
Comme le QCA-PA, il se présente sous la forme de questions « vrai ou faux » et l’option
« Ne sais pas » est également présente. Ce questionnaire se veut une synthèse des
connaissances sur l’asthme, mais certains éléments semblent manquant par rapport au
consensus international.

2. Génération d’items

Une fois que les concepts abordés dans le questionnaire sont bien établis, la création
d’items est possible, mais doit suivre plusieurs règles de base. Tout d’abord, tous les
items doivent être en lien avec les objectifs de l’évaluation (DeVellis, 2003). Ils doivent
également être concis, présenter un niveau de langage adapté à la population cible et ne
comporter qu’une seule idée. Il convient aussi d’éviter les multiples négations et les
pronoms ambigus (Lakhal et Frenette, sous presse). Par exemple, l’item de type « vrai ou
faux » suivant comporte plusieurs erreurs : « Le patient asthmatique devrait toujours
suivre les conseils de son médecin puisqu’il est la personne la mieux placée pour
connaître les actions les plus efficientes à poser ». En effet, cet item est trop long et
utilise un niveau de langage trop élevé pour l’ensemble de la population. Il comporte
également deux affirmations séparées par « puisqu’il » et ce dernier pronom peut être
compris comme faisant référence aussi bien au patient asthmatique qu’au médecin.

En respectant les différentes règles de base, une banque de 52 items inspirés du rapport
GINA a été construite pour le QCA-PA. Elle regroupait des questions se rattachant aux
cinq regroupements théoriques proposées par GINA, soit : biomédical, facteurs
déclenchants, diagnostic et contrôle, traitements ainsi que connaissances générales.

28
3. Détermination d’un format de mesure

La détermination de la forme que prendront les réponses doit faire l’objet d’une réflexion
par rapport aux buts d’évaluation poursuivis dans le questionnaire. Un questionnaire de
connaissances et un questionnaire d’attitudes ne comportent pas le même type de
questions. Il convient, à cette étape, de choisir le format de mesure le plus approprié au
questionnaire souhaité, telles les questions de type « vrai ou faux », les questions à choix
multiples, les échelles de type Thurstone ou Likert (DeVellis, 2003; Tousignant et
Morissette, 1989).

Comme le QCA-PA est un questionnaire qui vise à informer le professionnel de la santé


des connaissances du patient sur sa maladie (fonction pronostique), des items de type
« vrai ou faux » ont été privilégiés. Ce type de questionnaire s’avère plus rapide à
compléter et plus simple à comprendre et à analyser par le professionnel de la santé en
situation clinique. L’option « ne sais pas » faisait partie des choix de réponse pour toutes
les questions afin de réduire le nombre de données manquantes. Au moment de l’analyse,
elle était considérée comme une mauvaise réponse puisqu’elle ne montrait pas une
connaissance acquise par le patient.

4. Vérification de la clarté des items

La vérification de la clarté des items comporte deux éléments qui s’ajoutent aux preuves
de validité d’un instrument de mesure. La validité apparente et de contenu constituent un
premier test pour les items créés. La validité apparente consiste à présenter les items à un
échantillon représentatif de la population ciblée par l’évaluation. Elle vise à recueillir les
commentaires quant à l’adéquation entre les concepts abordés, la formulation des items
par rapport aux buts poursuivis par le questionnaire et la compréhension du vocabulaire
et du niveau de langage utilisés (DeVellis, 2003). La validité de contenu diffère de la
validité apparente par la composition du groupe auquel sont présentés les items. Dans ce
cas-ci, le questionnaire est présenté à un groupe d’experts du domaine abordé par le
questionnaire. L’objectif de la validité de contenu est de s’assurer qu’aucun aspect des
concepts abordés n’a été négligé en fonction des bases théoriques propres à ce domaine.
Les commentaires obtenus auprès de l’échantillon de la population cible et du groupe

29
d’experts permettent au chercheur de modifier ou de supprimer les items problématiques
et d’en ajouter d’autres au besoin (DeVellis, 2003).

Le QCA-PA a été développé initialement après consultation auprès de nombreux


spécialistes de l’asthme. Des preuves de validité apparente ont par la suite été obtenues
auprès d’un groupe de 20 patients asthmatiques fréquentant la clinique spécialisée de
pneumologie de l’Institut universitaire de cardiologie et de pneumologie de Québec
(IUCPQ). Des preuves de validité de contenu ont ensuite été cumulées grâce à un groupe
de trois pneumologues, trois éducatrices en asthme, un psychologue, un pharmacien et
deux médecins généralistes qui se sont penchés sur les items du questionnaire. Les
commentaires des patients et des spécialistes, portant surtout sur la terminologie utilisée,
ont permis de modifier la formulation de divers items. Le nombre d’items et les
catégories sont toutefois demeurés inchangés. Le QCA-PA a ensuite pu être soumis à un
prétest.

5. Prétest

Le prétest consiste à tester le questionnaire auprès d’un nouvel échantillon représentatif


de la population cible. Il a pour but de vérifier que chacun des items est pertinent dans le
questionnaire. Le prétest donne des indications sur les items qui nécessitent d’être
modifiés ou complètement supprimés. Il peut également servir à vérifier si les
regroupements théoriques (aussi appelés catégories, dimensions ou facteurs) sont
retrouvés lors de l’analyse des données (DeVellis, 2003). Le nombre de participants à
inclure dans le prétest fait l’objet de plusieurs discussions. Plus il est élevé, plus la
puissance des analyses est élevée et plus il est facile d’éviter les erreurs de mesure. Il faut
donc chercher à obtenir le ratio participants-items le plus élevé en autant que les
conditions de recherche le permettent (DeVellis, 2003).

La version préliminaire du QCA-PA a été complétée par des patients asthmatiques


adultes présentant divers niveaux de sévérité de la maladie lors d’une visite dans l’un des
trois groupes de médecine familiale (GMF) participants de la région de Québec. Un total
de 31 hommes et 53 femmes, âgés en moyenne de 46 ans (É.T. = 16 ans), ont répondu au
questionnaire papier une première fois. Puis, une session d’enseignement individuelle sur

30
l’asthme couvrant l’ensemble des concepts abordés dans le QCA-PA leur a été donnée
par une thérapeute respiratoire (inhalothérapeute). Entre quatre et six semaines plus tard,
29 de ces hommes et 47 de ces femmes ont complété le questionnaire une seconde fois
afin de mesurer la réponse aux changements, qui s’est avérée satisfaisante puisqu’une
augmentation significative au résultat total au questionnaire était perçue entre les deux
temps de mesure. Des analyses d’items (indice de discrimination et ajustement au modèle
de Rasch) (Bond et Fox, 2007) ont permis d’identifier des items à modifier ou à retirer
pour éviter la redondance. Les analyses factorielles confirmatoires suggéraient un
meilleur ajustement à un modèle unidimensionnel plutôt que les cinq catégories de
GINA.

L’apport du spécialiste du domaine dirigeant l’étude a aidé à guider les modifications. La


décision a aussi été prise d’ajouter une série de questions sur les conséquences d’un
asthme mal contrôlé à la suite d’une suggestion des inhalothérapeutes qui ont administré
le questionnaire aux participants. Ces modifications ont porté le nombre d’items de 52 à
54.

À la suite d’une redistribution des trois items de la catégorie « connaissances générales »


dans d’autres catégories leur correspondant mieux, les items ont été répartis en quatre
sections afin de faciliter la complétion du questionnaire par les participants (1-
caractéristiques de l’asthme, 2- facteurs déclenchants, 3- diagnostic et contrôle, 4-
traitement de l’asthme).

Échantillon pour la phase de validation

Pour la phase de validation, 101 nouveaux adultes asthmatiques n’ayant pas participé aux
phases précédentes de l’élaboration du QCA-PA ont été recrutés à la clinique spécialisée
de pneumologie de l’IUCPQ et au Centre de recherche de l’IUCPQ (Tableau 1).

31
Tableau 1 : Caractéristiques des participants (n=101) à la validation du QCA-PA
n

Sexe
Homme 38
Femme 63

Âge (années)a 45 ± 15

Groupe ethnique
Caucasien 101
Durée de l’asthme (années)b 20
(< 1 à 68)
Sévérité de l’asthme
Léger 45
Modéré 34
Sévère 22

Statut tabagique
Non-fumeur 66
Ex-fumeur 30
Fumeur 4
Tabagisme secondaire 1

Scolarité
Aucun diplôme d’études secondaires 3
Diplôme d’études secondaires ou cours classique 12
Certificat ou diplôme d’une école de métier 5
Certificat ou diplôme collégial 23
Certificat ou diplôme universitaire 58
Occupation
Travailleur temps plein 53
Travailleur temps partiel 10
Sans emploi 3
Étudiant(e) 14
Retraité(e) 21
a
moyenne ± écart-type; b moyenne (étendue).

L’échantillon comptait des adultes caucasiens asthmatiques présentant une sévérité et une
durée d’asthme variables. Les critères d’inclusion étaient les suivants : 1) asthme
diagnostiqué par un pneumologue, 2) réversibilité significative aux bronchodilatateurs
(augmentation d’au moins 12 % et/ou 200 ml du volume expiratoire maximal en une
seconde (VEMS) après la prise d’un bronchodilatateur) ou 3) présenter des symptômes
d’asthme et avoir un test de provocation à la métacholine positif (concentration de
métacholine provoquant une chute de 20 % ou plus du VEMS (CP20) ≤ 16 mg/ml). Les
critères d’exclusion étaient la présence d’une MPOC, la participation aux étapes
d’élaboration du questionnaire et l’incapacité à lire.

32
Déroulement

Le projet ayant reçu l’approbation du comité d’éthique de la recherche du Centre de


recherche de l’IUCPQ, les participants étaient convoqués à trois visites à ce même centre.
À la première visite (T0), des données descriptives telles que l’âge, le sexe, le groupe
ethnique, la durée de l’asthme, la sévérité de l’asthme, le statut tabagique, le degré de
scolarité et l’occupation étaient enregistrées. Deux questionnaires autoadministrés, le
QCA-PA et le QCALF (Nguyen et al., 2003), leur étaient ensuite présentés. Le QCALF
sera utilisé à l’étape 7 pour obtenir une preuve de validité concomitante. Ces deux
questionnaires étaient remplis dans un ordre aléatoire afin de réduire l’effet de la fatigue
comme source de variation dans les réponses (Ben-nun Bloom, 2008). La deuxième visite
(T1) avait lieu 14 jours (± 2 jours) après la première. Les participants y complétaient les
deux questionnaires afin de vérifier leur reproductibilité, puis recevaient une session
d’enseignement personnalisée par une infirmière spécialisée en éducation sur l’asthme. À
la suite de quoi, ils remplissaient à nouveau le QCA-PA et le QCALF (T2) afin de
mesurer la réponse aux changements des questionnaires. La dernière visite (T3) avait lieu
10 jours (± 3 jours) après la deuxième. À ce moment, les questionnaires étaient remplis
une dernière fois pour mesurer la rétention de l’information. Pour chacun des quatre
temps de mesure et pour chacun des questionnaires, le temps de complétion était noté. Il
était en moyenne de moins de cinq minutes pour le QCA-PA et de moins de quatre
minutes pour le QCALF.

Comme cette étude visait à mesurer les connaissances sur l’asthme des participants et
l’acquisition de nouvelles connaissances, le score des participants était attribué selon une
dichotomie bonne réponse/mauvaise réponse. Ainsi, pour chaque item, une note de 1 était
attribuée à la bonne réponse et de 0 à la mauvaise réponse ou à « ne sais pas ». Le score
des participants aux deux questionnaires équivalait au nombre de bonnes réponses. Les
scores pour le QCA-PA pouvaient varier de 0 à 54 et pour le QCALF de 0 à 37, puisque
ce dernier comporte 38 items, mais que l’un d’eux a été retiré parce qu’il ne s’appliquait
pas à la population cible.

33
Phase de validation

6. Analyse d’items (Preuves de validité de la structure interne)

L’analyse d’items constitue le cœur du développement d’un outil de mesure (DeVellis,


2003). Elle vise à identifier les questions qui doivent être conservées ou retirées du
questionnaire en se basant sur des indices statistiques afin d’améliorer l’information
obtenue (Laveault et Grégoire, 1997). Il est à noter qu’à cette étape, les bases théoriques
supportant la conception du questionnaire et le jugement de l’expert du domaine étudié
continuent de jouer un rôle important. En effet, un item présentant de mauvaises
statistiques peut être conservé sans modification si l’expert juge qu’il s’agit d’un item
primordial à la compréhension du concept de la maladie et que sa forme ne peut être
altérée. Les indices statistiques peuvent alors paraître moins satisfaisants, mais il est aussi
important que le questionnaire s’appuie sur la réalité clinique.

Trois procédures ont été privilégiées pour l’analyse d’items du QCA-PA, soit l’indice de
discrimination, l’analyse de la cohérence interne et l’analyse de l’ajustement des items au
modèle de Rasch. L’indice de discrimination est déterminé par le coefficient de
corrélation item-total. Il indique dans quelle mesure un item parvient à discriminer les
répondants ayant un score élevé de ceux ayant un score faible. Plus le coefficient est
élevé, plus l’item est discriminant. L’analyse de la cohérence interne consiste à s’assurer
que les items liés à un même concept réagissent de façon constante pour tous les
répondants. Ces deux procédures appartiennent à la théorie classique des tests qui
englobe de nombreux autres tests statistiques possibles (Crocker et Algina, 1989;
Laveault et Grégoire, 1997). La théorie de réponse aux items, pour sa part, permet une
analyse plus poussée des items puisqu’elle place sur une même échelle le degré de
difficulté des items et le niveau d’habileté des répondants (Bertrand et Blais, 2004).
Plusieurs modèles sont tirés de cette théorie, mais le plus simple, et le plus utilisé, est
certainement le modèle de Rasch qui postule qu’un seul trait latent est responsable de la
variance des items et que tous les items possèdent la même discrimination (Bond et Fox,
2007).

34
7. Preuves de validité (relation avec d’autres variables,
conséquences)

Ici seront vues les preuves de la validité de structure interne (validité de construit et
reproductibilité), de relation avec d’autres variables (validité concomitante) de même que
des preuves de la validité de conséquences (réponse aux changements).

La détermination de la validité, donc de la valeur d’un outil de mesure se fait par


l’accumulation de preuves. Certaines ont déjà été recueillies lors des étapes précédentes,
mais les plus importantes preuves de validité se démontrent à cette étape. D’une part, la
validité de construit constitue l’élément de validité primordial pour les spécialistes de la
psychométrie et de l’édumétrie (DeVellis, 2003). Elle consiste à déterminer dans quelle
mesure les items du questionnaire s’organisent de la même façon que les concepts
théoriques les supportant (DeVellis, 2003). D’autre part, la reproductibilité des résultats
d’un outil de mesure dans le temps de même que sa réponse aux changements constituent
des preuves de sa fiabilité, donc de la validité de sa structure interne et de la validité de
conséquences. Finalement, la validité concomitante vise à déterminer si le questionnaire
évalue bien ce qu’il prétend mesurer en le comparant à une mesure étalon. Comme il
n’existe pas de test qui permette de mesurer avec certitude les connaissances des patients
sur l’asthme, la comparaison des résultats du QCA-PA avec ceux obtenus à un autre
questionnaire portant sur le même concept a été utilisée pour vérifier la validité
concomitante. Dans ce cas-ci, la mesure étalon était le QCALF. Il est permis de croire
qu’une augmentation des connaissances détectée par le QCA-PA serait aussi détectée par
le QCALF. Cependant, comme le nouveau questionnaire se veut une bonification par
rapport aux outils déjà existants, une corrélation modérée était attendue pour obtenir une
preuve de validité concomitante. Dans sa validation initiale, il présentait un coefficient de
cohérence interne (0,82) et un coefficient de corrélation intra-classe (0,70) satisfaisants
avec des populations composées respectivement d’adultes asthmatique, d’adultes non
asthmatiques et d’étudiants en médecine (Nguyen et al., 2003).

35
Analyses statistiques

L’indice de discrimination est considéré problématique s’il se situe sous 0,2 (Crocker et
Algina, 1986; Nunnaly et Bernstein, 1994) (Voir Annexe 2). Comme des données
dichotomiques ont été utilisées, la corrélation point-bisériale item-total a servi aux
analyses. La cohérence interne est attestée par la valeur du coefficient de la formule 20 de
Kuder-Richardson (KR-20). Cette formule est privilégiée à l’alpha de Cronbach dans le
cas de données dichotomiques. Des valeurs entre 0,7 et 0,9 sont reconnues comme
présentant un bon niveau de cohérence interne (Crocker et Algina, 1986). Les analyses
ont été réalisées au moyen du logiciel TESTFAC 4.0 (Bock et al., 2003).

Les analyses avec le modèle de Rasch ont été réalisées avec l’aide du logiciel
WINSTEPS (version 3.32) (Linacre et Wright, 1999). Les statistiques d’ajustement sont
une indication de l’adéquation entre le modèle unidimensionnel de Rasch et les données
recueillies. Le logiciel WINSTEPS fournit deux statistiques d’ajustement pour les items :
infit et outfit (Linacre, 2002; Wright et Master, 1982). L’infit présente l’information
pondérée de la moyenne des carrés des résidus standardisés entre les réponses observées
et attendues en fonction de la variance de l’item et de la variance totale. L’outfit, utilisée
comme référence additionnelle, fournit la moyenne des carrés des résidus standardisés,
élevant les résidus au carré avant d’en faire la moyenne pour éviter que les résidus
négatifs ne compensent pour les résidus positifs. Une valeur de 1 à l’une et l’autre de ces
statistiques dénote un bon ajustement de l’item au modèle et une valeur allant de 0,5 à 1,5
est considérée satisfaisante (Linacre, 2002). Une valeur ≥ 1,5 indique un manque
d’homogénéité entre les items alors qu’une valeur ≤ 0,5 représente de la redondance entre
les items (Bain, Pini, Scallon et Bertrand, 1996).

Des analyses factorielles confirmatoires à partir des modèles d’équations structurelles ont
été exécutées en utilisant le logiciel EQS 6.2 (Bentler, 1995) afin d’obtenir une preuve de
la validité de construit du QCA-PA. Divers indices d’ajustement ont servi à comparer la
matrice théorique aux données empiriques : le chi-carré de Satorra-Bentler (la statistique
chi-carrée utilisée pour les données non normales) et son ratio sur les degrés de liberté
(SBχ2/dl), l’indice d’adéquation comparatif (Comparative Fit Index, CFI), l’indice

36
d’adéquation non normé (Non Normed Fit Index, NNFI) proposé par Tucker et Lewis
(1973) et la racine du carré moyen de l’erreur d’estimation (Root Mean Square Error of
Estimation, RMSEA) recommandée par Steiger (Steiger, 1990). La version modifiée de
l’Akaike Information Criterion (Consistent version of the AIC, CAIC), proposée par
Bozdogan (Bozdogan, 1987) a également été utilisée afin de comparer les modèles entre
eux.

Une valeur du SBχ2/dl s’approchant de 2,0 représente un bon ajustement du modèle aux
données empiriques, alors qu’une valeur de 5,0 indique un ajustement acceptable. Les
modèles indiquant un CFI et un NNFI au-dessus de 0,9 sont généralement considérés
comme adéquats (Schumacker et Lomax, 1996), alors que ceux présentant des valeurs de
0,95 sont qualifiés d’appréciables (Marsch, Ellis, Parada, Richards et Heubeck, 2005).
Une valeur du RMSEA en-dessous de 0,08 est acceptable, alors qu’une valeur en-dessous
de 0,05 est appréciable (Browne et Cudeck, 1993). Quant au CAIC, le modèle le plus
approprié devrait être celui qui présente la valeur la plus faible (Bentler, 1995). Enfin,
considérant que les données analysées ne respectaient pas la loi normale, la méthode
d’estimation du maximum de vraisemblance (Maximum Likelihood, ML) et son option
robust ont été utilisées. Étant donné le nombre de participants et le nombre de paramètres
à estimer, l’utilisation d’indicateurs était requise pour chacun des facteurs. Deux
indicateurs ont été construits pour chacun des facteurs. Marsch, Hau, Balla et Greyson
(1998) ont montré que leur utilisation était aussi efficace que l’utilisation de tous les
items pour évaluer l’adéquation des modèles théoriques aux données. Pour chacun des
facteurs, les indicateurs ont été conçus de façon aléatoire. L’indicateur 1 était obtenu par
la moyenne des items impairs et l’indicateur 2 par la moyenne des items pairs. Dans le
but d’optimiser la structure factorielle des modèles testés, le test multiplicatif de
Lagrange (LMTEST), qui propose l’ajout de paramètres, a aussi été employé (Bentler &
Dijkstra, 1985).

Selon les recommandations d’Anderson et Gerbing (1988), plusieurs analyses factorielles


confirmatoires ont été effectuées afin d’évaluer si d’autres modèles, spécifiés à la lumière
des bases théoriques, présentaient de meilleures statistiques d’ajustement. Trois modèles
ont donc été testés. Le premier modèle (M1) se basait sur le rapport GINA et éprouvait

37
un modèle à quatre facteurs corrélés (caractéristiques de l’asthme, facteurs déclenchants,
diagnostic et contrôle ainsi que traitement de l’asthme). Le deuxième modèle (M2)
ajoutait à la structure suggérée par la littérature un facteur de second ordre, les
connaissances sur l’asthme étant le facteur principal qui influence les quatre autres. Le
troisième et dernier modèle testé (M3) s’appuyait sur l’analyse de la cohérence interne
ainsi que sur les résultats obtenus au prétest et éprouvait une structure unidimensionnelle.

Afin d’obtenir une preuve de validité concomitante, des corrélations de Spearman ont été
réalisées entre les scores totaux du QCA-PA et du QCALF à chacun des temps de
mesure. Puisqu’un coefficient trop élevé démontrerait une trop grande similarité entre les
deux questionnaires, un coefficient entre 0,4 et 0,8 est jugé acceptable pour démontrer
une bonne preuve de validité concomitante (Streiner et Norman, 1995).

Dans le but de recueillir d’autres éléments de mesure de reproductibilité et de réponse


aux changements du QCA-PA, une ANOVA à mesures répétées a été effectuée en
analysant l’évolution du score moyen des participants à chacun des temps de mesure.

Résultats

Indice de discrimination

Le tableau 2 présente les résultats des analyses d’items obtenus pour chacun des items du
QCA-PA au premier temps de mesure (T0). Par souci de concision, les résultats
similaires ayant été obtenus aux autres temps de mesure ne sont pas présentés. Les items
12a, 12c, 16a et 16b avaient une variance nulle, tous les participants ayant obtenu la
bonne réponse, leur indice de discrimination était donc nul. Ces items ont été retirés des
analyses subséquentes. Ils ont tout de même été conservés à l’intérieur du QCA-PA
puisque, selon l’expert du domaine, il s’agit de connaissances primordiales que les
patients asthmatiques doivent posséder. Il est donc normal que tous les maîtrisent.
D’autres items, 13 au total, présentaient des indices de discrimination insatisfaisants au
T0 selon les critères fixés. Ils étaient répartis également dans le questionnaire et rien ne
semblait les lier à priori. Pour les mêmes raisons, ils ont été conservés. Une attention
particulière leur a été accordée pour la suite des analyses.

38
Tableau 2 : Résultats de l'analyse d'items au T0 pour chacun des items du QCA-PA

Item M É.T. Ind. Modèle de


discr. Rasch
Infit Outfit
1 Les patients avec asthme ont des bronches (conduits qui transportent l’air aux 0,82 0,39 0,34
poumons) inflammées (rouges et enflées).
2 Les enfants de parents asthmatiques sont plus à risque de développer de l’asthme. 0,86 0,48 0,31
3 Les personnes allergiques font plus souvent de l’asthme que celles qui n’ont pas 0,76 0,43 0,17
d’allergies.
4 Après l’âge de 50 ans, on ne peut pas développer d’asthme. 0,77 0,42 0,34
5 La plupart des personnes asthmatiques peuvent avoir une vie normale. 0,99 0,10 0,14
6 Les vaccins contre l’influenza (la ‘’grippe’’) ne sont pas recommandés pour les 0,81 0,39 0,34
personnes avec de l’asthme.
7 Les personnes asthmatiques ne peuvent pas faire d’exercice physique autant que les 0,91 0,29 0,14
autres.
Les conséquences d’un asthme mal contrôlé peuvent inclure :
8a Diminution de la qualité de vie 0,98 0,14 0,16
8b Augmentation du risque de visites à l’urgence 0,96 0,20 0,53 X
8c Augmentation du risque d’hospitalisation 0,92 0,27 0,30
8d Diminution accélérée de la fonction pulmonaire (capacité à vider l’air des 0,90 0,30 0,37
poumons)
8e Décès 0,65 0,48 0,36
9 La sévérité de l’asthme peut varier avec le temps. 0,91 0,29 0,40
10 Chez les personnes allergiques aux chats, aux pollens, aux acariens, etc., le contact 0,97 0,17 0,17
avec ceux-ci peut causer des symptômes d’asthme.
11 Le tabagisme n’affecte généralement pas l’asthme. 0,97 0,17 0,06
Les facteurs suivants peuvent produire des symptômes d'asthme chez les personnes
asthmatiques :
12a Poussière 1 - -
12b Fumée 0,99 0,10 0,25 X
12c Pollution de l’air 1 - -
12d Air froid 0,99 0,10 -0,08 X
12e Émotions fortes ou stress 0,79 0,41 0,51
12f Changements de température 0,86 0,35 0,14
12g Odeurs fortes 0,58 0,50 0,41
12h Rire 0,48 0,50 0,20
12i Virus (rhume) 0,96 0,20 0,30
12j Ensoleillement 0,70 0,46 0,27
12k Reflux d’acide de l’estomac 0,29 0,46 0,29
13 On peut retrouver, dans certains endroits de travail, des substances qui peuvent causer 0,86 0,35 0,34
le développement de l’asthme.
14 Les médicaments anti-inflammatoires contre l’arthrite ou pour traiter la douleur 0,13 0,34 0,30
peuvent causer une détérioration de l’asthme chez certaines personnes asthmatiques.
On peut confirmer le diagnostic d’asthme par :
15a Questionnaire 0,39 0,49 0,09
15b Examen physique (auscultation des poumons) 0,24 0,43 0,24
15c Test de fonction pulmonaire (souffler fort dans un appareil appelé spiromètre) 0,98 0,14 0,23 X
15d Radiographie des poumons 0,43 0,50 0,33
15e Les tests cutanés d’allergies 0,52 0,50 0,34
L’asthme peut causer :
16a Essoufflement 1 - -
16b Sillements 1 - -
16c Oppression au thorax (sensation de serrement à la poitrine) 0,96 0,20 -0,01 X
16d Crachats (sécrétions bronchiques) 0,89 0,31 0,15
16e Toux 0,92 0,27 0,22
16f Brûlements d’estomac 0,61 0,49 0,32
17 Lorsqu’elles n’ont pas de symptômes d’asthme, les personnes asthmatiques peuvent 0,73 0,45 0,32
arrêter de prendre leur médication de maintien (ex : FloventMD, PulmicortMD,
QVARMD, AlvescoMD, AsmanexMD, AdvairMD, SymbicortMD, ZenhaleMD, SingulairMD).
18 Il existe de petits appareils pour mesurer l’obstruction des bronches par soi-même 0,75 0,43 0,32
(ces appareils sont appelés débitmètres de pointe)
L’asthme d’une personne est bien contrôlé si :
19a elle a besoin de prendre sa médication de secours (Ex : VentolinMD, 0,80 0,40 0,38
BricanylMD, AiromirMD, SymbicortMD) 5 à 7 fois par semaine
19b elle s’éveille la nuit à cause de l’asthme pas plus de 2 fois par mois 0,25 0,43 0,23
19c elle peut faire des activités quotidiennes normales, incluant l’exercice 0,95 0,22 0,13
19d elle a des symptômes d’asthme 5 à 7 jours par semaine 0,86 0,35 0,49

39
19e elle a besoin de prendre sa médication de secours (ex. VentolinMD, BricanylMD, 0,66 0,48 0,35
AiromirMD, SymbicortMD) avant tout exercice physique
19f ses tests respiratoires (ex : débit expiratoire) sont à 70 % de leur meilleure 0,42 0,50 0,36
valeur
20 Le but du traitement de l’asthme est d’obtenir le contrôle de la maladie. 0,99 0,10 0,14 X
21 Les médicaments de secours (ex : VentolinMD, BricanylMD, AiromirMD et 0,62 0,49 0,47
SymbicortMD) sont les meilleurs types de médicaments pour le contrôle de l’asthme à
long terme.
22 Tous les patients asthmatiques nécessitent un plan d’action écrit (un document sur 0,57 0,50 0,23
lequel il est indiqué quoi faire si l’asthme se détériore).
Les médicaments suivants sont des médicaments de maintien, qui doivent donc être
pris régulièrement, à tous les jours :
23a Bronchodilatateurs à courte action (ex : VentolinMD, BricanylMD, AiromirMD) 0,81 0,39 0,37
23b Corticostéroïdes inhalés (ex : FloventMD, PulmicortMD, QVARMD, AlvescoMD, 0,67 0,47 0,45
AsmanexMD)
23c Combinés (AdvairMD, SymbicortMD, ZenhaleMD) 0,62 0,49 0,40
23d Antagonistes du récepteur des leucotriènes (SingulairMD) 0,37 0,48 0,46

Cohérence interne

Les coefficients de cohérence interne pour chacune des quatre catégories proposées par
les assises théoriques et à chacun des temps de mesure du QCA-PA, en plus de ceux du
QCALF, sont présentés au tableau 3. Pour le QCA-PA, les coefficients se situaient entre
0,71 et 0,82 à chacun des temps de mesure lorsque calculés pour l’ensemble du
questionnaire. Les coefficients n’étaient pas satisfaisants lorsque les catégories étaient
considérées séparément, indiquant qu’elles sont plutôt de nature descriptive. Les
coefficients du QCALF étaient également satisfaisants et justifiaient son utilisation
comme mesure étalon.

Tableau 3 : Cohérence interne (KR-20)

T0 T1 T2 T3
Facteurs
Caractéristiques de l’asthme 0,56 0,64 0,41 0,35
Facteurs déclenchants 0,40 0,55 0,34 0,23
Diagnostic et contrôle 0,54 0,61 0,63 0,60
Traitements de l’asthme 0,49 0,56 0,09 0,19
Total QCA-PA 0,78 0,82 0,71 0,71

Total QCALF 0,75 0,86 0,66 0,64

Modèle de Rasch

Le tableau 2 indique les items qui obtiennent des statistiques non satisfaisantes (marqués
d’un « x ») à la suite des analyses selon le modèle de Rasch à T0. Encore une fois, les

40
résultats similaires aux autres temps de mesure ne sont pas présentés par souci de
concision. Parmi les 13 items identifiés comme ayant un indice de discrimination
insatisfaisant, trois ressortaient à nouveau comme étant problématiques selon une des
deux statistiques rapportées. Il s’agit des items 12d, 16c et 20, liés respectivement aux
causes, aux symptômes et au traitement de la maladie. Une fois de plus, l’avis de l’expert
du domaine a fait foi de la décision de conserver ces items à l’intérieur du QCA-PA. Il
s’agit d’éléments incontournables des connaissances sur l’asthme et il est nécessaire que
les professionnels de la santé sachent si les patients les maîtrisent. Il en a été de même
pour les trois items problématiques selon l’outfit, mais adéquats selon l’indice de
discrimination qui ne reflétaient donc pas un problème récurrent d’une analyse à l’autre.

Analyse de la structure factorielle

Le tableau 4 présente les indices d’ajustement des données du QCA-PA pour les modèles
testés à T0. Des valeurs similaires ont été obtenues aux autres temps, mais ne sont pas
présentés, toujours par souci de concision.

Le M1, à quatre facteurs corrélés, présentait un bon ajustement du modèle aux données,
un CFI appréciable de même qu’un NNFI et un RMSEA acceptables. Cependant, c’est ce
modèle qui comportait l’indice CAIC le plus élevé. Le M2, comprenant un facteur de
deuxième ordre, présentait des statistiques d’ajustement légèrement moins élevées, soit
un bon SBχ2/dl, un CFI et un RMSEA acceptables, mais un NNFI sous le seuil
d’acceptabilité fixé. Son CAIC était plus faible que celui de M1. Pour ce qui est du M3,
bien que le CAIC indiquait qu’il s’agit du modèle s’ajustant le mieux aux données, le
CFI, le NNFI et le RMSEA n’étaient pas acceptables. Pour ce modèle, l’analyse du
LMTEST suggérait d’ajouter une corrélation entre les termes d’erreurs des indicateurs 5 et
6. Comme ils correspondaient au même domaine suggéré par la littérature, ce lien a été
ajouté. Le M4, soit le M3 optimisé à la lumière du LMTEST, présentait alors le CAIC le
plus faible, un RMSEA répondant au seuil appréciable ainsi que des valeurs de CFI et de
NNFI respectivement appréciables et adéquates. La figure 2 présente la solution
standardisée de l’analyse factorielle confirmatoire.

41
Tableau 4 : Indices d'ajustement des modèles testés à T0

Indices d’ajustement M1 M2 M3 M4

CAIC -59,896 -67,290 -80,244 -83,123


SBχ2 18,7158 22,5515 32,0582 23,5639
dl 14 16 20 19
SBχ2/dl 1,34 1,41 1,6 1,24
CFI 0,955 0,937 0,885 0,956
NNFI 0,910 0,890 0,838 0,936
RMSEA 0,058 0,064 0,078 0,049

Indicateur 1 0,24

0,49

Indicateur 2
0,31
0,55

Indicateur 3
0,34
0,58

0,41 Indicateur 4
0,17
Connaissances sur
l’asthme 0,61

Indicateur 5
0,38
0,64

Indicateur 6
0,41

0,53

Indicateur 7
0,28

0,55

Indicateur 8
0,31

Figure 2 : Solution standardisée de l'analyse factorielle confirmatoire du modèle


unidimensionnel (M4)

42
Validité concomitante

Le tableau 5 présente les corrélations entre les scores obtenus par les participants aux
deux questionnaires à chacun des temps de mesure. Les coefficients obtenus permettent
de constater que les corrélations étaient plus élevées à chacun des temps de mesure pour
un même questionnaire que d’un questionnaire à l’autre. Tel qu’attendu, les coefficients
de corrélation entre le QCA-PA et le QCALF pour chacun des temps de mesure respectifs
se situaient tous entre 0,479 et 0,665 et étaient significatifs (p = 0,01). Cela apporte une
preuve de la validité concomitante du QCA-PA envers un autre instrument de mesure
respectant certaines preuves de validité concernant le même concept, soit les
connaissances sur l’asthme.

Tableau 5 : Coefficients de corrélation QCA-PA vs QCALF

QCA- QCA- QCA- QCA- QCALF QCALF QCALF QCALF


PA T0 PA T1 PA T2 PA T3 T0 T1 T2 T3
QCA-PA 0,800 0,619 0,610 0,631 0,565 0,500 0,573
T0
QCA-PA 0,683 0,673 0,650 0,665 0,499 0,562
T1
QCA-PA 0,898 0,439 0,441 0,479 0,552
T2
QCA-PA 0,444 0,467 0,492 0,527
T3
QCALF 0,795 0,624 0,619
T0
QCALF 0,723 0,688
T1
QCALF 0,756
T2
QCALF
T3

Reproductibilité et réponse aux changements

Le tableau 5 montrant une corrélation plus élevé entre les scores du QCA-PA à T0 et T1,

soit avant la session d’enseignement, comparativement à T2 ou à T3, une autre preuve de

reproductibilité des résultats est obtenue.

43
Le tableau 6 présente les scores moyens obtenus au QCA-PA et au QCALF à chacun des
temps de mesure. Il montre que l’évolution des scores était comparable pour les deux
questionnaires. La figure 3 montre la comparaison du score moyen au QCA-PA à chacun
des temps de mesures. L’ANOVA à mesures répétées du QCA-PA, par le test de
sphéricité de Mauchly, montre une différence de la variance dans le temps (W(5) = 0,433 p
< 0,05), les analyses intra-sujets (Greenhouse-Geisser) attestant d’une différence
significative du score moyen pour chaque temps de mesure (F(2,009) = 115,311 p < 0,05,
ηp2 = 0,541). Spécifiquement, les analyses de contraste indiquaient une différence
significative de faible amplitude entre T0 et T1 (F(1) = 5,381 p < 0,05, ηp2 = 0,052) et une
différence significative de plus forte amplitude entre T1 et T2 (F(1) = 159,070 p < 0,05,
ηp2 = 0,619), ainsi qu’entre T2 et T3 (F(1) = 139,223 p < 0,05, ηp2 = 0,587). Les scores
moyens très similaires obtenus aux T0 et T1 démontrent la reproductibilité du
questionnaire. L’augmentation modérée significative des scores après la session
d’enseignement avère quant à elle la réponse aux changements du QCA-PA.
L’accroissement des scores entre T2 et T3 est probablement dû à la maturation des
concepts chez les répondants, un effet d’apprentissage se faisant sentir après avoir
répondu plusieurs fois aux mêmes questions. Comme les scores étaient très similaires,
cela démontre surtout la reproductibilité postenseignement.

Tableau 6 : Scores moyens (écart-type) au QCA-PA et au QCALF

Scores T0 T1 T2 T3
QCA-PA 40,6 (5,5) 41,32 (5,8) 45,65 (4,0) 45,79 (3,9)
QCALF 29,1 (4,5) 30,6 (4,4) 32,7 (2,9) 32,9 (2,8)

44
Score (/54)

T0 T1 T2 T3

Temps de mesure

Figure 3 : Scores moyens au QCA-PA à chacun des temps de mesure

Discussion

Le développement et le processus de validation du QCA-PA ont permis d’obtenir


plusieurs preuves de validité telles que proposées par Downing (2003). Tout d’abord, la
validité de contenu a été attestée non seulement par la présence d’un spécialiste du
domaine en tant que directeur de la recherche, mais également par une revue de littérature
et la consultation de questionnaires existants. La vérification de la clarté des items par un
groupe d’experts du domaine de la santé en constitue une preuve supplémentaire. La
validité apparente, quant à elle, a été établie par la vérification des items par un
échantillon de la population cible. L’ajout du choix « ne sais pas » et la décision d’opter
pour un questionnaire autoadministré constituent des éléments de preuve de la validité du
processus de réponse. L’étape du prétest a permis de se pencher sur les premières preuves
de validité liées à la structure interne.

45
D’autres preuves de validité ont été obtenues durant la phase de validation. Concernant la
structure interne, un niveau acceptable de cohérence interne a montré que les items du
QCA-PA étaient liés entre eux. L’indice de discrimination de chaque item et l’analyse
d’items selon le modèle de Rasch ont permis d’identifier des items problématiques.
Cependant, ces résultats ne dénotaient pas un problème persistant d’une analyse à l’autre
et d’un temps de mesure à l’autre. Se basant sur la réalité clinique, l’expert du domaine a
jugé qu’il fallait conserver tous les items puisqu’ils constituent des connaissances
importantes qu’un patient asthmatique doit posséder. Le présent questionnaire servant à
orienter la session d’enseignement sur les éléments à traiter, il revêt un enjeu important
par rapport au répondant puisqu’il est associé au contrôle de sa maladie, mais du point de
vue de la session d’enseignement, cet enjeu pronostique est de plus faible importance.
Ainsi, le fait de conserver des items problématiques n’a que peu d’incidences sur la
session d’enseignement.

Deux types d’analyses ont permis d’obtenir d’autres preuves de validité. Les preuves de
validité de construit sont attestées par les analyses factorielles confirmatoires qui
suggéraient un meilleur ajustement des données du QCA-PA à un modèle possédant un
seul facteur. Cette analyse allait dans le sens suggéré par le coefficient de cohérence
interne, les connaissances sur l’asthme ne pouvant pas être catégorisées, comme le
suggère le rapport GINA (FitzGerald et al., 2014). De plus, les coefficients de corrélation
acceptables entre le QCA-PA et le QCALF constituent une preuve de validité
concomitante du QCA-PA. L’obtention de corrélations modérées entre les deux
questionnaires a permis de démontrer le caractère distinctif du nouveau questionnaire. La
corrélation étant modérée, cela montre que le QCA-PA n’est pas une simple répétition du
QCALF, mais se veut une bonification par rapport à cet outil de mesure déjà existant,
notamment puisqu’il se base sur les recommandations internationales GINA et qu’il a
accumulé davantage de preuves de validité que tout autre questionnaire.

La comparaison de la moyenne des scores à chacun des temps de mesure a démontré la


reproductibilité et la réponse aux changements du QCA-PA. La persistance dans le temps
des connaissances acquises à la suite de l’enseignement (T2-T3) constitue une preuve de

46
la validité de conséquences de l’usage du questionnaire. De fait, les participants à l’étude
présentaient un niveau de connaissances plus élevé et durable sur leur maladie.

Diverses limites de la présente étude sont à mettre en lumière. Tout d’abord le nombre
limité de participants à la phase de validation peut s’expliquer par la période de temps
restreinte pour le recrutement et l’implication que demandait l’étude, soit trois
déplacements dont un d’une durée d’environ deux heures pour suivre la session
d’enseignement. Cependant, il s’avère appréciable d’avoir pu recruter une centaine de
patients sur une période d’environ six mois et de les avoir ainsi aidés à mieux connaître
leur maladie. De plus, la majorité des participants ayant été recrutés parmi les patients
fréquentant un centre de soins tertiaire, les scores moyens élevés dès le premier temps de
mesure, et donc l’amélioration modérée à la suite de l’enseignement, se comprennent
davantage. Une telle étude en soins de première ligne sur des patients récemment
diagnostiqués pourrait accentuer ces différences, sans toutefois changer les conclusions
de l’étude.

Afin d’obtenir d’autres preuves de la validité de conséquences de l’utilisation du QCA-


PA, des mesures supplémentaires auraient dû être collectées. Un temps de mesure un an
après la session d’enseignement aurait permis de vérifier la rétention de l’information par
les répondants. Des preuves de validité supplémentaires auraient également pu être
obtenues (corrélations inter-items, étude de généralisabilité, preuves de validité
convergente/divergente, etc.), mais leur nombre est déjà important et n’auraient que
confirmé davantage les conclusions déjà établies.

Des recherches futures pourraient s’attarder à différencier les connaissances des patients
en fonction des données sociodémographiques recueillies. De plus, une validation du
QCA-PA pour d’autres populations avec des caractéristiques différentes comme les
enfants, les personnes âgées ou les athlètes pourrait être envisagée. Enfin, une validation
transculturelle serait à prévoir pour renforcer le caractère généralisable du QCA-PA.

47
Conclusions

Le but de cette étude était de présenter une méthode rigoureuse de validation d’outils de
mesure des connaissances par l’exemple du Questionnaire de connaissances sur l’asthme
destiné aux patients adultes (QCA-PA). Cette méthode peut être reproduite pour d’autres
instruments de mesure des connaissances dans plusieurs domaines, les étapes demeurant
les mêmes. Les diverses preuves de validité permettent de supporter l’interprétation
proposée des résultats.

L’utilisation du QCA-PA en clinique a pour but d’informer les professionnels de la santé


de l’état des connaissances du patient asthmatique sur sa maladie en vue d’augmenter
l’efficacité de leurs interventions. Ce faisant, l’acquisition de nouvelles connaissances par
le patient pourrait améliorer ses capacités d’autogestion de la maladie. Finalement, le
QCA-PA est généralisable, dans une certaine mesure, puisqu’il a été validé auprès d’une
population hétérogène concernant l’âge, la durée et le degré de sévérité de la maladie, et
qu’il s’appuie sur les plus récentes recommandations internationales.

48
Remerciements

Nous remercions Juliet Foster, Martyn Partridge, Mark FitzGerald et Helen Reddel pour
leurs conseils sur les étapes initiales de développement de ce questionnaire. Nous
remercions également, sous la direction de Patricia Côté, les inhalothérapeutes du Réseau
québécois de l’asthme et de la MPOC (RQAM) Guylaine Gauthier, Livia Battisti et
Valérie Chabot, de même que Lyne Ringuette et Christiane Balizet de l’IUCPQ pour leur
enseignement aux participants, respectivement aux étapes du prétest et de la validation du
QCA-PA.

49
50
Conclusion

Cette section fait état des conclusions pouvant être tirées des résultats obtenus dans le
cadre de l’élaboration et de la validation de l’instrument de mesure développé. Elle
permettra tout d’abord de faire un bilan de l’étude menée pour le développement et la
validation du QCA-PA. Puis, les forces et les limites de l’étude seront présentées avant
d’ouvrir sur des possibilités de recherches futures en lien avec le développement de cet
instrument de mesure.

Bilan

Cette étude avait pour but le développement et l’obtention de preuves de validité d’un
instrument de mesure de nature diagnostique à interprétation critériée des connaissances
des patients asthmatiques sur leur maladie. Boulet et al.(2002) et Soriano et al. (2003)
ayant montré qu’une augmentation des connaissances peut mener à un meilleur contrôle
de la maladie, une bonne évaluation permet une meilleure intervention éducative, ce dont
bénéficient rarement les patients souffrant de maladies chroniques comme l’asthme
(Gibson et al., 2003). De plus, pour répondre à la défaillance d’instruments validés de
façon rigoureuse (Pink et al., 2009), les chercheurs ont ici décidé d’adapter une méthode
développée par DeVellis (2003) et éprouvée par Dussault et al. (2007). À noter que les
avancées sur le plan de la validité ont permis de fusionner les étapes 6 (analyse d’items)
et 7 (preuves de validité) en une seule étape (figure 4). Cette méthode a permis
l’accumulation d’un nombre appréciable de preuves de validité, tel que recommandé par
les spécialistes en mesure et évaluation (Downing, 2003; Laveault et Grégoire, 1997;
Messick, 1994; Waldmann, Gulich et Zeitler, 2008), ce qui lui confère une crédibilité
certaine.

51
1. Détermination de l’objet
de mesure
- Validité de contenu

2. Génération d’items
- Validité de contenu

3. Détermination du
format de mesure
Phase de développement
- Validité du processus de
réponse

4. Vérification de la clarté
des items
- Validité du processus de
réponse (apparente)
- Validité de contenu

5. Prétest
- Validité de la structure
interne
- Validité du processus de
réponse

6. Preuves de validité

Phase de validation - Validité de la structure


interne
- Validité de la relation
avec d’autres variables
- Validité de conséquences

Figure 4 : Adaptation de la méthode de développement et de validation de


questionnaire (Dussault et al., 2007) et preuves de validité associées

Forces et limites de l’étude

La principale force de cette étude est la rigueur du processus de développement et de


validation utilisé. De fait, à notre connaissance, aucun autre instrument de mesure des
connaissances sur l’asthme n’avait accumulé autant de preuves de validité (Pink et al.,
2009) comme l’a permis l’adaptation de la méthode proposée par Dussault et al. (2007).

52
De plus, s’appuyant sur les recommandations de l’organisme GINA (FitzGerald et al.,
2014), le QCA-PA s’avère applicable à grande échelle, les items concernant l’ensemble
des adultes asthmatiques.

La présence, d’un pneumologue émérite à la tête de cette étude a également permis un


aller-retour constant entre chacune des étapes de développement et de validation et la
réalité clinique, grâce à ses recommandations qui ont guidé les choix de modification et
de suppression des items problématiques. Même si des items paraissaient inadéquats
selon certaines analyses, l’expérience et la connaissance approfondie du domaine étudié
par ce chercheur ont mené à conserver ces items à l’intérieur du QCA-PA pour en faire
un instrument de mesure apprécié et utilisé par les professionnels de la santé. À cet égard,
un autre avantage à l’utilisation du QCA-PA s’est révélé au cours de l’étude. De l’avis
des infirmières ayant réalisé les sessions d’éducation personnalisées, la complétion du
questionnaire avant la rencontre amenait le patient à se questionner lui-même sur des
aspects de sa maladie qu’il négligeait auparavant. Ainsi, la session d’éducation prenait
davantage la forme d’une discussion entre le patient posant des questions et l’infirmière y
répondant. Il est d’ailleurs reconnu qu’un enseignement dans lequel l’apprenant a un rôle
participatif favorise davantage l’apprentissage qu’un exposé magistral (Tardif, 1999).

Une des limites de cette étude est que malgré l’accumulation de plusieurs preuves de
validité, certaines n’ont pas pu être vérifiées, principalement à cause du contexte de la
recherche. Ainsi, le nombre restreint de participants (n=101) à la phase de validation
aurait pu affecter l’analyse de la structure factorielle. L’exigence de se déplacer à trois
reprises et le temps alloué pour effectuer le recrutement ayant limité les possibilités de
recrutement. Une étude de généralisabilité aurait pu être réalisée afin de confirmer la
valeur universelle attribuée au QCA-PA puisqu’il se base sur des lignes directrices
internationales et que la reproductibilité de la mesure aux deux premiers temps de mesure
va en ce sens.

L’accumulation de preuves de validité de conséquences a été abordée rapidement. Bien


que l’ANOVA à mesures répétées indique une persistance des nouvelles connaissances
dans le temps après une dizaine de jours, il faudrait procéder à une nouvelle prise de

53
mesure à plus long terme afin d’évaluer l’impact de la complétion du questionnaire et de
la session d’enseignement sur les participants.

Perspectives de recherches futures

L’évaluation des connaissances des patients à long terme suivant la session d’éducation
sur l’asthme constitue une perspective future de recherche. En outre, il s’avérerait
intéressant d’évaluer le nouveau niveau de contrôle de l’asthme acquis chez les patients
ayant participé à l’étude de validation du QCA-PA, des données sur le contrôle initial de
l’asthme ayant été recueillies au T0. Ce type d’étude permettrait en effet d’éprouver la
théorie selon laquelle une augmentation des connaissances du patient conduirait à un
meilleur autocontrôle. De plus, un point de coupure du questionnaire pourrait être
déterminé, montrant quel score au questionnaire est associé à un bon contrôle de la
maladie.

L’analyse du niveau de connaissances sur l’asthme des patients en fonction de diverses


caractéristiques comme l’âge, le niveau d’éducation de même que la durée et la sévérité
de la maladie pourrait servir à développer des sessions d’éducation de groupe en lien avec
les caractéristiques propres des patients. Des analyses de différenciation seraient donc
pertinentes et constitueraient une preuve de validité supplémentaire. À cet effet, Downing
(2003) propose d’autres preuves de validité qui n’ont pas été recueillies dans la présente
étude telles que les corrélations inter-items, les courbes caractéristiques des items ou du
test, l’analyse de la validité convergente/divergente.

La validation du QCA-PA dans d’autres langues, notamment l’anglais, permettrait de


confirmer l’aspect généralisable de la version originale. Les bases théoriques ayant
permis le développement de cet instrument de mesure se voulant applicables à un niveau
international, il serait intéressant de les tester auprès de différentes populations.

54
Annexe 1

Questionnaire de Connaissances sur l’Asthme


destiné aux Patients Adultes (QCA-PA©)
Complété par le patient

Réservé au coordonnateur de l’étude


Initiales:__________________________________ Numéro du participant : ________________________
Date _______ / ________ / ________ Visite : Visite 1  Visite 2 Visite 3 
AAAA MM JJ Pré 
Post 

Ce questionnaire vous demande ce que vous connaissez sur l’asthme.


SVP, répondez par vous-même à chacune des questions ci-dessous en cochant « Vrai »
ou « Faux ». Si vous ne connaissez pas la réponse, cochez « Ne sais pas » et passez
directement à la question suivante.
En moyenne, 10 minutes sont nécessaires pour compléter le questionnaire.
A) À PROPOS DE L’ASTHME Vrai Faux Ne sais pas
1. Les patients avec asthme ont des bronches (conduits qui transportent l’air   
aux poumons) inflammées (rouges et enflées).
2. Les enfants de parents asthmatiques sont plus à risque de développer de   
l’asthme.
3. Les personnes allergiques font plus souvent de l’asthme que celles qui   
n’ont pas d’allergies.

4. Après l’âge de 50 ans, on ne peut pas développer d’asthme.   


5. La plupart des personnes asthmatiques peuvent avoir une vie normale.   
6. Les vaccins contre l’influenza (la ‘’grippe’’) ne sont pas recommandés pour   
les personnes avec de l’asthme.

7. Les personnes asthmatiques ne peuvent pas faire d’exercice physique   


autant que les autres.

8. Les conséquences d’un asthme mal contrôlé peuvent inclure :


a) Diminution de la qualité de vie   
b) Augmentation du risque de visites à l’urgence   
c) Augmentation du risque d’hospitalisation   
d) Diminution accélérée de la fonction pulmonaire (capacité à vider l’air   
des poumons)
e) Décès   
9. La sévérité de l’asthme peut varier avec le temps.   

55
Vrai Faux Ne sais pas
B) FACTEURS DÉCLENCHANTS
(ce qui peut causer des symptômes d’asthme)
10.Chez les personnes allergiques aux chats, aux pollens, aux acariens, etc., le   
contact avec ceux-ci peut causer des symptômes d’asthme.

11.Le tabagisme n’affecte généralement pas l’asthme.   


12.Les facteurs suivants peuvent produire des symptômes d'asthme chez les
personnes asthmatiques :
a) Poussière   
b) Fumée   
c) Pollution de l’air   
d) Air froid   
e) Émotions fortes ou stress   
f) Changements de température   
g) Odeurs fortes   
h) Rire   
i) Virus (rhume)   
j) Ensoleillement   
k) Reflux d’acide de l’estomac   
13.On peut retrouver, dans certains endroits de travail, des substances qui   
peuvent causer le développement de l’asthme.

14.Les médicaments anti-inflammatoires contre l’arthrite ou pour traiter la   


douleur peuvent causer une détérioration de l’asthme chez certaines
personnes asthmatiques.

C) TESTS POUR L’ASTHME


15. On peut confirmer le diagnostic d’asthme par :
a) Questionnaire   
b) Examen physique (auscultation des poumons)   
c) Test de fonction pulmonaire (souffler fort dans un appareil appelé   
spiromètre)
d) Radiographie des poumons   
e) Les tests cutanés d’allergies   
16. L’asthme peut causer :
a) Essoufflement   

56
Vrai Faux Ne sais pas
b) Sillements   
c) Oppression au thorax (sensation de serrement à la poitrine)   
d) Crachats (sécrétions bronchiques)   
e) Toux   
f) Brûlements d’estomac   
17. Lorsqu’elles n’ont pas de symptômes d’asthme, les personnes   
asthmatiques peuvent arrêter de prendre leur médication de maintien
(ex : FloventMD, PulmicortMD, QVARMD, AlvescoMD, AsmanexMD, AdvairMD,
SymbicortMD, ZenhaleMD, SingulairMD).
18.Il existe de petits appareils pour mesurer l’obstruction des bronches par   
soi-même (ces appareils sont appelés débitmètres de pointe).

19. L’asthme d’une personne est bien contrôlé si :


a) elle a besoin de prendre sa médication de secours (Ex : VentolinMD,   
BricanylMD, AiromirMD, SymbicortMD) 5 à 7 fois par semaine

b) elle s’éveille la nuit à cause de l’asthme pas plus de 2 fois par mois   
c) elle peut faire des activités quotidiennes normales, incluant l’exercice   
d) elle a des symptômes d’asthme 5 à 7 jours par semaine   
e) elle a besoin de prendre sa médication de secours (ex. VentolinMD,   
BricanylMD, AiromirMD, SymbicortMD) avant tout exercice physique

f) ses tests respiratoires (ex : débit expiratoire) sont à 70% de leur   


meilleure valeur

D) TRAITEMENT DE L’ASTHME
20. Le but du traitement de l’asthme est d’obtenir le contrôle de la maladie.   
MD MD
21. Les médicaments de secours (ex : Ventolin , Bricanyl , Airomir et MD
  
SymbicortMD) sont les meilleurs types de médicaments pour le contrôle
de l’asthme à long terme.
22. Tous les patients asthmatiques nécessitent un plan d’action écrit (un   
document sur lequel il est indiqué quoi faire si l’asthme se détériore).

23. Les médicaments suivants sont des médicaments de maintien, qui


doivent donc être pris régulièrement, à tous les jours :

a) Bronchodilatateurs à courte action (ex : VentolinMD, BricanylMD,   


AiromirMD)

b) Corticostéroïdes inhalés (ex : FloventMD, PulmicortMD, QVARMD,   


AlvescoMD, AsmanexMD)

57
Vrai Faux Ne sais pas
c) Combinés (AdvairMD, SymbicortMD, ZenhaleMD)   
d) Antagonistes du récepteur des leucotriènes (SingulairMD)   
MERCI D’AVOIR COMPLÉTÉ CE QUESTIONNAIRE
©Tout droit réservé. Ce questionnaire ne peut être reproduit sans la permission de
l’auteur.
Contact : lpboulet@med.ulaval.ca

58
Annexe 2

Glossaire annexé à l’article scientifique

-A- présente ou non. La méthode de


Greenhouse-Geisser est utilisée lorsque
Analyses de contrastes
le postulat de l’homogénéité des
Analyses statistiques utilisées dans le variances n’est pas respecté (voir test de
cadre de l’analyse de variance sphéricité de Mauchly).
(ANOVA) à mesures répétées. Dans le
-C-
cas présent, elles indiquent l’amplitude
de la différence significative (contraste) Cohérence interne
entre deux temps de mesure.
Degré d’interrelation entre les items d’un
Analyses factorielles confirmatoires test. La cohérence interne donne une
indication de la fidélité d’une épreuve.
Analyses statistiques visant à mesurer
L’alpha de Chronbach (α) est
l’adéquation d’un modèle théorique
généralement utilisé pour mesurer la
constitué de variables latentes à des
cohérence interne, sauf dans le cas de
données empiriques. Les analyses
données dichotomiques où la formule 20
factorielles confirmatoires s’effectuent à
de Kuder-Richardson (KR-20) lui est
l’aide de logiciels basés sur la
préférée.
modélisation par équations structurelles
tels EQS, LISREL, MPLUS ou autres. -I-

Analyses intra-sujets (Test de Indice d’ajustement comparatif


Greenhouse-Geisser) (Comparative Fit Index, CFI)

Analyses statistiques utilisées dans le Statistique d’ajustement utilisée en


cadre d’ANOVA à mesures répétées. équations structurelles. Elle permet
Elles ont pour but d’identifier les paires d’éviter les erreurs dues à la sous-
de variables indépendantes où une estimation de l’ajustement souvent notée
différence significative (contraste) est dans des petits échantillons. Plus l’indice

59
est élevé, meilleur est l’ajustement du Statistique utilisée dans le cadre
modèle. d’analyse par équations structurelles.
Elle estime l’adéquation d’un modèle
Indice d’ajustement non normé (Non
théorique à des données empiriques dans
Normed Fit Indexe, NNFI)
le cas de données qui ne respectent pas
Statistique d’ajustement utilisée en la loi normale.
équations structurelles. Elle prend en
-M-
compte l’ampleur des corrélations et le
nombre de paramètres estimés. Plus Maximum de vraisemblance
l’indice est élevé, meilleur est (Maximum Likelihood, ML)
l’ajustement du modèle.
Méthode statistique utilisée pour estimer
Indice de discrimination les paramètres dans un modèle, entre
autres en équations structurelles. Elle
Représenté par la corrélation item-total.
maximise la probabilité que la matrice
Indice statistique défini comme la
de corrélations reflète la distribution
différence entre la proportion de
réelle dans la population.
réussites à l'item parmi les individus
dont les résultats sont les plus élevés sur Modèle de Rasch
l'ensemble de l'épreuve et la proportion
Issu de la Théorie de Réponse aux Items
de réussites chez les individus dont les
(TRI), le modèle de Rasch est une
résultats globaux sont les plus faibles.
méthode d’analyse de données
Plus l’indice de discrimination est élevé
statistiques servant à mesurer les
pour un item, plus sa réussite est
capacités, les attitudes ou les traits de
représentative d’un score total plus élevé
personnalité des répondants à un
à l’épreuve ou, à l’inverse, plus son
questionnaire. Il est le modèle le plus
faible résultat est représentatif d’un score
simple et le plus utilisé de la TRI,
total plus faible à l’épreuve.
stipulant qu’un seul trait latent est
-K- responsable de la variance des items et
que tous les items possèdent le même
Khi carré de Satorra-Bentler (SBχ2)
niveau de discrimination.

60
Son analyse peut se faire à l’aide de l’indice est faible, meilleur est
logiciels tels WINSTEPS ou RUM2020. l’ajustement du modèle.
WINSTEPS présente deux statistiques
-T-
d’ajustement pour les items : infit et
outfit . L’infit présente l’information Test de sphéricité de Mauchly
pondérée de la moyenne des carrés des
Test statistique utilisé dans le cas
résidus standardisés entre les réponses
d’ANOVA à mesures répétées. Il a pour
observées et attendues en fonction de la
but de vérifier le postulat selon lequel la
variance de l’item et de la variance
variance des différences entre chaque
totale. L’outfit, utilisée comme référence
paire de variable indépendante est égale
additionnelle, fournit la moyenne des
(postulat d’homogénéité des variances).
carrés des résidus standardisés, élevant
les résidus au carré avant d’en faire la Test multiplicatif de Lagrange
moyenne pour éviter que les résidus (LMTEST)
négatifs ne compensent pour les résidus
Test statistique permettant, dans le cadre
positifs. Les valeurs considérées comme
d’analyses par équations structurelles, de
satisfaisantes pour chacune des
proposer l’ajout de paramètres au
statistiques devraient se situer entre 0,5
modèle théorique testé.
et 1,5.
-V-
-R-
Version modifiée de l’Akaike
Racine du carré moyen de l’erreur
Information criterion (Consistent
d’estimation (Root Mean Square Error
version of the Akaike Information
of Estimation, RMSEA)
Criterion, CAIC)
Statistique d’ajustement utilisée en
Statistique d’ajustement utilisée en
équations structurelles. Elle permet
équations structurelles. Elle permet de
d’éviter les erreurs dues à la taille de
comparer différents modèles théoriques
l’échantillon en comparant la différence
entre eux. Le modèle présentant l’indice
entre le modèle théorique et la matrice
CAIC le plus faible devrait être celui qui
de covariance de la population. Plus
s’ajuste le mieux aux données.

61
62
Bibliographie

American Educational Research Association (AERA), American Psychological Association (APA) et


National Council on Measurement in Education (NCME). (2014). Standards for
Educational and Psychological Testing. Washington, DC : auteur.
Anastasi, A. (1968). Psychological Testing (3e éd.). New York, NY : Macmillan.
Anderson, J. C. et Gerbing, G. W. (1988). Structural Equation Modeling in Practice: A Review and
Recommended Two-Step Approach. Psychological Bulletin, 103(3), 411-423.
Bain, D., Pini, G., Scallon, G. et Bertrand, R. (1996). Pour évaluer vos évaluations. La
généralisabilité : Mode d'emploi. Genève, Suisse : Centre de recherches
psychopédagogiques.
Bateman, E. D., Bousquet, J. et Braunstein, G. L. (2001). Is Overall Asthma Control Being
Achieved? A Hypothesis-Generating Study. European Respiratory Journal, 17(4), 589-
595.
Ben-nun Bloom, P. (2008). Respondent Fatigue. Dans P. J. Lavrakas (dir.), Encyclopedia of survey
research methods (p. 743-744). Thousand Oaks, CA: SAGE.
Bentler, P. M. (1995). EQS Structural Equations Program Manual. Encino, CA : Multivariate
Software inc.
Bentler, P. M. et Dijkstra, T. (1985). Efficient Estimation via Linearization in Structural Models.
Dansn P. R. Krishnaiah (dir.), Multivariate Analysis VI (p. 9-42), Amsterdam, Pays-Bas :
Elsevier.
Bertrand, R. et Blais, J. G. (2004). Modèles de mesure : l'apport de la théorie des réponses aux
items. Sainte-Foy, Canada : Presses de l'Université du Québec.
Bock, R. D., Gibbons, R., Schilling, S. G., Muraki, E., Wilson, D. T. et Wood, R. (2003). Testfact 4.0
[logiciel informatique]. Lincolwood, IL : Scientific Software International.
Bond, Trevor G., et Fox, Christine M. (2007). Applying the Rasch Model : Fundamental
Measurement in the Human Sciences (2e éd.). Mahwah, NJ : Lawrence Erlbaum
Associates.
Boulet, L. P., Becker, A., Bowie, D., Hernandez, P., McIvor, A., Rouleau, M., . . . Borduas, F.
(2006). Implementing Practice Guidelines: A Workshop on Guidelines Dissemination and
Implementation with a Focus on Asthma and COPD. Canadian Respiratory Journal, 13
Suppl A, 5-47.
Boulet, L. P., Boulet, V. et Milot, J. (2002). How Sould we Quantify Asthma? A Proposal. Chest,
122(6), 2217-2223.
Boulet, L. P., Phillips, R., O'Byrne, P. et Becker, A. (2002). Evaluation of Asthma Control by
Physicians and Patients: Comparison with Current Guidelines. Canadian Respiratory
Journal, 9(6), 417-423.
Bozdogan, H. (1987). Model Selection and Akaike Information Criterion : The General Theory
and its Analytical Extensions. Psychometrika, 3, 345-370.
Brancato, G., Macchia, S., Murgia, M., Signore, M., Simeoni, G., Blanke, K., . . . Hoffmeyer-
Zlotnik, J. H. P. (2006). Handbook of Reccommended Practices for Questionnaires
Development and Testing in the European Statistical System. Récupéré [le 15 mars 2015]
de http://ec.europa.eu/eurostat/documents/64157/4374310/13-Handbook-
recommended-practices-questionnaire-development-and-testing-methods-
2005.pdf/52bd85c2-2dc5-44ad-8f5d-0c6ccb2c55a0

63
Browne, M. W. et Cudeck, R. (1993). Alternative Ways of Assessing Model Fit. Dans K. A. Bollen
et J. S. Long (dir.), Testing Structural Equation Models (p. 136-162). Beverly Hills, CA:
Sage.
Cowie, R. L., Cicutto, L. et Boulet, L. P. (2001). Asthma Education and Management Programs in
Canada. Canadian Respiratory Journal, 8, 416-420.
Crocker, L. M. et Algina, J. (1986). Introduction to Classical and Modern Test Theory. New York,
NY : Holt, Rinehart, and Winston.
DeVellis, R. F. (2003). Scale Development : Theory and Applications (2e éd.). Thousand Oaks, CA :
SAGE.
Downing, S. M. (2003). Validity: On Meaningful Interpretation of Assessment Data. Medical
Education, 37(9), 830-837.
Dussault, M., Valois, P. et Frenette, E. (2007). Validation de l'échelle de Leadership Transformatif
du directeur d'école. Psychologie du travail et des organisations, 13(2), 37-52.
FitzGerald, J. M., Reddel, H. et Boulet, L. P. (2014). Pocket Guide for Asthma Management and
Prevention (for Adults and Children Older than 5 Years). Récupéré [le 15 mars 2015] de
http://www.ginasthma.org/local/uploads/files/GINA_Pocket_2014_Jun11.pdf
Foster, G., Taylor, S. J. et Elridge, S. E. (2007). Self-Management Education Programmes by Lay
Leaders for People with Chronic Conditions. Cochrane Database of Systematic Reviews,
4(CD005108).
Furr, R. M. (2011). Scale Construction and Psychometrics for Social and Personality Psychology.
Los Angeles, CA ; London, UK : SAGE.
Gibson, P. G., Ram, F. S. et Powell, H. (2003). Asthma Education. Respiratory Medicine, 97(9),
1036-1044.
Jöreskog, K. G. et Sörbom, D. (1996-2001). LISREL 8 [logiciel informatique]. Lincolnwood, IL :
Scientific Software International.
Juniper, E. F., Svensson, K., Mork, A. C. et Stahl, E. (2005). Measurement Properties and
Interpretation of Three Shortened Versions of the Asthma Control Questionnaire.
Respiratory Medicine, 99(5), 553-558.
Kline, P. (2000). The Handbook of Psychological Testing (2e éd.). London, UK ; New York, NY :
Routledge.
Lakhal, S. et Frenette, E. (sous presse). La rédaction des questions pour évaluer les
apprentissages. Dans J. Leroux (dir.), Évaluer les compétences au collégial et à
l'université : Guide pratique à l'intention des enseignants. Sherbrooke, Canada :
Performa.
Laurier, M., Tousignant, R. et Morissette, D. (2005). Les principes de la mesure et de l'évaluation
des apprentissages (3e éd.). Montréal, Canada : Gaëtan Morin.
Laveault, D. et Grégoire, J. (1997). Introduction aux théories des tests en sciences humaines.
Paris, France ; Bruxelles, Belgique : De Boeck Université.
Linacre, J. M. (2002). What do Infit and Outfit, Mean-Squared and Standardized Mean? Rasch
Measurement Transaction, 16, 878.
Linacre, J. M. et Wright, B. D. (1999). Winsteps Rasch-Model Computer Program (version 2.88)
[logiciel informatique]. Chicago, IL : MESA Press.
Marquis, P. (2003). Développement et validation d'un questionnaire : état de l'art et niveau
d'évidence requis. Dans O. Chassany et C. Caulin (dir.), Qualité de vie liée à l'état de
santé (p. 37-45). Paris, France : Springer-Verlag.
Marsch, H. W., Ellis, L., Parada, L., Richards, G. et Heubeck, B. G. (2005). A Short Version of the
Self-Description Questionnaire ii : Operationalising Criteria for Sort Form Evaluation with

64
New Applications of Confirmatory Factor Analysis. Psychological Assessment, 17, 81-
102.
Marsch, H. W., Hau, K. T., Balla, J. et Grayson, D. (1998). Is More Ever Too Much: The Number of
Indicators per Factor in Confirmatory Factor Analysis. Multivariate Behavioral Research,
33, 181-220.
Masoli, M., Fabian, D., Holt, S., Beasley, R. et Global Initiative for Asthma Program. (2004). The
Global Burden of Asthma: Executive Summary of the GINA Dissemination Committee
Report. Allergy, 59(5), 469-478.
Messick, S. (1990). Validity of Test Interpretation ans Use. Dans M. C. Alcin (dir.), Encyclopedia of
Educational Research (6e éd.). New York, NY : Macmillan.
Messick, S. (1994). Validity of Psychological Assessment: Validation of Inferences from Persons'
Responses and Performances as Scientific Inquiry into Score Meaning. American
Psychologist, 50(9), 741-749.
Muthén, L. K., et Muthén, B. O. (1998-2010). Mplus Statistical Software [logiciel informatique].
Los Angeles, CA: auteur.
Nguyen, L., Raherison, C., Bozonnat, M. C., Lheureux, M., Nocent, C., Tunon-de-Lara, J. M. et
Taytard, A. (2003). Validation of an Asthma Knowledge Questionnaire. Revue des
Maladies Respiratoires, 20(6 Pt 1), 871-880.
Nunnally, J. C., et Bernstein, I. H. (1994). Psychometric Theory (3e éd.). New York, NY : McGraw-
Hill inc.
Osterlind, S. J. (2010). Modern Measurement. Theory, Principles and Applications of Mental
Appraisal (2e éd.). London, UK : Pearson.
Pink, J., Pink, K. et Elwyn, G. (2009). Measuring Patient Knowledge of Asthma: A Systematic
Review of Outcome Measures. Journal of Asthma, 46(10), 980-987.
Rattray, J., Jones, M. C. (2005). Essential, Elements of Questionnaire Design and Development.
Journal of Clinical Nursing, 16, 234-243.
Schumacker, R. E. et Lomax, R. G. (1996). A Beginner's Guide tu Structural Equation Modeling.
Mahwah, NJ : Lawrence Erlbaum Associates.
Shum, D., O'Gorman, J. et Myors, B. (2006). Psychological Testing and Assessment. South
Melbourne, Australia ; New York, NY: Oxford University Press.
Soriano, J. B., Rabe, K. F. et Vermeire, P. A. (2003). Predictors of Poor Asthma Control in
European Adults. Journal of Asthma, 40(7), 803-813.
Steiger, J. H. (1990). Structural Model Evaluation and Modification : An Interval Estimation
Approach. Multivariate Behavioral Research, 25, 173-180.
Stevens, S. S. (1951). Handbook of Experimental Psychology. New York, NY : Wiley.
Streiner, D. L., et Norman, G. R. (1995). Health Measurement Scales: A Practical Guide to their
Development and Use (2e éd.). Oxford, UK ; New York, NY : Oxford University Press.
Tabachnick, Barbara G., et Fidell, Linda S. (2007). Using multivariate statistics (5th ed.). Boston ;
Toronto: Pearson/Allyn et Bacon.
Tardif, J. (1999). Le transfert des apprentissages. Montréal, Canada : Éditions Logiques.
Thurstone, T. G., et Byrne, K. M. (1951). Mental abilities of children. Chicago, IL : Science
Research Associates.
Tousignant, R. et Morissette, D. (1989). Les Principes de la mesure et de l'évaluation des
apprentissages (2e éd. rev. et augm.). Boucherville, Canada : Gaëtan Morin.
Tucker, L. R. et Lewis, C. M. (1973). A Reliability Coefficient for Maximum Likelihood Factor
Analysis. Psychometrika, 38, 1-10.
Urbina, Susana. (2004). Essentials of Psychological Testing. Hoboken, NJ: John Wiley & Sons.

65
Waldman, U. M., Gulich, M. S., et Zeitler, H. P. (2008). Virtual Patients fos Assessing Medical
Students: Important Aspects when Considering the Introduction of a New Assessment
Format. Medical Teacher, 30(1), 17-24.
Wright, B. D. et Master, G. N. (1982). Rating Scale Analysis: Rasch Measurement. Chicago, IL :
MESA Press.

66

Vous aimerez peut-être aussi