Académique Documents
Professionnel Documents
Culture Documents
Rsa 2000 48 4 29 0
Rsa 2000 48 4 29 0
J.-M. T RICOT
M. M ESBAH
Un modèle de réponses aux items. Propriétés et
comparaison de groupes de traitement en épidémiologie
Revue de statistique appliquée, tome 48, no 4 (2000), p. 29-39
<http://www.numdam.org/item?id=RSA_2000__48_4_29_0>
RÉSUMÉ
La Théorie des Réponses aux Items (IRT) est étudiée dans le cadre des items à réponses
dichotomiques. Le modèle de Rasch possède de bonnes propriétés parmi les modèles IRT
unidimensionnels. On s’intéresse particulièrement au cas où on a un modèle à effet aléatoire. On
présente la combinaison du modèle de Rasch et d’un modèle linéaire sur la variable latente (effet
aléatoire) avec application au cas où les variables prédictrices sont des variables d’affectation.
Dans ce contexte, une exemple réel porte sur la comparaison de groupes de traitements en
diabétologie. Le test de la comparaison des groupes est effectué à l’aide de la statistique LR.
Mots-clés : Modèles IRT, Modèles de Rasch, Trait latent, Exhaustivité, Score, Variables
prédictrices, Statistique LR
ABSTRACT
The Item Response Theory (IRT) is analysed Within the framework of dichotomous
responses items. Rasch model have some good properties that make them outstanding univariate
IRT model. The random effect model is of our interest. We insert a linear model applied to
the latent variable (random effect) inside the Rasch model with binary preditors to classes’
assignment. Within this framework, we analyse two treatments groups comparison as an
example in a diabetes study. The group’s comparison test is a LR test.
Keywords : IRT models, Rasch model, Latent trait, Sufficiency, Score, Predictors, LR Statistics
1. Introduction
On est souvent amené à analyser des enquêtes où les données ont été obte-
nues par autoquestionnaire. Les autoquestionnaires sont couramment utilisés dans la
recherche médicale pour mesurer des variables telles que la douleur, l’émotion etc...
30 J. -M. TRICOT, M. MESBAH
2. Notations et Modèles
On distingue deux parties dans le modèle. D’une part, une partie instrumentale
qui concerne les items et qui est caractérisée par un ensemble de paramètres d’item : le
paramètre de l’item i, est noté 03B2i i, i 1, k. Il est interprété comme étant la difficulté
=
suppose que 03B2i E R. D’autre part, une partie structurelle qui concerne le trait latent
(ou variable latente) noté o. Il est interprété comme étant l’aptitude du sujet à réussir
l’item i, i =
1, k, c’est-à-dire à répondre xi = 1. Si l’on spécifie le sujet à l’aide de
l’indice s, s =
1, n, on passe de manière évidente de la notation 0 à 03B8s (aptitude du
sujet s) et de Xi et xi respectivement à Xsi et xsi. Suivant le point de vue adopté, on
supposera que 0 E R est un paramètre fixe ou un paramètre aléatoire (une variable
aléatoire réelle).
UN MODÈLE DE RÉPONSES AUX ITEMS. 31
Classiquement, la modélisation d’un effet item (effet fixe donné par /3i) et d’un
effet sujet (effet fixe ou aléatoire donné par 03B8s) sur la réalisation xs2 est obtenu
linéairement à l’aide d’un plan à deux facteurs sans répétition (ou à un facteur «avec
blocs». Voir Tomassone et al., 1993), donné par :
linéaire P(Xsi = 1|03B8s,03B2i) = Os + {3i n’est pas satisfaisant puisque des valeurs
supérieures à 1 ou négatives pourraient être prises par le membre de droite, à moins
d’imposer à celui-ci une contrainte.
Le modèle logistique de Rasch retenu récemment par de nombreux auteurs, ,
intègre une telle contrainte : il est construit à partir de la transformation logit appliquée
à la probabilité P(Xsi 1|03B8s, {3i) :
=
où le signe négatif devant 03B2i permet d’opposer l’aptitude du sujet (Os) à la difficulté
de l’item (03B2i). D’autre liens ont aussi été utilisés en pratique. Entre autre on peut citer
le lien probit (par exemple, cf. McCullagh & Nelder, 1989).
La fonction IRF («Item Response Function») de l’item i, est la fonction qui,
pour modèle logistique, à 03B8 associe P(Xi == 110, 03B2i), i
ce 1, k. Les k courbes
=
où X si prend la valeur 0 ou 1.
3. Définitions et propriétés
l’exhaustivité des statistiques Rs X,i pour 6S (score pour 03B8s), et Ti = 03A3 Xsi
i s
pour /3i (score pour /3i). On prend naturellement la notation R pour désigner le score
pour O. Fischer (1995) montre que, sous de bonnes conditions de régularité, il est
équivalent, pour un modèle IRT unidimensionnel, de supposer que c’est un modèle
de Rasch ou de supposer les trois hypothèses suivantes : la monotonicité croissante
des courbes des fonctions IRT, l’indépendance locale des items et l’exhaustivité du
score R pour O.
Pour un tel modèle logistique, il existe un «comparateur» entre deux sujets s
ets’, indépendant du modèle de mesure (indépendant des /3), noté C(s, s’), défini,
quelque soit i, par :
xsi, i =
1, k. On note aussi /3 = (03B21, ..., 03B2k). L’exhaustivité du score Rs (cas où 03B8s
est considéré comme un paramètre fixe) permet d’effectuer la factorisation suivante,
pour une réalisation rs de Rs :
somme est réalisée sur 2’ valeurs possibles de xs, pour s fixé. Du fait que, de manière
évidente, on a P( Rs == r si lx. , 03B8s, 03B2) 1 si Xs est tel que rs =
-
03A3
xsi (condition
i
UN MODÈLE DE RÉPONSES AUX ITEMS. 33
On se place maintenant dans le cas d’un modèle mixte où 03B8 est aléatoire, de loi
F (. 1 A) paramétrée par A (A sera, par exemple le paramètre (M,a2) d’une loi normale).
Plusieurs auteurs et en particulier Zwinderman (1991) donnent les étapes
d’estimation suivantes :
Première étape : estimation du paramètre {3 par la méthode CML, c’est-à-dire
en maximisant la log-vraisemblance de 3, notée Le, calculée à partir de (8) :
possible
un intervalle de confiance autour de 03B8s puisque l’on peut calculer la variance
conditionnelle a posteriori de 0 connaissant le score individuel du sujet s.
Il s’agit d’un modèle de Rasch à effet mixte (Hoijtink, 1995) qui combine un
modèle de mesure à effet fixe (les (3 sont les paramètres du questionnaire qui sert
d’instrument de mesure) et un modèle structurel à effet aléatoire linéaire (0 est la
variable qui décrit la structure de la population de sujet).
UN MODÈLE DE RÉPONSES AUX ITEMS. 35
que 6’s possède une distribution N(0, aî) et de même Os 03BC2 + 03B5s lorsque s == 03BC1+1,
=
paramètre de difficulté pour l’item i est 03B2ii (resp. 03B22i) dans le premier groupe (resp. le
deuxième groupe) et que le paramètre de difficulté pour cet item tout groupe confondu
(donc, pour les nl + n2 sujets), est 03B20i (plutôt que,Q2). L’équation (13) redéfinie lorsque
P = 1 et 03B30 0 dans le modèle (12), est équivalente, pour le groupe 1, à :
=
et pour le groupe 2, à
TABLEAU 1
Estimation de la difficulté des items dans le groupe 1
et score des items (0, réponse oui, 1, réponse non).
UN MODÈLE DE RÉPONSES AUX ITEMS. 37
TABLEAU 2
Estimation de la difficulté des items dans le groupe 2
et score des items (0, réponse oui, 1, réponse non).
On pose :
pour h =
0,1, 2.
Les trois vraisemblances calculées pour l’ensemble des sujets et pour chacun
des deux groupes sont notées respectivement Lo, LI (pour le groupe 1) et L2 (pour
le groupe 2). Les équations (10), (14), (15) et (16) permettent alors d’écrire :
.015. Au seuil de 5% on admettra une différence entre les deux groupes. On a aussi
les valeurs moyennes suivantes : Ml = -3.013(2.17) dans le groupe 1 est inférieure à
M2 = -2.460(1.99) dans le groupe 2. Puisque le groupe 1 correspond à un niveau de
contrôle glycémique plus élevé que dans le groupe 2, cela signifie qu’une moyenne
faible traduit un niveau de contrôle glycémique élevé : l’échelle de mesure du trait
latent indique donc en moyenne des réactions émotionnelles moins fortes dans le
deuxième groupe. On remarque enfin un bon ajustement du modèle au sens où les
items les plus «difficiles» (pour des /3 faibles) ont les scores les moins élevés dans
chacun des groupes : il s’agit des items 3 et 5. Le score de l’item 3 est de 382 dans le
groupe 1 (le score maximum est 574) et de 354 dans le groupe 2 (le score maximum
est 561). Pour l’item 5, les scores sont respectivement de 426 dans le groupe 1 et
de 389 dans le groupe 2. La nervosité et la colère sont donc des attitudes facilement
présentes quelque soit le niveau de contrôle glycémique.
7. Conclusion
pourrait tester la différence des groupes en terme d’aptitude des sujets et rester dans
le cadre du modèle de Rasch. Les logiciels actuellement existant ne permettent pas
d’utiliser directement leurs résultats pour construire ce test.
L’analyse, par le modèle de Rasch à effet mixte, de problèmes liés à la Qualité
de Vie (dans notre cas, une étude épidémiologique) pourrait être explicitée de manière
plus approfondie en vue de fournir une interprétation de la position réciproque des
paramètres de moyenne dans les populations de sujet et des paramètres de difficulté
des items.
Enfin, il faut préciser qu’il serait intéressant d’étendre l’étude précédente à plus
de deux groupes de traitement et à des items polychotomiques. Les modèles de Rasch
utilisés dans ce dernier cas sont alors de type polychotomique.
UN MODÈLE DE RÉPONSES AUX ITEMS. 39
Bibliographie
FISCHER G.H., SELIGER E.S. (1997), in Van der Linden W.J. & Hambleton R.K.,
Handbook of Modern Item Response Theory, New York : Springer Verlag.
GLAS C.A.W. (1993), RSP, Rasch Scaling Program : Computer Program and User’s
Manual, Groningen : ProGAMMA.
HOIJTINK H. (1995), in Fischer G.H. & Molenaar I.W., Linear and Repeated
Measures Models for Person Parameters, New York : Springer Verlag.
MCCULLAGH P., NELDER J.A. (1989), Generalized Linear Models, London,
Chapman and Hall.
PFANZAGL J. (1994), in Fischer G.H. & Laming D., Contributions to Mathematical
Psychology, Psychometrics and Methodology, New York : Springer Verlag.
RASCH G. (1960), Probabilistic Models for Some Intelligence and Attainment Tests,
Chicago, The University of Chicago Press.
TOMASSONE R., DERVIN C., MASSON J.P. (1993), Biométrie. Modélisation de
Phénomènes Biologiques, Paris, Masson.
ZWINDERMAN A.H. (1991), A generalized Rasch Model for manifest predictors,
Psychometrika, 56, 589-600.