Rsa 2000 48 4 29 0

R EVUE DE STATISTIQUE APPLIQUÉE
J.-M. T RICOT
M. M ESBAH
Un modèle de réponses aux items. Propriétés et
comparaison de groupes de traitement en épidémiologie
Revue de statistique appliquée, tome 48, no 4 (2000), p. 29-39
<http://www.numdam.org/item?id=RSA_2000__48_4_29_0>
© Société française de statistique, 2000, tous droits réservés.

L’accès aux archives de la revue « Revue de statistique appliquée »
(http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi-
tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti-
lisation commerciale ou impression systématique est constitutive d’une in-
fraction pénale. Toute copie ou impression de ce fichier doit contenir
la présente mention de copyright.
Article numérisé dans le cadre du programme

Numérisation de documents anciens mathématiques
http://www.numdam.org/
Rev. Statistique Appliquée, 2000, XLVIII 29
UN MODÈLE DE RÉPONSES AUX ITEMS.

PROPRIÉTÉS ET COMPARAISON DE GROUPES
DE TRAITEMENT EN ÉPIDÉMIOLOGIE
J.-M. Tricot*, M. Mesbah*

*
Laboratoire de Statistique Appliquée Bretagne-Sud
Université de Bretagne-Sud, IUP Informatique & Statistique, Tohannic, 56000 Vannes
RÉSUMÉ
La Théorie des Réponses aux Items (IRT) est étudiée dans le cadre des items à réponses
dichotomiques. Le modèle de Rasch possède de bonnes propriétés parmi les modèles IRT
unidimensionnels. On s’intéresse particulièrement au cas où on a un modèle à effet aléatoire. On
présente la combinaison du modèle de Rasch et d’un modèle linéaire sur la variable latente (effet
aléatoire) avec application au cas où les variables prédictrices sont des variables d’affectation.
Dans ce contexte, une exemple réel porte sur la comparaison de groupes de traitements en
diabétologie. Le test de la comparaison des groupes est effectué à l’aide de la statistique LR.
Mots-clés : Modèles IRT, Modèles de Rasch, Trait latent, Exhaustivité, Score, Variables
prédictrices, Statistique LR
ABSTRACT
The Item Response Theory (IRT) is analysed Within the framework of dichotomous
responses items. Rasch model have some good properties that make them outstanding univariate
IRT model. The random effect model is of our interest. We insert a linear model applied to
the latent variable (random effect) inside the Rasch model with binary preditors to classes’
assignment. Within this framework, we analyse two treatments groups comparison as an
example in a diabetes study. The group’s comparison test is a LR test.
Keywords : IRT models, Rasch model, Latent trait, Sufficiency, Score, Predictors, LR Statistics
1. Introduction
On est souvent amené à analyser des enquêtes où les données ont été obte-
nues par autoquestionnaire. Les autoquestionnaires sont couramment utilisés dans la
recherche médicale pour mesurer des variables telles que la douleur, l’émotion etc...
30 J. -M. TRICOT, M. MESBAH
Plus généralement l’analyse des autoquestionnaires est réalisée dans le domaine de

la Qualité de Vie (Pfanzagl, 1994).
La Théorie des Réponses aux Items (IRT) est développée dans ce cadre. Une
revue rapide des modèles IRT est donnée par Andersen (1991). Chaque autoquestion-
naire est assimilable à un ensemble d’items dont on va supposer qu’ils sont dichoto-
miques et qu’ils mesurent un unique critère d’évaluation ou trait latent : ceci revient
à dire que la variable (critère ou trait latent) à mesurer est unidimensionnelle.
On se focalise sur un modèle dérivé du modèle de Rasch (1960) pour lequel
l’ensemble des items représentent la partie instrumentale (mesurable) du modèle
dont les paramètres sont des paramètres d’item. L’effet sujet, c’est-à-dire le trait
latent (critère à mesurer) est considéré soit sous une forme paramétrique soit sous
la forme d’un effet aléatoire : il représente la partie structurelle du modèle. Dans la
partie 2, on définit le modèle et on fait un lien avec les méthodes classiques d’analyse
de variance. Dans la partie 3, les propriétés essentielles du modèle sont abordées.
La partie 4 présente un cadre théorique d’estimation des paramètres du modèle. La
partie 5 traite de la combinaison du modèle de Rasch et d’un modèle linéaire que l’on
restreint au cas où les prédicteurs sont des variables d’affectation. En 6e partie, un
exemple est donné dans le domaine de l’épidémiologie.
2. Notations et Modèles
L’utilisation du modèle de Rasch (1960) dichotomique est pertinente en

présence d’un trait latent dans la population de sujets : on estime et teste une variable
non observable ou variable latente («latent variable») à l’aide d’un ensemble de
variables observables ou items («manifest variables»). L’ensemble des items constitue
l’autoquestionnaire. C’est un instrument de mesure pour la variable latente. Les items
sont, ici, des variables qualitatives dichotomiques (réponse 0 ou 1). Dans le domaine
de la psychométrie par exemple (cf. la 6e partie), l’état émotionnel d’un sujet est
mesuré sur des réponses à des questions objectives du type «je me sens nerveux,
tendu», «la vie ne vaut plus la peine d’être vécue» etc... Ces variables dichotomiques
admettent les réponses «oui» (échec), ou «non» (succès). Les codages respectifs sont
0 et 1, par exemple. Soient n sujets et k questions (items). La question Xi (ou plus
simplement i), i 1, k, admet la réponse xi, xi 0, 1. Ces valeurs sont considérées
= =
comme un système de codage sur les réponses.
On distingue deux parties dans le modèle. D’une part, une partie instrumentale
qui concerne les items et qui est caractérisée par un ensemble de paramètres d’item : le
paramètre de l’item i, est noté 03B2i i, i 1, k. Il est interprété comme étant la difficulté
=
de l’item i : il s’agit de la difficulté à réussir i (dans l’exemple, si l’item i est : «je

me sens nerveux, tendu», la difficulté Oi mesure la difficulté à répondre xi = 1). On
suppose que 03B2i E R. D’autre part, une partie structurelle qui concerne le trait latent
(ou variable latente) noté o. Il est interprété comme étant l’aptitude du sujet à réussir
l’item i, i =
1, k, c’est-à-dire à répondre xi = 1. Si l’on spécifie le sujet à l’aide de
l’indice s, s =
1, n, on passe de manière évidente de la notation 0 à 03B8s (aptitude du
sujet s) et de Xi et xi respectivement à Xsi et xsi. Suivant le point de vue adopté, on
supposera que 0 E R est un paramètre fixe ou un paramètre aléatoire (une variable
aléatoire réelle).
UN MODÈLE DE RÉPONSES AUX ITEMS. 31
Classiquement, la modélisation d’un effet item (effet fixe donné par /3i) et d’un
effet sujet (effet fixe ou aléatoire donné par 03B8s) sur la réalisation xs2 est obtenu
linéairement à l’aide d’un plan à deux facteurs sans répétition (ou à un facteur «avec
blocs». Voir Tomassone et al., 1993), donné par :
où 03B8s est un effet sujet et {3i est un effet item.

Plusieurs travaux récents sur la Théorie des Réponses aux Items se focalisent
non plus sur la variable réponse Xsi mais plutôt sur une transformation de la
probabilité P (X si 1|03B8s,03B2i) dans le cas dichotomique. Dans ce cadre, le modèle
=
linéaire P(Xsi = 1|03B8s,03B2i) = Os + {3i n’est pas satisfaisant puisque des valeurs
supérieures à 1 ou négatives pourraient être prises par le membre de droite, à moins
d’imposer à celui-ci une contrainte.
Le modèle logistique de Rasch retenu récemment par de nombreux auteurs, ,
intègre une telle contrainte : il est construit à partir de la transformation logit appliquée
à la probabilité P(Xsi 1|03B8s, {3i) :
=
où le signe négatif devant 03B2i permet d’opposer l’aptitude du sujet (Os) à la difficulté
de l’item (03B2i). D’autre liens ont aussi été utilisés en pratique. Entre autre on peut citer
le lien probit (par exemple, cf. McCullagh & Nelder, 1989).
La fonction IRF («Item Response Function») de l’item i, est la fonction qui,
pour modèle logistique, à 03B8 associe P(Xi == 110, 03B2i), i
ce 1, k. Les k courbes
=
logistiques associées aux k fonctions IRF, sont parallèles puisqu’elles ne dépendent

des effets sujet et item que via la différence 0 - oi, i 1, k. L’équation (2) et les
=
notations introduites permettent d’écrire :
où X si prend la valeur 0 ou 1.
3. Définitions et propriétés
Le modèle de Rasch dichotomique est défini par les deux caractéristiques

suivantes :
1) la forme de la fonction IRF donnée par l’équation (2).
2) l’indépendance locale des items, c’est-à-dire : pour un individu donné (0
fixé), les Xi sont des variables indépendantes (pas d’empiétement des questions) et
de plus on a l’unidimensionalité de 03B8 (0 E R) et par conséquent l’aptitude 0 suffit à
expliquer toutes les réponses.
Le modèle logistique de Rasch appartient à la famille exponentielle en 0 et 03B2.
On en déduit donc immédiatement, lorsque 0, est considéré comme un paramètre fixe,
l’exhaustivité des statistiques Rs X,i pour 6S (score pour 03B8s), et Ti = 03A3 Xsi
i s
pour /3i (score pour /3i). On prend naturellement la notation R pour désigner le score
pour O. Fischer (1995) montre que, sous de bonnes conditions de régularité, il est
équivalent, pour un modèle IRT unidimensionnel, de supposer que c’est un modèle
de Rasch ou de supposer les trois hypothèses suivantes : la monotonicité croissante
des courbes des fonctions IRT, l’indépendance locale des items et l’exhaustivité du
score R pour O.
Pour un tel modèle logistique, il existe un «comparateur» entre deux sujets s
ets’, indépendant du modèle de mesure (indépendant des /3), noté C(s, s’), défini,
quelque soit i, par :
La définition (4) donne, par un calcul élémentaire, la valeur de C(s, s’),

indépendante des f3, suivante :
En particulier, d’après (5), C(s,s’) 1/2 si et seulement si, quelque soit

i, 03B8s’ 03B8s si et seulement si P(Xs’i = 1)
ou P(Xsi - 1). On voit
immédiatement qu’une condition suffisante pour que 03B8s’ 03B8s est qu’il existe i tel
que P(Xs’i == 1) 1/2 (i.e. 03B8s’ /3i) et P(Xsi = 1) 1/2 (i.e. 03B8s /3i). Un
item suffit donc à classer 2 sujets. En ce sens, chaque /3, représenté sur l’échelle
unidimensionnelle des valeurs réelles de 0, est valeur discriminante pour les sujets
dans la détermination du classement de l’ensemble des sujets au sens d’une aptitude
«de plus en plus grande» à réussir les items.
4. Estimation des paramètres
On note Xs, le vecteur des réponses du sujet s aux items, à k composantes,

de ième composante Xsi, i 1, k, et x, une réalisation de Xs, de 2eme composante
=
xsi, i =
1, k. On note aussi /3 = (03B21, ..., 03B2k). L’exhaustivité du score Rs (cas où 03B8s
est considéré comme un paramètre fixe) permet d’effectuer la factorisation suivante,
pour une réalisation rs de Rs :
où le deuxième facteur de la partie droite de l’équation ne dépend pas de () s .
somme est réalisée sur 2’ valeurs possibles de xs, pour s fixé. Du fait que, de manière
évidente, on a P( Rs == r si lx. , 03B8s, 03B2) 1 si Xs est tel que rs =
-
03A3
xsi (condition
i
notée Xs Ir s) et 0 sinon, la loi de RS est donc donnée par :
et, par conséquent, la loi conditionnelle de Xs sachant rs est donnée par
si rs est tel que rs == L Xsi et 0 sinon.

i
On se place maintenant dans le cas d’un modèle mixte où 03B8 est aléatoire, de loi
F (. 1 A) paramétrée par A (A sera, par exemple le paramètre (M,a2) d’une loi normale).
Plusieurs auteurs et en particulier Zwinderman (1991) donnent les étapes
d’estimation suivantes :
Première étape : estimation du paramètre {3 par la méthode CML, c’est-à-dire
en maximisant la log-vraisemblance de 3, notée Le, calculée à partir de (8) :
L’estimation de 3 est obtenue pratiquement par les méthodes algorithmiques

usuelles (procédures EM ou Newton-Raphson). On consultera, par exemple, Fischer
et Ponocny (1994) pour une description de ces méthodes.
Deuxième étape : estimation du paramètre A par la méthode MML, c’est-à-dire
en maximisant la log-vraisemblance de A, notée LM, lorsque 3 est supposé connu,
c’est-à-dire en remplaçant 0 (resp. 03B2i, i 1, k) par son

=
estimation 13
(resp. ,Q2,
i =
1, k) obtenue à la première étape (cf. (9)). Pour cela, on écrit LM à l’aide des
équations (6) et (7) :
Seul le deuxième terme de la somme (10) précédente dépend de À. C’est ce
terme qui est maximisé et permet d’obtenir une estimation A de A.

L’ estimation osde Os est alors l’espérance mathématique a posteriori de 0
sachant XS - xs, lorsque 03B2 et À sont estimés respectivement par i3 et . La loi a
posteriori de 0 dans le cas absolument continu où f(03B8|03BB) est la densité a priori de 0,
est donnée en fonction de P(Xs xs|03B8, 03B2) (cf. (6» et f(03B8|03BB), par la densité, notée
=
fs(03B8|03B2, À) suivante (formule de Baves habituelle) :
De (11) on déduit l’estimation

du modèle de Rasch à effet mixte, on constate donc
de os : os - 03B8fs(03B8|,)d03B8.
est qu’il d’obtenir
Dans le cadre
possible
un intervalle de confiance autour de 03B8s puisque l’on peut calculer la variance
conditionnelle a posteriori de 0 connaissant le score individuel du sujet s.
5. Combinaison d’un modèle de Rasch et d’un modèle linéaire sur 0
On se place dans le cas où la variable latente 0 est aléatoire et supposée liée

linéairement à P prédicteurs Zl,Z2, ..., zp. Pour le sujet s, les observations sur les P
prédicteurs sont zs1,zs2, ..., Zsp. On pose donc :
en supposant que les é s, s =

1, n, sont des erreurs normales N(0, 0-2) homoscédas-
tiques.
Soit "/ (1’0, 03B31, ..., ’yp). On considère le modèle
=
qui combine un modèle de
Rasch et le modèle linéaire sur 0 défini en (12), suivant :
Il s’agit d’un modèle de Rasch à effet mixte (Hoijtink, 1995) qui combine un
modèle de mesure à effet fixe (les (3 sont les paramètres du questionnaire qui sert
d’instrument de mesure) et un modèle structurel à effet aléatoire linéaire (0 est la
variable qui décrit la structure de la population de sujet).
On particularise le problème au cas où les prédicteurs sont des variables

indicatrices d’affectation à des groupes de traitement. Fischer et Seliger (1997)
étudient une telle comparaison de groupes de traitement effectuée lorsque les groupes
sont observés à différentes périodes du temps.
Une étude épidémiologique récente, EDIAB (éducation des diabétiques : on

pourra consulter par exemple, Chwalow et al., 1994), considérait deux groupes de
traitement, et avait pour but le «diagnostic et l’évaluation de stratégies éducatives
pour les diabétiques non insulino-dépendants (DNID)».
Soit Zg, g 1, 2, la variable indicatrice d’affectation au groupe de traitement g.
=
On suppose que, pour le groupe 1, l’indice sujet varie comme suit : s =

1,
ni, et que dans ce groupe l’aptitude moyenne des patients est Mi. Dans le groupe 2,
s = ni + 1, ni + n2 et l’aptitude moyenne des patients est 03BC2.
L’aptitude du patient s est alors 0. - /LI + 03B5s lorsque s 1, nI où l’on suppose

=
que 6’s possède une distribution N(0, aî) et de même Os 03BC2 + 03B5s lorsque s == 03BC1+1,
=
ni + n2 où l’on suppose que és possède

une distribution N(0, 03C322). On admet que le
paramètre de difficulté pour l’item i est 03B2ii (resp. 03B22i) dans le premier groupe (resp. le
deuxième groupe) et que le paramètre de difficulté pour cet item tout groupe confondu
(donc, pour les nl + n2 sujets), est 03B20i (plutôt que,Q2). L’équation (13) redéfinie lorsque
P = 1 et 03B30 0 dans le modèle (12), est équivalente, pour le groupe 1, à :
=
et pour le groupe 2, à
Dans ce contexte, on suppose que la distribution F(.|03BB) de 0, dans le groupe 1,

est normale N(03BC1, aI) avec À = (03BC1,03C321) et celle de 0, dans le groupe 2, est normale
N(03BC2, 03C322) avec (03BC2, 03C322).
6. Exemple et test de l’identité de deux groupes de traitement
Une enquête auprès des médecins et leurs malades a permis de collecter

1 366 réponses de patients à un questionnaire mesurant outre des informations d’ordre
socio-démographiques (age, sexe, CSP, etc...) des items de santé (niveau de contrôle
glycémique etc...), des échelles cognitives, psycho-sociales et enfin une échelle
multidimensionnelle de qualité de vie : l’échelle Nothingham Health Profile (NHP)
constituée par 38 items dichotomiques regroupant 6 dimensions ou sous-échelles : la
douleur (8 items), les réactions émotionnelles (9 items), l’énergie/le tonus (3 items),
la mobilité physique (8 items), l’isolement social (5 items) et le sommeil (5 items).
On s’intéresse à comparer les réactions émotionnelles dans deux groupes de patients,
suivant le niveau de contrôle glycémique. Le niveau de contrôle glycémique est élevé
dans le groupe 1 et faible dans le groupe 2.
Les 9 items dichotomiques de l’échelle des réactions émotionnelles sont les

suivants :
-
Item 1 : Je suis de plus en plus découragé

-
Item 2 : Plus rien ne me fait plaisir
Item 3 : Je me sens nerveux, tendu

-
Item 4 : Je trouve les journées interminables

-
Item 5 : Je me mets facilement en colère

-
Item 6 : J’ai du mal à faire face aux événements

-
Item 7 : Mes soucis m’empêchent de dormir

-
Item 8 : La vie ne vaut pas la peine d’être vécue

-
Item 9 : Je me réveille déprimé le matin

La réponse à un item est codée 1 si celle-ci est négative (dans ce cas la réaction
émotionnelle est contrôlée et la réponse «non» est un succès), sinon elle est codée 0.
Compte tenu de la présence de données manquantes, on peut analyser 1 135 pa-
tients répartis en deux groupes de taille 574 pour le groupe 1 et 561 pour le groupe 2.
On se place dans le cadre du modèle de Rasch à effet mixte. On note de manière
évidente : 03B20-
(03B201, ..., et 03B2g = ({3f, ..., {3f) pour g 1, 2 et k = 9. Le test de
=
l’identité des groupes réalisé, est le test LR du rapport de vraisemblance. On teste

l’égalité des paramètres, soit Ho : 111 03BC2 /-Lo et aî 03C322 u2 et 03B21 = 32 oO,
= == = = -
contre l’alternative contraire.

La significativité du test pourra intervenir aussi bien dans le cas d’un effet
traitement positif sur les groupes que dans le cas où l’instrument de mesure suffit à
séparer les groupes.
L’estimation, par la méthode CML, des paramètres 01 et f32 respectivement
dans chacun des groupes 1 et 2, donne les résultats reportés dans les tableaux 1 et 2
suivants :
TABLEAU 1
Estimation de la difficulté des items dans le groupe 1
et score des items (0, réponse oui, 1, réponse non).
TABLEAU 2
Estimation de la difficulté des items dans le groupe 2
et score des items (0, réponse oui, 1, réponse non).
On pose :
pour h =
0,1, 2.
Les trois vraisemblances calculées pour l’ensemble des sujets et pour chacun
des deux groupes sont notées respectivement Lo, LI (pour le groupe 1) et L2 (pour
le groupe 2). Les équations (10), (14), (15) et (16) permettent alors d’écrire :
On note Lo, Li et L2 les maxima respectivement de Lo, L1 et L2 aux points

qui donnent les estimations des paramètres de position et d’échelle. La statistique LR
du test de l’identité des deux groupes de traitement, à savoir :
possède asymptotiquement, lorsque n ~ oo, une distribution ~2 à k + 2 degrés de

liberté.
Le RSP de Glas (1993) donne les valeurs : logLo = -3 664.4,
logiciel
logL 1 -1713.2, logL2 - -1940.8. On remarque que les vraisemblances Lo,
=
Li et L2 prennent des valeurs très faibles indiquant que l’ajustement du modèle de

Rasch n’est pas satisfaisant dans les trois populations (global, groupe 1 et groupe 2).
Nous n’avons pas abordé ici le problème de l’ajustement préalable du modèle de

Rasch. De (17) on déduit la valeur LR 20.8 pour 11 dl ce qui donne une p-value de
=
.015. Au seuil de 5% on admettra une différence entre les deux groupes. On a aussi
les valeurs moyennes suivantes : Ml = -3.013(2.17) dans le groupe 1 est inférieure à
M2 = -2.460(1.99) dans le groupe 2. Puisque le groupe 1 correspond à un niveau de
contrôle glycémique plus élevé que dans le groupe 2, cela signifie qu’une moyenne
faible traduit un niveau de contrôle glycémique élevé : l’échelle de mesure du trait
latent indique donc en moyenne des réactions émotionnelles moins fortes dans le
deuxième groupe. On remarque enfin un bon ajustement du modèle au sens où les
items les plus «difficiles» (pour des /3 faibles) ont les scores les moins élevés dans
chacun des groupes : il s’agit des items 3 et 5. Le score de l’item 3 est de 382 dans le
groupe 1 (le score maximum est 574) et de 354 dans le groupe 2 (le score maximum
est 561). Pour l’item 5, les scores sont respectivement de 426 dans le groupe 1 et
de 389 dans le groupe 2. La nervosité et la colère sont donc des attitudes facilement
présentes quelque soit le niveau de contrôle glycémique.
7. Conclusion
Le test de comparaison des groupes de traitement a donné des résultats

significatifs.Par rapport à une analyse de variance classique, le modèle de Rasch
à effet mixte a montré sa pertinence et comment il pouvait être considéré comme une
généralisation d’un modèle linéaire. L’importance de supposer l’effet sujet comme
aléatoire permet d’envisager une variabilité au niveau du comportement du sujet.
Cependant ce contexte n’est pas exempt de difficultés d’estimation des paramètres du
modèle au niveau de la résolution numérique de problèmes d’optimisation. Le modèle
de Rasch est performant dans la mesure où les outils algorithmiques sont maîtrisés.
L’hypothèse alternative posée ici, ne spécifie pas un modèle de Rasch. Sous cette
hypothèse, les paramètres /3 dépendent du groupe considéré et donc des sujets mais en
revanche, un modèle de Rasch particulier est spécifié par groupe. L’instrument utilisé
sous l’hypothèse alternative, dépend donc des individus ce qui contredit le modèle
de Rasch. Si l’on voulait ne pas altérer l’instrument de mesure considéré sous Ho on
prendrait l’alternative suivante : 03BC1 i= 03BC2 ou 03C321 ~ 03C322 et 0’ = 03B22 (30. Ainsi on
=
pourrait tester la différence des groupes en terme d’aptitude des sujets et rester dans
le cadre du modèle de Rasch. Les logiciels actuellement existant ne permettent pas
d’utiliser directement leurs résultats pour construire ce test.
L’analyse, par le modèle de Rasch à effet mixte, de problèmes liés à la Qualité
de Vie (dans notre cas, une étude épidémiologique) pourrait être explicitée de manière
plus approfondie en vue de fournir une interprétation de la position réciproque des
paramètres de moyenne dans les populations de sujet et des paramètres de difficulté
des items.
Enfin, il faut préciser qu’il serait intéressant d’étendre l’étude précédente à plus
de deux groupes de traitement et à des items polychotomiques. Les modèles de Rasch
utilisés dans ce dernier cas sont alors de type polychotomique.
Bibliographie
ANDERSEN E.B. (1991), The Statistical Analysis of Categorical Data, Heidelberg :

Springer Verlag.
CHWALOW A.J., COSTAGLIOLA D.G., MESBAH M., ESCHWEGE E. (1994),
Management of type 2 diabetes mellitus in France : attitudes and practices
among a representative sample of general practitioners, Diabete & Metabolisme
(Paris), 20, 458-464.
FISCHER G.H. (1995), in Fischer G.H. & Molenaar I.W., Derivations of the Rasch
Model, New York : Springer Verlag.
FISCHER G.H., PONOCNY I. (1994), An extension of the Partial Credit Model with
an application to the measurement of change, Psychometrika, 59, 177-192.
FISCHER G.H., SELIGER E.S. (1997), in Van der Linden W.J. & Hambleton R.K.,
Handbook of Modern Item Response Theory, New York : Springer Verlag.
GLAS C.A.W. (1993), RSP, Rasch Scaling Program : Computer Program and User’s
Manual, Groningen : ProGAMMA.
HOIJTINK H. (1995), in Fischer G.H. & Molenaar I.W., Linear and Repeated
Measures Models for Person Parameters, New York : Springer Verlag.
MCCULLAGH P., NELDER J.A. (1989), Generalized Linear Models, London,
Chapman and Hall.
PFANZAGL J. (1994), in Fischer G.H. & Laming D., Contributions to Mathematical
Psychology, Psychometrics and Methodology, New York : Springer Verlag.
RASCH G. (1960), Probabilistic Models for Some Intelligence and Attainment Tests,
Chicago, The University of Chicago Press.
TOMASSONE R., DERVIN C., MASSON J.P. (1993), Biométrie. Modélisation de
Phénomènes Biologiques, Paris, Masson.
ZWINDERMAN A.H. (1991), A generalized Rasch Model for manifest predictors,
Psychometrika, 56, 589-600.

Rsa 2000 48 4 29 0

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Rsa 2000 48 4 29 0

Transféré par

Droits d'auteur :

Formats disponibles

R EVUE DE STATISTIQUE APPLIQUÉE

© Société française de statistique, 2000, tous droits réservés.

Article numérisé dans le cadre du programme

UN MODÈLE DE RÉPONSES AUX ITEMS.

J.-M. Tricot*, M. Mesbah*

Plus généralement l’analyse des autoquestionnaires est réalisée dans le domaine de

L’utilisation du modèle de Rasch (1960) dichotomique est pertinente en

comme un système de codage sur les réponses.

de l’item i : il s’agit de la difficulté à réussir i (dans l’exemple, si l’item i est : «je

où 03B8s est un effet sujet et {3i est un effet item.

logistiques associées aux k fonctions IRF, sont parallèles puisqu’elles ne dépendent

notations introduites permettent d’écrire :

Le modèle de Rasch dichotomique est défini par les deux caractéristiques

La définition (4) donne, par un calcul élémentaire, la valeur de C(s, s’),

En particulier, d’après (5), C(s,s’) 1/2 si et seulement si, quelque soit

4. Estimation des paramètres

On note Xs, le vecteur des réponses du sujet s aux items, à k composantes,

où le deuxième facteur de la partie droite de l’équation ne dépend pas de () s .

notée Xs Ir s) et 0 sinon, la loi de RS est donc donnée par :

et, par conséquent, la loi conditionnelle de Xs sachant rs est donnée par

si rs est tel que rs == L Xsi et 0 sinon.

L’estimation de 3 est obtenue pratiquement par les méthodes algorithmiques

c’est-à-dire en remplaçant 0 (resp. 03B2i, i 1, k) par son

Seul le deuxième terme de la somme (10) précédente dépend de À. C’est ce

terme qui est maximisé et permet d’obtenir une estimation A de A.

fs(03B8|03B2, À) suivante (formule de Baves habituelle) :

De (11) on déduit l’estimation

5. Combinaison d’un modèle de Rasch et d’un modèle linéaire sur 0

On se place dans le cas où la variable latente 0 est aléatoire et supposée liée

en supposant que les é s, s =

On particularise le problème au cas où les prédicteurs sont des variables

Une étude épidémiologique récente, EDIAB (éducation des diabétiques : on

On suppose que, pour le groupe 1, l’indice sujet varie comme suit : s =

L’aptitude du patient s est alors 0. - /LI + 03B5s lorsque s 1, nI où l’on suppose

ni + n2 où l’on suppose que és possède

Dans ce contexte, on suppose que la distribution F(.|03BB) de 0, dans le groupe 1,

6. Exemple et test de l’identité de deux groupes de traitement

Une enquête auprès des médecins et leurs malades a permis de collecter

Les 9 items dichotomiques de l’échelle des réactions émotionnelles sont les

Item 1 : Je suis de plus en plus découragé

Item 2 : Plus rien ne me fait plaisir

Item 3 : Je me sens nerveux, tendu

Item 4 : Je trouve les journées interminables

Item 5 : Je me mets facilement en colère

Item 6 : J’ai du mal à faire face aux événements

Item 7 : Mes soucis m’empêchent de dormir

Item 8 : La vie ne vaut pas la peine d’être vécue

Item 9 : Je me réveille déprimé le matin

l’identité des groupes réalisé, est le test LR du rapport de vraisemblance. On teste

contre l’alternative contraire.

On note Lo, Li et L2 les maxima respectivement de Lo, L1 et L2 aux points

possède asymptotiquement, lorsque n ~ oo, une distribution ~2 à k + 2 degrés de

Li et L2 prennent des valeurs très faibles indiquant que l’ajustement du modèle de

Nous n’avons pas abordé ici le problème de l’ajustement préalable du modèle de

Le test de comparaison des groupes de traitement a donné des résultats

ANDERSEN E.B. (1991), The Statistical Analysis of Categorical Data, Heidelberg :

Vous aimerez peut-être aussi

J.-M. Tricot, M. Mesbah