Université Paris-Sud 11 Faculté de Médecine

UNIVERSITÉ PARIS-SUD 11
FACULTÉ DE MÉDECINE
Année : 2009 N° attribué par la bibiothèque

| | | | | | | | | | |
THÈSE
en vue de l’obtention du diplôme de
DOCTEUR DE L’UNIVERSITÉ PARIS-SUD 11
Spécialité : BIOSTATISTIQUE
Présentée et soutenue publiquement par
Ismaı̈l AHMED
Le 8 avril 2009
Détection automatique de signaux en pharmacovigilance :

Approche statistique fondée sur les comparaisons multiples
Directeur de thèse : Mme Pascale Tubert-Bitter
JURY
M. Jean Christophe Thalabard, Pr. Président
M. Stephen Evans, Pr. Rapporteur

Mme Sylvia Richardson, Pr. Rapporteur
M. Stéphane Robin, Pr. Examinateur
Mme Pascale Tubert-Bitter, DR. Examinateur
Mes remerciements s’adressent en premier lieu à Pascale Tubert-Bitter. Travailler
avec elle a été un très grand plaisir et je lui suis profondément reconnaissant d’avoir
su si bien me guider et m’encourager tout au long de ce parcours.
Je tiens aussi à remercier chaleureusement Françoise Haramburu, Annie Fourrier-

Réglat, Frantz Thiessard, Carmen Kreft-Jais, Ghada Miremont-Salamé et Bernard
Bégaud pour leur aide et l’intérêt qu’ils ont porté à ce travail.
Mes remerciements s’adressent ensuite à Cyril Dalmasso avec qui j’ai eu grand
plaisir à travailler ainsi qu’à Philippe Broët.
Je remercie également les membres et ex-membres de l’équipe biostatistique, et

plus particulièrement Laurence Watier et Thierry Moreau, pour leur accueil, leur
disponibilité et leurs conseils. Je tiens aussi à remercier vivement M. Lellouch pour

nos longues conversations, ses lectures attentives et ses conseils avisés.
Merci aux membres de l’unité 780 qui ont rendu ces trois années de thèse très
agréables et plus particulièrement à Jérémie, Hélène, Antoine, Estelle, Olivier, Hé-
lèna, Yves, Dorota, Sigrid, Juliette, Mounia, Raphaëlle, Marie, Alexia et David avec
lesquels j’ai le plus partagé.
L’occasion m’est donnée de remercier l’Institut de Recherche en Santé Publique

qui a contribué financièrement à l’accomplissement de ce travail.
Je remercie Stephen Evans et Sylvia Richardson pour avoir accepté d’être les
rapporteurs de ma thèse ainsi que Stéphane Robin et Jean Christophe Thalabard
pour leur participation à mon jury.
Mes derniers remerciements s’adressent à ma famille et à Aurélie.
i
Valorisation scientifique
Communications orales
I. Ahmed, C. Dalmasso, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jaı̈s,
G. Miremont-Salamé, B. Bégaud, P. Broët, P. Tubert-Bitter, Fisher’s Exact Test Applied
to Pharmacovigilance, 29th Annual Conference of the International Society for Clinical
Biostatistics, 17-21 August 2008, Copenhagen, Denmark.
I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jais, G. Miremont-

Salamé, B. Bégaud, P. Tubert-Bitter, Signal Ranking-Based Comparison of Automatic De-
tection Methods in Pharmacovigilance : A Hypothesis Test Approach, Epidemiology and
Biometry 2008, IBS Channel Network, 10-11 July 2008, Paris, France.
I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, G. Miremont-Salamé, C. Kreft-

Jaı̈s, P. Tubert-Bitter, Bayesian Pharmacovigilance Signal Detection Methods Revisited in
a Multiple Comparison Setting, First IBS Channel Network Conference, 8-11 May 2007,
Rolduc, The Netherlands.
I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, G. Miremont-Salamé, C. Kreft-

Jaı̈s, P. Tubert-Bitter, A New Automatic Signal Detection Method in Pharmacovigilance ;
A Bayesian Multiple Comparisons Setting, 22nd International Conference on Pharmacoe-
pidemiology & Therapeutic Risk Management, 24-27 August 2006, Lisbon, Portugal.
Publications avec comité de lecture

I. Ahmed, C. Dalmasso, F. Haramburu, F. Thiessard, P. Broët, P. Tubert-Bitter, False
Discovery Rate Estimation for Frequentist Pharmacovigilance Signal Detection Methods,
Biometrics, Accepté.
I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jais, G. Miremont-

Salamé, B. Bégaud, P. Tubert-Bitter, Bayesian Pharmacovigilance Signal Detection Me-
thods Revisited in a Multiple Comparison Setting Statistics in Medicine, Accepté.
ii
Table des matières
Remerciements i
Valorisation scientifique ii
Communications orales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
Publications avec comité de lecture . . . . . . . . . . . . . . . . . . . . . . ii
Table des matières iii
Table des figures vi
Liste des tableaux viii
Liste des abréviations ix
1 Introduction 1
1.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Problématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Objectif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Description des principales méthodes de détection automatique 7

2.1 Structure des données analysées . . . . . . . . . . . . . . . . . . . . . 7
2.2 Les méthodes fréquentistes . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.1 La méthode Reporting Odds Ratio (ROR) . . . . . . . . . . . 9
iii
TABLE DES MATIÈRES iv
2.2.2 La méthode Proportional Reporting Ratio (PRR) . . . . . . . 9
2.3 Les méthodes bayésiennes . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3.1 La méthode Bayesian Confidence Propagation Neural Network
(BCPNN) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3.2 La méthode Gamma Poisson Shrinker (GPS) . . . . . . . . . 15
2.4 Quelques remarques générales . . . . . . . . . . . . . . . . . . . . . . 18
3 Méthodes de détection automatique revisitées dans le cadre des

comparaisons multiples 20
3.1 Comparaisons multiples et méthodes fréquentistes . . . . . . . . . . . 21

3.1.1 ROR, PRR et test d’hypothèses . . . . . . . . . . . . . . . . . 21
3.1.2 Test exact de Fisher et mid-P-values . . . . . . . . . . . . . . 22
3.1.3 FDR et méthodes fréquentistes . . . . . . . . . . . . . . . . . 23
3.2 Comparaisons multiples et méthodes bayésiennes . . . . . . . . . . . 29

3.2.1 GPS et BCPNN dans le cadre bayésien de la théorie de la décision 31
3.2.2 Autres approches proposées pour la prise en compte des com-
paraisons multiples à partir du modèle GPS . . . . . . . . . . 34
3.3 Quelques remarques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4 Étude de simulations 38
4.1 Modèle de simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.2 Comparaison des approches fréquentistes . . . . . . . . . . . . . . . . 43
4.2.1 Étude de la densité des degrés de signification . . . . . . . . . 44
4.2.2 Estimation de π0 π0 ∗ . . . . . . . . . . . . . . . . . . . . . . . 46
4.2.3 Comparaison des méthodes selon le FDR et son estimation . . 46
4.3 Comparaison des approches bayésiennes . . . . . . . . . . . . . . . . 53

4.3.1 GPS et règles de classement . . . . . . . . . . . . . . . . . . . 54
TABLE DES MATIÈRES v
4.3.2 Comparaison de GPS et BCPNN basés sur Pr(H∗0 ) . . . . . . . 57
4.4 Comparaison à partir du modèle de simulations proposé . . . . . . . . 57

4.5 Comparaison à partir du modèle de simulations de Roux et al. . . . . 65
4.6 Conclusion des simulations . . . . . . . . . . . . . . . . . . . . . . . . 67
5 Application aux données françaises de pharmacovigilance 68

5.1 Comparaison des méthodes sur les données de 1984-2003 . . . . . . . 69
5.1.1 Les données . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.1.2 Estimation des quantités caractéristiques (FDR, FNR, Se et Sp) 70

5.1.3 Comparaison des signaux générés . . . . . . . . . . . . . . . . 73
5.2 Évaluation séquentielle à partir de cas d’alertes réels . . . . . . . . . 77
5.2.1 Plan d’analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
5.2.2 Premier scénario : Mise en place d’un système de détection

automatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.2.3 Deuxième scénario : Utilisation en routine de GPS . . . . . . . 84
6 Conclusion 90
Réferences 94
Annexes 98
A Résultats complémentaires pour l’étude de simulations 98
B Résultats complémentaires pour l’application 102
C Publications 114
Table des figures
3.1 Histogrammes de la densité marginale des degrés de signification ob-

tenus à partir de la méthode midRFET sur les données de la base
française . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2 Histogramme de la distribution de Pr(λ∗ij ≤ 1) obtenu à partir des
données de la base Française. . . . . . . . . . . . . . . . . . . . . . . 35
4.1 Histogrammes du logarithme des risques observés dans la base fran-

çaise et dans les données simulées. . . . . . . . . . . . . . . . . . . . . 42
4.2 Histogrammes des distributions marginales, sous H0 et sous H1 des
degrés de signification pour ROR, RFET et midRFET. . . . . . . . . 45
4.3 Estimations de π0 π0 ∗ obtenues avec LBE et Qvalue à partir de la dis-
tribution marginale des degrés de signification transformés (p∗ ) pour
RFET. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.4 Comparaison de ROR, RFET et midRFET selon le FDR et son esti-
mation pour nij ≥ 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.5 Comparaison de ROR, RFET et midRFET selon le FDR et son esti-
mation pour nij ≥ 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.6 Biais relatif observé dans l’estimation du FDR pour ROR, RFET et
midRFET. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.7 Comparaison selon le FDR et son estimation des différentes règles de
classement pour GPS. . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.8 Variabilité du FDR et de son estimation pour GPS basé sur Pr(H∗0 ). . 56
4.9 Comparaison selon le FDR et son estimation de BCPNN et GPS basés
sur Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.10 Comparaison selon le FNR et son estimation de BCPNN et GPS basés
sur Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.11 Comparaison selon la sensibilité et son estimation de BCPNN et GPS
basés sur Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.12 Comparaison selon la spécificité et son estimation de BCPNN et GPS
basés sur Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.13 Comparaison du FDR obtenu avec midRFET, ROR, BCPNN et GPS
basé sur Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
vi
TABLE DES FIGURES vii
4.14 Comparaison du FDR et de son estimation pour midRFET, BCPNN

et GPS basé sur Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.15 Comparaison du FDR et de son estimation pour ROR, midRFET,
BCPNN et GPS basé Pr(H∗0 ) à partir du plan de simulation de Roux
et al. (2005). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.1 Comparaison des estimations du FDR sur la base de pharmacovigi-

lance française. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.2 Proportion de signaux communs entre les méthodes proposées en fonc-
tion du nombre de signaux générés. . . . . . . . . . . . . . . . . . . . 74
5.3 Proportion de signaux communs entre les méthodes proposées pour
{ψ0 = 1, RR0 = 1} en fonction du FDR estimé par GPS basé sur
Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.4 Proportion de signaux communs entre les différentes règles de classe-
ment pour GPS et RR0 = 1 . . . . . . . . . . . . . . . . . . . . . . . 76
5.5 Évolution au cours du temps du nombre de couples médicament-
événements présentant au moins une et au moins trois notifications
dans la base française “créée” au 1er janvier 1995. . . . . . . . . . . . 79
5.6 Histogramme des délais observés entre la date de détection par le
modèle GPS basé sur Pr(H∗0 ) et la date d’alerte en comité technique -
Scénario 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.7 Évolution du nombre de nouveaux signaux générés à partir du modèle
GPS basé sur Pr(H∗0 ) et d’un seuil de 5% pour le FDR∗ - Scénario 2. . 85
5.8 Évolution du seuil sur Pr(H∗0 ) pour FDR∗ = 5% lors de l’utilisation de
GPS - Scénario 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.9 Histogramme des 216 délais observés entre la date de détection par le
modèle GPS basé sur Pr(H∗0 ) et la date d’alerte en comité technique -
Scénario 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.10 Évolution du nombre de nouveaux signaux générés à partir du modèle
GPS basé sur Pr(H∗0 ) et FDR∗ = 1% - Scénario 2. . . . . . . . . . . . 88
A.1 Histogrammes de la distribution des degrés de signification sous H0

pour ROR, RFET et midRFET avec nij ≥ 1 . . . . . . . . . . . . . . 99
A.2 Histogrammes de la distribution des degrés de signification sous H0
pour ROR, RFET et midRFET avec nij ≥ 3. . . . . . . . . . . . . . . 100
A.3 Estimations de π0 π0 ∗ obtenues avec LBE et Qvalue à partir de la dis-
tribution marginale des degrés de signification transformés (p∗ ) pour
ROR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
B.1 Proportion de signaux communs entre les méthodes proposées en fonc-

tion du FDR estimé par GPS. . . . . . . . . . . . . . . . . . . . . . . 103
Liste des tableaux
2.1 Représentation des données pour le couple (i, j). . . . . . . . . . . . . 8
3.1 Tableau récapitulatif des méthodes étudiées. . . . . . . . . . . . . . . 36
5.1 Estimation des quantités caractéristiques avec GPS et Pr(H∗0 ) sur les
données de pharmacovigilance française. . . . . . . . . . . . . . . . . 72
5.2 Nombre de signaux de référence détectés par GPS basé sur Pr(H∗0 ) et
Q0.05 (λ∗ ), midRFET et ROR - Scénario 1. . . . . . . . . . . . . . . . 81
5.3 Comparaison des signaux de référence détectés dans les cas nij ≥ 3 et
nij ≥ 1 pour GPS basé sur Pr(H∗0 ) et pour midRFET - Scénario 1. . . 81
5.4 Rangs moyens dans le délai de détection des 309 signaux de référence
pour GPS basé sur Pr(H∗0 ) et Q0.05 (λ∗ ), midRFET et ROR - Scénario 1. 82
5.5 Rangs moyens dans le délai de détection des 164 signaux de référence
pour GPS basé sur Pr(H∗0 ) et Q0.05 (λ∗ ), midRFET et ROR - Scénario 1. 82
5.6 Capacité de détection du modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5%
en fonction du nombre de notifications associé aux signaux de référence
au 1er juillet 2002 - Scénario 2. . . . . . . . . . . . . . . . . . . . . . . 88
B.1 Signaux de référence (47) avec moins de 3 notifications spontanées au

1er juillet 2002. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
B.2 Signaux de référence (216) détectés par le modèle GPS basé sur Pr(H∗0 )
et FDR∗ = 5% - Scénario 2. . . . . . . . . . . . . . . . . . . . . . . . 106
B.3 Signaux de référence (46) avec au moins 3 notifications spontanées au
1er juillet 2002 et non détectés par le modèle GPS basé sur Pr(H∗0 ) et
FDR∗ = 5% - Scénario 2. . . . . . . . . . . . . . . . . . . . . . . . . . 112
viii
Liste des abréviations
Afssaps Agence française de sécurité sanitaire des produits de santé

ATC Anatomical Therapeutical Clinical
ATC5 Code ATC à 5 caractères
BCPNN Bayesian Confidence Propagation Neural Network
CRPV Centre régional de pharmacovigilance
FDA Food and Drug Administration
FDP False Discovery Proportion
FDR False Discovery Rate
FNP False Negative Proportion
FNR False Negative Rate
GPS Gamma Poisson Shrinker
HLT High Level Term
LBE Location Based Estimator
MedDRA Medical Dictionary for Regulatory Activities
MGPS Multi-Item Gamma Poisson Shrinker
midRFET mid-P-values calculées à partir du test exact de Fisher
PRR Proportional Reporting Ratio
RFET Reporting Fisher’s Exact Test
ROR Reporting Odds Ratio.
Se Sensibilité
Sp Spécificité
ix
Chapitre 1
Introduction
1.1 Contexte
Les effets indésirables des médicaments sont le plus souvent découverts après leur
autorisation de mise sur le marché et ceci pour au moins deux raisons. La première
tient à la nature même des effets indésirables qui peuvent être rares, spécifiques à
certaines catégories de la population ou se manifester après une grande période de
latence. Une autre raison est qu’une fois le médicament commercialisé, ses conditions
d’utilisation sont en général différentes de celles étudiées dans les cadres expérimen-
taux précédant sa mise sur le marché. Les systèmes de pharmacovigilance ont donc
pour but de détecter le plus précocement possible l’existence d’associations entre mé-
dicaments et événements indésirables. Ils reposent en général sur la déclaration par
des professionnels de santé (médecins ou pharmaciens) de la survenue d’événements
indésirables dont la cause suspectée est médicamenteuse. Prises individuellement, ces
notifications spontanées ne comportent que très rarement l’assurance de la respon-

sabilité du ou des médicaments incriminés. C’est donc leur accumulation qui conduit
les pharmacologues à mettre en évidence l’existence d’effets indésirables médicamen-
teux. Une difficulté rencontrée dans l’analyse de telles données réside dans le fait que
1
1.1 Contexte 2
les effets indésirables des médicaments commercialisés ne sont pas tous reconnus ni
rapportés aux instances de pharmacovigilance. Des études montrent que cette sous-
notification peut être très importante même dans le cas d’effets indésirables graves
(Bégaud et al., 2002). Il est très vraisemblable qu’elle soit fonction de l’événement
indésirable, du médicament ou du couple événement-médicament étudié ce qui peut
biaiser les conclusions tirées de l’information brute (van der Heijden et al., 2002).
Néanmoins, malgré ses limites, l’analyse des notifications spontanées demeure cer-
tainement le moyen le plus rapide et économique pour identifier de nouveaux effets
médicamenteux après l’autorisation de mise sur le marché et est par conséquent à la
base de la plupart des décisions prises par les instances de pharmacovigilance.

Le système de pharmacovigilance français a été mis en place en 1979. Il reposait
alors sur un réseau de 15 centres régionnaux de pharmacovigilance (CRPV) qui
fut rapidement étendu à 29 en 1984 puis à 31 en 1994. Ces centres ont une mission
d’information auprès des professionnels de santé. Ils ont aussi en charge la collecte des
notifications ainsi que leur enregistrement au sein de la base nationale coordonnée

par l’unité de pharmacovigilance de l’Agence Française de Sécurité Sanitaire des
Produits de Santé (Afssaps). C’est aussi au niveau de ces centres que s’exerce une
partie de la surveillance ; les cas suspectés étant par la suite discutés par le comité
technique de pharmacovigilance lors de réunions mensuelles au siège de l’Afssaps.

Entre 1986 et 2001, les données de pharmacovigilance françaises ont été enrichies
de 197 580 notifications spontanées avec une augmentation linéaire à travers le temps
pour atteindre le nombre annuel de 18 253 en 2001 (Thiessard et al., 2005). Cette base
doit être cependant considérée comme petite face aux deux principales bases mon-
diales : la base américaine coordonnée par la Food and Drug Administration (FDA)
et la base de l’Organisation Mondiale de la Santé administrée par l’Uppsala Moni-
1.2 Problématique 3
toring Center en Suède, qui, en décembre 2004, contenaient respectivement environ
2.6 et 3.7 millions de notifications (Almenoff et al., 2005).

Face à ce flux très important de données, ces deux systèmes de pharmacovigilance
ainsi que d’autres ont développé depuis une dizaine d’années des méthodes statis-
tiques de génération automatique de signaux. Ces méthodes ont pour but de détecter
les couples événement-médicament dont la présence est anormalement fréquente par

rapport à ce qui est attendu compte tenu de l’information présente dans le reste
de la base. Du fait des limites des notifications spontanées énoncées plus haut et
de la nature essentiellement exploratoire des ces analyses, les signaux ainsi générés
doivent être examinés par des experts pour en évaluer la pertinence. Il s’agit donc
plutôt d’outils complémentaires à la veille opérée par les pharmacovigilants ayant
pour objectif d’aider à l’exploration de l’immensité des données et agissant comme
des générateurs d’hypothèses.
1.2 Problématique
Les principales méthodes de détection automatique décrites dans la littérature

sont les méthodes Proportional Reporting Ratio (PRR, Evans et al. 2001), Repor-
ting Odds Ratio (ROR, van Puijenbroek et al. 2002), Bayesian Confidence Propa-
gation Neural Network (BCPNN, Bate et al. 1998; Norén et al. 2006) et (Multi-
Item) Gamma Poisson Shrinker ((M)GPS, DuMouchel 1999; DuMouchel et Pregi-
bon 2001). La méthode PRR est utilisée à la fois par le système de pharmacovigilance
anglais (Medical Control Agency) et par le système de pharmacovigilance européen
EudraVigilance. La méthode ROR est utilisée sur la base nationale des Pays Bas. La
méthode BCPNN est utilisée sur la base de l’OMS tandis que la méthode MGPS est
utilisée par la FDA (Almenoff et al., 2005; Hauben et al., 2005). La France, pour sa
part, n’utilise pas encore de système de détection automatique. Néanmoins, le tra-
1.2 Problématique 4
vail de thèse de Frantz Thiessard (Thiessard, 2004), l’étude par simulation de Roux
et al. (2005) et ce travail réalisé en collaboration avec l’unité de pharmacovigilance

de l’Afssaps et le CRPV de Bordeaux (Inserm U. 687) témoignent de la volonté de
mettre en place un tel système à moyen terme.
Les méthodes de détection automatique citées plus haut reposent sur une re-
présentation simplifiée de la base de pharmacovigilance dans laquelle les données

sont agrégées de manière à obtenir une très grande table de contingence croisant
l’ensemble des événements indésirables et des médicaments. Chaque couple se voit
ensuite associer une mesure de disproportionnalité qui conduit par comparaison à un
seuil à la génération ou non d’un signal. Ces méthodes diffèrent sur la mesure de dis-
proportionnalité choisie, le modèle de probabilité à l’origine de cette mesure ainsi que
sur les seuils de génération d’alerte. De plus, elles ne présentent pas le même degré de
complexité. En effet, les méthodes PRR et ROR sont des méthodes simples de nature
fréquentiste alors que BCPNN et GPS sont des méthodes bayésiennes reposant sur
une modélisation des données plus complexe.

Une limite de ces méthodes réside dans les seuils actuellement utilisés qui ont été
déterminés de manière arbitraire, au mieux sur la seule base d’études rétrospectives
empiriques. Il nous a donc semblé intéressant de réfléchir à une détermination plus
objective de ces derniers, fondée en particulier sur des critères d’erreurs statistiques
tenant compte du nombre très important de comparaisons effectuées simultanément.
La prise en compte de la multiplicité des comparaisons est un problème statistique
qui a reçu un intérêt croissant ces dernières années, en grande partie motivé par
l’arrivée de technologies pour l’analyse de données génomiques que sont les biopuces.
Le fruit de ces travaux a été le développement d’une multitude de méthodes pour
contrôler ou estimer de nouveaux critères d’erreurs. Parmi eux, le False Discovery
Rate (FDR) proposé par Benjamini et Hochberg (1995) et défini comme l’espérance
1.3 Objectif 5
du taux de fausses découvertes a reçu un intérêt particulier dans la mesure où il est
adapté à l’exploration de jeux de données de grandes tailles.
1.3 Objectif
Ce travail a été initié par la volonté de proposer des seuils de détection pour les
méthodes existantes fondés sur le FDR. Pour ce faire, les méthodes ont été revisitées
dans le cadre des tests d’hypothèses, ce qui ne modifie en rien leur modèle statistique
sous-jacent mais conduit néanmoins à des stratégies de détection relativement diffé-
rentes. Nous nous sommes intéressés au FDR dans la mesure où ce critère semblait
a priori répondre au caractère exploratoire de l’analyse des données de pharmaco-
vigilance. La nature fréquentiste ou bayésienne des méthodes nous a conduit à son

estimation selon deux approches différentes. En ce qui concerne les méthodes fré-
quentistes, nous avons étudié les approches d’estimation du FDR par la modélisation
des degrés de signification à l’aide de mélanges de distributions (Storey, 2002) tandis
que pour les méthodes bayésiennes, l’approche envisagée s’est appuyée sur le cadre
de la théorie de la décision proposé par Müller et al. (2004).
Le plan de ce manuscrit est le suivant. Nous présentons dans le chapitre 2 les
principales méthodes de détection automatique. Le chapitre 3 expose l’extension de
ces méthodes au cadre des comparaisons multiples. Le chapitre 4 est consacré à la

présentation de deux études par simulations visant à comparer les stratégies de détec-
tion proposées à celles actuellement en vigueur. La première se fonde sur un modèle
de simulation utilisant des caractéristiques de la base française de pharmacovigilance
tandis que la deuxième reprend le modèle de simulation de Roux et al. (2005) qui
vise à reproduire un système complet de notifications spontanées. Le chapitre 5 in-

clut d’une part les résultats de ce travail sur l’ensemble des données françaises de
pharmacovigilance collectées entre 1984 et 2003. D’autre part nous présentons les
1.3 Objectif 6
résultats d’une étude rétrospective ayant pour objectif d’évaluer les méthodes pro-
posées en utilisation séquentielle à partir de cas d’alertes réels. Le chapitre 6 conclut

sur le travail réalisé.
Chapitre 2
Description des principales

méthodes de détection
automatique
2.1 Structure des données analysées
Toutes les méthodes de détection automatique de signaux citées en introduction

se fondent sur une représentation des données de pharmacovigilance sous la forme
d’une très grande table de contingence de dimension I × J croisant l’ensemble des
médicaments et des événements indésirables impliqués au moins une fois dans une
notification spontanée. Comme nous le verrons dans le chapitre 5, la taille de cette
table de contingence dépend fortement du degré de précision utilisé pour le codage

des événements indésirables et des médicaments. Cette table est aussi caractérisée
par une grande proportion de cellules vides dépendant, là encore, du codage utilisé.
Une grande partie des notifications spontanées envoyées aux CRPV implique
plusieurs médicaments et/ou plusieurs événements indésirables. Dans de tels cas,
7
2.1 Structure des données analysées 8
chacune des combinaisons médicament-événement indésirable présente dans la noti-
fication est reportée dans la table de contingence.

Les méthodes automatiques étudiées reposent sur des mesures de disproportion-
nalité calculées pour l’ensemble des couples ayant fait l’objet d’au moins une notifi-
cation spontanée. Ces dernières constituent les statistiques d’intérêt et sont calculées
pour un couple (i, j) par agrégation de la table I × J en une table de contingence

2 × 2 présentée dans le tableau 2.1.
Tab. 2.1: Représentation des données pour le couple (i, j).
Evénement Autres événement

indésirable j indésirables
Médicament i nij nij̄ ni.
Autres médicaments nīj nīj̄ nī.
n.j n.j̄ n
nij avec i ∈ {1, . . . I} et j ∈ {1, . . . J} indique donc le nombre de notifications

P
impliquant à la fois le médicament i et l’événement indésirable j. ni. = i nij ,
P P
n.j = j nij et n = ij nij représentent les comptes marginaux. Il faut néanmoins
noter que du fait de la multiplicité des couples impliqués dans certaines notifications
spontanées, ces comptes marginaux ne correspondent pas au nombre de notifications
impliquant le médicament i (ni. ), l’événement indésirable j (n.j ) ou les deux (n).

Dans la suite de l’exposé, les méthodes existantes sont passées en revue.
2.2 Les méthodes fréquentistes 9
2.2 Les méthodes fréquentistes
2.2.1 La méthode Reporting Odds Ratio (ROR)
La méthode ROR proposée par van Puijenbroek et al. (2002) consiste à estimer
pour chacun des couples (i, j) l’odds ratio ψij à partir de la table 2.1 :
nij nīj̄
ψ̂ij = .
nīj nij̄
Le logarithme de ψ̂ij est supposé suivre une loi normale dont la variance est estimée
à partir de la delta méthode :
1 1 1 1
var{ln(
c ψ̂ij )} = + + + .
nij nīj̄ nīj nij̄
Un signal est généré lorsque la borne inférieure de l’intervalle de confiance à 95%

de ln(ψ̂ij ) est strictement supérieure à 0.
De par sa définition, ψ̂ij n’est pas calculable dans les cas très rares où le médica-
ment i n’est associé qu’à l’événement indésirable j (nij̄ = 0) ou lorsque l’événement
indésirable j n’est associé qu’au médicament i (nīj =0).
2.2.2 La méthode Proportional Reporting Ratio (PRR)
La méthode PRR proposée par Evans et al. (2001) est basée sur le calcul du
risque relatif observé dans la table 2.1 :
nij /ni.
ϕ̂ij = .
nīj /nī.
De manière analogue à ψ̂ij , ϕ̂ij n’est pas calculable dans le cas où nīj = 0.
2.3 Les méthodes bayésiennes 10
La règle proposée par Evans et al. et utilisée au MCA pour la génération d’un
signal est fondée sur 3 critères : (i) ϕ̂ij ≥ 2, (ii) nij ≥ 3 et (iii) la statistique de χ2 à
1 degré de liberté ≥ 4.
D’autre part, van Puijenbroek et al. (2002) ont proposé le même type de règle de
décision que celle utilisée pour la méthode ROR. Le logarithme de ϕ̂ij est supposé
suivre une loi normale de variance estimée par :
1 1 1 1
var{ln(
c ϕ̂ij )} = + + + ,
nij ni. nīj nī.
et un signal est généré lorsque la borne inférieure de l’intervalle de confiance à 95%

de ln(ϕ̂ij ) est strictement supérieure à 0.
En pratique, les deux statistiques ψ̂ et ϕ̂ donnent des résultats très proches ce

qui s’explique par le fait que l’on observe pour la très grande majorité des couples
nij ≪ (nīj , nij̄ ) ≪ nīj̄ (Almenoff et al., 2007).
2.3 Les méthodes bayésiennes
2.3.1 La méthode Bayesian Confidence Propagation Neural Net-
work (BCPNN)
Le modèle
La méthode initialement proposée par Bate et al. (1998) repose sur 3 modèles
beta-binomiaux :
nij| pij ∼ Bi(n, pij ) avec pij ∼ Be(αij , βij )
ni.| pi. ∼ Bi(n, pi. ) avec pij ∼ Be(αi. , βi. )

n.j| p.j ∼ Bi(n, p.j ) avec p.j ∼ Be(α.j , β.j )
dans lesquels pi. , p.j et pij indiquent respectivement la probabilité dans la base d’être
“exposé” au médicament i, d’observer l’événement indésirable j et de rencontrer les

deux. Les distributions des paramètres a posteriori sont donc aussi des lois beta :
p∗ij ≡ pij| nij ∼ Be(αij + nij , βij + n − nij )
p∗i. ≡ pi.| ni. ∼ Be(αi. + ni. , βi. + n − ni. )

p∗.j ≡ p.j| n.j ∼ Be(α.j + n.j , β.j + n − n.j ).
Dans la suite de l’exposé, le symbole * sera utilisé pour indiquer des variables
aléatoires conditionnelles aux observations appropriées. Les hyperparamètres propo-
sés par Bate et al. (1998) pour les distributions a priori sont les suivants :
1
αij = 1, βij = − 1, αi. = 1, βi. = 1, α.j = 1 et β.j = 1
E(p∗i. )E(p∗.j )
avec
αi. + ni. α.j + n.j
E(p∗i. ) = et E(p∗.j ) = .
αi. + βi. + n α.j + β.j + n
Bate et al. définissent donc deux lois uniformes pour p∗i. et p∗.j . Quant aux valeurs
choisies pour les hyperparamètres αij et βij , elles sont justifiées par le fait que l’es-
pérance a priori de pij correspond ainsi au produit des espérances a posteriori des
probabilités marginales.
Plus récemment, Norén et al. (2006) ont proposé de généraliser ces 3 modèles
beta-binomiaux à un modèle Dirichlet-multinomial afin de mieux prendre en compte

les dépendances existant entre la probabilité de la cellule considérée et les probabilités
marginales correspondantes :
(nij , nij̄ , nīj , nīj̄ ) ∼ Mu(n, pij , pij̄ , pīj , pīj̄ )
avec (pij , pij̄ , pīj , pīj̄ ) ∼ Di(αij , αij̄ , αīj , αīj̄ ).
La distribution a posteriori de (pij , pij̄ , pīj , pīj̄ ) est donc aussi une loi de Dirichlet :
(pij , pij̄ , pīj , pīj̄ )∗ ∼ Di(γij , γij̄ , γīj , γīj̄ )
où γkl désigne αkl + nkl .

pi. , p.j et pij sont toujours distribuées selon des lois beta mais avec une paramé-
trisation légèrement différente :
p∗ij ∼ Be(γij , γij̄ + γīj + γīj̄ )
p∗i. = p∗ij + p∗ij̄ ∼ Be(γij + γij̄ , γīj + γīj̄ )
p∗.j = p∗ij + p∗īj ∼ Be(γij + γīj , γij̄ + γīj̄ ).
Les hyperparamètres choisis sont les suivants :
αij = qi. q.j α.. , αij̄ = qi. q.j̄ α.. , αīj = qī. q.j α.. , αīj̄ = qī. q.j̄ α.. ,
0.5
avec α.. = et
qi. q.j
ni. + 0.5 nī. + 0.5 n.j + 0.5 n.j̄ + 0.5

qi. = , qī. = , q.j = , q.j̄ = .
n+1 n+1 n+1 n+1
Règle de décision utilisée pour la génération de signaux
La statistique d’intérêt est fondée sur l’Information Component défini pour la

cellule (i, j) comme !
p∗ij
IC∗ij = log2 .
p∗i. p∗.j
Un signal est généré si le quantile à 2.5% de la distribution de IC∗ij est plus grand
que 0 :
Q0.025 (IC∗ij ) > 0.
Que ce soit pour le modèle beta-binomial ou sa généralisation, la distribution de

IC∗ij n’a pas de forme analytique. La stratégie initiale décrite dans Bate et al. (1998)
consistait à en faire une approximation par une loi normale N{E(IC∗ij ), var(IC∗ij )},
les deux moments étant approximés par la delta méthode. Par la suite, ces deux
moments furent développés exactement dans l’article de Gould (2003) en utilisant le
fait que la fonction génératrice des moments d’une variable aléatoire Y = ln(X), où
X est distribuée selon une loi beta de paramètres (α, β), a la forme suivante :
Γ(α + t) Γ(α + β)
mY (t) = .
Γ(α + β + t) Γ(α)
où Γ indique la fonction gamma1 . Il est alors possible d’obtenir les moments d’ordre
1 et 2 de IC∗ij par dérivation à l’ordre 1 et à l’ordre 2 de la fonction génératrice des
Z ∞
1
Γ(x) = tx−1 e−t dt.
0
moments de IC∗ij prise au point 0 :

1
E(IC∗ij ) = Ψ(αij + nij ) − Ψ(αij + βij + n)
ln(2)

−Ψ(αi. + ni. ) + Ψ(αi. + βi. + n) − Ψ(α.j + n.j ) + Ψ(α.j + β.j + n)

1 (2 + n)2
= Ψ(1 + nij ) − Ψ
ln(2) (1 + ni. )(1 + n.j )

−Ψ(1 + ni. ) + Ψ(2 + n) − Ψ(1 + n.j ) + Ψ(2 + n)

1 (2 + n)2
var(IC∗ij ) = ′
Ψ (1 + nij ) − Ψ ′
ln(2)2 (1 + ni. )(1 + n.j )

′ ′ ′ ′
+Ψ (1 + ni. ) − Ψ (2 + n) + Ψ (1 + n.j ) − Ψ (2 + n)
où Ψ et Ψ′ indiquent respectivement les fonctions digamma et trigamma2 .

Dans l’article de Norén et al. (2006), les auteurs reconnaissent que l’utilisation de
la loi normale s’avère trop approximative pour les cellules contenant peu de notifi-
cations alors même que ces dernières sont les plus représentées dans la base. Ils pro-
posent par conséquent une méthode pour estimer plus finement Q0.025 (IC∗ij ). Celle-ci
repose sur l’équation suivante :
Q ij
[
b 0.025 (IC∗ ) = mode(IC∗ ˆ
ij ) − ∆ij
ˆ ij désigne l’estimation de l’écart entre le mode de la distribution de

dans laquelle ∆
IC∗ij et son quantile à 2.5%. L’estimateur employé pour le mode de IC∗ij est identique
2
Les fonctions digamma Ψ et trigamma Ψ′ sont définies comme les dérivées première et seconde
du logarithme de la fonction gamma Γ :
d d2
Ψ(x) = ln Γ(x) et Ψ′ (x) = ln Γ(x)
dx dx2
à celui utilisé pour estimer E(IC∗ij ) dans Bate et al. (1998) :
E(p∗ij )
[
mode(IC∗
ij ) = log2 .
E(p∗i. ) E(p∗.j )
∆ij est estimé à l’aide du modèle de régression suivant :
−1/2 −3/2
∆ij (γij ) = Ar γij + Br γij .
Les paramètres Ar et Br dépendent de r = γij / min(γi. , γ.j ). Ils sont estimés à l’aide
de simulations par Monte Carlo pour différentes configurations simulées basées sur
11 valeurs de r (0.0, 0.1, . . . , 1.0). Par la suite, pour une valeur observée de r, Ar
et Br sont calculés par interpolation linéaire. Le choix d’utiliser cette modélisation

plutôt que de recourir à l’estimation de Q0.025 (IC∗ij ) pour chaque couple (i, j) à l’aide
de simulations par Monte Carlo est justifié par la taille très importante de la base de
l’OMS.
2.3.2 La méthode Gamma Poisson Shrinker (GPS)
Le modèle
L’approche proposée par DuMouchel (1999) suppose que les nij sont distribués
selon une loi de Poisson :
nij ∼ Pn(λij eij )
où eij est une quantité fixe indiquant le nombre de notifications attendu dans la cellule
(i, j) en supposant l’indépendance entre les lignes (médicaments) et les colonnes
ni. n.j
(événements indésirables) de la table de contingence : eij = .
n
La distribution a priori choisie pour les λij est un mélange de deux lois gamma :
λij ∼ ŵ Ga(α̂1 , β̂1 ) + (1 − ŵ) Ga(α̂2 , β̂2 ),
dans laquelle les hyperparamètres θ̂ = (α̂1 , β̂1 , α̂2 , β̂2 , ŵ) sont calculés par maximisa-
tion de la vraisemblance marginale des nij :
f (n; e, α1 , β1 , α2 , β2 , w) (2.1)
Y ∞ Z
= fPn (nij ; λij eij ){w fGa (λij ; α1 , β1 ) + (1 − w) fGa (λij ; α2 , β2 )}dλij
ij 0
Y
= w fBn {nij ; α1 , β1 /(β1 + eij )} + (1 − w) fBn {nij ; α2 , β2 /(β2 + eij )}
ij
où n = {n11 , . . . , nIJ }, e = {e11 , . . . , eIJ } et fPn , fGa , fBn indiquent respectivement
les densités de probabilité de lois de Poisson, gamma et binomiale négative. Il s’agit
donc d’une approche bayésienne empirique.

La distribution a posteriori de λij est calculée de la manière suivante :
fPn (nij ; λij eij ){ŵ fGa (λij ; α̂1 , β̂1 ) + (1 − ŵ) fGa (λij ; α̂2 , β̂2 )}
f (λij| nij ) = R ∞
0
fPn (nij ; λij eij ){ŵ fGa (λij ; α̂1 , β̂1 ) + (1 − ŵ) fGa (λij ; α̂2 , β̂2 )}dλij
fPn (nij ; λij eij ){ŵ fGa (λij ; α̂1 , β̂1 ) + (1 − ŵ) fGa (λij ; α̂2 , β̂2 )}
=
ŵ fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )} + (1 − ŵ) fBn {nij ; α̂2 , β̂2 /(β̂2 + eij )}
fPn (nij ;λij eij ) fGa (λij ;α̂1 ,β̂1 )

ŵ fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )} fBn {nij ;α̂1 ,β̂1 /(β̂1 +eij )}
=
fPn (nij ;λij eij ) fGa (λij ;α̂2 ,β̂2 )

(1 − ŵ) fBn {nij ; α̂2 , β̂2 /(β̂2 + eij )} fBn {nij ;α̂2 ,β̂2 /(β̂2 +eij )}
+ .
(2.2)
En définissant wij comme :
ŵ fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )}

wij =
" #−1
1 − ŵ fBn {nij ; α̂2 , β̂2 /(β̂2 + eij )}
= 1+ , (2.3)
ŵ fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )}
l’expression (2.2) devient :
fPn (nij ; λij eij ) fGa (λij ; α̂1 , β̂1 )

f (λij| nij ) = wij
fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )}
fPn (nij ; λij eij ) fGa (λij ; α̂2 , β̂2 )

+ (1 − wij ) .
fBn {nij ; α̂2 , β̂2 /(β̂2 + eij )}
On en déduit que la distribution a posteriori de λij est un mélange de deux lois
gamma :
λij| nij ≡ λ∗ij ∼ wij Ga(α̂1 + nij , β̂1 + eij ) + (1 − wij ) Ga(α̂2 + nij , β̂2 + eij ). (2.4)
La méthode utilisée actuellement par la FDA propose en réalité un degré de

sophistication plus élevé pour le calcul du nombre de signaux attendu eij . Ce dernier
est calculé par stratification en tenant compte de variables comme l’âge ou le sexe
des patients. De plus, la méthode MGPS permet de s’intéresser à des associations

impliquant plusieurs médicaments et/ou plusieurs événements indésirables à l’aide
de modèles log-linéaires (DuMouchel et Pregibon, 2001; Agresti, 2002). Le travail
présenté ici s’est fondé uniquement sur le modèle de la méthode GPS.
2.4 Quelques remarques générales 18
Règle de décision utilisée pour la génération de signaux
La stratégie proposée initialement par DuMouchel (1999) consistait à ranger les

couples (i, j) en fonction de l’espérance a posteriori de E{log2 (λ)} :
E{log2 (λ∗ij )} = ln(2)−1 [wij {Ψ(α̂1 + nij ) − ln(β̂1 + eij )}
+(1 − wij ){Ψ(α̂2 + nij ) − ln(β̂2 + eij )}].
Plus tard, DuMouchel et Pregibon (2001) proposaient une autre possibilité consistant
à ranger les cellules selon le quantile à 5% de la distribution des λ∗ij : Q0.05 (λ∗ij ). Par
la suite, Szarfman et al. (2002) ont proposé le seuil de détection suivant :
Q0.05 (λ∗ij ) ≥ 2.
Cette règle de décision a notamment été utilisée dans une étude récente comparant
GPS à PRR (Almenoff et al., 2006).
2.4 Quelques remarques générales
D’autres méthodes ont été proposées mais ne semblent pas être employées actuel-
lement. On trouve par exemple une méthode utilisant le sequential probability ratio
test (Evans, 2003) ainsi que d’autres basées sur la distribution de Poisson, le calcul
du χ2 avec correction de Yates ou du Yule’s Q (van Puijenbroek et al., 2002).
Concernant les méthodes décrites plus haut, il est difficile de savoir de quelle
manière elles s’inscrivent effectivement dans le processus de surveillance des systèmes

de pharmacovigilance. La littérature rapporte néanmoins des travaux attestant de
leur utilité potentielle à travers des études rétrospectives (Lindquist et al., 2000;
Szarfman et al., 2002).
2.4 Quelques remarques générales 19
Actuellement, aucune méthode ne fait l’objet d’un consensus, les méthodes étant
finalement utilisées par les systèmes de pharmacovigilance les ayant développées.

Ceci s’explique aussi peut être par le fait que peu d’études comparant l’ensemble des
méthodes n’aient été publiées. Une étude sur données réelles a été proposée par van
Puijenbroek et al. (2002) mais en prenant BCPNN comme méthode de référence. La
seule étude de simulations visant à une comparaison de l’ensemble des méthodes a

été proposée par Roux et al. (2005) et indique que les méthodes bayésiennes sont les
plus performantes du point de vue de la sensibilité et spécificité.
Enfin, les seuils choisis pour la génération de signaux ont été le sujet de peu
d’investigations et sont, somme toute, arbitraires. L’objet du chapitre suivant est de

proposer un cadre statistique général permettant notamment d’assoir le choix de ces
seuils pour les principales méthodes de détection automatique.
Chapitre 3
Méthodes de détection
automatique revisitées dans le
cadre des comparaisons multiples
Les méthodes présentées dans le chapitre précédent s’appuient sur des seuils ne
prenant pas en compte la multiplicité des comparaisons réalisées si bien qu’aucun
critère statistique n’accompagne les listes de signaux générés. Il existe une littérature
abondante consacrée à la prise en compte de la multiplicité des comparaisons. Les
méthodes sont basées sur l’estimation ou le contrôle de critères d’erreurs tels que
le Family Wise Error Rate (FWER, Hochberg et Tamhane, 1987) défini comme la
probabilité de commettre une fausse découverte ou le False Discovery Rate (FDR,
Benjamini et Hochberg, 1995) défini comme l’espérance du taux de faux positifs. Ce
dernier étant moins restrictif que le FWER, il permet un gain de puissance et est plus
adapté pour les analyses dans lesquelles un très grand nombre de comparaisons est
réalisé. Depuis l’article de Benjamini et Hochberg (1995), beaucoup de procédures ont
été proposées pour estimer ou contrôler le FDR ou des quantités dérivées. La nature
20
3.1 Comparaisons multiples et méthodes fréquentistes 21
fréquentiste et bayésienne des méthodes de pharmacovigilance nous a conduit à nous
intéresser à deux types d’approches. La première se fonde sur la modélisation des

degrés de signification par un modèle de mélange tandis que la deuxième approche
utilise le cadre décisionnel de la statistique bayésienne.
3.1 Comparaisons multiples et méthodes fréquentistes
3.1.1 ROR, PRR et test d’hypothèses
L’objectif des méthodes de détection automatique est de générer des signaux

pour lesquels le nombre de cas notifiés est significativement supérieur à ce qui aurait
été observé en cas d’indépendance entre le médicament et l’événement indésirable
considéré dans la table de contingence. Si l’on prend l’exemple de la méthode ROR,
la mesure d’association étant l’odds ratio, il s’agit donc de tester pour un couple
donné (i, j) :
H0ij : ψij ≤ ψ0 versus H1ij : ψij > ψ0 . (3.1)
Le même raisonnement peut être aussi effectué avec la méthode PRR, la mesure
d’association d’intérêt devenant le risque relatif. Pour la méthode ROR, une “vraie
association dans la base” est définie par ψ > 1 ce qui conduit à choisir naturellement
ψ0 = 1. Néanmoins, on peut aussi s’intéresser à des associations plus fortes et donc
utiliser des valeurs pour ψ0 strictement supérieures à 1.

A partir de (3.1) on peut donc proposer le calcul des degrés de signification
suivant : pij = 1 − FN [ln(ψ̂ij ); ln(ψ0 ), var{ln(ψ̂ij )}1/2 ] où FN {ln(ψ̂ij ); a, b} indique la
fonction de répartition au point ln(ψ̂ij ) d’une loi normale N(a, b). En particulier, la
méthode proposée par van Puijenbroek et al. (2002) consiste à définir une région de
rejet à 2.5% pour les degrés de signification que ce soit pour la méthode ROR ou
PRR. En revanche, il n’est pas possible de trouver d’équivalent à la règle de décision
proposée par Evans et al. (2001).
3.1.2 Test exact de Fisher et mid-P-values
Une grande proportion des couples dans la base étant associée à de faibles nombres
de notifications, nous proposons d’étudier le test de Fisher comme alternative aux
méthodes PRR et ROR. Ce test est simple et ne repose sur aucune approximation
de distribution. Dans la suite de l’exposé, il sera appelé RFET (pour Reporting Fi-
sher’s Exact Test) par souci d’homogénéité avec les appellations des autres méthodes
fréquentistes.
Pour une cellule donnée (i, j) le test est construit en supposant que les comptages
marginaux (ni. , n.j et n) sont fixes et la variable aléatoire Nij est distribuée selon
une loi hypergéométrique décentrée (Agresti, 2002). On a donc :

ni. n − ni. n
ψijij
nij n.j − nij
Pr(Nij = nij ; ni. , n.j , n, ψij ) = x=min(ni. ,n.j ) . (3.2)
X ni. n − ni. x
ψ
x n.j − x ij
x=max(0,ni. +n.j −n)
Lorsque ψij = 1, la formule (3.2) se réduit à la probabilité d’une loi hypergéométrique.
Les degrés de signification associés au test (3.1) sont calculés de la manière suivante :
pij = Pr(Nij ≥ nij | ni. , n.j , n, ψ0 ). Par ailleurs, comme le test de Fisher est connu
pour être conservatif, nous avons aussi étudié l’utilisation des mid-P-values définies
1
comme 2
Pr(Nij = nij ; ni. , n.j , n, ψ0 ) + Pr(Nij > nij ; ni. , n.j , n, ψ0 ) (Agresti, 2002).
Par la suite, l’association des mid-P-values avec le test exact de Fisher sera notée
midRFET.
3.1.3 FDR et méthodes fréquentistes
Si l’on désigne par V et R les deux variables aléatoires correspondant respecti-

vement au nombre de fausses découvertes et au nombre de signaux générés, alors le
FDR tel qu’il est défini par Benjamini et Hochberg (1995) s’écrit :

V
FDR = E |R > 0 Pr(R > 0).
R
Plus récemment Storey (2002) a popularisé un critère dérivé du FDR : le pFDR

(pour positive FDR) défini comme

V
pFDR = E |R > 0 .
R
Ces deux critères sont asymptotiquement équivalents puisque Pr(R > 0) tend vers
1 lorsque le nombre de comparaisons augmente. Comme le nombre de comparaisons
réalisées en pharmacovigilance est très important, nous utiliserons indifféremment la

notation FDR.
L’approche proposée par Storey (2002) s’appuie sur la modélisation des statis-
tiques d’intérêt notées Pij supposées i.i.d selon un mélange de deux distributions :
f (p) = π0 f0 (p) + (1 − π0 )f1 (p), (3.3)
dans lequel f0 et f1 sont les densités de probabilité de Pij sous l’hypothèse nulle
et alternative. π0 représente donc la probabilité marginale de l’hypothèse nulle. En

particulier, lorsque les Pij sont des degrés de signification, Storey montre que le FDR
associé à une région de rejet pour les degrés de signification [0, γ] avec γ ∈ [0, 1] est
égal à
π0 F0 (γ)
FDR(γ) = (3.4)
F (γ)
où F0 indique la fonction de répartition des degrés de signification au point γ sous
l’hypothèse nulle et F la fonction de répartition marginale au point γ. Il s’agit donc

de la probabilité a posteriori de l’hypothèse nulle.
Cas d’hypothèses simples
Dans le cas de tests d’hypothèses nulles simples, la distribution des degrés de

signification sous l’hypothèse nulle est uniforme. Le modèle (3.3) se ramène donc à
f (p) = π0 + (1 − π0 )f1 (p) (3.5)
et l’équation (3.4) peut donc s’exprimer comme
π0 γ
FDR(γ) = .
F (γ)
F (γ) peut être estimée en utilisant la distribution empirique des degrés de significa-
tion observés : P
ij 1[pij ≤γ]
F̂ (γ) =
m
où 1[·] représente la fonction indicatrice et m indique le nombre d’hypothèses testées.

La principale difficulté réside donc dans l’estimation de π0 .
Sans hypothèse distributionnelle sur f1 , le modèle (3.5) est non identifiable et
seule une borne supérieure de π0 peut être estimée ce qui conduit à surestimer le
FDR. Il existe un grand nombre de procédures destinées à estimer un majorant de
π0 . Il s’agit le plus souvent d’estimer π0 +(1−π0 ) inf p {f1 (p)}. C’est le cas par exemple
de la procédure Qvalue développée par Storey et Tibshirani (2003) qui est la plus
utilisée actuellement.
La procédure Qvalue La procédure Qvalue s’appuie sur l’estimateur de π0 pro-
posé par Schweder et Spjøtvoll (1982). Cet estimateur repose sur l’hypothèse qu’il
existe une valeur λ ∈ [0, 1] telle que f1 est nulle pour toute valeur de p ≥ λ et donc
que F1 (p) = 1. Il s’ensuit d’après l’équation (3.5) :
F (λ) = π0 λ + (1 − π0 )
ce qui conduit à l’estimateur suivant :
1 − F̂ (λ)
π̂0 (λ) = . (3.6)
1−λ
L’approche de Storey et Tibshirani (2003) a pour objectif de calculer (3.6) lorsque λ

tend vers 1, c’est-à-dire f (1). Pour cela, π̂0 (λ) est calculé pour un ensemble de valeurs
de λ. Une fonction de lissage par splines cubiques est ensuite ajustée à l’ensemble de
ces points. L’estimation de π0 correspond à la valeur de cette fonction au point 1.
D’autres procédures sont aussi couramment citées telles que la procédure LBE
(pour Location Based Estimator ) qui a démontré de bonnes performances par si-
mulations (Dalmasso et al., 2005; Lai, 2007) et qui jouit de certaines propriétés
asymptotiques. Notre travail s’est principalement appuyé sur cette procédure.
La procédure Location Based Estimator LBE est fondée sur l’égalité sui-
vante :
E{ϕ(P )} E1 {ϕ(P )}
= π0 + (1 − π0 ) (3.7)
E0 {ϕ(P )} E {ϕ(P )}
| {z0 }
biais, ≥0
où E0 {ϕ(P )} et E1 {ϕ(P )} indiquent respectivement l’espérance d’une transformation

ϕ des degrés de signification sous l’hypothèse nulle et sous l’hypothèse alternative. La
transformation ϕ(p) = {− ln(1−p)}a avec a ∈ IR+ est choisie de manière à minimiser
le terme positif dans l’équation (3.7) ce qui conduit à l’estimateur de π0 suivant :
1
P 1
P
Ê{ϕ(P )} m ij ϕ(pij ) m ij {− ln(1− pij )}a
π̂0 = = =
E0 {ϕ(P )} E0 {ϕ(P )} Γ(a + 1)
où Γ(·) indique la fonction gamma. Une propriété intéressante de l’estimateur LBE
est qu’il est asymptotiquement distribué selon une loi normale avec une variance
bornée par

1 Γ(2a + 1)
var(π̂
¯ 0(a) ) = −1 . (3.8)
m Γ(a + 1)2
Dalmasso et al. (2005) montrent que le biais de LBE diminue lorsque a augmente
alors que var(π̂
¯ 0(a) ) augmente avec a. Dans la suite, a est choisi de manière à ce que
l’écart type de LBE soit inférieur à 0.05.
Cas d’hypothèses unilatérales
Comme l’indique (3.1), les hypothèses testées dans le cas de la pharmacovigilance
sont unilatérales. Or les degrés de signification ne sont pas calculés sous H0 mais sous
l’hypothèse H0∗ : ψij = ψ0 . Par conséquent la distribution des degrés de signification
n’est pas uniforme sous H0 . Au vu des histogrammes des densités marginales ob-
servés sur les données de la base française de pharmacovigilance pour les différentes
méthodes (illustrés pour la méthode midRFET par la figure 3.1), nous faisons l’hy-
pothèse que la distribution f0 des degrés de signification sous H0 est une fonction
croissante résultant du mélange d’une distribution uniforme et d’une fonction crois-
sante f1∗ (p), pour laquelle il existe une valeur p0 ∈ [0, 1] telle que f1∗ (p0 ) = 0. Il en
résulte que le modèle (3.3) peut s’exprimer de la manière suivante :
f (p) = π0 f0 (p) + (1 − π0 )f1 (p)
= π0 {π0∗ + (1 − π0∗ )f1∗ (p)} + (1 − π0 )f1 (p) (3.9)

et (3.4) comme suit :
π0 {π0∗ F0∗ (γ) + (1 − π0∗ ) F1∗ (γ)}

FDR(γ) = . (3.10)
F (γ)
En pratique, les valeurs de FDR supérieures à 0.15 ne nous intéressent pas si bien
que seules les faibles valeurs de γ seront considérées. Si l’on suppose qu’elles sont
inférieures à p0 , alors (3.10) se réduit à
π0 π0∗ γ
FDR(γ) = .
F (γ)
L’objectif devient donc d’estimer π0 π0∗ . Récemment Pounds et Cheng (2006) ont
étudié par simulation un cas particulier de la méthode LBE dans lequel ϕ est choisie
comme fonction identité. Dans le cas de tests unilatéraux, ils proposent d’appliquer
LBE sur la transformation P ∗ = 1 − 2|P − 21 |. Pour être complètement rigoureux, il
nous faut montrer que P ∗ a une distribution décroissante.
Lemme : Si P ∗ = 1 − 2|P − 21 | où P désigne une variable aléatoire définie sur [0, 1]
dont la densité de probabilité peut s’exprimer comme :
f (p) = π0 {π0∗ + (1 − π0∗ )f1∗ (p)} + (1 − π0 )f1 (p)
et où f1∗ et f1 sont des fonctions dérivables, convexes, respectivement croissantes et

décroissantes, alors la densité de probabilité de P ∗ est décroissante et peut s’exprimer
de la manière suivante :
fP ∗ (p∗ ) = π0 π0∗ + (1 − π0 π0∗ )f1P ∗ (p∗ ).

Démonstration : Soient FP ∗ et F les fonctions de répartition de P ∗ et P .
FP ∗ (p∗ ) = Pr(P ∗ ≤ p∗ )
= Pr(P ∗ ≤ p∗| P ≤ 12 ) Pr(P ≤ 21 ) + Pr(P ∗ ≤ p∗| P > 21 ) Pr(P > 12 ).
Pour P ∈ [0, 21 ], on a P ∗ = 2P et pour P ∈ [ 12 , 1], on a P ∗ = 2(1 − P ). FP ∗ peut donc

s’écrire de la manière suivante :
FP ∗ (p∗ ) = Pr(2P ≤ p∗ ∩ P ≤ 12 ) + Pr{2(1 − P ) ≤ p∗ ∩ P > 21 }

p∗
+ Pr(P ≥ 1− p2 )
∗
= Pr(P ≤ 2
)
= F ( p2 ) + 1 − F (1− p2 ).
∗ ∗
On a donc :
fP ∗ (p∗ ) = 12 f ( p2 ) + 21 f (1− p2 )
∗ ∗
et :
fP′ ∗ (p∗ ) = 41 f ′ ( p2 ) − 41 f ′ (1− p2 ).

∗ ∗
fP′ ∗ est négative puisque fP ∗ est convexe car définie comme combinaison linéaire
positive de deux fonctions convexes. Par conséquent, fP ∗ est décroissante.
De plus, la fonction de répartition de P peut être exprimée comme :
f (p) = π0 π0∗ + (1 − π0 π0∗ )f1P (p),
ce qui conduit à :
fP ∗ (p∗ ) = + (1 − π0 π0∗ )f1P ( p2 )} + 21 {π0 π0∗ + (1 − π0 π0∗ )f1P (1− p2 )}

∗ ∗
1
2
{π0 π0∗
= π0 π0∗ + 21 (1 − π0 π0∗ ){f1P ( p2 ) + f1P (1− p2 )}.

∗ ∗
3.2 Comparaisons multiples et méthodes bayésiennes 29
On peut par conséquent appliquer les méthodes LBE, Qvalue ainsi que d’autres
telles que BUM (Pounds et Morris, 2003) ou SPLOSH (Pounds et Cheng, 2004) pour
estimer un majorant de π0 π0∗ .
ψ0 = 1 ψ0 = 2 ψ0 = 5
8
8
6
6
f (p )
f (p )
f (p )
4
4
2
2
π0π0* = 0.581 π0π0* = 0.437
π0π0* = 0.243
0
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
(a) (b) (c)
Fig. 3.1: Histogrammes de la densité marginale des degrés de signification obtenus à

partir de la méthode midRFET sur les cellules non-vides de la base française (codage
ATC5 - HLT, 1984-2003) pour des valeurs de ψ0 = 1, 2 ou 5. Les lignes horizontales
matérialisent les estimations de π0 π0∗ obtenues avec la méthode LBE.
Il est à noter que l’approche proposée pour estimer un majorant de π0 π0∗ s’ap-
puie sur une modélisation des degrés de signification au moyen d’un mélange à trois
composantes (cf (3.9)) pour lesquelles nous avons choisi de recourir à très peu d’hy-
pothèses distributionnelles. La principale conséquence de ce choix est que l’ensemble
des poids des différentes composantes ne peut être estimé. En particulier, ni π0∗ , ni
même π0 , c’est-à-dire la proportion d’hypothèses nulles ne peuvent être obtenus sans
hypothèses distributionnelles supplémentaires sur f1∗ et f1 .
3.2 Comparaisons multiples et méthodes bayésiennes
Une grande partie des méthodes proposées pour l’estimation du FDR repose sur
la modélisation de la distribution marginale de la quantité d’intérêt au moyen de mé-
lange de distributions, une composante représentant généralement l’hypothèse nulle,
l’autre ou les autres l’hypothèse alternative. Cette approche par modèle de mélange
a donné lieu à de nombreux travaux dans le cadre bayésien, développés pour l’ana-
lyse des biopuces dans les études comparatives en génomique (Broët et al. (2004);
Newton et al. (2004); Gottardo et al. (2006); Lewin et al. (2007)). Le modèle y est
formulé soit avec un mélange au niveau des observations ou de statistiques fonctions
des observations, soit au niveau de la distribution a priori des paramètres gouver-

nant l’expression différentielle des gènes. Le cadre bayésien conduit naturellement à
fonder la règle de décision sur la probabilité a posteriori de l’hypothèse nulle qui
dans le cas d’un modèle de mélange correspond à calculer pour chaque “individu” sa
probabilité d’appartenance à la composante nulle conditionnellement aux données.

Pour un ensemble d’individus sélectionnés à partir d’un seuil sur cette règle de déci-
sion, le FDR est simplement estimé par la moyenne de leur probabilité a posteriori
de l’hypothèse nulle. Cette quantité joue donc un rôle double en intervenant à la fois
dans la sélection des individus et dans l’estimation du FDR.
La méthode GPS étant fondée sur un modèle de mélange, il pourrait sembler

naturel d’envisager ce type d’approche. Néanmoins, comme il est souligné dans la
discussion de DuMouchel (1999), les deux composantes n’ont pas vocation à mo-
déliser les hypothèses en concurrence, en témoigne l’approche bayésienne empirique
utilisée pour la détermination des hyperparamètres. Nous verrons cependant, dans

la partie 3.2.2, que ce modèle a récemment été généralisé par Gould (2007) dans
l’esprit des travaux cités ci-dessus. L’approche que nous proposons s’appuie sur le
cadre décisionnel bayésien proposé par Müller et al. (2004) et ne repose pas sur la
modélisation par mélanges de distributions ce qui permet notamment de l’appliquer

directement aux deux méthodes bayésiennes existantes en pharmacovigilance.
3.2.1 GPS et BCPNN dans le cadre bayésien de la théorie de la
décision
Estimation bayésienne du FDR et du FNR
Pour chacune des cellules (i, j) on définit d’une part zij ∈ {0, 1} comme l’indica-
trice du statut inconnu de l’hypothèse testée (zij = 0 signifie que l’hypothèse nulle
testée est vraie). D’autre part dij ∈ {0, 1} est l’indicatrice de la décision de générer
un signal. A partir de ces deux quantités, la proportion de fausses découvertes (FDP)
et de faux négatifs (FNP) s’écrivent de la manière suivante :
P P
ij (1
− zij )dij ij (1
− dij )zij
FDP = P et FNP = P .
ij dij m − ij dij
Comme le soulignent Müller et al. (2004), FDR = E(FNP) et FNR = E(FNP) sont
difficiles à obtenir car ces quantités font intervenir des ratios de variables aléatoires.
Ils proposent donc de s’intéresser à leur équivalent bayésien, à savoir les espérances
a posteriori de FDP et FNP que l’on notera FDR∗ et FNR∗ . En particulier, si l’on
considère que la décision dij se fonde uniquement sur les données observées alors le
calcul de FDR∗ et FNR∗ est direct :
P P
ij (1 − vij )dij ij (1
− dij )vij
FDR∗ = P et FNR∗ = P (3.11)
ij dij m − ij dij
où vij = Pr(zij∗ = 1) indique la probabilité a posteriori que l’hypothèse alternative
soit vraie.
La détermination de vij dépend à la fois de l’hypothèse nulle testée et du modèle
de probabilité supposé. Ainsi, si l’on utilise la méthode GPS et que l’on s’intéresse à
de vraies associations dans la base, alors vij = Pr(λ∗ij > 1). Dans le cas de BCPNN
on a vij = Pr(IC∗ij > 0). Plus généralement, pour une valeur donnée de RR0 et pour
GPS, on peut définir vij de la manère suivante :
vij (GPS, RR0 ) = Pr(λ∗ij > RR0 )
= 1 − {wij FGa (RR0 ; α̂1 + nij , β̂1 + eij )
+(1 − wij ) FGa (RR0 ; α̂2 + nij , β̂2 + eij )}
où FGa (RR0 , s, t) indique la fonction de répartition d’une loi gamma de paramètre s
et t au point RR0 .
Dans le cas de BCPNN, on a :
vij (BCPNN, RR0 ) = Pr{IC∗ij > log2 (RR0 )}

∗
pij
= Pr ∗ ∗ > RR0 .
pi. p.j
La distribution exacte de IC∗ij n’a pas de forme analytique. Dans le cas de la version
initiale de la méthode BCPNN (Bate et al., 1998), la distribution de IC∗ij est supposée
être normale et il est donc facile de calculer vij . Cette approximation n’est plus faite
dans l’extension proposée par Norén et al. (2006) qui proposent uniquement une
nouvelle estimation de Q0.025 (IC∗ij ). Néanmoins, on peut obtenir pour chacune des
cellules (i, j) la distribution de IC∗ij à l’aide de simulations par Monte Carlo. Cette
solution est cependant très coûteuse en temps de calcul, en particulier si l’on souhaite
obtenir une précision raisonnable pour vij (BCPNN, RR0 ).
Règles de décision pour la génération de signaux
La règle de décision (dij ) que nous avons choisi d’étudier est celle proposée par
Müller et al. (2004). Elle se fonde sur vij et les auteurs ont montré qu’elle était
optimale selon plusieurs fonctions de coûts combinant FDR∗, FNR∗ ou des quantités
apparentées. dij est donc définie de la manière suivante : dij = 1[vij >1−α] où 1[·]
indique la fonction indicatrice.

Les règles de décision en vigueur pour BCPNN et GPS (décrites dans les para-
graphes 2.3.1 page 13 et 2.3.2 page 18) peuvent être formulées dans le cadre déci-
sionnel proposé par Müller et al.. Dans le cas de la méthode BCPNN, la règle de
décision utilisée par l’OMS correspond à définir l’hypothèse testée et la décision pour
la génération d’un signal sur la base de RR0 = 1 et α = 0.025. Pour GPS, la règle de
décision proposée par Szarfman et al. (2002) revient à utiliser RR0 = 2 et à générer
des signaux en fixant α à 0.05.
Remarquons que dans les articles de DuMouchel (1999) et de DuMouchel et Pre-

gibon (2001), les cellules sont rangées selon E{log2 (λ∗ij )} ou Q0.05 (λ∗ij ). L’approche
proposée ici diffère en ce que les cellules sont classées par rapport à 1 − vij .
Estimation bayésienne de la sensibilité et de la spécificité
La sensibité (Se) et la spécificité (Sp) observées sont définies de la manière sui-

vante : P P
ij zij dij ij (1
− dij )(1 − zij )
Se = P et Sp = P .
ij zij m − ij zij
McLachlan et al. (2006) proposent d’estimer ces deux quantités en remplaçant zij
par son espérance a posteriori vij ce qui conduit aux estimateurs suivants :
P P
∗ ij vij dij ∗ ij (1
− dij )(1 − vij )
Se = P et Sp = P .
ij vij m − ij vij
3.2.2 Autres approches proposées pour la prise en compte des
comparaisons multiples à partir du modèle GPS
Deux approches différentes de celle étudiée dans ce travail ont récemment été
proposées par Gould (2007) à partir du modèle GPS. La première, reprenant une idée
de Roux et al. (2005), propose de donner une interprétation aux deux composantes
du modèle de mélange de DuMouchel (1999). Chaque cellule se voit donc associer
une indicatrice zij de son appartenance à l’une des deux lois gamma.
λij| zij ∼ (1 − zij ) Ga(α1 , β1 ) + zij Ga(α2 , β2 ).
zij est supposé suivre a priori une loi de Bernouilli de paramètre w lui même distribué
selon une loi beta de paramètres ξ et 1 avec ξ choisi entre 3 et 4.

La statistique d’intérêt est la suivante :
Pr(zij = 0 | n, e, α1 , β1 , α2 , β2 , ξ) = (3.12)
Z 1 " #−1
1 − w fBn {nij ; α2 , β2 /(β2 + eij )}
1+ f (w| n, e, α1 , β1 , α2 , β2 , ξ) dw
p=0 w fBn {nij ; α1 , β1 /(β1 + eij )}
avec f (w| n, e, α1 , β1 , α2 , β2 , ξ) ∝
Y
fBe (w; ξ, 1) w fBn {nij ; α1 , β1 /(β1 + eij )}
ij

+ (1 − w) fBn {nij ; α1 , β1 /(β1 + eij )} .
Notons que dans le travail de Roux et al. (2005), il s’agissait simplement de wij (cf
(2.3), page 17) correspondant au terme entre crochets de l’équation (3.12).

Cette approche se veut plus subjective que celle proposée par DuMouchel (1999)
dans la mesure où l’utilisateur doit spécifier les hyperparamètres des deux lois gamma
et déterminer de ce fait la distribution a priori de λij en présence et en absence
d’association. Les cellules sont classées selon (3.12) qui tient compte naturellement
de la multiplicité des comparaisons (Scott et Berger, 2006) sans que pour autant ne
soit proposé de seuil de détection basé sur des critères tels que le FDR.
La seconde approche proposée par Gould (2007) consiste à utiliser la procédure
Qvalue de Storey et Tibshirani (2003) sur Pr(λ∗ij ≤ RR0 ) = 1 − vij (GPS, RR0 )
(cf (3.12)) ; l’idée étant que sous l’hypothèse nulle λij ≤ RR0 , Pr(λ∗ij ≤ RR0 ) est,
de manière analogue aux degrés de signification, distribuée selon une loi uniforme.
Cependant, cette hypothèse ne semble pas vérifiée en pratique sur nos données comme
l’illustre la figure 3.2 pour RR0 = 1. En effet, on observe un pic important pour les
valeurs de Pr(λ∗ij ≤ 1) proches de 1.
4
3
2
1
0
0.0 0.2 0.4 0.6 0.8 1.0
Pr(λij* ≤ 1)
Fig. 3.2: Histogramme de la distribution de Pr(λ∗ij ≤ 1) obtenu à partir des données

de la base française (codage ATC5 - HLT, 1984-2003) à partir de cellules avec nij ≥ 3.
3.3 Quelques remarques 36
3.3 Quelques remarques
Partant avec l’idée de proposer des seuils de détection plus objectifs se basant
sur la prise en compte de la multiplicité des comparaisons, ce travail nous a conduit
d’une part à la proposition d’un nouveau modèle pour la détection automatique de

signaux, à savoir midRFET, et d’autre part à la proposition de statistiques d’inté-
rêt alternatives pour les méthodes existantes : les degrés de signification pour les
méthodes fréquentistes et la distribution a posteriori de l’hypothèse nulle pour les
méthodes bayésiennes. Des méthodes existantes, nous ne conservons finalement que

les modèles de probabilité sous-jacents, les règles de décision ainsi que les seuils de
détection ayant été modifiés.
Le tableau 3.1 récapitule l’ensemble des méthodes étudiées.
Modèle Méthodes existantes Nouvelles méthodes

Statistique Décision H0ij Statistique Décision
ROR Borne inf. >0 ψij ≤ ψ0 degré de FDR
normal de l’int. de signification
conf. à 95%
de ln(ψ̂ij )
PRR ϕ̂ij ≥ 2, nij ≥ 3, χ21 ≥ 4
normal Borne inf. >0 ϕij ≤ ϕ0 degré de FDR
de l’int. de signification
conf. à 95%
de ln(ϕ̂ij )
RFET ψij ≤ ψ0 degré de FDR
hypergéométrique signification
midRFET ψij ≤ ψ0 Mid-P-value FDR
hypergéométrique
BCPNN Q0.025 (IC∗ij ) >0 ICij ≤ RR0 Pr(H0∗ij ) FDR
Dirichlet- Monte Carlo
multinomial
GPS E{log2 (λ∗ij )} classement λij ≤ RR0 E{log2 (λ∗ij )} FDR†
Poisson- Q0.05 (λ∗ij ) classement λij ≤ RR0 Q0.05 (λ∗ij ) FDR†
2 gamma ∗
Q0.05 (λij ) >2 λij ≤ RR0 Pr(H0∗ij ) FDR
†Ces cas correspondent à l’utilisation des règles de classement proposées par DuMouchel (1999) et
DuMouchel et Pregibon (2001) en association avec un seuil fondé sur le FDR.
Tab. 3.1: Tableau récapitulatif des méthodes étudiées.

3.3 Quelques remarques 37
Dans un souci de clarté, en l’absence de précision, les appellations ROR, RFET,
midRFET et BCPNN feront désormais références aux modèles de probabilité en as-

sociation avec les règles de classement proposées. En revanche, GPS sera utilisé pour
désigner uniquement le modèle de probabilité et nous préciserons systématiquement
la règle de classement utilisée.
Il s’agit donc maintenant d’évaluer l’apport de ces nouvelles méthodes par rap-
port aux méthodes existantes mais aussi de caractériser et comparer l’ensemble des
approches proposées afin de conclure sur l’éventuelle supériorité de l’une d’entres
elles. C’est l’objet des deux chapitres suivants.
Chapitre 4
Étude de simulations
La seule étude de simulations comparant l’ensemble des méthodes de détection
déjà existantes en pharmacovigilance a été proposée par Roux et al. (2005) selon un
modèle de simulation décrit dans Roux et al. (2003, 2007). Dans cette étude, pour
chaque couple médicament i événement j, le nombre de notifications nij obtenu sur
une période ∆t = [t, t + ∆] est supposé suivre une loi de Poisson :
nij (∆t ) ∼ Po{RRij · Ti (t) · Ij · pij (t)}
où
– RRij indique pour l’événement j, le risque relatif lié à l’exposition au médica-

ment i,
– Ti (t) indique la fréquence d’exposition au médicament i, c’est-à-dire le nombre
de patients exposés au médicament i au temps t,
– Ij indique l’incidence de base de l’événement j et

– pij (t) indique la probabilité de notification du couple médicament i événement
j au temps t.
38
39
Le système de notifications spontanées est simulé sur une période de 10 ans pour
150 médicaments et 100 événements indésirables. Le statut d’un couple est défini à
partir de RRij qui vaut 1 en cas d’absence d’association (90% des couples), ou qui
suit une loi exponentielle sur l’intervalle [1.2, 10]. Le plan de simulation affecte aussi
une date de “mise sur le marché” aux médicaments ainsi qu’un niveau de gravité,
sous forme de variable binaire, aux événements indésirables. La quantité clef de cette
modélisation est la probabilité de notification pij (t). Cette dernière varie au cours du
temps en fonction de règles floues basées sur la date de lancement du médicament,
la gravité de l’événement ainsi que du nombre de notifications cumulées au temps
t. La fréquence d’exposition obéit aussi à des règles floues déterminées sur la base
de l’ancienneté du médicament et dépend d’une exposition maximale prenant trois
valeurs : 3 millions, 300 000 et 30 000. Enfin, pour chaque événement j, l’incidence
de base est choisie parmi deux valeurs : 1/50 000 et 1/10 000.
Le plan de simulation que nous proposons n’a pas pour but de simuler un système
complet de notifications mais plutôt d’obtenir des données ressemblant aux données
étudiées du point de vue des risques observés (nij /eij ) et des comptes marginaux
(ni. , n.j et n). Pour ce faire, des caractéristiques de la base étudiée sont utilisées dans
le processus de génération des données.
L’objectif global de cette étude par simulations est de comparer les performances
des différentes méthodes ainsi que d’évaluer la qualité des estimateurs proposés pour
différentes quantités caractéristiques : le FDR dans le cas des méthodes fréquentistes,
le FDR, le FNR, la sensibilité et la spécificité dans le cas des méthodes bayésiennes.
Dans la première partie de ce chapitre, nous présentons la procédure de simulation

des données proposée. Nous exposons ensuite les résultats de la comparaison des
méthodes fréquentistes d’une part, et des méthodes bayésiennes d’autre part avant
de présenter les résultats de la comparaison de l’ensemble des méthodes évaluées.
4.1 Modèle de simulation 40
Pour terminer, nous confrontons ces résultats à ceux obtenus à partir d’une étude
par simulations utilisant des données générées suivant le modèle de Roux et al. (2005).
4.1 Modèle de simulation
Le plan de simulation s’appuie sur la représentation des données sous la forme

d’une table de contingence. Pour chaque jeu de simulation s, un vecteur de notifica-
tions ns = (ns11 , . . . , nsIJ ) de longueur égale au nombre de cellules de la base française
est généré selon une loi multinomiale
ns ∼ Mu(n, ps )
où n correspond à la somme des nij observés dans la base de pharmacovigilance

étudiée et ps = (ps11 , . . . , psIJ ).
La génération de ps se fait de la manière suivante. Deux vecteurs temporaires
sont générés selon deux lois de Dirichlet utilisant les comptes marginaux de la base
française comme paramètres :
(psw1. , psw2. , . . . , pswI.) ∼ Di(n1. , n2. , . . . , nI. )
(psw.1 , psw.2, . . . , psw.J ) ∼ Di(n.1 , n.2 , . . . , n.J ). (4.1)
s
D’autre part, pour chaque cellule (i, j), un risque temporaire rwij est généré selon
l’exponentiel d’une loi logistique de paramètres 0 et 0.5.
Le calcul de psij se fait à partir de ces trois quantités :
s
rwij pswi. psw.j
psij = P s s s .
ij rwij pwi. pw.j
Les probabilités marginales d’être exposé au médicament i ou d’observer l’événement
indésirable j sont respectivement :
X X
psi. = psij et ps.j = psij .
j i
Les comptes marginaux sont calculés de la manière suivante :
X X X
nsi. = nsij , ns.j = nsij , et ns = nsij .
j i ij
Les méthodes de génération de signaux sont fondées sur différentes mesures d’as-
sociation. Pour la méthode PRR, il s’agit du risque relatif :
psij /psi.
ϕsij = s .
(p.j − psij )/(1 − psi. )
Pour les méthode ROR, RFET, et midRFET, la mesure d’intérêt est l’odds ratio :
psij (1 + psij − psi. − ps.j )

ψijs = ,
(psi. − psij ) (ps.j − psij )
tandis que pour les méthodes bayésiennes, c’est encore d’un autre risque dont il
s’agit :
psij
RRij = s s .
pi. p.j
Dans l’étude de simulations que nous avons menée, les différentes méthodes ont été
évaluées du point de vue de leur mesure d’association respective.
Le choix d’une distribution logistique ainsi que de ses paramètres a été fait sur
la base d’une comparaison graphique entre la distribution empirique du logarithme
des risques observés simulés (ln(nsij ) − ln(esij )) et celle observée sur la base française.
La figure 4.1 illustre cette comparaison pour 50 jeux de simulations. Le nombre de
cellules non vides a aussi été pris en compte.
0.4
0.3
0.2
0.1
0.0
−5 0 5 10
Fig. 4.1: Histogrammes du logarithme des risques observés dans la base française
et dans les données simulées. L’histogramme pour les données simulées (gris) a été
obtenu à partir de 50 jeux de données.
Les jeux de données générés contenant un ou plusieurs comptes marginaux nuls
ont été systématiquement éliminés. Afin d’en réduire l’occurrence, les comptes mar-
ginaux de la base française inférieurs à 5 n’ont pas été utilisés pour le calcul des
vecteurs temporaires (cf (4.1)).
Finalement, 500 jeux de données ont été générés de dimension 634 × 756 avec n
égal à 1 196 487. Le nombre moyen de cellules non vides observé pour les jeux simulés
est de 103 131 contre 97 256 pour les données réelles.

Dans la majeure partie de l’étude par simulations, nous avons restreint l’analyse
aux cellules avec au moins trois notifications dans la mesure où peu de systèmes
accordent foi à des signaux générés sur la base d’une ou deux notifications. Lorsque
les analyses sont restreintes de cette manière, les mesures de disproportionnalité

4.2 Comparaison des approches fréquentistes 43
sont tout de même calculées à partir de l’ensemble des cellules, notamment en ce
qui concerne les comptes marginaux et les hyperparamètres du modèle GPS. Seules
les quantités caractéristiques sont calculées sur la base des cellules d’intérêt (m =
P
ij 1[nij ≥3] ).
Le FDR, le FNR, la sensibilité et la spécificité ont été estimés à partir de moyennes
calculées sur les 500 jeux de données.

Les calculs ont été réalisés à l’aide du logiciel R (R Development Core Team, 2008).
Par ailleurs, un package R nommé PhViD (pour Pharmacovigilance Detection) per-
mettant l’utilisation de l’ensemble des méthodes évaluées dans ce travail a été ré-
cemment mis à disposition sur le site du CRAN (http://cran.r-project.org/).

Son développement a été effectué en collaboration avec Antoine Poncet, ingénieur
statisticien recruté notamment pour ce projet dans notre unité.
4.2 Comparaison des approches fréquentistes
Les méthodes ROR et PRR étant basées sur des mesures d’association très
proches dans le contexte des données de pharmacovigilance, nous avons choisi de
restreindre l’analyse aux méthode ROR, RFET ainsi que midRFET dans la mesure
où elles reposent sur l’odds ratio comme mesure d’association.

Cette étude par simulations a pour objectif de comparer les performances des
trois méthodes du point de vue du FDR et d’évaluer la qualité de son estimation
avec la méthodologie proposée. Différentes hypothèses nulles basées sur ψ0 = 1, 2 et
5 ont été étudiées.

4.2.1 Étude de la densité des degrés de signification
La figure 4.2 présente les distributions des degrés de signification calculés à partir
des méthodes ROR, RFET et midRFET dans le cas où l’hypothèse testée repose sur
ψ0 = 1. Cette figure montre tout d’abord que la distribution marginale (figures a,

d, g et j) et la distribution sous l’hypothèse alternative (figures c, f, i, l) des degrés
de signification est cohérente avec les hypothèses distributionnelles supposées dans
la partie 3.1.3.
En revanche la figure 4.2b montre que ce n’est pas le cas pour la méthode ROR
appliquée aux cellules non vides sous l’hypothèse nulle. En effet, on peut voir que la
distribution est fortement décroissante pour des petits degrés de signification alors
que cette dernière est supposée être constante à cette endroit. Cette décroissance
observée est le reflet du problème lié à l’approximation normale. Une proportion trop
grande de cellules sous l’hypothèse nulle est affectée de petits degrés de signification ce
qui aura pour conséquence une augmentation du nombre de faux positifs. La figure
4.2e montre que la distribution des degrés de signification sous l’hypothèse nulle
pour RFET est tout à fait conforme à celle supposée. Dans le cas de midRFET, on
observe une légère décroissance pour des petits degrés de signification. La figure A.1
proposée en annexe illustre l’ensemble des distributions des degrés de signification
sous l’hypothèse nulle pour les trois méthodes et les trois hypothèses testées (ψ0 = 1,
2 et 5). Elle confirme que les tendances observées pour ψ0 = 1 sont identiques pour
les autres hypothèses testées.

Les figures 4.2k et A.2a, b et c montrent qu’en restreignant l’analyse aux cellules
avec nij ≥ 3, la décroissance observée pour les petits degrés de signification est
considérablement réduite. Pour midRFET, les figures A.2g, h et i montrent que la
légère décroissance observée précédemment a totalement disparu.

ROR : nij ≥ 1 RFET : nij ≥ 1 midRFET : nij ≥ 1 ROR : nij ≥ 3
0 1 2 3 4 5 6 7
10
12
6
8
0 2 4 6 8
f(p)
4
4
2
2
0
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
(a) (d) (g) (j)
10
8
15
8 10
8
6
10
f0(p)
6
6
4
4
4
5
2
2
2
0
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
(b) (e) (h) (k)

20
15
12
20
15
10
f1(p)
0 2 4 6 8
10
10
5
5
5
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
(c) (f) (i) (l)
Fig. 4.2: Histogrammes des distributions marginales, sous H0 et sous H1 des degrés
de signification pour ROR, RFET et midRFET. Les histogrammes sont obtenus à
partir de 50 jeux de données et calculés à partir de (i) la méthode ROR appliquée
aux cellules non vides (a, b, c), (ii) la méthode RFET appliquée aux cellules non
vides (d, e, f), (iii) la méthode midRFET appliquée aux cellules non vides (g, h, i)
et (iv) la méthode ROR appliquée aux cellules avec nij ≥ 3 (j, k, l). Les hypothèses
testées sont basées sur ψ0 = 1. La première ligne représente la distribution marginale
des degrés de signification. Les deux dernières lignes représentent respectivement les
histogrammes de la distribution des degrés de signification avec ψij ≤ 1 (H0ij ) et
ψij > 1 (H1ij ).
4.2.2 Estimation de π0 π0 ∗
La quantité clef pour l’estimation du FDR dans le cas des approches fréquentistes
est π0 π0 ∗. Mais, du fait de la procédure de simulation des données employée, cette
quantité nous est inconnue. Néanmoins la qualité de son estimation peut être évaluée
graphiquement comme l’illustrent les figures 4.3 et A.3.

Ces figures présentent les distributions marginales des degrés de signification
transformés (p∗ ) obtenues à partir des 500 jeux de simulation pour la méthode RFET
(figure 4.3) et la méthode ROR (figure A.3) et trois hypothèses nulles testées défi-
nies par ψ0 = 1, 2 et 5. Y sont aussi représentées les estimations moyennes de π0 π0∗

obtenues avec les procédures LBE et Qvalue.
Rappelons que l’objectif de la procédure Qvalue est d’estimer le minimum de la
distribution marginale qu’elle suppose être en p∗ = 1. On peut donc voir que la procé-
dure Qvalue sous-estime très légèrement cette valeur. Le majorant de π0 π0∗ qu’estime
LBE ne peut être représenté sur ces graphiques. En revanche, il est possible de mon-
trer qu’il est minoré par celui de la procédure Qvalue. On peut donc en conclure que
la procédure LBE se comporte bien. Dans la suite de l’exposé les résultats présen-
tés ont été obtenus à partir de cette dernière. D’autres procédures d’estimation de
π0 π0 ∗ ont par ailleurs été étudiées : la procédure BUM (Pounds et Morris, 2003) et la
procédure SPLOSH (Pounds et Cheng, 2004). Les résultats des estimations ne sont
pas présentés dans ce travail mais s’avèrent beaucoup moins satisfaisants que ceux
obtenus avec LBE ou Qvalue.
4.2.3 Comparaison des méthodes selon le FDR et son estimation
La figure 4.4 présente les courbes du FDR ainsi que de la moyenne de son esti-
mation obtenues à partir des méthodes ROR, RFET et midRFET, lorsque toutes les
cellules non vides sont considérées. En moyenne, 44 466 cellules (43.1% des cellules
ψ0 = 1
0.50
0.45
f(p*)
0.40
0.35
0.30
0.0 0.2 0.4 0.6 0.8 1.0
(a)
ψ0 = 2
0.40
0.35
f(p*)
0.30
0.25
0.20
0.0 0.2 0.4 0.6 0.8 1.0
(b)
ψ0 = 5
0.20
LBE
Qvalue
0.15
f(p*)
0.10
0.05
0.00
0.0 0.2 0.4 0.6 0.8 1.0
(c)
Fig. 4.3: Estimations de π0 π0 ∗ obtenues avec LBE et Qvalue à partir de la dis-

tribution marginale des degrés de signification transformés (p∗ ) pour RFET. Les
histogrammes sont obtenus à partir des cellules non vides des 500 jeux de simula-
tions. Les lignes horizontales représentent les estimations obtenues pour π0 π0 ∗ avec
les procédures LBE et Qvalue. Les trois figures représentent les résultats pour les
trois hypothèses nulles testées.
ψ0 = 1
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0 5000 10000 15000 20000 25000

Nombre moyen de signaux générés
(a)
ψ0 = 2
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0 2000 4000 6000 8000

(b)
ψ0 = 5
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0 500 1000 1500 2000 2500

(c)
Fig. 4.4: Comparaison de ROR (noir), RFET (rouge) et midRFET (bleu) selon le
FDR et son estimation pour nij ≥ 1. Le FDR (courbes épaisses) et la moyenne des
estimations du FDR (courbes fines) sont représentés en fonction de la moyenne du
nombre de signaux générés. Les estimations du FDR sont obtenues avec la procédure
LBE. Les résultats sont présentés pour les trois hypothèses nulles testées (ψ0 = 1, 2
et 5). La règle de décision basée sur une région de rejet [0, 0.025] pour p et sur ψ0 = 1
est identifiée par les droites verticales.
non vides) ont un odds ratio supérieur à 1, 17 985 (17.4%) ont un odds ratio supé-
rieur à 2 et 4 070 (3.9%) ont un odds ratio supérieur à 5. Le FDR et son estimation
sont calculés pour différentes régions de rejet [0, γ] des degrés de signification p et
sont représentés en fonction du nombre moyen de signaux générés correspondant.
Ces figures montrent que quelle que soit l’hypothèse testée, le FDR obtenu avec la
méthode ROR (courbes épaisses noires) est toujours supérieur à celui obtenu avec les
méthodes RFET (courbes épaisses rouges) et midRFET (courbes épaisses bleues) qui
présentent quant à elles des performances identiques de ce point de vue. Les mauvaises
performances observées pour la méthode ROR étaient attendues au vu de la distribu-
tion observée des degrés de signification sous l’hypothèse nulle (cf figure 4.2b). Si l’on
s’intéresse maintenant à l’estimation du FDR, la figure 4.4 montre qu’en moyenne,
le FDR est toujours surestimé avec la méthode RFET (courbes fines rouges). Ce
résultat, compatible avec une stratégie de contrôle du FDR, était attendu compte
tenu de la procédure d’estimation utilisée (LBE) et du respect des hypothèses distri-
butionnelles observé (cf figure 4.2d, e, f). Néanmoins, on note que la surestimation
du FDR est relativement importante. Pour la méthode ROR (courbes fines noires),
le FDR est systématiquement sous-estimé pour les mêmes raisons qu’évoquées pré-
cédemment. En ce qui concerne la méthode midRFET (courbes fines bleues), les
estimations obtenues sont particulièrement bonnes dans le cas ψ0 = 1. Pour ψ0 = 2

et 5, le FDR est surestimé mais moins qu’avec la méthode RFET.
La figure 4.5 présente le même type de résultats que la figure 4.4 mais pour
les cellules avec nij ≥ 3. Le nombre moyen de ces dernières est égal à 47 316, soit
45% des cellules non vides. Sur ces 47 316 cellules, 23 160 (48.9%) ont un odds ratio
supérieur à 1, 10 154 (21.5%) ont un odds ratio supérieur à 2 et 2 553 (5.4%) ont
un odds ratio supérieur à 5. Cette figure montre que les méthodes RFET (courbes
épaisses rouges) et midRFET (courbes épaisses bleues) présentent des performances
ψ0 = 1
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0 5000 10000 15000 20000 25000

(a)
ψ0 = 2
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0 2000 4000 6000 8000

(b)
ψ0 = 5
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0 500 1000 1500 2000 2500

(c)
Fig. 4.5: Comparaison de ROR (noir), RFET (rouge) et midRFET (bleu) selon le
FDR et son estimation pour nij ≥ 3. Le FDR (courbes épaisses) et la moyenne des
estimations du FDR (courbes fines) sont représentés en fonction de la moyenne du
nombre de signaux générés. Les estimations du FDR sont obtenues avec la procédure
LBE. Les résultats sont présentés pour les trois hypothèses nulles testées (ψ0 = 1, 2
et 5). La règle de décision basée sur une région de rejet [0, 0.025] pour p et sur ψ0 = 1
est identifiée par les droites verticales.
légèrement meilleures que la méthode ROR (courbes épaisses noires) du point de
vue du FDR pour ψ0 = 2 et 5. Par ailleurs, la figure 4.5 montre que le FDR est
surestimé par la méthode RFET (courbes fines rouges) et sous-estimé par la méthode
ROR (courbes fines noires) pour des petites valeurs. La méthode midRFET (courbes
fines bleues) semble, là encore, fournir un bon compromis entre ces deux méthodes
puisque le FDR est surestimé en moyenne mais moins qu’avec la méthode RFET.
On peut remarquer que dans le cas nij ≥ 3, la méthode midRFET conduit à une
surestimation du FDR quel que soit ψ0 alors que pour nij ≥ 1, des estimations non
biaisées sont observées pour ψ0 = 1 (cf figure 4.4a). Ceci peut être expliqué par
l’étude de la distribution observée des degrés de signification. La légère décroissance

observée dans le cas nij ≥ 1 (cf figure A.1g, h, i) va dans le sens d’une sous-estimation
du FDR tandis que la procédure utilisée pour l’estimation de π0 π0 ∗ va dans le sens
d’une surestimation de ce dernier. Aussi, il semble que pour ψ0 = 1 ces deux biais se
compensent.
D’autre part, les résultats présentés par les figures 4.4 et 4.5 semblent indiquer
que les estimations du FDR obtenues avec les méthodes RFET (courbes fines rouges)
et midREFT (courbes fines bleues) sont plus conservatrices lorsque ψ0 augmente. Ce
phénomène, illustré plus clairement à travers la figure 4.6, est probablement lié au
fait que le biais de l’estimateur LBE tend à augmenter avec ψ0 mais notre procédure
de simulation des données ne permet pas de le vérifier dans la mesure où π0 π0 ∗ est
inconnu.
Dans les figures 4.4 et 4.5, les lignes verticales illustrent les résultats obtenus avec
la règle de décision proposée par van Puijenbroek et al. (2002), c’est-à-dire pour une
région de rejet des degrés de signification égale à [0, 0.025] et ψ0 = 1. L’utilisation de
cette règle de décision pour la méthode ROR sur l’ensemble des cellules non vides (cf
figure 4.4a) conduit à générer en moyenne 23 574 signaux associés à un FDR de 15.7%
ψ0 = 1 ψ0 = 1
Degrés de signification : 1=0.0001, 2=0.001, 3= 0.005,

3 4=0.01, 5=0.025, 6=0.05, 7=0.1, 8=0.125, 9=0.15
3
ROR
RFET
midRFET
2
2
34 5 6 7 8 9 3 4 5 6 7 8 9
12 1 2
1
1
6 7 8 9 9 6 7 8 99
3 4 5 7 8 3 4 5 7 8
12 1 2
6 6
5 5
0
0
4 4
3 3
2 2
1 1
−1
−1
0.00 0.02 0.04 0.06 0.08 0.10 5000 10000 15000 20000
FDR Nombre moyen de signaux générés
(a) (d)
ψ0 = 2 ψ0 = 2
3
3
2
12 3 4 5 1 2 3 4 5
6 7 6 7
8 9 8 9
1
12 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9
8 9 8 9
7 7
6 6
5 5
0
4 4
3 3
2 2
1 1
−1
−1
0.00 0.05 0.10 0.15 2000 3000 4000 5000 6000 7000 8000 9000
(b) (e)
ψ0 = 5 ψ0 = 5
1 1
3
2 2
3 4 3 4
5 5
6 6
2
1 1
7 8 7 8
2 9 2 9
3 4 5 3 4 5
6 6
7 8 9 7 8 9
1
7 8 9 7 8 9
6 6
5 5
0
4 4
3 3
2 2
1 1
−1
−1
0.00 0.05 0.10 0.15 0.20 500 1000 1500 2000 2500
(c) (f)
Fig. 4.6: Biais relatif observé dans l’estimation du FDR pour ROR, RFET et mi-
dRFET. Le biais relatif ({moyenne des estimations du FDR - FDR}/FDR) est re-
présenté en fonction du FDR (a, b, c) et en fonction du nombre moyen de signaux
générés (d, e, f). Les résultats sont présentés pour les cellules avec nij ≥ 3. Les
nombres figurant sur les courbes correspondent aux seuils de rejet de l’hypothèse
nulle pour les degrés de signification indiqués dans la légende de la figure a.
4.3 Comparaison des approches bayésiennes 53
et estimé en moyenne à 5.9%. Cette même règle de décision appliquée aux méthodes
RFET et midRFET aboutit respectivement à 13 905 et 16 894 signaux associés à des

FDR de 5.6% et 8.3%. De la même manière, si l’on restreint l’analyse aux cellules
avec au moins trois notifications, la figure 4.5 montre que l’utilisation de chacune
des trois méthodes conduit à un nombre relativement différent de signaux générés et
justifie donc l’intérêt de fonder une règle de décision sur (ou d’associer à une liste de
signaux générés) un critère d’erreur global comme le FDR.
4.3 Comparaison des approches bayésiennes
La première partie de cette étude est consacrée à la comparaison des différentes
règles de classement proposées pour le modèle GPS. Nous comparons ensuite les
modèles GPS et BCPNN en utilisant la règle de classement basée sur la probabilité
a posteriori de l’hypothèse nulle.
Dans cette étude, nous avons choisi de restreindre l’analyse aux cellules avec au
moins trois notifications dans la mesure où les méthodes bayésiennes ne reposent sur
aucune approximation de lois et qu’il n’y a donc pas lieu d’anticiper de problèmes
particuliers lorsque l’ensemble des cellules est pris en compte. Plusieurs hypothèses
nulles ont été testées, basées sur des valeurs de RR0 allant de 1 à 5. Sur cet ensemble
restreint de cellules d’intérêt, les nombres moyens de cellules avec un risque supérieur
à 1, 2, 3, 4 ou 5 sont respectivement égaux à 23 160 (48.9%), 10 028 (21.2%), 5 510
(11.6%), 3 501 (7.4%) et 2 434 (5.1%).
Le modèle GPS repose sur une détermination des hyperparamètres par maximi-
sation de la vraisemblance marginale (cf (2.1)). Pour ce faire, la fonction que nous
avons programmée fait appel à la fonction R nlm(). Pour chaque jeu de simulation,
la convergence de l’algorithme a été contrôlée au moyen d’un indicateur retourné par
cette fonction (nlm()$code=1).
4.3.1 GPS et règles de classement
La figure 4.7 présente les résultats de la comparaison des règles de classement

proposées par DuMouchel (1999) et DuMouchel et Pregibon (2001), respectivement
notées E(λ∗ ) et Q0.05 (λ∗ ) à celle proposée dans ce travail notée Pr(H∗0 ). Cette figure
montre que Pr(H∗0 ) (courbes − ⋆ −) est une meilleure règle de classement du point
de vue du FDR. Néanmoins, pour de faibles valeurs de FDR (< 1 ou 2%), les figures
4.7b, d, f, h et j indiquent que les performances de Pr(H∗0 ) et Q0.05 (λ∗ ) (courbes
− + −) sont très proches.
D’autre part, la figure 4.7 montre que les estimations fournies par FDR∗ (courbes
violette) ne sont pas biaisées pour RR0 = 1 et 3. En revanche, pour RR0 = 2
le FDR est surestimé tandis que pour RR0 = 4 et 5, il est sous-estimé. On note
donc que l’évolution du biais n’est pas monotone avec RR0 . La figure 4.8 illustre
d’une part la variabilité de la proportion de fausses découvertes pour les 500 jeux
de simulation à partir desquels est estimé le “vrai” FDR. D’autre part, elle présente
la variabilité de son estimation (FDR∗). Les figures a, c, e, g et i montrent que la
variance de FDP augmente avec RR0 . Quant aux figures b, d, f, h et l, elles montrent
que les biais d’estimation observés dans la figure 4.7 ne sont pas le résultat d’une
variabilité trop grande de FDR∗ . L’approche proposée pour l’estimation du FDR

repose nécessairement sur un bon ajustement du modèle aux données. Le modèle de
simulation des données proposé dans ce travail diffère du modèle GPS et les biais
observés semblent donc plutôt témoigner des limites de ce dernier à s’adapter aux
données générées. Néanmoins les figures 4.7 et 4.8 montrent que le biais reste modéré
et qu’il est compatible avec une stratégie de contrôle du FDR pour des valeurs de
RR0 ≤ 3.
E(λ*) et Pr(H0*) Q0.05(λ*) et Pr(H0*)

RR0 = 1 * *
0.08
0.08
° +
* *
°* *
° * *
0.04
0.04
° +
° * *
° ° * +*
°° ° ° °° ° ° * +
*
°° + +
0.00
0.00
°
°°°°°°
°°°°°°°°° *° *°* * * * * * +
+ +
+
+
+++++++++
+ *++
+*++++ * + +* *
*+*++*++ +
0 5000 10000 15000 20000 0 5000 10000 15000 20000
Nombre moyen de signaux générés Nombre moyen de signaux générés
(a) (b)
* + *
RR0 = 2 °
* °* + * *
°
0.08
0.08
° * °* + * *
° °
° ° ° *° * + * *
° °° ° ° * +
0.04
0.04
° ° * *
°° °° °° ° ° ° + *
°
°° * * +
+* *
* +* *
° ° ° **
+ +
+ *
° ° * +
+* *
0.00
0.00
°°°°° * * * * * * * * +++++++ +
++ + ++
++++++++++
* +
* ** * * *
0 1000 2000 3000 4000 5000 6000 7000 0 1000 2000 3000 4000 5000 6000 7000
(c) (d)
° +
+
RR0 = 3
** **
0.08
0.08
+
+
°° * *
°° +
+
* *
+
0.04
0.04
°°
°° * *
+
°° * + *
°°
° °
° *
++ ++ *
++++
0.00
0.00
° ° °* * * * * * *
* * * +++++++ +* +* *+* +
* *+ * *
0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500 3000 3500
(e) (f)
* + *
RR0 = 4 *° *
+ * *
° +
0.08
0.08
+
° * * + * *
° +
* + *
* *
° ° ++
0.04
0.04
° ° * * ++ * *
° ° * + *
°° ° * *
* *
° °° ** + *
° *+ *
0.00
0.00
+*
*°* * * * * * * ++++++* +* *+* +* +
*
0 500 1000 1500 2000 2500 0 500 1000 1500 2000 2500
(g) (h)
RR0 = 5
°
0.08
0.08
*° *
° ° * + *
* *
° ° +
0.04
0.04
* * * *
° °
° ° * * * *
°
°° **
* +
**+
*
° °
0.00
0.00
+
* ** * * * * * * +* *+* +* + * + * *
++++
0 500 1000 1500 0 500 1000 1500

(i) (j)
Fig. 4.7: Comparaison selon le FDR et son estimation des différentes règles de
classement pour GPS. Le FDR (courbes noires) et la moyenne des FDR∗ (courbes
violette) sont représentés en fonction du nombre moyen de signaux générés pour
RR0 = 1, 2, 3, 4 et 5. Les symboles ◦, + et ⋆ représentent respectivement E(λ∗ ),
Q0.05 (λ∗ ) et Pr(H∗0 ).
4.3 Comparaison des approches bayésiennes
0.00 0.02 0.04 0.06 0.08 0.10
56
0.00 0.02 0.04 0.06 0.08 0.10

RR0 = 1 FDR
FDR* moyen
0 5000 10000 15000 20000 0 5000 10000 15000 20000
(a) (b)
0.00 0.02 0.04 0.06 0.08 0.10
0.00 0.02 0.04 0.06 0.08 0.10

RR0 = 2
0 1000 2000 3000 4000 5000 6000 7000 0 1000 2000 3000 4000 5000 6000 7000
(c) (d)
0.00 0.02 0.04 0.06 0.08 0.10
0.00 0.02 0.04 0.06 0.08 0.10
RR0 = 3
0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500 3000 3500
(e) (f)
0.00 0.02 0.04 0.06 0.08 0.10
0.00 0.02 0.04 0.06 0.08 0.10
RR0 = 4
0 500 1000 1500 2000 2500 0 500 1000 1500 2000 2500
(g) (h)
0.00 0.02 0.04 0.06 0.08 0.10
0.00 0.02 0.04 0.06 0.08 0.10
RR0 = 5
0 500 1000 1500 0 500 1000 1500
(i) (j)
Fig. 4.8: Variabilité du FDR et de son estimation pour GPS basé sur Pr(H∗0 ). Le
FDR (courbes épaisses noires) et la moyenne des FDR∗ (courbes épaisses violette)
sont représentés en fonction du nombre moyen de signaux générés pour RR0 = 1, 2,
3, 4 et 5. Les courbes fines grises (figures a, c, e, g et i) représentent les quantiles à
2.5% et 97.5% de la distribution des FDPs tandis que les courbes fines en violet clair
(figures b, d, f, h et j) représentent les quantiles à 2.5% et 97.5% de la distribution
des FDR∗s .
4.4 Comparaison à partir du modèle de simulations proposé 57
4.3.2 Comparaison de GPS et BCPNN basés sur Pr(H∗0)
Les figures 4.9 à 4.12 illustrent les résultats de la comparaison de GPS et BCPNN
fondés sur la règle de classement proposée (Pr(H∗0 )) pour les différentes quantités
caractéristiques estimées : le FDR, le FNR, la sensibilité et la spécificité. En ce qui
concerne BPCNN, la distribution de IC∗ij a été obtenue pour chacune des cellules
considérées au moyen de 50 000 simulations par Monte Carlo. Les figures 4.9 à 4.12
montrent que les performances des deux modèles sont identiques quels que soient la
caractéristique étudiée et le seuil RR0 (courbes noires). En revanche les estimations
sont très différentes. D’une manière générale, pour des valeurs de RR0 ≤ 3, les
estimations obtenues avec le modèle GPS (courbes − ⋆ −) sont meilleures que celles
obtenues avec le modèle BCPNN (courbes − ◦ −). En particulier, les figures 4.9a, b, c
montrent que le FDR est sous-estimé de manière importante avec le modèle BCPNN.
Pour RR0 = 4, le modèle BCPNN fournit de meilleures estimations que le modèle
GPS pour le FDR (figure 4.9d) et pour la spécificité (figure 4.12d). Pour RR0 = 5,
les estimations obtenues avec le modèle BCPNN sont globalement plus satisfaisantes
que celles obtenues avec le modèle GPS. En effet, ce dernier sous-estime de manière
importante le FDR et surestime la spécificité.
4.4 Comparaison de l’ensemble des méthodes à partir
du modèle de simulations proposé
Plusieurs points sont à souligner pour conclure sur les résultats de cette étude
par simulations.
En ce qui concerne les méthodes fréquentistes, les limites de la méthode ROR
apparaissent clairement et la restriction à des cellules avec au moins trois notifica-
tions ne semble pas suffisante lorsque l’objectif est d’estimer le FDR. La méthode
RR0 = 1 RR0 = 2
0.10
0.10
*
°* * *
°
0.08
0.08
°* *
*
*
0.06
0.06
°
° * *°
°
* *
°
0.04
0.04
° *
* *° °
°
*
0.02
0.02
° * °
*° *
*°
*° °
**°°
°
°
0.00
0.00
* °°* * °*
* ** * * ° * ° * * * * *° * °
0 5000 10000 15000 20000 0 1000 2000 3000 4000 5000 6000 7000

(a) (b)
RR0 = 3 RR0 = 4
0.10
0.10 °
°
* *
**
0.08
0.08
° °
* °* *
°
0.06
0.06
° ° *
* °*
°
°
0.04
0.04
* *
° °*
°
* ° *
°*
0.02
0.02
°
*° °
° *
*
*° **°° *
0.00
0.00
°*
* * * * °* °* °* * * * *° * ° * ° *°
0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500

(c) (d)
RR0 = 5
0.10
°
°
0.08
*
°
°
0.06
* *
°
°
*
0.04
*
° °
° °* *
0.02
° ° *
*
°° * ° *
0.00
*
* * * *° * ° * ° °°*
0 500 1000 1500

(e)
Fig. 4.9: Comparaison selon le FDR et son estimation de BCPNN et GPS basés
sur Pr(H∗0 ). Le FDR (courbes noires) et le FDR∗ moyen (courbes violette pour GPS
et vertes pour BCPNN) sont représentés en fonction du nombre moyen de signaux
générés pour RR0 = 1, 2, 3, 4 et 5. Les symboles ◦ et ⋆ représentent respectivement
les résultats obtenus avec BCPNN et GPS.
RR0 = 1 RR0 = 2
0.30
0.5
** ** ° °
** ** *
* ° **
0.25
° °
0.4
** °
°** ** ° ° °
0.20
° °
**° ° * ** * °
0.3
** * * * * *° * ° °
° ** ° * * * °* °
0.15
° * * *° °
° ** ° * *° °
°** * *
0.2
* * *° *
°*
0.10
* * *° * °*
* * *
0.1
0.05
0.00
0.0
0 5000 10000 15000 20000 0 1000 2000 3000 4000 5000 6000 7000

(a) (b)
RR0 = 3 RR0 = 4
0.20
0.10
0.08
0.15
** ** * ° °
* **° *
0.06
° * ° ** ° ° °
° ° **°
° °
0.10
* ** * ° **° °
* * * * °* °* ° ** ° °
* * ° °* °
0.04
°* °* ° °
* * *° ° °* °* °
* *° * ° °* °
* * ° ** *° * *° *
0.05
* * °* °
0.02
*
0.00
0.00
0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500

(c) (d)
RR0 = 5
0.10
0.08
0.06
* ** *
* * * *° * *
0.04
*° * ° * *
°* ° * *
°* ° *
°* °° * *°
* °° *° *°
0.02
*°
0.00
0 500 1000 1500

(e)
Fig. 4.10: Comparaison selon le FNR et son estimation de BCPNN et GPS basés
sur Pr(H∗0 ). Le FNR (courbes noires) et le FNR∗ moyen (courbes violette pour GPS
et vertes pour BCPNN) sont représentés en fonction du nombre moyen de signaux
générés pour RR0 = 1, 2, 3, 4 et 5. Les symboles ◦ et ⋆ représentent respectivement
les résultats obtenus avec BCPNN et GPS.
RR0 = 1 RR0 = 2
1.0
1.0
0.8
0.8
°**
°** °
° ** ° *
°
° ** ** ° *
0.6
0.6
* ° *°
** * °
*°° **° °
**
*°° **° °
0.4
0.4
°°* **° °
* *
° ** °* °
*° *° °
0.2
0.2
* °° **° * °
** ** °
** **
0.0
0.0
0 5000 10000 15000 20000 0 1000 2000 3000 4000 5000 6000 7000

(a) (b)
RR0 = 3 RR0 = 4
1.0
1.0
0.8
0.8
* * °
0.6
0.6
* *°
*° * °* °* °
°
* * ° °* °
* °* ° °* °
** ° * ° °* °
0.4
0.4
**° ° * °° °
°** ° °
° *°
°** ° °° *°
* ° °*
0.2
0.2
** °°* °* °
* * * °° * *°
* **
0.0
0.0
0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500

(c) (d)
RR0 = 5
1.0
0.8
0.6
*°°
*°° *
*° *
°° * °
°°**
0.4
° ** °
°*
°** *
* °
0.2
*° ** ° *
** *
**
0.0
0 500 1000 1500

(e)
Fig. 4.11: Comparaison selon la sensibilité et son estimation de BCPNN et GPS

basés sur Pr(H∗0 ). La sensibilité (courbes noires) et la moyenne de son estimation
(courbes violette pour GPS et vertes pour BCPNN) sont représentées en fonction du
nombre moyen de signaux générés pour RR0 = 1, 2, 3, 4 et 5. Les symboles ◦ et ⋆
représentent respectivement les résultats obtenus avec BCPNN et GPS.
RR0 = 1 RR0 = 2
0.970 0.975 0.980 0.985 0.990 0.995 1.000

1.00
* ** * * ° * ° * °* * * * * *° * ° * °* *°
*°° ° **°°
*° ** °
° *°
0.98
* * °
° ° *
*
* *° °
0.96
° *
° *
*
° * °
0.94
° *
*
*
0.92
°
*
0.90
0 5000 10000 15000 20000 0 1000 2000 3000 4000 5000 6000 7000

(a) (b)
RR0 = 3 RR0 = 4
1.000
1.000
* * * * °* °* °* °* * * * *° * ° * ° *° *° *
*° °
*° °°** *
0.998
0.998
* °°*
°° *
°°*
* *
0.996
0.996
° °*
*° ° *
*
° *
0.994
0.994
* ° °
*
°
°°
0.992
0.992
**
0.990
0.990
0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500

(c) (d)
RR0 = 5
1.000
* * * *° * ° * ° °* ° * °° *
°° °**
° ° **
° ° *
0.998
° *° *
° *°
0.996
°
0.994
0.992
0.990
0 500 1000 1500

(e)
Fig. 4.12: Comparaison selon la spécificité et son estimation de BCPNN et GPS

basés sur Pr(H∗0 ). La spécificité (courbes noires) et la moyenne de son estimation
(courbes violette pour GPS et vertes pour BCPNN) sont représentées en fonction du
nombre moyen de signaux générés pour RR0 = 1, 2, 3, 4 et 5. Les symboles ◦ et ⋆
représentent respectivement les résultats obtenus avec BCPNN et GPS.
midRFET conduit à de meilleures estimations du FDR en accord avec la stratégie
de contrôle induite par les procédures comme LBE ou Qvalue.

Dans le cas des méthodes bayésiennes, cette étude par simulation montre que la
qualité de l’estimation des caractéristiques d’intérêt dépend fortement de l’hypothèse
testée. Elle révèle aussi que la règle de classement Pr(H∗0 ) est meilleure que celles
proposées jusqu’alors pour le modèle GPS du point de vue du FDR. Il est vrai
cependant que les différences semblent marginales entre Q0.05 (λ∗ ) et Pr(H∗0 ) pour des
valeurs de FDR inférieures à 1 ou 2%.
La figure 4.13 illustre les résultats de la comparaison du FDR des différentes mé-
thodes pour des cellules associées à au moins trois notifications. Elle montre que les
performances des méthodes bayésiennes (courbes en tirets longs violets pour GPS
et en tirets-points verts pour BCPNN) sont très légèrement supérieures à celles ob-
servées pour les méthodes RFET (courbes en tirets courts rouges) et midRFET
(courbes pleines bleues). On voit aussi que les performances de la méthode ROR
(courbes en pointillés noirs) sont moins bonnes que celles des autres méthodes et que
cette différence semble s’accroı̂tre lorsque le risque testé augmente.
La figure 4.14 permet de comparer les estimations obtenues avec midRFET,
BCPNN et GPS basé sur Pr(H∗0 ). Les méthodes RFET et ROR ne sont pas re-
présentées dans la mesure où leur estimation du FDR est moins satisfaisante que
celle obtenue avec midRFET (cf figures 4.4 et 4.5). Cette figure illustre le fait que s’il
est vrai que la méthodologie employée pour l’estimation du FDR dans le cas des mé-
thodes fréquentistes permet de s’assurer du contrôle de ce dernier, la surestimation
occasionnée est très importante en comparaison de celle observée pour les méthodes
bayésiennes.
ψ0 = 1 , RR0 = 1
0.10
midRFET
RFET
ROR
0.08
BCPNN
GPS
0.06
0.04
0.02
0.00
0 5000 10000 15000 20000

(a)
ψ0 = 2 , RR0 = 2
0.10
0.08
0.06
0.04
0.02
0.00
0 1000 2000 3000 4000 5000 6000 7000

(b)
ψ0 = 5 , RR0 = 5
0.10
0.08
0.06
0.04
0.02
0.00
0 500 1000 1500

(c)
Fig. 4.13: Comparaison du FDR obtenu avec midRFET, ROR, BCPNN et GPS
basé sur Pr(H∗0 ). Le FDR est calculé pour des cellules avec nij ≥ 3.
ψ0 = 1 , RR0 = 1
0.10
midFET
GPS
BCPNN
0.08
0.06
0.04
0.02
0.00
0 5000 10000 15000 20000

(a)
ψ0 = 2 , RR0 = 2
0.10
0.08
0.06
0.04
0.02
0.00
0 1000 2000 3000 4000 5000 6000 7000

(b)
ψ0 = 5 , RR0 = 5
0.10
0.08
0.06
0.04
0.02
0.00
0 500 1000 1500

(c)
Fig. 4.14: Comparaison du FDR et de son estimation pour midRFET, BCPNN et

GPS basé sur Pr(H∗0 ). Le FDR est représenté par les courbes en gras. Le FDR et son
estimation sont calculés pour des cellules avec nij ≥ 3.
4.5 Comparaison à partir du modèle de simulations de Roux et al. 65
4.5 Comparaison à partir du modèle de simulations
de Roux et al.
Il est difficile de comparer les conclusions du travail de Roux et al. (2005) aux
nôtres dans la mesure où le plan de simulation ainsi que les méthodes évaluées dif-
fèrent de manière importante. Nous avons donc choisi d’évaluer l’approche proposée
à partir de 500 jeux de données simulés sous le modèle de Roux et al. (2003) briève-
ment décrit en introduction de ce chapitre. Les méthodes retenues pour cette étude
sont ROR, midRFET, BCPNN et GPS basé sur Pr(H∗0 ). Le FDR et son estimation
ont été calculés en considérant les cellules avec au moins trois notifications. Sur ces
500 jeux de données, les nombres moyens de cellules avec au moins une et au moins
trois notifications sont respectivement égaux à 10 503 (70.0%) et 7 321 (48.8%) pour
un total de 15 000 cellules. Compte tenu du modèle de simulation, les méthodes n’ont
été évaluées que sur la base d’associations d’intérêt définies par RR0 = 1 pour les
méthodes bayésiennes et ψ0 = 1 pour les méthodes fréquentistes.
La figure 4.15a montre les courbes de FDR obtenues pour l’ensemble des méthodes
évaluées. L’allure des courbes conduit aux mêmes conclusions sur les performances
des méthodes du point de vue du FDR que celles énoncées dans le cas de notre
modèle de simulations. Au niveau des estimations du FDR représentées en couleurs
sur la figure 4.15b, les tendances semblent, là encore, être relativement proches de
celles obtenues avec notre modèle de simulation excepté pour GPS (courbe en tirets
violets) pour qui FDR∗ conduit à une surestimation assez importante du FDR. Ce
comportement reste néanmoins compatible avec une stratégie de contrôle de ce cri-
tère, à la différence de la sous-estimation qui se retrouve ici confirmée pour ROR.
Plus généralement, les estimations obtenues dans cette étude par simulations sont
moins satisfaisantes que dans l’étude précédente ce qui pourrait s’expliquer par le fait
4.5 Comparaison à partir du modèle de simulations de Roux et al. 66
ψ0 = 1 , RR0 = 1
0.10
midRFET
ROR
0.08 BCPNN
GPS
0.06
0.04
0.02
0.00
0 200 400 600 800

(a)
ψ0 = 1 , RR0 = 1
0.10
0.08
0.06
0.04
0.02
0.00
0 200 400 600 800

(b)
Fig. 4.15: Comparaison du FDR et de son estimation pour ROR, midRFET,

BCPNN et GPS basé Pr(H∗0 ) à partir du plan de simulation de Roux et al. (2003).
La figure a présente le FDR pour chacune des méthodes. Dans la figure b, le FDR
apparait en grisé tandis que les estimations sont représentées en couleur et en gras.
Le FDR et son estimation sont calculés pour des cellules avec nij ≥ 3.
4.6 Conclusion des simulations 67
que la définition d’une véritable association diffère entre les deux études par simula-
tions. En effet, dans l’approche proposée par Roux et al., la nature des associations
est définie préalablement à travers un risque lié à l’exposition au médicament en
“population générale”. Ce risque correspond bien à celui dont on aimerait disposer en
réalité. Cependant, il ne correspond pas directement à celui évalué par les méthodes
de détection automatiques qui sont appliquées sur des notifications restructurées en

table de contingence.
4.6 Conclusion des simulations
Au terme de ces études par simulations, GPS semble être le modèle le plus inté-
ressant dans la mesure où les estimations du FDR obtenues à partir de la règle de
classement proposée sont les plus satisfaisantes pour des RR0 ≤ 3 qui sont vraisem-
blablement les valeurs d’intérêt majeur. Il présente aussi l’avantage par rapport au
modèle BCPNN d’être beaucoup moins lourd d’un point de vue computationnel pour
la détermination de la distribution a posteriori de l’hypothèse nulle puisque cette der-
nière a une forme analytique. Finalement, le cadre utilisé pour la prise en compte
des comparaisons multiples permet aussi d’estimer d’autres quantités d’intérêt que
sont le FNR, la sensibilité et la spécificité.

Chapitre 5
Application aux données

françaises de pharmacovigilance
La première partie de cette application s’inscrit dans le prolongement direct de

l’étude par simulation. L’approche proposée est utilisée sur les données françaises
de pharmacovigilance collectées entre 1984 et 2003 dont les caractéristiques ont été
utilisées pour la génération des jeux de données de simulations.
Néanmoins, l’application de méthodes de détection automatique sur une base figée
ne peut, en réalité, constituer qu’une première étape. Le véritable objectif est bien
d’utiliser régulièrement ces outils sur une base de pharmacovigilance constamment
alimentée par des notifications spontanées. Aussi, la deuxième partie de ce chapitre
est consacrée à l’étude de l’application de ces méthodes en utilisation séquentielle à
travers une analyse rétrospective ainsi qu’à leur évaluation au regard de leur capacité
de détection de cas d’alertes réels.
68
5.1 Comparaison des méthodes sur les données de 1984-2003 69
5.1 Comparaison des méthodes sur les données fran-
çaises de 1984-2003
5.1.1 Les données
Les données utilisées pour cette application correspondent aux 209 833 notifica-
tions spontanées collectées par le système de pharmacovigilance français entre 1984
et 2003. Ces données initialement fournies par l’Afssaps ont été recodées par Frantz
Thiessard au cours de son travail de thèse selon la classification ATC (Anatomi-
cal Therapeutical Clinical, Miller et Britt, 1995) pour les médicaments et selon la
classification MeDRA (Medical Dictionary for Regulatory Activities, Brown et al.,
1999) pour les événements indésirables (Thiessard, 2004). La classification ATC est
arborescente et présente 5 niveaux de précision allant du groupe anatomique (code

à une lettre dénommé ATC1) à la dénomination commune internationale (code à 7
caractères ATC7). Nous avons travaillé à partir des médicaments codés en ATC5,
ce qui correspond au premier niveau de regroupement de la classification ATC. La
classification MedDRA présente 5 niveaux de précision (System Organ Class (SOC),

High-Level Group Terms (HLGT), High-Level Terms (HLT), Preferred Terms (PT)
et Lower-Level Terms (LLT)). Nous avons choisi de travailler à partir de la classifica-
tion de précision moyenne HLT. Avec ce codage utilisé, les données collectées entre
1984 et 2003 impliquent 672 classes de médicaments et 820 classes d’événements in-
désirables. Le nombre de cellules de la table de contingence ainsi constituée est donc
égal à 551 040 dont 97 256 (17.6%) sont des cellules non vides et 47 520 (8.6%) ont
des nij ≥ 3. Les résultats présentés dans la suite ont été obtenus en considérant que
les signaux potentiels devaient être impliqués dans au moins trois notifications.
5.1.2 Estimation des quantités caractéristiques
La figure 5.1 présente les résultats de l’estimation du FDR par ROR, midRFET,
BCPNN et GPS basé sur Pr(H∗0 ). Pour BCPNN, les estimations des distributions de
IC∗ij ont été obtenues à l’aide de 500 000 simulations par Monte Carlo. Dans le cas
{ψ0 = 1, RR0 = 1}, les résultats sont similaires à ceux obtenus par simulations (cf
figure 4.14a, page 64). Pour {ψ0 = 2, RR0 = 2} et {ψ0 = 3, RR0 = 3} (dans le cas
des méthodes bayésiennes), on voit apparaitre de légères différences. Par exemple,
pour {ψ0 = 2, RR0 = 2}, les estimations obtenues avec GPS et midRFET sont plus
proches que celles observées dans les simulations (cf figure 4.14b, page 64). Il faut
bien évidemment rappeler que les résultats de l’étude par simulations présentaient
des estimations moyennes. Pour les cas {ψ0 = 4, RR0 = 4} et {ψ0 = 5, RR0 = 5},
les différences semblent s’accentuer entre les résultats obtenus par simulation et ceux
de l’application. En particulier, pour RR0 = 5, on observe que l’estimation du FDR
obtenue avec BCPNN est supérieure à celle de midRFET.

Au regard de ces résultats, se manifeste l’intérêt d’avoir préalablement étudié par
simulation le comportement des différentes approches selon un modèle de simulation
“proche” des données réelles. Pour RR0 ≤ 3, les similitudes observées entre les résul-
tats de l’étude par simulations et ceux de cette application nous rendent confiants
quant aux estimations obtenues avec GPS. Le tableau 5.1 présente les estimations
des quantités caractéristiques obtenues avec GPS pour différentes valeurs de Pr(H∗0 ).
Il y figure, en particulier, le cas où l’approche proposée et la règle de décision de
Szarfman et al. (2002) (Q0.05 (λ∗ ) ≥ 2) sont formellement identiques et conduisent

donc à la même liste de signaux.
ψ0 = 1 , RR0 = 1 ψ0 = 2 , RR0 = 2
0.10
0.10
midRFET
ROR
BCPNN
GPS
0.08
0.08
0.06
0.06
0.04
0.04
0.02
0.02
0.00
0.00
0 5000 10000 15000 20000 0 1000 2000 3000 4000 5000 6000 7000
Nombre de signaux générés Nombre de signaux générés
(a) (b)
ψ0 = 3 , RR0 = 3 ψ0 = 4 , RR0 = 4
0.10
0.10
0.08
0.08
0.06
0.06
0.04
0.04
0.02
0.02
0.00
0.00
0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500 3000
(c) (d)
ψ0 = 5 , RR0 = 5
0.10
0.08
0.06
0.04
0.02
0.00
0 500 1000 1500 2000

Nombre de signaux générés
(e)
Fig. 5.1: Comparaison des estimations du FDR sur la base de pharmacovigilance

française.
α Signaux FDR∗ FNR∗ Se∗ Sp∗

RR0 = 1
0.010 7640 0.001 0.420 0.313 1.000
0.025 8976 0.004 0.401 0.367 0.999
0.050 10442 0.008 0.379 0.424 0.996
0.100 12623 0.020 0.344 0.507 0.989
0.150 14547 0.034 0.313 0.576 0.979
0.200 16223 0.048 0.286 0.633 0.966
0.250 17772 0.063 0.261 0.682 0.951
0.300 19261 0.080 0.236 0.727 0.934
0.400 22118 0.115 0.189 0.803 0.890
0.500 24803 0.151 0.147 0.863 0.838
RR0 = 2
0.010 2764 0.001 0.138 0.309 1.000
0.025 3181 0.003 0.130 0.355 1.000
0.050 3591 0.007 0.122 0.399 0.999
0.100 4150 0.016 0.112 0.457 0.998
0.150 4625 0.027 0.103 0.504 0.997
0.200 5066 0.040 0.096 0.544 0.995
0.250 5461 0.053 0.090 0.579 0.992
0.300 5851 0.068 0.084 0.610 0.990
0.400 6673 0.103 0.072 0.670 0.982
0.500 7661 0.148 0.060 0.731 0.971
RR0 = 3
0.010 1823 0.001 0.068 0.368 1.000
0.025 2091 0.003 0.063 0.422 1.000
0.050 2356 0.007 0.058 0.473 1.000
0.100 2679 0.015 0.051 0.534 0.999
0.150 2895 0.023 0.047 0.572 0.998
0.200 3168 0.036 0.043 0.618 0.997
0.250 3349 0.046 0.040 0.646 0.996
0.300 3522 0.058 0.037 0.671 0.995
0.400 3919 0.087 0.031 0.723 0.992
0.500 4369 0.125 0.026 0.773 0.987
Tab. 5.1: Estimation des quantités caractéristiques avec GPS et Pr(H∗0 ) sur les
données de pharmacovigilance française. Le tableau présente pour différents seuils
α sur Pr(H∗0 ) et différentes valeurs RR0 le nombre de signaux générés ainsi que
les estimations de FDR, FNR, Se et Sp. La ligne en gras correspond au cas où
l’approche proposée et la règle de décision de Szarfman et al. (2002) (Q0.05 (λ∗ ) ≥ 2)
sont formellement identiques.
5.1.3 Comparaison des signaux générés
Au vu des résultats des simulations montrant des performances très proches entre
les méthodes proposées du point de vue du FDR (cf figure 4.13, page 63), se pose
la question de la proportion de signaux partagés. La figure 5.2 présente pour ROR,
midRFET, BCPNN et GPS basé sur Pr(H∗0 ), l’évolution de la proportion de signaux

communs entre les méthodes prises deux à deux, ou plus, en fonction du nombre de
signaux générés. Concernant BCPNN, cette figure laisse entrevoir que ce pourcentage
est très faible lorsque le nombre de signaux générés est faible au regard de l’hypothèse
testée. La principale raison de ce résultat est que le nombre de simulations par Monte
Carlo réalisé (500 000) ne permet pas d’avoir une précision suffisamment grande pour
le calcul de Pr(H∗0 ). Il en résulte qu’un grand nombre de cellules ont des probabilités
a posteriori de l’hypothèse nulle identiques, et de manière plus problématique égales
à 0. Par exemple, dans le cas de RR0 = 1, ce dernier est égal à 3 474. En dehors de
ces problèmes numériques, les méthodes partagent au moins 80% de signaux quelle
que soit l’hypothèse testée et ce pourcentage tend à augmenter lorsque le nombre de
signaux générés augmente (courbes en pointillés rouges). Les principales différences
sont observées entre les méthodes bayésiennes et ROR et plus particulièrement entre
BCPNN et ROR lorsque RR0 ≥ 3 (courbes en tirets). Pour de faibles nombres

de signaux générés au regard de l’hypothèse testée, ce sont GPS et midRFET qui
partagent le plus de signaux. Lorsque le nombre de signaux générés augmente, la
proportion de signaux communs entre ROR et midRFET tend vers 1.
La figure 5.3 illustre le même type de résultats mais en fonction du FDR estimé
avec GPS pour {ψ0 = 1, RR0 = 1}. Cette figure met l’accent sur les différences entre
les méthodes pour des nombres relativement importants de signaux générés. En effet,
d’après le tableau 5.1, un FDR estimé proche de 1% (0.008) conduit à la génération
de 10 442 signaux avec le modèle GPS basé sur Pr(H∗0 ). De la même manière, un FDR
ψ0 = 1 , RR0 = 1 ψ0 = 2 , RR0 = 2
1.00
1.00
0.95
0.95
0.90
0.90
0.85
0.85
GPS − BCPNN
0.80
0.80
GPS − midRFET
GPS − ROR
BCPNN − midRFET
0.75
0.75
BCPNN − ROR
midRFET − ROR
GPS − ROR − midRFET
0.70
0.70
GPS − BCPNN − ROR − midRFET
0 5000 10000 15000 20000 0 1000 2000 3000 4000 5000 6000 7000
(a) (b)
ψ0 = 3 , RR0 = 3 ψ0 = 4 , RR0 = 4
1.00
1.00
0.95
0.95
0.90
0.90
0.85
0.85
0.80
0.80
0.75
0.75
0.70
0.70
0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500 3000
(c) (d)
ψ0 = 5 , RR0 = 5
1.00
0.95
0.90
0.85
0.80
0.75
0.70
500 1000 1500 2000

(e)
Fig. 5.2: Proportion de signaux communs entre les méthodes proposées en fonction
du nombre de signaux générés. L’évolution de cette proportion est illustrée pour
différents {ψ0 , RR0 }.
ψ0 = 1 , RR0 = 1
1.00
0.95
0.90
0.85
GPS − BCPNN
0.80
GPS − midRFET
GPS − ROR
BCPNN − midRFET
0.75
BCPNN − ROR
midRFET − ROR
0.70
0.00 0.02 0.04 0.06 0.08 0.10
FDR estimé par GPS
Fig. 5.3: Proportion de signaux communs entre les méthodes proposées pour {ψ0 =
1, RR0 = 1} en fonction du FDR estimé par GPS basé sur Pr(H∗0 ).
estimé proche de 5% (0.048) conduit à la génération de 16 223 signaux. Les figures
correspondant à l’ensemble des hypothèses testées sont fournies en annexe (figure

B.1).
Enfin, dans le cas de GPS, la proportion de signaux communs entre les trois règles
de classement a aussi été étudiée et est illustrée par la figure 5.4 dans le cas RR0 = 1.
Elle montre d’importantes différences lorsque le nombre de signaux est faible (figure
5.4a). Pour E(λ∗ ) et Pr(H∗0 ), la proportion de signaux communs ne cesse d’augmenter.

Ce résultat est en accord avec les résultats des simulations qui montrent que le FDR
des deux méthodes tend à devenir très proche lorsque le nombre de signaux générés
augmente (cf figure 4.7a, page 55). Concernant Q0.05 (λ∗ ) et Pr(H∗0 ), on constate que
passé un certain seuil, la proportion de signaux communs diminue (figure 5.4b). Là
encore, ce résultat est en accord avec celui observé par simulation dans la mesure où
ψ0 = 1 , RR0 = 1
1.0
0.8
0.6
0.4
0.2
Pr(H0*) − Q0.05(λ*)
Pr(H0*) − E(λ*)
0.0
0 5000 10000 15000 20000

(a)
ψ0 = 1 , RR0 = 1
1.00
0.95
0.90
0.85
0.80
0.75
0.70
0.00 0.02 0.04 0.06 0.08 0.10

FDR estimé par GPS
(b)
Fig. 5.4: Proportion de signaux communs entre E(λ∗ ) et Pr(H∗0 ) d’une part, et entre
Q0.05 (λ∗ ) et Pr(H∗0 ) d’autre part, pour GPS et RR0 = 1 en fonction du nombre de
signaux générés (figure a) et du FDR estimé par GPS basé sur Pr(H∗0 ) (figure b).
5.2 Évaluation séquentielle à partir de cas d’alertes réels 77
les différences entre les deux règles de classement se manifestent lorsque le nombre
de signaux augmente (cf figure 4.7b).
5.2 Évaluation séquentielle à partir de cas d’alertes réels
L’ensemble du travail présenté jusqu’à présent à été appliqué sur une base de
données figée dans le temps. Il est bien évident qu’en pratique, les méthodes de
détection automatique sont destinées à être appliquées régulièrement sur des données
alimentées constamment. Cette partie est donc consacrée à l’étude de l’utilisation
séquentielle des différentes méthodes. Ne disposant que des données de la période
1984-2003, cette étude séquentielle a donc été réalisée de manière rétrospective.
De plus, ce travail s’est aussi attaché à l’évaluation des différentes méthodes du

point de vue de la détection de cas d’alertes réels dans la continuité du travail réa-
lisé par Thiessard (2004). En reprenant l’ensemble des comptes rendus des réunions
du comité technique de pharmacovigilance sur la période 1995 - juin 2002, Frantz
Thiessard a établi une liste de 429 alertes (en utilisant les dictionnaires ATC5-HLT).
Ces alertes correspondent à des enquêtes lancées par l’Afssaps ce qui ne signifie pas
pour autant qu’elles aient abouties à la mise en évidence de véritables associations.
Dans cette étude, nous considérons que ces alertes constituent des signaux de ré-
férence à partir desquels les capacités de détection des méthodes sont évaluées et
comparées. Cette définition de signaux de référence n’est néanmoins pas exempte
de défaut dans la mesure où elle postule que les méthodes de détection automa-
tique doivent au moins détecter les alertes mises en évidence par les experts. Or
les pharmacologues ne se fondent pas uniquement sur les informations recueillies à
partir des notifications spontanées. Par exemple, certaines alertes sont identifiées à
partir d’alertes européennes ou, plus rarement, d’études récemment publiées. Ainsi
nous verrons qu’un certain nombre de ces signaux de référence n’est même associé
à aucune notification spontanée. Cette limite tend à pénaliser les performances des
méthodes de détection automatique. En revanche, elle n’est pas problématique dans

le cas de leur comparaison.
5.2.1 Plan d’analyse
Pour cette étude, les données utilisées correspondent aux cas notifiés entre le 1er
janvier 1995 et le 30 juin 2002. Cette décision a été prise pour éviter des problèmes
de codage rencontrés lors du transfert de la base de pharmacovigilance des Hospices
Civils de Lyon à l’Agence du Médicament (actuellement Afssaps) entre 1994 et 1995.

L’analyse séquentielle a donc été réalisée à partir du 1er janvier 1996, de manière à
avoir un recul de un an pour la première analyse. Elle a été réalisée tous les mois jus-
qu’au 1er juillet 2002 compris. La figure 5.5 présente l’évolution du nombre de couples
médicament-événements présentant au moins une et au moins trois notifications dans

la base française “créée” à partir de janvier 1995.
377 des 429 signaux de référence sélectionnés par Frantz Thiessard ont été initia-
lement retenus car ils couvraient la période d’analyse séquentielle. 53 d’entre eux ont
été retirés de l’analyse dans la mesure où aucune notification n’avaient été enregistrée
au 1er juillet 2002. 15 autres ont été éliminés de l’analyse car les codes ATC étaient
trop peu précis pour être interprétables. Il y avait notamment des codes appartenant
aux catégories V03 et V07 respectivement intitulées “all other therapeutic products”
et “all other non-therapeutic products”. Finalement, le nombre de signaux de réfé-
rence utilisés pour cette analyse est égal à 309 dont 262 sont associés à au moins
trois notifications au 1er juillet 2002. Les 47 signaux de référence avec moins de trois
notifications au terme de l’analyse sont listés dans le tableau B.1 présenté en annexe.
De plus, une des particularités du système de pharmacovigilance français, est que
les pharmacovigilants affectent un score d’imputabilité aux notifications spontanées

nij ≥ 1
nij ≥ 3
70000
60000
50000
40000
30000
20000
10000
1996 1997 1998 1999 2000 2001 2002
Fig. 5.5: Évolution au cours du temps du nombre de couples médicament-

événements présentant au moins une et au moins trois notifications dans la base
française “créée” au 1er janvier 1995.
attestant de leur plausibilité ainsi que de l’état des connaissances bibliographiques

(Bégaud et al., 1985). Nous avons donc considéré que des couples pour lesquels les
scores d’imputabilité attestaient d’une connaissance bibliographique (codée “B3”)
dans au moins 80% des cas notifiés au cours de l’année 1995 correspondaient à des
signaux déjà analysés. Ainsi, au 1er janvier 1996, 950 couples sont considérés comme
connus et donc “détectés” par les méthodes, parmi lesquels figurent 25 signaux de
référence.
5.2.2 Premier scénario : Mise en place d’un système de détection
automatique
Dans ce scénario, nous avons évalué les méthodes dans le cas de la mise en place
d’un système de détection automatique. En concertation avec le groupe collaboratif

de ce projet1 , nous avons convenu qu’une analyse mensuelle de 100 signaux par
l’ensemble des pharmacologues des 31 CRPV était un scénario réaliste. Ainsi, pour
chacune des méthodes évaluées, 79 analyses mensuelles ont été réalisées portant ainsi
le nombre de signaux “analysés” au 1er juillet 2002 à 8 850 (950 + 7 900).
Comparaison des méthodes de détection automatique
Dans un premier temps, la comparaison a porté sur le modèle GPS basé sur Pr(H∗0 )
et Q0.05 (λ∗ ), midRFET et ROR. Les degrés de signification et Pr(H∗0 ) ont été calculés
à partir de {ψ0 = 1, RR0 = 1}. Nous avons aussi considéré qu’un prérequis de trois
notifications spontanées était nécessaire à la génération d’un signal, ce choix ayant
pour conséquence d’éliminer toute détection potentielle des 47 signaux de référence
ayant moins de trois notifications au terme de la période d’analyse.
Le tableau 5.2 présente le nombre de signaux détectés au 1er juillet 2002. Elle
montre que c’est le modèle GPS qui permet de détecter le plus nombre de signaux de
référence à savoir 180, soit 58.3% des 309 signaux de référence et 68.7% des signaux de
référence associés à au moins trois notifications au terme de l’analyse. On remarque
aussi que les signaux détectés par les méthodes diffèrent légèrement et que midRFET
inclut l’ensemble des signaux de référence détectés par ROR. Le nombre de signaux
de référence commun à l’ensemble des méthodes est égal à 164.
L’évaluation des règles de classement fondées sur {ψ0 = 2, RR0 = 2} a aussi
été effectuée avec midRFET et GPS basé sur Pr(H∗0 ). Elle conduit à un nombre de
signaux de référence détectés bien inférieur à celui observé pour {ψ0 = 1, RR0 = 1} :
respectivement 138 et 146 pour midRFET et GPS. Par ailleurs, pour ces deux mé-
thodes (basées sur {ψ0 = 1, RR0 = 1}) nous avons aussi conduit l’analyse séquentielle
1
C. Kreft-Jaı̈s, P. Auriche, I. Bidault (Afssaps), F. Thiessard (Inserm-Bordeaux 2 U. 897/LE-
SIM), B. Bégaud, A. Fourrier-Réglat, F. Haramburu, G. Miremont-Salamé (Inserm-Bordeaux 2 U.
657/ Centre de Pharmacovigilance)
GPS Pr(H∗0 ) GPS Q0.05 (λ∗ ) midRFET ROR

GPS Pr(H∗0 ) 180 178 169 166
∗
GPS Q0.05 (λ ) - 180 167 164
midRFET - - 174 171
ROR - - - 171
Tab. 5.2: Nombre de signaux de référence détectés par GPS basé sur Pr(H∗0 ) et
Q0.05 (λ∗ ), midRFET et ROR - Scénario 1.
en considérant l’ensemble des couples avec au moins une notification. Les résultats
illustrés dans le tableau 5.3 montrent que 181 signaux de référence sont détectés avec
GPS, soit un couple de plus que précédemment. En revanche, pour midRFET, ce
nombre devient inférieur à celui observé précédemment (166 contre 174).
GPS Pr(H∗0 ) GPS Pr(H∗0 ) midRFET midRFET

nij ≥ 3 nij ≥ 1 nij ≥ 3 nij ≥ 1
GPS Pr(H∗0 ) nij ≥3 180 179 - -
GPS Pr(H∗0 ) nij ≥1 - 181 - -
midRFET nij ≥3 - - 174 161
midRFET nij ≥1 - - - 166
Tab. 5.3: Comparaison des signaux de référence détectés dans les cas nij ≥ 3 et
nij ≥ 1 pour GPS basé sur Pr(H∗0 ) et pour midRFET - Scénario 1.
Nous comparons maintenant les méthodes du point de vue des délais de détection
des signaux de référence. Ces délais sont calculés comme la différence entre la date
de détection des signaux de référence et la date de leur première notification. Dans

le cas où le signal de référence est déjà présent au début de l’analyse, c’est la date
du 1er janvier 1996 qui est retenue. En cas de non détection, le délai de détection
est considéré comme censuré au 1er juillet 2002. La première analyse porte sur la
comparaison des délais de détection des 309 signaux de référence. Pour ce faire, nous
avons utilisé le test non paramétrique de Friedman (Friedman, 1937). En cas d’égalité
des délais de détection (notamment en cas de censure), le rang utilisé correspond au
rang moyen.
Le tableau 5.4 présente les résultats de la comparaison des rangs moyens des
délais de détection des 309 signaux de référence. Il montre que le modèle GPS avec
la règle de classement proposée présente le meilleur rang moyen de détection. La
comparaison des rangs de ces quatre méthodes à l’aide du test de Friedman conduit
à rejeter l’hypothèse d’égalité des délais de détection (p = 4.98 10−6 ).

2.36 2.45 2.52 2.67
Tab. 5.4: Rangs moyens dans le délai de détection des 309 signaux de référence pour
GPS basé sur Pr(H∗0 ) et Q0.05 (λ∗ ), midRFET et ROR - Scénario 1.
Le test de rang de Friedman ne permettant pas de différencier les délais censurés

des autres délais, nous avons réalisé la même analyse sur les 164 signaux de réfé-
rence détectés par l’ensemble des méthodes de détection automatique. Le tableau 5.5
montre que l’ordre des rangs moyens de détection reste inchangé. Le test de Friedman
demeure également très en faveur du rejet de l’hypothèse d’égalité des rangs avec un
degré de signification égal à 8.12 10−5 .

2.30 2.44 2.49 2.77
Tab. 5.5: Rangs moyens dans le délai de détection des 164 signaux de référence pour
GPS basé sur Pr(H∗0 ) et Q0.05 (λ∗ ), midRFET et ROR - Scénario 1.
La comparaison des deux règles de classement pour le modèle GPS sur l’ensemble
des 309 signaux de référence montre que le rang moyen de détection avec Pr(H∗0 ) est
inférieur à celui de GPS Q0.05 (λ∗ ) (1.46 contre 1.54) et le degré de signification du
test de Friedman est égal à 2.66 10−4 .
Cette analyse concernant la comparaison des délais de détection des 4 méthodes
étudiées est donc en faveur de l’utilisation du modèle GPS avec la règle de classement
proposée.
Comparaison des délais de détection entre GPS et les alertes en comité
technique de pharmacovigilance
La deuxième partie de cette analyse concerne l’étude du délai entre la date de

détection des signaux de référence par le modèle GPS avec Pr(H∗0 ) et la date d’alerte
en comité technique. Un délai négatif traduit une détection plus précoce du signal
de référence avec le modèle GPS. La figure 5.6 montre l’histogramme des 180 délais
observés pour les signaux de référence détectés et illustre leur très large amplitude.
Les délais moyen et médian sont respectivement égaux à −190 et −49 jours.
25
20
15
10
5
0
−2000 −1000 0 1000 2000
Délais en jours
Fig. 5.6: Histogramme des 180 délais observés entre la date de détection par le
modèle GPS basé sur Pr(H∗0 ) et la date d’alerte en comité technique - Scénario 1.
A travers ce scénario, nous avons montré que les méthodes de détection auto-
matique permettent de détecter une proportion importante des signaux de référence

malgré les limites évoquées en introduction de cette partie. Cette analyse fondée sur
un nombre identique de signaux analysés chaque mois nous a aussi permis de compa-
rer de manière équitable les différentes méthodes et règles de classement étudiées. Il
en ressort que le modèle GPS en association avec Pr(H∗0 ) permet de détecter le plus
de signaux de référence dans le délai le plus court.
Cette étude montre aussi que les méthodes de détection ne deviennent réellement
efficaces que pour des associations impliquant au moins trois notifications. Cela ne
signifie pas pour autant qu’il faut restreindre l’analyse aux cellules avec au moins
trois notifications. En effet, si l’on prend l’exemple du modèle GPS, nous avons vu
que le nombre de signaux de référence détectés à partir des cellules non vides était
même supérieur à celui observé pour des cellules avec nij ≥ 3. Néanmoins, il faut
être conscient que la capacité du modèle GPS pour la détection de telles associations
semble limitée.
Dans la suite nous avons reconduit l’analyse séquentielle avec pour objectif d’éva-
luer les capacités de détection de GPS en association avec le FDR.
5.2.3 Deuxième scénario : Utilisation en routine de GPS
Dans cette analyse le modèle GPS basé sur la règle de classement Pr(H∗0 ) est utilisé
sur données restreintes aux couples avec au moins trois notifications. Pour chacune
des 79 analyses réalisées, le seuil de détection pour Pr(H∗0 ) est choisi en fonction
d’une valeur estimée de FDR égale à 5%. La figure 5.7 montre le nombre de nouveaux
signaux analysés chaque mois. Au 1er janvier 1996, l’utilisation du FDR à 5% ainsi que
des scores bibliographiques conduit à la génération de 2424 signaux parmi lesquels
figurent 74 signaux de référence. Dans l’idée d’une utilisation en routine, ces 2 424
signaux ont déjà été analysés au cours des mois précédents et l’on s’intéresse surtout
aux signaux générés à partir de janvier 1996. La figure 5.7 montre que le nombre de
nouveaux signaux varie entre 89 et 273 et tend à diminuer au cours du temps. Au
1er juillet 2002, le nombre de signaux analysés est égal à 13 650.
°
2000
1000
500
°
° °
°
200
°° °
°°
°° ° °° °°° ° ° °° °
° ° °°° ° ° °
° °° ° ° °° ° °° °° ° °
° ° ° ° °° ° ° ° °°
°°
° ° °
° °
°°
100
° ° ° °° ° °°
°
° ° ° °
1996 1997 1998 1999 2000 2001 2002
Fig. 5.7: Évolution du nombre de nouveaux signaux générés à partir du modèle

GPS basé sur Pr(H∗0 ) et d’un seuil de 5% pour le FDR∗ - Scénario 2.
La figure 5.8 montre l’évolution du seuil de détection sur la statistique Pr(H∗0 )

pour obtenir un FDR estimé de 5%. Si l’on suppose que la qualité de l’estimation de ce
dernier ne varie pas au cours du temps, alors on voit que le seuil sur Pr(H∗0 ) augmente
avec le temps ce qui est un argument supplémentaire en faveur de l’utilisation de
FDR∗ comme règle de décision.

Au 1er juillet 2002, 216 signaux de référence sont détectés, soit 69.9% des 309
signaux de référence et 82.4% des 262 signaux de référence avec au moins trois no-
tifications. Les signaux de référence détectés incluent la totalité de ceux détectés
0.19
°°°°°°
°°°
°°
°
°°
°
° °°°°
0.18 °
°°°° ° °°°°°°
°
°°°°
°°°
°° °°
°°
°
°°°°°
0.17
°° °°
°°
°°
°°°
°
° °
° ° °° °
0.16
°
°°°
°
°
°
0.15
1996 1997 1998 1999 2000 2001 2002
Fig. 5.8: Évolution du seuil sur Pr(H∗0 ) pour FDR∗ = 5% lors de l’utilisation de
GPS - Scénario 2.
dans le scénario précédent (y compris ceux des autres méthodes). Les tableaux B.2
et B.3 présentés en annexe listent les 216 signaux de référence détectés par le modèle
GPS dans ce scénario et les 46 signaux de référence non détectés mais avec plus
de trois notifications au 1er juillet 2002. Dans ce dernier tableau, les 12 signaux de
référence pour lesquels le risque observé (RRij /eij ) ne dépasse jamais 1 tout au long
de l’analyse sont aussi indiqués.

La figure 5.9 présente l’histogramme des délais entre la date de détection par
le modèle GPS avec Pr(H∗0 ) et la date d’alerte en comité technique pour les 216
signaux de référence. Parmi ces derniers, 148 sont détectés avant la date d’alerte en
comité technique. Les délais médian et moyen sont respectivement égaux à −234
et −384 jours. Le tableau 5.6 illustre ce type de résultats en fonction du nombre

de notifications associées aux signaux de référence au 1er juillet 2002. Il montre que
les performances en termes de rapidité et de pourcentage de signaux de référence
détectés augmente lorsque l’on s’intéresse à signaux de référence très notifiés.
30
20
10
0
−2000 −1000 0 1000 2000
Délais en jours
Fig. 5.9: Histogramme des 216 délais observés entre la date de détection par le
modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5% et la date d’alerte en comité technique
- Scénario 2.
Ce scénario conduit à analyser un plus grand nombre de signaux que dans le

scénario un (13 650 contre 8 850). Nous avons donc simulé une analyse fondée sur un
seuil plus restrictif pour le FDR, à savoir à 1%. La figure 5.10 présente (de la même
manière que la figure 5.7) le nombre de signaux analysés chaque mois. On peut
voir qu’en dehors de la première étape nécessitant l’analyse de 1 253 signaux (1 620
signaux générés − 367 signaux connus du point de vue des scores bibliographiques),
le nombre de signaux varie entre 57 et 152. Au terme de cette analyse, le nombre de
signaux analysés est égal à 8454, en comptant les 950 couples connus du point de vue
des scores bibliographiques, ce qui est moins que le nombre de signaux analysés au
cours du scénario 1. Néanmoins, les résultats obtenus sont meilleurs dans la mesure où
Nb de Nb de Nb de signaux % de signaux délai délai

notifications signaux de de référence de référence moyen médian
er
au 1 juil. 02 référence détectés détectés
≥3 262 216 82.4% −384 −234
≥5 231 195 84.4% −493 −304
≥ 10 178 161 90.4% −620 −409
≥ 25 122 111 91.0% −692 −422
≥ 50 74 69 93.2% −851 −561
≥ 100 36 34 94.4% −958 −619
Tab. 5.6: Capacité de détection du modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5%
en fonction du nombre de notifications associé aux signaux de référence au 1er juillet
2002 - Scénario 2.
°
1000
500
200
°
° °
°° ° °
° ° ° °°
100
°° ° ° ° ° °
° ° ° ° ° ° ° ° °°
° °° ° ° °°° °
° ° °
° °°°
° ° ° ° ° °° °
° ° ° °
° ° °
°
° °° ° ° ° °°
° ° ° °
° °°
°
50
1996 1997 1998 1999 2000 2001 2002
Fig. 5.10: Évolution du nombre de nouveaux signaux générés à partir du modèle

GPS basé sur Pr(H∗0 ) et FDR∗ = 1% - Scénario 2.
191 signaux de référence sont détectés contre 180 précédemment. De plus, les délais
entre la date de détection et la date d’alerte en comité technique de pharmacovigilance

sont en moyenne et en médiane respectivement égaux à −356 et −155 ce qui traduit
une meilleure anticipation que dans le scénario 1. Évidemment, dans ce scénario,
il est tout de même nécessaire d’évaluer un grand nombre de signaux lors de la
première analyse et il n’est pas évident que suffisamment de ressources humaines soit
mobilisables pour cette première étape. Il n’en reste pas moins que si l’on souhaite
mettre en place un système de détection qui soit réactif par rapport aux alertes
d’actualité, il semble nécessaire de faire cette analyse préliminaire qui vise à réaliser
d’une certaine manière “l’état des lieux du système”.

Chapitre 6
Conclusion
De par la nature des données traitées, les méthodes de détection automatique sont
fondamentalement des outils d’analyse exploratoire. Néanmoins, la mise en place d’un

cadre statistique visant à tenir compte de la multiplicité des comparaisons permet
de fonder la génération de signaux sur la base de seuils liés à des critères d’erreurs
directement interprétables. Evidemment, les quantités caractéristiques estimées dans
ce travail ne peuvent être interprétées au niveau général de l’identification d’associa-
tions médicamenteuses. Il s’agit avant tout de caractéristiques permettant d’évaluer

les capacités statistiques des méthodes en prenant comme référentiel les données sur
lesquelles elles sont appliquées.
L’approche présentée est simple à mettre en place et ne modifie pas les modèles
de probabilité des différentes méthodes. Elle consiste tout d’abord à proposer de

nouvelles règles de classement, à savoir les degrés de signification pour les méthodes
fréquentistes et les probabilités a posteriori de l’hypothèse nulle pour les méthodes
bayésiennes. De ce point de vue, nous avons montré à travers l’étude par simulation
et dans une moindre mesure à travers l’évaluation séquentielle à partir de cas réels
la supériorité de la règle de classement proposée sur celles existantes dans le cas
du modèle GPS. Concernant les autres méthodes, étant donné l’absence de référence
90
91
quant à la possibilité d’ordonner les cellules selon une statistique d’intérêt, nous avons
considéré les règles de décision en vigueur comme des cas particuliers de l’approche
proposée.
Dès lors que l’on travaille à partir d’une règle de classement, deux stratégies
de détection sont envisageables et correspondent aux deux scénarios étudiés lors de
l’évaluation séquentielle des méthodes à partir des cas d’alertes réels. La première
consiste à analyser un certain nombre de signaux ordonnés selon la statistique de
classement, ce nombre étant fixé au regard des capacités d’analyses des systèmes
de pharmacovigilance avec la possibilité à tout moment d’estimer les quantités ca-
ractéristiques. La deuxième stratégie, plus proche de ce qui semble être fait par les
principaux systèmes de pharmacovigilance, consiste à fixer préalablement un seuil
de détection, dans notre cas sur la base de FDR∗. Le nombre de signaux à analyser
devient donc variable mais semble diminuer au cours du temps.
Ces stratégies de détection reposent fondamentalement sur le prérequis d’une
estimation sans biais du FDR ou tout du moins sur une estimation donnant des
garanties sur le contrôle de celui-ci. Or, l’étude par simulation montre que malgré
des performances opérationnelles très proches à nombre de signaux générés égal, la
qualité d’estimation du FDR varie de manière importante d’une méthode à l’autre.
Ainsi, pour le modèle BCPNN, on observe une importante sous-estimation du FDR

pour des RR0 d’intérêt majeurs reflétant probablement une modélisation des don-
nées moins satisfaisante que celle obtenue avec le modèle GPS. En ajoutant à cela
la lourdeur computationnelle due à l’estimation de Pr(H∗0 ) par Monte Carlo, il nous
semble donc que l’utilisation de ce modèle avec l’approche proposée est peu inté-
ressante. L’approche d’estimation du FDR pour les méthodes fréquentistes présente
l’avantage de garantir un contrôle de ce critère sous réserve du respect des hypothèses
distributionnelles, ce qui n’est pas le cas pour la méthode ROR, mais au prix d’une
92
surestimation relativement importante même dans le cas de midRFET. Au terme de
deux études par simulation et de l’évaluation séquentielle à partir de cas d’alertes

réels, il semble donc que ce soit le modèle GPS en association avec la règle de décision
proposée qui fournisse les résultats les plus satisfaisants.
Il faut toutefois noter que des travaux récents dans le domaine de l’analyse des
données de génomique explorent les limites de l’utilisation des méthodes d’estimation

du FDR en présence de dépendances. En particulier, Qiu et al. (2005) ont montré
par simulations que plusieurs estimateurs du FDR (dont Qvalue) pouvaient être en-
tachés dans ce cas d’une variance importante. Les scénarios étudiés sont néanmoins
très pessimistes dans la mesure où les données sont générées sous une structure de
dépendance complète (tous les gènes sont corrélés) et sur un nombre relativement
restreint de gènes (1 255). Il n’en demeure pas moins que certaines formes de dé-
pendance entre événements ou entre médicaments existent très vraisemblablement
dans les données de pharmacovigilance analysées. Par conséquent, les récents dé-
veloppements ayant pour objectif d’améliorer les qualités des estimateurs du FDR
par l’utilisation d’informations supplémentaires disponibles constituent des sources
d’inspiration précieuses (Ferkingstad et Frigessi, 2008; Leek et Storey, 2008).
Plus généralement, la prise en compte d’informations supplémentaires semble être
d’autant plus attrayante qu’elle doit aussi permettre d’augmenter les chances de gé-
nérer des signaux pertinents. La méthode GPS permet déjà de prendre en compte,
par stratification, certaines caractéristiques des patients à l’origine des notifications
pour la détermination du nombre attendu eij . Très récemment Prieto-Merino et al.
(2008) ont utilisé le modèle bayésien hiérarchique de Berry et Berry (2004) ainsi que
des méthodes de classification non supervisées afin de prendre en compte les corré-
lations observées entre événements indésirables dans la base de pharmacovigilance
pour améliorer le calcul du ROR. En ce qui concerne les médicaments, une voie d’ex-
93
ploration pourrait être de prendre en compte les mécanismes d’actions des principes
actifs à travers l’utilisation, par exemple, de profils d’affinité aux différents récepteurs
moléculaires.
Pour conclure, l’évaluation rétrospective des approches proposées à partir de cas
réels vient confirmer l’utilité de ces outils de détection automatique. Par conséquent,
en parallèle des perspectives de recherche méthodologique citées plus haut, il paraı̂t

essentiel de travailler à la mise en place rapide d’un système de détection automatique
en France.
Bibliographie
Agresti, A. (2002). Categorical data analysis. Wiley Interscience.
Almenoff, J. S., Lacroix, K. K., Yuen, N. A., Fram, D. et DuMouchel, W. (2006). Com-
parative performance of two quantitative safety signalling methods : Implications for use in a
pharmacovigilance department. Drug Safety, 29(10):875–887.
Almenoff, J. S., Pattishall, E. N., Gibbs, T. G., DuMouchel, W., Evans, S. J. W. et Yuen, N.
(2007). Novel statistical tools for monitoring the safety of marketed drugs. Clinical Pharmacology
& Therapeutics, 82(2):157–166.
Almenoff, J. S., Tonning, J. M., Gould, A. L., Szarfman, A., Hauben, M., Ouellet-
Hellstrom, R., Ball, R., Hornbuckle, K., Walsh, L., Yee, C., Sacks, S. T., Yuen, N. A.,
Patadia, V., Blum, M., Johnston, M., Gerrits, C., Seifert, H. et LaCroix, K. K. (2005).
Perspectives on the use of data mining in pharmacovigilance. Drug Safety, 28(11):981–1007.
Bate, A., Lindquist, M., Edwards, I. R., Olsson, S., Orre, R., Lansner, A. et De Freitas,
R. M. (1998). A bayesian neural network method for adverse drug reaction signal generation.
European Journal of Clinical Pharmacology, 54(4):315–321.
Benjamini, Y. et Hochberg, Y. (1995). Controlling the false discovery rate : a practical and
powerful approach to multiple testing. Journal of the Royal Statistical Society, Series B, 57(1):
289–300.
Berry, S. M. et Berry, D. A. (2004). Accounting for multiplicities in assessing drug safety : A

three-level hierarchical mixture model. Biometrics, 60(2):418–426.
Brown, E. G., Wood, L. et Wood, S. (1999). The medical dictionary for regulatory activities
(MedDRA). Drug Safety, 20(2):1999.
Broët, P., Lewin, A., Richardson, S., Dalmasso, C. et Magdelenat, H. (2004). A mixture
model-based strategy for selecting sets of genes in multiclass response microarray experiments.
Bioinformatics, 20(16):2562–2571.
Bégaud, B., Evreux, J. C., Jouglard, J. et Lagier, G. (1985). Imputabilité des effets inattendus
ou toxiques des médicaments : actualisation de la méthode utilisée en france. Thérapie, 40(2):111–
118.
Bégaud, B., Martin, K., Haramburu, F. et Moore, N. (2002). Rates of spontaneous reporting
of adverse drug reactions in france. JAMA, 288:1588.
Dalmasso, C., Broët, P. et Moreau, T. (2005). A simple procedure for estimating the false
discovery rate. Bioinformatics, 21(5):660–668.
94
BIBLIOGRAPHIE 95
DuMouchel, W. (1999). Bayesian data mining in large frequency tables, with an application to
the fda spontaneous reporting system. The American Statistician, 53(3):177–190.
DuMouchel, W. et Pregibon, D. (2001). Empirical bayes screening for multi-item associations.

In KDD ’01 : Proceedings of the Seventh ACM SIGKDD International Conference on Knowledge
Discovery and Data Mining, pages 67–76.
Evans, S. (2003). Sequential probability ratio tests applied to public health problems. Controlled
Clinical Trials, 24:67S.
Evans, S. J., Waller, P. C. et Davis, S. (2001). Use of proportional reporting ratios (PRRs) for
signal generation from spontaneous adverse drug reaction reports. Pharmacoepidemiology and
Drug Safety, 10(6):483–486.
Ferkingstad, E. et Frigessi, A. (2008). Unsupervised empirical bayesian multiple testing with

external covariates. Annals of Applied Statistics, 2(2):714–735.
Friedman, M. (1937). The use of ranks to avoid the assumption of normality implicit in the
analysis of variance. Journal of the American Statistical Association, 32(200):675–701.
Gottardo, R., Raftery, A. E., Yeung, K. Y. et Bumgarner, R. (2006). Bayesian robust

inference for differential gene expression in cdna microarrays with multiple samples. Biometrics,
62:10–18.
Gould, A. L. (2003). Practical pharmacovigilance analysis strategies. Pharmacoepidemiology and

Drug Safety, 12(7):559–574.
Gould, A. L. (2007). Accounting for multiplicity in the evaluation of ”signals” obtained by data
mining from spontaneous report adverse event databases. Biometrical Journal, 49:151–165.
Hauben, M., Madigan, D., Gerrits, C. M., Walsh, L. et van Puijenbroek, E. P. (2005). The
role of data mining in pharmacovigilance. Expert Opinion on Drug Safety, 4(5):929–948.
Hochberg, Y. et Tamhane, A. C. (1987). Multiple Comparison Procedures. Wiley.
Lai, Y. (2007). A moment-based method for estimating the proportion of true null hypotheses and
its application to microarray gene expression data. Biostatistics, 8(4):744–755.
Leek, J. T. et Storey, J. D. (2008). A general framework for multiple testing dependence.

Proceedings of the National Academy of Sciences, 105(48):18718–18723.
Lewin, A., Bochkina, N. et Richardson, S. (2007). Fully bayesian mixture model for differen-
tial gene expression : Simulations and model checks. Statistical Applications in Genetics and
Molecular Biology, 6:Article 36.
Lindquist, M., Ståhl, M., Bate, A., Edwards, I. et Meyboom, R. H. B. (2000). A retrospective
evaluation of a data mining approach to aid finding new adverse drug reaction signals in the who
international database. Drug Safety, 23(6):533–542.
McLachlan, G. J., Bean, R. W. et Ben-Tovim Jones, L. (2006). A simple implementation of a

normal mixture approach to differential gene expression in multiclass microarrays. Bioinforma-
tics, 22(13):1608–1615.
Miller, G. C. et Britt, H. (1995). A new drug classification for computer systems : the ATC
extension code. International Journal of Bio-Medical Computing, 40(2):121–124.
BIBLIOGRAPHIE 96
Müller, P., Parmigiani, G., Robert, C. et Rousseau, J. (2004). Optimal sample size for
multiple testing : the case of gene expression microarrays. Journal of The American Statistical
Association, 99:990–1001.
Newton, M. A., Noueiry, A., Sarkar, D. et Ahlquist, P. (2004). Detecting differential gene
expression with a semiparametric hierarchical mixture method. Biostatistics, 5(2):155–176.
Norén, G. N., Bate, A., Orre, R. et Edwards, I. R. (2006). Extending the methods used to
screen the who drug safety database towards analysis of complex associations and improved
accuracy for rare events. Statistics in Medicine, 25(21):3740–3757.
Pounds, P. et Cheng, C. (2006). Robust estimation of the false discovery rate. Bioinformatics,
22(16):1979–1987.
Pounds, S. et Cheng, C. (2004). Improving false discovery rate estimation. Bioinformatics,

20(11):1737–1745.
Pounds, S. et Morris, S. W. (2003). Estimating the occurrence of false positives and false negatives
in microarray studies by approximating and partitioning the empirical distribution of p-values.
Bioinformatics, 19(10):1236–1242.
Prieto-Merino, D., Evans, S. J. W., Whittaker, J., Smeeth, L. et Spiegelhalter, D. J.

(2008). Different groupings of drug adverse events in a bayesian analyses. In 29th Annual
Conference of the International Society for Clinical Biostatistics.
Qiu, X., Klebanov, L. et Yakovlev, A. (2005). Correlation between gene expression levels
and limitations of the empirical bayes methodology for finding differentially expressed genes.
Statistical Applications in Genetics and Molecular Biology, 4:Article34.
R Development Core Team (2008). R : A Language and Environment for Statistical Computing.
R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0.
Roux, E., Thiessard, F., Fourrier, A., Bégaud, B. et Tubert-Bitter, P. (2005). Evaluation of
statistical association measures for the automatic signal generation in pharmacovigilance. IEEE
Transactions on Information Technology in Biomedicine, 9(4):518–527.
Roux, E., Thiessard, F., Fourrier-Reglat, A., Bégaud, B. et P., T.-B. (2003). Spontaneous
reporting system modelling for data mining methods evaluation in pharmacovigilance. In Work-
shop Intelligent Data Analysis in Medicine and Pharmacology.
Roux, E., Thiessard, F., Fourrier-Réglat, A., Bégaud, B. et Tubert-Bitter, P. (2007).

Advances in Statistical Methods for the Health Sciences, chapitre Spontaneous Reporting System
Modelling for the Evaluation of Automatic Signal Generation Methods in Pharmacovigilance,
pages 75–92. Birkhauser.
Schweder, T. et Spjøtvoll, E. (1982). Plots of p-values to evaluate many tests simultaneously.

Biometrika, 69(3):493–502.
Scott, J. G. et Berger, J. O. (2006). An exploration of aspects of bayesian multiple testing.

Journal of Statistical Planning and Inference, 136(7):2144–2162.
Storey, J. D. (2002). A direct approach to false discovery rates. Journal of the Royal Statistical
Society, Series B, 64(3):479–498.
BIBLIOGRAPHIE 97
Storey, J. D. et Tibshirani, R. (2003). Statistical significance for genome-wide studies. Procee-

dings of the National Academy of Sciences, 100:9440–9445.
Szarfman, A., Machado, S. et O’Neill, R. (2002). Use of screening algorithms and computer
systems to efficiently signal higher-than-expected combinations of drugs and events in the US
FDA’s spontaneous reports database. Drug Safety, 25(6):381–392.
Thiessard, F. (2004). Détection des effets indésirables des médicaments par un système de géné-
ration automatisée du signal adapté à la base nationale française de pharmacovigilance. Thèse
de doctorat, Université Victor Segalen - Bordeaux 2.
Thiessard, F., Roux, E., Miremont-Salamé, G., Fourrier-Réglat, A., Haramburu, F.,
Tubert-Bitter, P. et Bégaud, B. (2005). Trends in spontaneous adverse drug reaction reports
to the French pharmacovigilance system (1986-2001). Drug Safety, 28(8):731–740.
van der Heijden, P. G., Van Puijenbroek, E. P., Van Buuren, S. et Van der Hofstede, J. W.
(2002). On the assessment of adverse drug reactions from spontaneous reporting systems : the
influence of under-reporting on odds ratios. Statistics in Medicine, 21(14):2027–2044.
van Puijenbroek, E. P., Bate, A., Leufkens, H. G., Lindquist, M., Orre, R. et Egberts,
A. C. (2002). A comparison of measures of disproportionality for signal detection in spontaneous
reporting systems for adverse drug reactions. Pharmacoepidemiology and Drug Safety, 11(1):3–10.
Annexe A
Résultats complémentaires pour

l’étude de simulations
98
99
ψ0 = 1 ψ0 = 2 ψ0 = 5
7
7
ROR
6
6
5
5
4
4
3
3
2
2
1
1
0
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
(a) (b) (c)

7
7
RFET
6
6
5
5
4
4
3
3
2
2
1
1
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
(d) (e) (f)

7
midRFET
6
6
5
5
4
4
3
3
2
2
1
1
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
(g) (h) (i)
Fig. A.1: Histogrammes de la distribution des degrés de signification sous H0 pour

ROR, RFET et midRFET avec nij ≥ 1. Les histogrammes sont obtenus à partir
de 50 jeux de données simulés et des degrés de signification pour lesquels ψij ≤ ψ0 .
Les figures tronquent la distribution des degrés de signification proches de 1 afin de
représenter plus clairement la distribution des petits degrés de signification.
100
ψ0 = 1 ψ0 = 2 ψ0 = 5
7
7
ROR
6
6
5
5
4
4
3
3
2
2
1
1
0
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
(a) (b) (c)

7
7
RFET
6
6
5
5
4
4
3
3
2
2
1
1
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
(d) (e) (f)

7
midRFET
6
6
5
5
4
4
3
3
2
2
1
1
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
(g) (h) (i)
Fig. A.2: Histogrammes de la distribution des degrés de signification sous H0 pour

ROR, RFET et midRFET avec nij ≥ 3. Les histogrammes sont obtenus à partir
de 50 jeux de données simulés et des degrés de signification pour lesquels ψij ≤ ψ0 .
Les figures tronquent la distribution des degrés de signification proches de 1 afin de
représenter plus clairement la distribution des petits degrés de signification.
101
ψ0 = 1
0.50
0.45
f(p*)
0.40
0.35
0.30
0.0 0.2 0.4 0.6 0.8 1.0
(a)
ψ0 = 2
0.40
0.35
f(p*)
0.30
0.25
0.20
0.0 0.2 0.4 0.6 0.8 1.0
(b)
ψ0 = 5
0.20
LBE
Qvalue
0.15
f(p*)
0.10
0.05
0.00
0.0 0.2 0.4 0.6 0.8 1.0
(c)
Fig. A.3: Estimations de π0 π0 ∗ obtenues avec LBE et Qvalue à partir de la distri-

bution marginale des degrés de signification transformés (p∗ ) pour ROR. Les histo-
grammes sont obtenus à partir des cellules non-vides des 500 jeux de simulations.
Les lignes horizontales représentent les estimations obtenues pour π0 π0 ∗ avec les
procédures LBE et Qvalue. Les trois figures représentent les résultats pour les trois
hypothèses nulles testées.
Annexe B
Résultats complémentaires pour

l’application
102
103
ψ0 = 1 , RR0 = 1 ψ0 = 2 , RR0 = 2
1.00
1.00
0.95
0.95
0.90
0.90
0.85
0.85
GPS − BCPNN
0.80
0.80
GPS − midRFET
GPS − ROR
BCPNN − midRFET
0.75
0.75
BCPNN − ROR
midRFET − ROR
0.70
0.70
0.00 0.02 0.04 0.06 0.08 0.10 0.00 0.02 0.04 0.06 0.08 0.10
FDR estimé par GPS FDR estimé par GPS
(a) (b)
ψ0 = 3 , RR0 = 3 ψ0 = 4 , RR0 = 4
1.00
1.00
0.95
0.95
0.90
0.90
0.85
0.85
0.80
0.80
0.75
0.75
0.70
0.70
0.00 0.02 0.04 0.06 0.08 0.10 0.00 0.02 0.04 0.06 0.08 0.10
FDR estimé par GPS FDR estimé par GPS
(c) (d)
ψ0 = 5 , RR0 = 5
1.00
0.95
0.90
0.85
0.80
0.75
0.70
0.00 0.02 0.04 0.06 0.08 0.10

FDR estimé par GPS
(e)
Fig. B.1: Proportion de signaux communs entre les méthodes proposées en fonction
du FDR estimé par GPS. L’évolution de cette proportion est illustrée pour différents
{ψ0 , RR0 }.
Tab. B.1: Signaux de référence (47) avec moins de 3 notifications spontanées au 1er juillet 2002.
ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT
A-M-J
A01AB 10013862 2001-12-04 ANTIINFECTIEUX POUR TRAITEMENT ORAL LOCAL Duodenal ulcers and perforation
A02BX 10027678 1996-09-30 AUTRES MEDICAMENTS POUR L’ULCERE GASTRO-DUODENAL ET LE Gastrointestinal signs and symptoms NEC
REFLUX GASTRO-OESPHAGIEN (RGO)
A07AA 10008028 1998-07-23 ANTIBIOTIQUES Cerebellar coordination and balance distur-
bances
A07EC 10035777 1996-09-30 ACIDE AMINOSALICYLIQUE ET ANALOGUES Poisoning and toxicity
A08AA 10046971 1997-09-15 MEDICAMENTS CONTRE L’OBESITE A ACTION CENTRALE Cardiac valve disorders NEC
A12AA 10007602 1998-12-17 CALCIUM Cardiac and vascular procedural complications
B02BB 10057181 1998-12-17 FIBRINOGENE Vascular hypotensive disorders
C02AA 10022398 1997-02-28 ALCALOIDES DU RAUWOLFIA Inner ear signs and symptoms
C02AA 10052769 1997-02-28 ALCALOIDES DU RAUWOLFIA Vertigos NEC
C04AX 10046591 1997-04-01 AUTRES VASODILATATEURS PERIPHERIQUES Urinary tract signs and symptoms NEC
D07AB 10012736 1997-07-15 CORTICOIDES D’ACTIVITE MODEREE (GROUPE II) Diarrhoea (excl infective)
G01AD 10014624 1998-10-21 ACIDES ORGANIQUES Encephalopathies toxic and metabolic
G03AA 10037555 1999-06-22 PROGESTATIFS ET ESTROGENES EN ASSOCIATION FIXE Purpura and related conditions
J01AA 10030206 1997-12-04 TETRACYCLINES Oesophageal ulcers and perforation
J01CG 10037573 1996-12-19 INHIBITEURS DE BETALACTAMASES Pustular conditions
J01CG 10040786 1996-12-19 INHIBITEURS DE BETALACTAMASES Skin structures and soft tissue infections
J01GA 10011879 1998-07-23 STREPTOMYCINES Hearing losses
J01XX 10027654 2001-01-09 AUTRES ANTIBACTERIENS Allergic conditions NEC
J05AE 10002700 2000-10-17 INHIBITEURS DE PROTEASE Anterior pituitary hyperfunction
J05AE 10013316 2000-10-17 INHIBITEURS DE PROTEASE Lactation disorders
J05AE 10021109 2000-10-17 INHIBITEURS DE PROTEASE Hypothalamic and pituitary disorders NEC
J05AE 10038909 1996-09-12 INHIBITEURS DE PROTEASE Retinal, choroid and vitreous infections and in-
flammations
J07AG 10028323 2002-02-18 VACCINS ANTIHAEMOPHILUS INFLUENZAE B Muscle pains
J07AL 10007602 1998-02-23 VACCINS ANTIPNEUMOCOCCIQUES Cardiac and vascular procedural complications
J07AL 10057181 1998-02-23 VACCINS ANTIPNEUMOCOCCIQUES Vascular hypotensive disorders
J07BL 10007935 1998-09-10 VACCINS CONTRE LA FIEVRE JAUNE Central nervous system and spinal infections
J07BL 10027187 1998-09-10 VACCINS CONTRE LA FIEVRE JAUNE Meningitis NEC
L01AA 10035777 1997-10-16 MOUTARDES A L’AZOTE Poisoning and toxicity
L01BC 10007580 1998-02-11 ANALOGUES DE LA PYRIMIDINE Cardiac infections
L01BC 10034494 1998-02-11 ANALOGUES DE LA PYRIMIDINE Noninfectious pericarditis
M01AE 10005049 1997-12-04 DERIVES DE L’ACIDE PROPIONIQUE Bladder infections and inflammations
M01AE 10046577 1997-12-04 DERIVES DE L’ACIDE PROPIONIQUE Urinary tract infections
M01AE 10052776 2000-08-26 DERIVES DE L’ACIDE PROPIONIQUE Musculoskeletal and connective tissue infec-
tions and inflammations NEC
M01AE 10057192 2000-08-26 DERIVES DE L’ACIDE PROPIONIQUE Muscle and soft tissue infections
M01AH 10052776 2000-08-26 COXIBS Musculoskeletal and connective tissue infec-
104
tions and inflammations NEC
M01AH 10057192 2000-08-26 COXIBS Muscle and soft tissue infections
Tab. B.1: Signaux de référence (47) avec moins de 3 notifications spontanées au 1er juillet 2002.
A-M-J
M01AX 10052776 2000-08-26 AUTRES ANTIINFLAMMATOIRES ANTIRHUMATISMAUX NON STEROI- Musculoskeletal and connective tissue infec-
DIENS tions and inflammations NEC
M01AX 10057192 2000-08-26 AUTRES ANTIINFLAMMATOIRES ANTIRHUMATISMAUX NON STEROI- Muscle and soft tissue infections
DIENS
N02AC 10004607 1996-01-04 DERIVES DE LA DIPHENYLPROPYLAMINE Bile duct infections and inflammations
N03AX 10018305 2001-10-09 AUTRES ANTIEPILEPTIQUES Glaucomas (excl congenital)
N05AH 10007635 2002-02-05 DIAZEPINES, OXAZEPINES ET THIAZEPINES Cardiomyopathies
N06AX 10019281 2000-06-29 AUTRES ANTIDEPRESSEURS Heart failures NEC (excl ventricular failure)
N06BC 10004607 1996-01-04 DERIVES DE LA XANTHINE Bile duct infections and inflammations
N07CA 10012401 2001-08-17 ANTIVERTIGINEUX Depressive disorders
R06AX 10010447 1999-03-01 AUTRES ANTIHISTAMINIQUES A USAGE SYSTEMIQUE Congenital male reproductive tract disorders
R06AX 10010661 1999-03-01 AUTRES ANTIHISTAMINIQUES A USAGE SYSTEMIQUE Congenital urethral disorders
R06AX 10025517 1999-03-01 AUTRES ANTIHISTAMINIQUES A USAGE SYSTEMIQUE Male reproductive tract disorders congenital
105
Tab. B.2: Signaux de référence (216) détectés par le modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5% - Scénario 2.
A-M-J
A01AB 10030206 1999-09-07 ANTIINFECTIEUX POUR TRAITEMENT ORAL LOCAL Oesophageal ulcers and perforation
A01AD 10021982 1998-10-21 AUTRES MEDICAMENTS POUR TRAITEMENT ORAL LOCAL Inflammatory disorders following infection
A02BC 10010301 2002-04-16 INHIBITEURS DE LA POMPE A PROTONS Confusion and disorientation
A02BC 10011168 2002-04-16 INHIBITEURS DE LA POMPE A PROTONS Cortical dysfunction NEC
A02BC 10013305 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Erection and ejaculation conditions and disor-
ders
A02BC 10013322 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Male gonadal function disorders
A02BC 10034374 2002-04-16 INHIBITEURS DE LA POMPE A PROTONS Perception disturbances
A02BC 10040466 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Sexual arousal disorders
A02BC 10040675 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Breast disorders NEC
A02BC 10041273 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Sodium imbalance
A03AA 10024385 1999-04-27 ANTICHOLINERGIQUES DE SYNTHESE : ESTERS AVEC GROUPEMENT Leukopenias NEC
AMINE TERTIAIRE
A03AX 10002220 1996-01-11 AUTRES MEDICAMENTS POUR LES DESORDRES FONCTIONNELS IN- Anaphylactic responses
TESTINAUX
A03AX 10009193 1996-01-11 AUTRES MEDICAMENTS POUR LES DESORDRES FONCTIONNELS IN- Circulatory collapse and shock
TESTINAUX
A03AX 10019833 1998-02-18 AUTRES MEDICAMENTS POUR LES DESORDRES FONCTIONNELS IN- Hepatocellular damage and hepatitis NEC
TESTINAUX
A03FA 10013929 1996-03-07 STIMULANTS DE LA MOTRICITE INTESTINALE Dyskinesias and movement disorders NEC
A06AA 10052566 1996-05-22 LAXATIFS LUBRIFIANTS Rashes, eruptions and exanthems NEC
A07A 10024689 1996-10-31 ANTIINFECTIEUX INTESTINAUX Liver function analyses
A07AA 10003788 1998-07-23 ANTIBIOTIQUES Auditory nerve disorders
A07AA 10011879 1998-07-23 ANTIBIOTIQUES Hearing losses
A07AA 10024385 1997-02-26 ANTIBIOTIQUES Leukopenias NEC
A07DA 10019833 2001-06-05 RALENTISSEURS DE LA MOTRICITE INTESTINALE Hepatocellular damage and hepatitis NEC
A07EC 10018365 1996-09-30 ACIDE AMINOSALICYLIQUE ET ANALOGUES Glomerulonephritis and nephrotic syndrome
A07EC 10029137 1996-09-30 ACIDE AMINOSALICYLIQUE ET ANALOGUES Nephritis NEC
A07EC 10029150 1996-09-30 ACIDE AMINOSALICYLIQUE ET ANALOGUES Nephropathies and tubular disorders NEC
A08AA 10037401 1997-09-15 MEDICAMENTS CONTRE L’OBESITE A ACTION CENTRALE Pulmonary hypertensions
A10BB 10019833 1998-02-26 SULFAMIDES, DERIVES DE L’UREE Hepatocellular damage and hepatitis NEC
A11AA 10019833 1996-02-15 POLYVITAMINES AVEC ELEMENTS MINERAUX Hepatocellular damage and hepatitis NEC
A11HA 10019833 1996-02-15 AUTRES PREPARATIONS VITAMINIQUES NON ASSOCIEES Hepatocellular damage and hepatitis NEC
A12CB 10040786 2000-06-13 ZINC Skin structures and soft tissue infections
A12CB 10040788 2000-06-13 ZINC Skin and subcutaneous tissue bacterial infec-
tions
A13A 10012736 1997-07-15 TONIQUES Diarrhoea (excl infective)
B01AB 10013305 1998-11-19 GROUPE DE L’HEPARINE Erection and ejaculation conditions and disor-
ders
106
B01AB 10018987 1999-12-07 GROUPE DE L’HEPARINE Haemorrhages NEC
B01AC 10024385 1998-08-31 INHIBITEURS DE L’AGREGATION PLAQUETTAIRE, HEPARINE EXCLUE Leukopenias NEC
Tab. B.2: Signaux de référence (216) détectés par le modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5% - Scénario 2 (suite).
A-M-J
B01AC 10026847 1996-09-12 INHIBITEURS DE L’AGREGATION PLAQUETTAIRE, HEPARINE EXCLUE Marrow depression and hypoplastic anaemias
B02AA 10039912 1996-09-12 ACIDES AMINES Seizures and seizure disorders NEC
B03XA 10043411 2000-03-07 AUTRES PREPARATIONS ANTIANEMIQUES Therapeutic drug monitoring analyses
B05AA 10019833 1998-09-10 SUBSTITUTS DU SANG ET FRACTIONS PROTEIQUES PLASMATIQUES Hepatocellular damage and hepatitis NEC
B05AA 10053567 1997-11-13 SUBSTITUTS DU SANG ET FRACTIONS PROTEIQUES PLASMATIQUES Coagulopathies
B06AA 10012736 1997-07-15 ENZYMES Diarrhoea (excl infective)
C01BC 10019833 2000-02-16 ANTIARYTHMIQUES, CLASSE IC Hepatocellular damage and hepatitis NEC
C01BD 10043712 1999-02-15 ANTIARYTHMIQUES, CLASSE III Thyroid disorders NEC
C01BG 10019833 1996-02-15 AUTRES ANTIARYTHMIQUES DE CLASSE I Hepatocellular damage and hepatitis NEC
C01DX 10042129 1997-04-24 AUTRES VASODILATATEURS EN CARDIOLOGIE Stomatitis and ulceration
C01DX 10047283 2000-09-12 AUTRES VASODILATATEURS EN CARDIOLOGIE Ventricular arrhythmias and cardiac arrest
C02CA 10002700 1999-09-07 ALPHA-BLOQUANTS Anterior pituitary hyperfunction
C02CA 10013316 1999-09-07 ALPHA-BLOQUANTS Lactation disorders
C02CA 10021109 1999-09-07 ALPHA-BLOQUANTS Hypothalamic and pituitary disorders NEC
C03AA 10033646 1998-09-10 THIAZIDIQUES NON ASSOCIES Acute and chronic pancreatitis
C03DB 10038443 1998-06-13 AUTRES DIURETIQUES EPARGNEURS POTASSIQUES Renal failure and impairment
C04AX 10029306 2001-01-11 AUTRES VASODILATATEURS PERIPHERIQUES Neurological signs and symptoms NEC
C04AX 10039912 1996-03-07 AUTRES VASODILATATEURS PERIPHERIQUES Seizures and seizure disorders NEC
C05AX 10012736 1997-07-15 AUTRES ANTIHEMORROIDAIRES A USAGE TOPIQUE Diarrhoea (excl infective)
C05CA 10019833 1996-02-15 BIOFLAVONOIDES Hepatocellular damage and hepatitis NEC
C05CX 10019833 1996-02-15 AUTRES MEDICAMENTS AGISSANT SUR LES CAPILLAIRES Hepatocellular damage and hepatitis NEC
C08EA 10037908 1999-10-12 DERIVES DE LA PHENYLALKYLAMINE Rate and rhythm disorders NEC
C09AA 10024972 1998-11-23 INHIBITEURS DE L’ENZYME DE CONVERSION (IEC) NON ASSOCIES Lower respiratory tract inflammatory and im-
munologic conditions
C09AA 10036451 2002-03-12 INHIBITEURS DE L’ENZYME DE CONVERSION (IEC) NON ASSOCIES Potassium imbalance
C09AA 10043131 1996-03-07 INHIBITEURS DE L’ENZYME DE CONVERSION (IEC) NON ASSOCIES Taste disorders
C09AA 10052828 1998-11-23 INHIBITEURS DE L’ENZYME DE CONVERSION (IEC) NON ASSOCIES Eosinophilic disorders
C10AA 10007772 1998-05-20 INHIBITEURS DE L’HMG-COA REDUCTASE Cataracts (excl congenital)
C10AA 10013305 1999-06-22 INHIBITEURS DE L’HMG-COA REDUCTASE Erection and ejaculation conditions and disor-
ders
C10AA 10013322 2001-12-04 INHIBITEURS DE L’HMG-COA REDUCTASE Male gonadal function disorders
C10AA 10028640 2002-03-12 INHIBITEURS DE L’HMG-COA REDUCTASE Myopathies
C10AA 10033646 1999-10-12 INHIBITEURS DE L’HMG-COA REDUCTASE Acute and chronic pancreatitis
C10AA 10033979 2002-03-12 INHIBITEURS DE L’HMG-COA REDUCTASE Parenchymal lung disorders NEC
C10AA 10040466 1999-06-22 INHIBITEURS DE L’HMG-COA REDUCTASE Sexual arousal disorders
C10AA 10040675 2001-12-04 INHIBITEURS DE L’HMG-COA REDUCTASE Breast disorders NEC
C10AA 10043234 1998-02-26 INHIBITEURS DE L’HMG-COA REDUCTASE Tendon disorders
C10AB 10034971 1998-09-10 FIBRATES Photosensitivity conditions
D01AE 10040786 2000-06-13 AUTRES ANTIFONGIQUES A USAGE TOPIQUE Skin structures and soft tissue infections
107
D01AE 10040788 2000-06-13 AUTRES ANTIFONGIQUES A USAGE TOPIQUE Skin and subcutaneous tissue bacterial infec-
tions
A-M-J
D02AC 10052566 1996-05-22 PARAFFINE ET PRODUITS GRAS Rashes, eruptions and exanthems NEC
D06AX 10018913 1996-06-27 AUTRES ANTIBIOTIQUES A USAGE TOPIQUE Haemolyses NEC
D06AX 10024385 1996-06-27 AUTRES ANTIBIOTIQUES A USAGE TOPIQUE Leukopenias NEC
D06AX 10034607 1997-11-13 AUTRES ANTIBIOTIQUES A USAGE TOPIQUE Peripheral neuropathies NEC
D06BA 10012435 2000-09-12 SULFAMIDES Dermatitis and eczema
D06BA 10015151 2000-09-12 SULFAMIDES Erythemas
D09AA 10027654 2001-01-09 PANSEMENTS AVEC ANTIINFECTIEUX Allergic conditions NEC
D10AD 10007635 2001-12-04 RETINOIDES ANTIACNEIQUES A USAGE TOPIQUE Cardiomyopathies
D10AF 10019833 1997-03-27 ANTIINFECTIEUX POUR LE TRAITEMENT DE L’ACNE Hepatocellular damage and hepatitis NEC
G01AD 10012736 1997-07-15 ACIDES ORGANIQUES Diarrhoea (excl infective)
G01AD 10019833 1996-02-15 ACIDES ORGANIQUES Hepatocellular damage and hepatitis NEC
G01AD 10021982 1998-10-21 ACIDES ORGANIQUES Inflammatory disorders following infection
G01AX 10040786 2000-06-13 AUTRES ANTIINFECTIEUX ET ANTISEPTIQUES Skin structures and soft tissue infections
G01AX 10040788 2000-06-13 AUTRES ANTIINFECTIEUX ET ANTISEPTIQUES Skin and subcutaneous tissue bacterial infec-
tions
G02CB 10029306 2000-01-04 INHIBITEURS DE LA PROLACTINE Neurological signs and symptoms NEC
G03AC 10007962 2002-06-04 PROGESTATIFS Central nervous system vascular disorders
NEC
G03AC 10008193 2002-06-04 PROGESTATIFS Cerebrovascular and spinal vascular disorders
NEC
G03AC 10014524 1999-09-21 PROGESTATIFS Non-site specific embolism and thrombosis
G03AC 10019833 1999-09-21 PROGESTATIFS Hepatocellular damage and hepatitis NEC
G03XA 10019833 1996-01-19 ANTIGONADOTROPHINES ET ANALOGUES Hepatocellular damage and hepatitis NEC
J01AA 10003828 1996-03-07 TETRACYCLINES Autoimmunity analyses
J01AA 10019833 1996-03-07 TETRACYCLINES Hepatocellular damage and hepatitis NEC
J01AA 10024972 1996-03-07 TETRACYCLINES Lower respiratory tract inflammatory and im-
munologic conditions
J01CA 10006555 2001-02-20 PENICILLINES A LARGE SPECTRE Bullous conditions
J01CA 10037573 1996-12-19 PENICILLINES A LARGE SPECTRE Pustular conditions
J01CA 10040786 1996-12-19 PENICILLINES A LARGE SPECTRE Skin structures and soft tissue infections
J01CE 10037573 1996-12-19 PENICILLINES SENSIBLES AUX BETALACTAMASES Pustular conditions
J01CF 10037573 1996-12-19 PENICILLINES RESISTANTES AUX BETALACTAMASES Pustular conditions
J01CF 10040786 1996-12-19 PENICILLINES RESISTANTES AUX BETALACTAMASES Skin structures and soft tissue infections
J01CR 10006555 2001-02-20 ASSOCIATIONS DE PENICILLINES, INHIBITEURS DE BETALACTAMASES Bullous conditions
J01CR 10037573 1996-12-19 ASSOCIATIONS DE PENICILLINES, INHIBITEURS DE BETALACTAMASES Pustular conditions
J01CR 10040786 1996-12-19 ASSOCIATIONS DE PENICILLINES, INHIBITEURS DE BETALACTAMASES Skin structures and soft tissue infections
J01DA 10002055 1998-11-19 CEPHALOSPORINES ET APPARENTES Anaemias haemolytic NEC
J01DA 10009653 1997-11-13 CEPHALOSPORINES ET APPARENTES Clostridia infections
J01DA 10009888 1997-11-13 CEPHALOSPORINES ET APPARENTES Colitis (excl infective)
108
J01DA 10037573 1996-12-19 CEPHALOSPORINES ET APPARENTES Pustular conditions
J01DA 10040786 1996-12-19 CEPHALOSPORINES ET APPARENTES Skin structures and soft tissue infections
A-M-J
J01DH 10037573 1996-12-19 CARBAPENEMS Pustular conditions
J01FA 10006555 1998-02-26 MACROLIDES Bullous conditions
J01FA 10037573 1996-12-19 MACROLIDES Pustular conditions
J01FA 10040786 1996-12-19 MACROLIDES Skin structures and soft tissue infections
J01MB 10002220 1996-01-11 AUTRES QUINOLONES Anaphylactic responses
J01MB 10009193 1996-01-11 AUTRES QUINOLONES Circulatory collapse and shock
J01XC 10018913 1996-06-27 ANTIBACTERIENS STEROIDIENS Haemolyses NEC
J01XC 10024385 1996-06-27 ANTIBACTERIENS STEROIDIENS Leukopenias NEC
J01XC 10034607 1997-11-13 ANTIBACTERIENS STEROIDIENS Peripheral neuropathies NEC
J04AB 10019833 1997-04-24 ANTIBIOTIQUES Hepatocellular damage and hepatitis NEC
J05AE 10018987 1996-07-15 INHIBITEURS DE PROTEASE Haemorrhages NEC
J05AF 10011085 1999-03-30 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NUCLEOSIDIQUES Ischaemic coronary artery disorders
J05AF 10019833 1997-09-11 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NUCLEOSIDIQUES Hepatocellular damage and hepatitis NEC
J05AF 10024581 1997-09-11 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NUCLEOSIDIQUES Lipid metabolism and deposit disorders NEC
J05AF 10027416 1997-09-11 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NUCLEOSIDIQUES Metabolic acidoses (excl diabetic acidoses)
J05AF 10033646 1997-09-11 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NUCLEOSIDIQUES Acute and chronic pancreatitis
J05AG 10019833 2000-03-07 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NON NUCLEOSIDIQUES Hepatocellular damage and hepatitis NEC
J05AG 10040993 1998-06-08 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NON NUCLEOSIDIQUES Sleep disorders NEC
J06BA 10002055 1999-02-02 IMMUNOGLOBULINES HUMAINES POLYVALENTES Anaemias haemolytic NEC
J07AF 10003550 2002-02-18 VACCINS ANTIDIPHTERIQUES Asthenic conditions
J07AF 10028323 2002-02-18 VACCINS ANTIDIPHTERIQUES Muscle pains
J07AG 10003550 2002-02-18 VACCINS ANTIHAEMOPHILUS INFLUENZAE B Asthenic conditions
J07AH 10003550 2002-02-18 VACCINS ANTIMENINGOCOCCIQUES Asthenic conditions
J07AH 10028323 2002-02-18 VACCINS ANTIMENINGOCOCCIQUES Muscle pains
J07AJ 10003550 2002-02-18 VACCINS CONTRE LA COQUELUCHE Asthenic conditions
J07AJ 10028323 2002-02-18 VACCINS CONTRE LA COQUELUCHE Muscle pains
J07AL 10006484 1998-02-23 VACCINS ANTIPNEUMOCOCCIQUES Bronchospasm and obstruction
J07AL 10028323 2002-02-18 VACCINS ANTIPNEUMOCOCCIQUES Muscle pains
J07AM 10003550 2002-02-18 VACCINS ANTITETANIQUES Asthenic conditions
J07AM 10028323 2002-02-18 VACCINS ANTITETANIQUES Muscle pains
J07AN 10044756 1998-01-12 VACCINS ANTITUBERCULEUX Tuberculous infections
J07AX 10006484 1998-02-23 AUTRES VACCINS BACTERIENS Bronchospasm and obstruction
J07BC 10003550 2002-02-18 VACCINS CONTRE L’HEPATITE Asthenic conditions
J07BC 10028323 2002-02-18 VACCINS CONTRE L’HEPATITE Muscle pains
J07BF 10003550 2002-02-18 VACCINS CONTRE LA POLIOMYELITE Asthenic conditions
J07BF 10028323 2002-02-18 VACCINS CONTRE LA POLIOMYELITE Muscle pains
J07X 10006484 1998-02-23 AUTRES VACCINS Bronchospasm and obstruction
J07X 10007602 1998-02-23 AUTRES VACCINS Cardiac and vascular procedural complications
L01AA 10029150 1997-10-16 MOUTARDES A L’AZOTE Nephropathies and tubular disorders NEC
109
L01AD 10033979 1996-04-30 NITROSOUREES Parenchymal lung disorders NEC
L01BC 10011085 1998-02-11 ANALOGUES DE LA PYRIMIDINE Ischaemic coronary artery disorders
A-M-J
L01BC 10042600 1998-02-11 ANALOGUES DE LA PYRIMIDINE Supraventricular arrhythmias
L01XD 10033372 2001-12-04 MEDICAMENTS UTILISES DANS LA THERAPIE PHOTODYNAMIQUE Pain and discomfort NEC
L01XX 10016286 1997-01-16 AUTRES ANTINEOPLASIQUES Febrile disorders
L02AE 10022097 1999-07-02 ANALOGUES DE L’HORMONE ENTRAINANT LA LIBERATION DE GONA- Injection and infusion site reactions
DOTROPHINES
L02BA 10007962 1997-01-16 ANTIESTROGENES Central nervous system vascular disorders
NEC
L02BA 10008193 1997-01-16 ANTIESTROGENES Cerebrovascular and spinal vascular disorders
NEC
L02BB 10019833 1996-05-22 ANTIANDROGENES Hepatocellular damage and hepatitis NEC
L03A 10006484 1998-02-23 CYTOKINES ET IMMUNOMODULATEURS Bronchospasm and obstruction
L03AB 10012219 2001-02-13 INTERFERONS Deliria
L03AB 10012401 2001-02-13 INTERFERONS Depressive disorders
L03AB 10038837 2000-04-04 INTERFERONS Retinal bleeding and vascular disorders (excl
retinopathy)
L03AB 10038861 2000-04-04 INTERFERONS Retinal embolism and thrombosis
L03AB 10038869 2000-04-04 INTERFERONS Retinal haemorrhagic disorders
L03AB 10042459 2001-02-13 INTERFERONS Suicidal and self-injurious behaviour
L04AA 10019833 2000-08-22 IMMUNOSUPPRESSEURS SELECTIFS Hepatocellular damage and hepatitis NEC
M01AB 10012435 1997-06-26 DERIVES DE L’ACIDE ACETIQUE ET APPARENTES Dermatitis and eczema
M01AE 10038443 2001-06-05 DERIVES DE L’ACIDE PROPIONIQUE Renal failure and impairment
M01AH 10011907 2002-06-04 COXIBS Death and sudden death
M01AH 10017847 2000-07-11 COXIBS Gastric ulcers and perforation
M01AX 10006555 1996-10-31 AUTRES ANTIINFLAMMATOIRES ANTIRHUMATISMAUX NON STEROI- Bullous conditions
DIENS
M01AX 10021982 1996-10-31 AUTRES ANTIINFLAMMATOIRES ANTIRHUMATISMAUX NON STEROI- Inflammatory disorders following infection
DIENS
M03BA 10019833 1996-09-12 ESTERS DE L’ACIDE CARBAMIQUE Hepatocellular damage and hepatitis NEC
M03BA 10052566 1996-09-12 ESTERS DE L’ACIDE CARBAMIQUE Rashes, eruptions and exanthems NEC
M04AA 10052566 1996-09-12 INHIBITEURS DE LA SYNTHESE DE L’ACIDE URIQUE Rashes, eruptions and exanthems NEC
N01AX 10037908 1997-02-06 AUTRES ANESTHESIQUES GENERAUX Rate and rhythm disorders NEC
N02AC 10002113 1996-04-25 DERIVES DE LA DIPHENYLPROPYLAMINE Anal and rectal disorders NEC
N02AE 10019833 1996-09-12 DERIVES DE L’ORIPAVINE Hepatocellular damage and hepatitis NEC
N02AX 10022398 1997-10-15 AUTRES OPIOIDES Inner ear signs and symptoms
N02AX 10039912 1997-10-15 AUTRES OPIOIDES Seizures and seizure disorders NEC
N02AX 10052769 1997-10-15 AUTRES OPIOIDES Vertigos NEC
N02BE 10002113 1996-04-25 ANILIDES Anal and rectal disorders NEC
N02BE 10004607 1996-01-04 ANILIDES Bile duct infections and inflammations
N02BE 10019833 1997-01-16 ANILIDES Hepatocellular damage and hepatitis NEC
110
N03AA 10019833 1996-09-12 BARBITURIQUES ET DERIVES Hepatocellular damage and hepatitis NEC
N03AA 10052566 1996-09-12 BARBITURIQUES ET DERIVES Rashes, eruptions and exanthems NEC
A-M-J
N03AG 10013929 2000-11-22 DERIVES D’ACIDE GRAS Dyskinesias and movement disorders NEC
N03AG 10029292 1996-12-26 DERIVES D’ACIDE GRAS Neurologic visual problems NEC
N03AG 10047559 1996-12-26 DERIVES D’ACIDE GRAS Visual field disorders
N03AG 10053567 1997-06-26 DERIVES D’ACIDE GRAS Coagulopathies
N04BC 10029306 1997-04-24 AGONISTES DOPAMINERGIQUES Neurological signs and symptoms NEC
N04BX 10028342 1999-09-07 AUTRES DOPAMINERGIQUES Muscle tone abnormal
N05AH 10018009 1996-06-27 DIAZEPINES, OXAZEPINES ET THIAZEPINES Gastrointestinal stenosis and obstruction NEC
N05AH 10052736 1996-06-27 DIAZEPINES, OXAZEPINES ET THIAZEPINES Non-mechanical ileus
N05AN 10038443 2001-03-20 LITHIUM Renal failure and impairment
N05CA 10043555 1997-04-07 BARBITURIQUES NON ASSOCIES Thrombocytopenias
N05CB 10019833 1996-09-12 BARBITURIQUES EN ASSOCIATION Hepatocellular damage and hepatitis NEC
N05CB 10052566 1996-09-12 BARBITURIQUES EN ASSOCIATION Rashes, eruptions and exanthems NEC
N05CF 10037180 1997-04-10 MEDICAMENTS RELIES AUX BENZODIAZEPINES Psychiatric symptoms NEC
N05CM 10003550 1997-04-24 AUTRES HYPNOTIQUES ET SEDATIFS Asthenic conditions
N06AB 10018987 1999-01-26 INHIBITEURS SELECTIFS DE LA RECAPTURE DE LA SEROTONINE Haemorrhages NEC
N06AB 10019833 2001-01-09 INHIBITEURS SELECTIFS DE LA RECAPTURE DE LA SEROTONINE Hepatocellular damage and hepatitis NEC
N06AB 10041273 1999-10-12 INHIBITEURS SELECTIFS DE LA RECAPTURE DE LA SEROTONINE Sodium imbalance
N06AX 10023226 2000-06-29 AUTRES ANTIDEPRESSEURS Joint related signs and symptoms
N06AX 10037908 2000-06-29 AUTRES ANTIDEPRESSEURS Rate and rhythm disorders NEC
N06AX 10039912 1996-02-01 AUTRES ANTIDEPRESSEURS Seizures and seizure disorders NEC
N07CA 10013929 2001-08-17 ANTIVERTIGINEUX Dyskinesias and movement disorders NEC
P01AA 10024689 1996-10-31 DERIVES DE L’HYDROXYQUINOLINE Liver function analyses
P03AX 10040786 2000-06-13 AUTRES ANTIPARASITAIRES EXTERNES, SCABICIDES INCLUS Skin structures and soft tissue infections
P03AX 10040788 2000-06-13 AUTRES ANTIPARASITAIRES EXTERNES, SCABICIDES INCLUS Skin and subcutaneous tissue bacterial infec-
tions
R05CB 10033788 1999-03-30 MUCOLYTIQUES Paraesthesias and dysaesthesias
R05DA 10004607 1996-01-04 ALCALOIDES DE L’OPIUM ET DERIVES Bile duct infections and inflammations
R06AX 10047283 1997-01-24 AUTRES ANTIHISTAMINIQUES A USAGE SYSTEMIQUE Ventricular arrhythmias and cardiac arrest
R07AB 10034607 2000-01-13 STIMULANTS RESPIRATOIRES Peripheral neuropathies NEC
R07AB 10034989 2000-01-13 STIMULANTS RESPIRATOIRES Physical examination procedures
S01JA 10002220 1996-02-19 COLORANTS Anaphylactic responses
S01JA 10009193 1996-02-19 COLORANTS Circulatory collapse and shock
111
Tab. B.3: Signaux de référence (46) avec au moins 3 notifications spontanées au 1er juillet 2002 et non détectés par le modèle GPS
basé sur Pr(H∗0 ) et FDR∗ = 5% - Scénario 2. La dernière colonne indique les signaux de référence pour lesquels le risque observé
est inférieur à 1 tout au long de l’analyse.
ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT RR <1
A-M-J
A01AB 10017847 2001-12-04 ANTIINFECTIEUX POUR TRAITEMENT ORAL LOCAL Gastric ulcers and perforation
A01AD 10019833 1998-10-21 AUTRES MEDICAMENTS POUR TRAITEMENT ORAL LOCAL Hepatocellular damage and hepatitis NEC ×
A02BC 10013316 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Lactation disorders
A02BC 10021109 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Hypothalamic and pituitary disorders NEC
A03AX 10027654 1996-06-27 AUTRES MEDICAMENTS POUR LES DESORDRES FONCTION- Allergic conditions NEC
NELS INTESTINAUX
A11AA 10012736 1997-07-15 POLYVITAMINES AVEC ELEMENTS MINERAUX Diarrhoea (excl infective)
A11HA 10012736 1997-07-15 AUTRES PREPARATIONS VITAMINIQUES NON ASSOCIEES Diarrhoea (excl infective)
A12AA 10057181 1998-12-17 CALCIUM Vascular hypotensive disorders
A13A 10019833 1996-02-15 TONIQUES Hepatocellular damage and hepatitis NEC
B01AA 10023226 1998-05-27 ANTIVITAMINES K Joint related signs and symptoms ×
B01AB 10012736 1997-07-15 GROUPE DE L’HEPARINE Diarrhoea (excl infective) ×
B01AB 10019833 1996-02-15 GROUPE DE L’HEPARINE Hepatocellular damage and hepatitis NEC ×
B02BD 10057181 1998-12-17 FACTEURS DE LA COAGULATION SANGUINE Vascular hypotensive disorders
B06AA 10019833 1996-02-15 ENZYMES Hepatocellular damage and hepatitis NEC
C03BA 10022398 1997-02-28 SULFAMIDES NON ASSOCIES Inner ear signs and symptoms
C03BA 10052769 1997-02-28 SULFAMIDES NON ASSOCIES Vertigos NEC
C05AX 10019833 1996-02-15 AUTRES ANTIHEMORROIDAIRES A USAGE TOPIQUE Hepatocellular damage and hepatitis NEC
C08DA 10013929 1997-04-24 DERIVES DE LA PHENYLALKYLAMINE Dyskinesias and movement disorders NEC
C08DB 10013929 1997-04-24 DERIVES DE LA BENZOTHIAZEPINE Dyskinesias and movement disorders NEC ×
C09AA 10029306 1996-03-07 INHIBITEURS DE L’ENZYME DE CONVERSION (IEC) NON ASSO- Neurological signs and symptoms NEC
CIES
D04AB 10012736 1997-07-15 ANESTHESIQUES A USAGE TOPIQUE Diarrhoea (excl infective) ×
D04AB 10019833 1996-02-15 ANESTHESIQUES A USAGE TOPIQUE Hepatocellular damage and hepatitis NEC ×
D07AB 10019833 1996-02-15 CORTICOIDES D’ACTIVITE MODEREE (GROUPE II) Hepatocellular damage and hepatitis NEC ×
D10AD 10012736 1997-07-15 RETINOIDES ANTIACNEIQUES A USAGE TOPIQUE Diarrhoea (excl infective) ×
D10AD 10019833 1996-02-15 RETINOIDES ANTIACNEIQUES A USAGE TOPIQUE Hepatocellular damage and hepatitis NEC
G03AA 10006513 1999-06-22 PROGESTATIFS ET ESTROGENES EN ASSOCIATION FIXE Bruising, ecchymosis and purpura
G03AA 10043555 1999-06-22 PROGESTATIFS ET ESTROGENES EN ASSOCIATION FIXE Thrombocytopenias ×
J01AA 10033788 1997-11-13 TETRACYCLINES Paraesthesias and dysaesthesias
J01CE 10040786 1996-12-19 PENICILLINES SENSIBLES AUX BETALACTAMASES Skin structures and soft tissue infections
J01DH 10040786 1996-12-19 CARBAPENEMS Skin structures and soft tissue infections
J01MA 10002220 1996-01-11 FLUOROQUINOLONES Anaphylactic responses
J01MA 10009193 1996-01-11 FLUOROQUINOLONES Circulatory collapse and shock
J07AL 10003550 2002-02-18 VACCINS ANTIPNEUMOCOCCIQUES Asthenic conditions
J07X 10057181 1998-02-23 AUTRES VACCINS Vascular hypotensive disorders
L01XX 10019833 1996-09-12 AUTRES ANTINEOPLASIQUES Hepatocellular damage and hepatitis NEC
112
L03AB 10013929 2000-10-17 INTERFERONS Dyskinesias and movement disorders NEC
Tab. B.3: Signaux de référence (46) avec au moins 3 notifications spontanées au 1er juillet 2002 et non détectés par le modèle GPS
basé sur Pr(H∗0 ) et FDR∗ = 5% - Scénario 2. La dernière colonne indique les signaux de référence pour lesquels le risque observé
est inférieur à 1 tout au long de l’analyse (suite).
ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT RR <1
A-M-J
M01AX 10019833 1999-03-08 AUTRES ANTIINFLAMMATOIRES ANTIRHUMATISMAUX NON Hepatocellular damage and hepatitis NEC
STEROIDIENS
N01AX 10011907 1997-02-06 AUTRES ANESTHESIQUES GENERAUX Death and sudden death
N02BE 10027654 1996-05-22 ANILIDES Allergic conditions NEC
N04BX 10016286 1999-09-07 AUTRES DOPAMINERGIQUES Febrile disorders
N05CA 10052566 2001-05-15 BARBITURIQUES NON ASSOCIES Rashes, eruptions and exanthems NEC ×
N06AX 10011085 2000-06-29 AUTRES ANTIDEPRESSEURS Ischaemic coronary artery disorders
N06AX 10043555 2000-06-29 AUTRES ANTIDEPRESSEURS Thrombocytopenias ×
N06DA 10000032 1999-09-07 ANTICHOLINESTERASIQUES Cardiac conduction disorders
N07BB 10020774 1998-07-23 MEDICAMENTS UTILISES DANS LA DEPENDANCE ALCOO- Vascular hypertensive disorders NEC
LIQUE
R02AB 10027654 2001-01-09 ANTIBIOTIQUES Allergic conditions NEC
113
Annexe C
Publications
114

Université Paris-Sud 11 Faculté de Médecine

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Université Paris-Sud 11 Faculté de Médecine

Transféré par

Droits d'auteur :

Formats disponibles

UNIVERSITÉ PARIS-SUD 11

Année : 2009 N° attribué par la bibiothèque

Présentée et soutenue publiquement par

Détection automatique de signaux en pharmacovigilance :

Directeur de thèse : Mme Pascale Tubert-Bitter

M. Jean Christophe Thalabard, Pr. Président

M. Stephen Evans, Pr. Rapporteur

Je tiens aussi à remercier chaleureusement Françoise Haramburu, Annie Fourrier-

Bégaud pour leur aide et l’intérêt qu’ils ont porté à ce travail.

Je remercie également les membres et ex-membres de l’équipe biostatistique, et

disponibilité et leurs conseils. Je tiens aussi à remercier vivement M. Lellouch pour

lesquels j’ai le plus partagé.

L’occasion m’est donnée de remercier l’Institut de Recherche en Santé Publique

pour leur participation à mon jury.

Mes derniers remerciements s’adressent à ma famille et à Aurélie.

I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jais, G. Miremont-

I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, G. Miremont-Salamé, C. Kreft-

I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, G. Miremont-Salamé, C. Kreft-

Publications avec comité de lecture

I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jais, G. Miremont-

Publications avec comité de lecture . . . . . . . . . . . . . . . . . . . . . . ii

Table des matières iii

Table des figures vi

Liste des tableaux viii

Liste des abréviations ix

2 Description des principales méthodes de détection automatique 7

2.2.1 La méthode Reporting Odds Ratio (ROR) . . . . . . . . . . . 9

2.2.2 La méthode Proportional Reporting Ratio (PRR) . . . . . . . 9

2.3 Les méthodes bayésiennes . . . . . . . . . . . . . . . . . . . . . . . . 10

3 Méthodes de détection automatique revisitées dans le cadre des

3.1 Comparaisons multiples et méthodes fréquentistes . . . . . . . . . . . 21

3.2 Comparaisons multiples et méthodes bayésiennes . . . . . . . . . . . 29

3.3 Quelques remarques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.1 Modèle de simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.3 Comparaison des approches bayésiennes . . . . . . . . . . . . . . . . 53

4.3.2 Comparaison de GPS et BCPNN basés sur Pr(H∗0 ) . . . . . . . 57

4.4 Comparaison à partir du modèle de simulations proposé . . . . . . . . 57

5 Application aux données françaises de pharmacovigilance 68

5.1.2 Estimation des quantités caractéristiques (FDR, FNR, Se et Sp) 70

5.2.2 Premier scénario : Mise en place d’un système de détection

A Résultats complémentaires pour l’étude de simulations 98

B Résultats complémentaires pour l’application 102

3.1 Histogrammes de la densité marginale des degrés de signification ob-

4.1 Histogrammes du logarithme des risques observés dans la base fran-

4.14 Comparaison du FDR et de son estimation pour midRFET, BCPNN

5.1 Comparaison des estimations du FDR sur la base de pharmacovigi-

A.1 Histogrammes de la distribution des degrés de signification sous H0

B.1 Proportion de signaux communs entre les méthodes proposées en fonc-

2.1 Représentation des données pour le couple (i, j). . . . . . . . . . . . . 8

3.1 Tableau récapitulatif des méthodes étudiées. . . . . . . . . . . . . . . 36

B.1 Signaux de référence (47) avec moins de 3 notifications spontanées au

Afssaps Agence française de sécurité sanitaire des produits de santé

notifications spontanées ne comportent que très rarement l’assurance de la respon-

base de la plupart des décisions prises par les instances de pharmacovigilance.

notifications ainsi que leur enregistrement au sein de la base nationale coordonnée

technique de pharmacovigilance lors de réunions mensuelles au siège de l’Afssaps.

toring Center en Suède, qui, en décembre 2004, contenaient respectivement environ

2.6 et 3.7 millions de notifications (Almenoff et al., 2005).

les couples événement-médicament dont la présence est anormalement fréquente par

Les principales méthodes de détection automatique décrites dans la littérature

et al. (2005) et ce travail réalisé en collaboration avec l’unité de pharmacovigilance

présentation simplifiée de la base de pharmacovigilance dans laquelle les données

une modélisation des données plus complexe.