Vous êtes sur la page 1sur 124

UNIVERSITÉ PARIS-SUD 11

FACULTÉ DE MÉDECINE

Année : 2009 N° attribué par la bibiothèque


| | | | | | | | | | |

THÈSE
en vue de l’obtention du diplôme de
DOCTEUR DE L’UNIVERSITÉ PARIS-SUD 11
Spécialité : BIOSTATISTIQUE

Présentée et soutenue publiquement par

Ismaı̈l AHMED

Le 8 avril 2009

Détection automatique de signaux en pharmacovigilance :


Approche statistique fondée sur les comparaisons multiples

Directeur de thèse : Mme Pascale Tubert-Bitter

JURY

M. Jean Christophe Thalabard, Pr. Président

M. Stephen Evans, Pr. Rapporteur


Mme Sylvia Richardson, Pr. Rapporteur
M. Stéphane Robin, Pr. Examinateur
Mme Pascale Tubert-Bitter, DR. Examinateur
Mes remerciements s’adressent en premier lieu à Pascale Tubert-Bitter. Travailler
avec elle a été un très grand plaisir et je lui suis profondément reconnaissant d’avoir
su si bien me guider et m’encourager tout au long de ce parcours.

Je tiens aussi à remercier chaleureusement Françoise Haramburu, Annie Fourrier-


Réglat, Frantz Thiessard, Carmen Kreft-Jais, Ghada Miremont-Salamé et Bernard

Bégaud pour leur aide et l’intérêt qu’ils ont porté à ce travail.

Mes remerciements s’adressent ensuite à Cyril Dalmasso avec qui j’ai eu grand
plaisir à travailler ainsi qu’à Philippe Broët.

Je remercie également les membres et ex-membres de l’équipe biostatistique, et


plus particulièrement Laurence Watier et Thierry Moreau, pour leur accueil, leur

disponibilité et leurs conseils. Je tiens aussi à remercier vivement M. Lellouch pour


nos longues conversations, ses lectures attentives et ses conseils avisés.

Merci aux membres de l’unité 780 qui ont rendu ces trois années de thèse très
agréables et plus particulièrement à Jérémie, Hélène, Antoine, Estelle, Olivier, Hé-
lèna, Yves, Dorota, Sigrid, Juliette, Mounia, Raphaëlle, Marie, Alexia et David avec

lesquels j’ai le plus partagé.

L’occasion m’est donnée de remercier l’Institut de Recherche en Santé Publique


qui a contribué financièrement à l’accomplissement de ce travail.

Je remercie Stephen Evans et Sylvia Richardson pour avoir accepté d’être les
rapporteurs de ma thèse ainsi que Stéphane Robin et Jean Christophe Thalabard

pour leur participation à mon jury.

Mes derniers remerciements s’adressent à ma famille et à Aurélie.

i
Valorisation scientifique

Communications orales
I. Ahmed, C. Dalmasso, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jaı̈s,
G. Miremont-Salamé, B. Bégaud, P. Broët, P. Tubert-Bitter, Fisher’s Exact Test Applied
to Pharmacovigilance, 29th Annual Conference of the International Society for Clinical
Biostatistics, 17-21 August 2008, Copenhagen, Denmark.

I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jais, G. Miremont-


Salamé, B. Bégaud, P. Tubert-Bitter, Signal Ranking-Based Comparison of Automatic De-
tection Methods in Pharmacovigilance : A Hypothesis Test Approach, Epidemiology and
Biometry 2008, IBS Channel Network, 10-11 July 2008, Paris, France.

I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, G. Miremont-Salamé, C. Kreft-


Jaı̈s, P. Tubert-Bitter, Bayesian Pharmacovigilance Signal Detection Methods Revisited in
a Multiple Comparison Setting, First IBS Channel Network Conference, 8-11 May 2007,
Rolduc, The Netherlands.

I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, G. Miremont-Salamé, C. Kreft-


Jaı̈s, P. Tubert-Bitter, A New Automatic Signal Detection Method in Pharmacovigilance ;
A Bayesian Multiple Comparisons Setting, 22nd International Conference on Pharmacoe-
pidemiology & Therapeutic Risk Management, 24-27 August 2006, Lisbon, Portugal.

Publications avec comité de lecture


I. Ahmed, C. Dalmasso, F. Haramburu, F. Thiessard, P. Broët, P. Tubert-Bitter, False
Discovery Rate Estimation for Frequentist Pharmacovigilance Signal Detection Methods,
Biometrics, Accepté.

I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jais, G. Miremont-


Salamé, B. Bégaud, P. Tubert-Bitter, Bayesian Pharmacovigilance Signal Detection Me-
thods Revisited in a Multiple Comparison Setting Statistics in Medicine, Accepté.

ii
Table des matières

Remerciements i

Valorisation scientifique ii
Communications orales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii

Publications avec comité de lecture . . . . . . . . . . . . . . . . . . . . . . ii

Table des matières iii

Table des figures vi

Liste des tableaux viii

Liste des abréviations ix

1 Introduction 1
1.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Problématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Objectif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Description des principales méthodes de détection automatique 7


2.1 Structure des données analysées . . . . . . . . . . . . . . . . . . . . . 7
2.2 Les méthodes fréquentistes . . . . . . . . . . . . . . . . . . . . . . . . 9

2.2.1 La méthode Reporting Odds Ratio (ROR) . . . . . . . . . . . 9

iii
TABLE DES MATIÈRES iv

2.2.2 La méthode Proportional Reporting Ratio (PRR) . . . . . . . 9

2.3 Les méthodes bayésiennes . . . . . . . . . . . . . . . . . . . . . . . . 10


2.3.1 La méthode Bayesian Confidence Propagation Neural Network
(BCPNN) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3.2 La méthode Gamma Poisson Shrinker (GPS) . . . . . . . . . 15
2.4 Quelques remarques générales . . . . . . . . . . . . . . . . . . . . . . 18

3 Méthodes de détection automatique revisitées dans le cadre des


comparaisons multiples 20

3.1 Comparaisons multiples et méthodes fréquentistes . . . . . . . . . . . 21


3.1.1 ROR, PRR et test d’hypothèses . . . . . . . . . . . . . . . . . 21
3.1.2 Test exact de Fisher et mid-P-values . . . . . . . . . . . . . . 22
3.1.3 FDR et méthodes fréquentistes . . . . . . . . . . . . . . . . . 23

3.2 Comparaisons multiples et méthodes bayésiennes . . . . . . . . . . . 29


3.2.1 GPS et BCPNN dans le cadre bayésien de la théorie de la décision 31
3.2.2 Autres approches proposées pour la prise en compte des com-
paraisons multiples à partir du modèle GPS . . . . . . . . . . 34

3.3 Quelques remarques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4 Étude de simulations 38

4.1 Modèle de simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . 40


4.2 Comparaison des approches fréquentistes . . . . . . . . . . . . . . . . 43
4.2.1 Étude de la densité des degrés de signification . . . . . . . . . 44
4.2.2 Estimation de π0 π0 ∗ . . . . . . . . . . . . . . . . . . . . . . . 46
4.2.3 Comparaison des méthodes selon le FDR et son estimation . . 46

4.3 Comparaison des approches bayésiennes . . . . . . . . . . . . . . . . 53


4.3.1 GPS et règles de classement . . . . . . . . . . . . . . . . . . . 54
TABLE DES MATIÈRES v

4.3.2 Comparaison de GPS et BCPNN basés sur Pr(H∗0 ) . . . . . . . 57

4.4 Comparaison à partir du modèle de simulations proposé . . . . . . . . 57


4.5 Comparaison à partir du modèle de simulations de Roux et al. . . . . 65
4.6 Conclusion des simulations . . . . . . . . . . . . . . . . . . . . . . . . 67

5 Application aux données françaises de pharmacovigilance 68


5.1 Comparaison des méthodes sur les données de 1984-2003 . . . . . . . 69
5.1.1 Les données . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.1.2 Estimation des quantités caractéristiques (FDR, FNR, Se et Sp) 70


5.1.3 Comparaison des signaux générés . . . . . . . . . . . . . . . . 73
5.2 Évaluation séquentielle à partir de cas d’alertes réels . . . . . . . . . 77
5.2.1 Plan d’analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

5.2.2 Premier scénario : Mise en place d’un système de détection


automatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.2.3 Deuxième scénario : Utilisation en routine de GPS . . . . . . . 84

6 Conclusion 90

Réferences 94

Annexes 98

A Résultats complémentaires pour l’étude de simulations 98

B Résultats complémentaires pour l’application 102

C Publications 114
Table des figures

3.1 Histogrammes de la densité marginale des degrés de signification ob-


tenus à partir de la méthode midRFET sur les données de la base
française . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2 Histogramme de la distribution de Pr(λ∗ij ≤ 1) obtenu à partir des
données de la base Française. . . . . . . . . . . . . . . . . . . . . . . 35

4.1 Histogrammes du logarithme des risques observés dans la base fran-


çaise et dans les données simulées. . . . . . . . . . . . . . . . . . . . . 42
4.2 Histogrammes des distributions marginales, sous H0 et sous H1 des
degrés de signification pour ROR, RFET et midRFET. . . . . . . . . 45
4.3 Estimations de π0 π0 ∗ obtenues avec LBE et Qvalue à partir de la dis-
tribution marginale des degrés de signification transformés (p∗ ) pour
RFET. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.4 Comparaison de ROR, RFET et midRFET selon le FDR et son esti-
mation pour nij ≥ 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.5 Comparaison de ROR, RFET et midRFET selon le FDR et son esti-
mation pour nij ≥ 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.6 Biais relatif observé dans l’estimation du FDR pour ROR, RFET et
midRFET. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.7 Comparaison selon le FDR et son estimation des différentes règles de
classement pour GPS. . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.8 Variabilité du FDR et de son estimation pour GPS basé sur Pr(H∗0 ). . 56
4.9 Comparaison selon le FDR et son estimation de BCPNN et GPS basés
sur Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.10 Comparaison selon le FNR et son estimation de BCPNN et GPS basés
sur Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.11 Comparaison selon la sensibilité et son estimation de BCPNN et GPS
basés sur Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.12 Comparaison selon la spécificité et son estimation de BCPNN et GPS
basés sur Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.13 Comparaison du FDR obtenu avec midRFET, ROR, BCPNN et GPS
basé sur Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

vi
TABLE DES FIGURES vii

4.14 Comparaison du FDR et de son estimation pour midRFET, BCPNN


et GPS basé sur Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.15 Comparaison du FDR et de son estimation pour ROR, midRFET,
BCPNN et GPS basé Pr(H∗0 ) à partir du plan de simulation de Roux
et al. (2005). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.1 Comparaison des estimations du FDR sur la base de pharmacovigi-


lance française. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.2 Proportion de signaux communs entre les méthodes proposées en fonc-
tion du nombre de signaux générés. . . . . . . . . . . . . . . . . . . . 74
5.3 Proportion de signaux communs entre les méthodes proposées pour
{ψ0 = 1, RR0 = 1} en fonction du FDR estimé par GPS basé sur
Pr(H∗0 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.4 Proportion de signaux communs entre les différentes règles de classe-
ment pour GPS et RR0 = 1 . . . . . . . . . . . . . . . . . . . . . . . 76
5.5 Évolution au cours du temps du nombre de couples médicament-
événements présentant au moins une et au moins trois notifications
dans la base française “créée” au 1er janvier 1995. . . . . . . . . . . . 79
5.6 Histogramme des délais observés entre la date de détection par le
modèle GPS basé sur Pr(H∗0 ) et la date d’alerte en comité technique -
Scénario 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.7 Évolution du nombre de nouveaux signaux générés à partir du modèle
GPS basé sur Pr(H∗0 ) et d’un seuil de 5% pour le FDR∗ - Scénario 2. . 85
5.8 Évolution du seuil sur Pr(H∗0 ) pour FDR∗ = 5% lors de l’utilisation de
GPS - Scénario 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.9 Histogramme des 216 délais observés entre la date de détection par le
modèle GPS basé sur Pr(H∗0 ) et la date d’alerte en comité technique -
Scénario 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.10 Évolution du nombre de nouveaux signaux générés à partir du modèle
GPS basé sur Pr(H∗0 ) et FDR∗ = 1% - Scénario 2. . . . . . . . . . . . 88

A.1 Histogrammes de la distribution des degrés de signification sous H0


pour ROR, RFET et midRFET avec nij ≥ 1 . . . . . . . . . . . . . . 99
A.2 Histogrammes de la distribution des degrés de signification sous H0
pour ROR, RFET et midRFET avec nij ≥ 3. . . . . . . . . . . . . . . 100
A.3 Estimations de π0 π0 ∗ obtenues avec LBE et Qvalue à partir de la dis-
tribution marginale des degrés de signification transformés (p∗ ) pour
ROR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

B.1 Proportion de signaux communs entre les méthodes proposées en fonc-


tion du FDR estimé par GPS. . . . . . . . . . . . . . . . . . . . . . . 103
Liste des tableaux

2.1 Représentation des données pour le couple (i, j). . . . . . . . . . . . . 8

3.1 Tableau récapitulatif des méthodes étudiées. . . . . . . . . . . . . . . 36

5.1 Estimation des quantités caractéristiques avec GPS et Pr(H∗0 ) sur les
données de pharmacovigilance française. . . . . . . . . . . . . . . . . 72
5.2 Nombre de signaux de référence détectés par GPS basé sur Pr(H∗0 ) et
Q0.05 (λ∗ ), midRFET et ROR - Scénario 1. . . . . . . . . . . . . . . . 81
5.3 Comparaison des signaux de référence détectés dans les cas nij ≥ 3 et
nij ≥ 1 pour GPS basé sur Pr(H∗0 ) et pour midRFET - Scénario 1. . . 81
5.4 Rangs moyens dans le délai de détection des 309 signaux de référence
pour GPS basé sur Pr(H∗0 ) et Q0.05 (λ∗ ), midRFET et ROR - Scénario 1. 82
5.5 Rangs moyens dans le délai de détection des 164 signaux de référence
pour GPS basé sur Pr(H∗0 ) et Q0.05 (λ∗ ), midRFET et ROR - Scénario 1. 82
5.6 Capacité de détection du modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5%
en fonction du nombre de notifications associé aux signaux de référence
au 1er juillet 2002 - Scénario 2. . . . . . . . . . . . . . . . . . . . . . . 88

B.1 Signaux de référence (47) avec moins de 3 notifications spontanées au


1er juillet 2002. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
B.2 Signaux de référence (216) détectés par le modèle GPS basé sur Pr(H∗0 )
et FDR∗ = 5% - Scénario 2. . . . . . . . . . . . . . . . . . . . . . . . 106
B.3 Signaux de référence (46) avec au moins 3 notifications spontanées au
1er juillet 2002 et non détectés par le modèle GPS basé sur Pr(H∗0 ) et
FDR∗ = 5% - Scénario 2. . . . . . . . . . . . . . . . . . . . . . . . . . 112

viii
Liste des abréviations

Afssaps Agence française de sécurité sanitaire des produits de santé


ATC Anatomical Therapeutical Clinical
ATC5 Code ATC à 5 caractères
BCPNN Bayesian Confidence Propagation Neural Network
CRPV Centre régional de pharmacovigilance
FDA Food and Drug Administration
FDP False Discovery Proportion
FDR False Discovery Rate
FNP False Negative Proportion
FNR False Negative Rate
GPS Gamma Poisson Shrinker
HLT High Level Term
LBE Location Based Estimator
MedDRA Medical Dictionary for Regulatory Activities
MGPS Multi-Item Gamma Poisson Shrinker
midRFET mid-P-values calculées à partir du test exact de Fisher
PRR Proportional Reporting Ratio
RFET Reporting Fisher’s Exact Test
ROR Reporting Odds Ratio.
Se Sensibilité
Sp Spécificité

ix
Chapitre 1

Introduction

1.1 Contexte

Les effets indésirables des médicaments sont le plus souvent découverts après leur
autorisation de mise sur le marché et ceci pour au moins deux raisons. La première

tient à la nature même des effets indésirables qui peuvent être rares, spécifiques à
certaines catégories de la population ou se manifester après une grande période de
latence. Une autre raison est qu’une fois le médicament commercialisé, ses conditions
d’utilisation sont en général différentes de celles étudiées dans les cadres expérimen-

taux précédant sa mise sur le marché. Les systèmes de pharmacovigilance ont donc
pour but de détecter le plus précocement possible l’existence d’associations entre mé-
dicaments et événements indésirables. Ils reposent en général sur la déclaration par
des professionnels de santé (médecins ou pharmaciens) de la survenue d’événements
indésirables dont la cause suspectée est médicamenteuse. Prises individuellement, ces

notifications spontanées ne comportent que très rarement l’assurance de la respon-


sabilité du ou des médicaments incriminés. C’est donc leur accumulation qui conduit
les pharmacologues à mettre en évidence l’existence d’effets indésirables médicamen-
teux. Une difficulté rencontrée dans l’analyse de telles données réside dans le fait que

1
1.1 Contexte 2

les effets indésirables des médicaments commercialisés ne sont pas tous reconnus ni

rapportés aux instances de pharmacovigilance. Des études montrent que cette sous-
notification peut être très importante même dans le cas d’effets indésirables graves
(Bégaud et al., 2002). Il est très vraisemblable qu’elle soit fonction de l’événement
indésirable, du médicament ou du couple événement-médicament étudié ce qui peut

biaiser les conclusions tirées de l’information brute (van der Heijden et al., 2002).
Néanmoins, malgré ses limites, l’analyse des notifications spontanées demeure cer-
tainement le moyen le plus rapide et économique pour identifier de nouveaux effets
médicamenteux après l’autorisation de mise sur le marché et est par conséquent à la

base de la plupart des décisions prises par les instances de pharmacovigilance.


Le système de pharmacovigilance français a été mis en place en 1979. Il reposait
alors sur un réseau de 15 centres régionnaux de pharmacovigilance (CRPV) qui
fut rapidement étendu à 29 en 1984 puis à 31 en 1994. Ces centres ont une mission
d’information auprès des professionnels de santé. Ils ont aussi en charge la collecte des

notifications ainsi que leur enregistrement au sein de la base nationale coordonnée


par l’unité de pharmacovigilance de l’Agence Française de Sécurité Sanitaire des
Produits de Santé (Afssaps). C’est aussi au niveau de ces centres que s’exerce une
partie de la surveillance ; les cas suspectés étant par la suite discutés par le comité

technique de pharmacovigilance lors de réunions mensuelles au siège de l’Afssaps.


Entre 1986 et 2001, les données de pharmacovigilance françaises ont été enrichies
de 197 580 notifications spontanées avec une augmentation linéaire à travers le temps
pour atteindre le nombre annuel de 18 253 en 2001 (Thiessard et al., 2005). Cette base

doit être cependant considérée comme petite face aux deux principales bases mon-
diales : la base américaine coordonnée par la Food and Drug Administration (FDA)
et la base de l’Organisation Mondiale de la Santé administrée par l’Uppsala Moni-
1.2 Problématique 3

toring Center en Suède, qui, en décembre 2004, contenaient respectivement environ

2.6 et 3.7 millions de notifications (Almenoff et al., 2005).


Face à ce flux très important de données, ces deux systèmes de pharmacovigilance
ainsi que d’autres ont développé depuis une dizaine d’années des méthodes statis-
tiques de génération automatique de signaux. Ces méthodes ont pour but de détecter

les couples événement-médicament dont la présence est anormalement fréquente par


rapport à ce qui est attendu compte tenu de l’information présente dans le reste
de la base. Du fait des limites des notifications spontanées énoncées plus haut et
de la nature essentiellement exploratoire des ces analyses, les signaux ainsi générés

doivent être examinés par des experts pour en évaluer la pertinence. Il s’agit donc
plutôt d’outils complémentaires à la veille opérée par les pharmacovigilants ayant
pour objectif d’aider à l’exploration de l’immensité des données et agissant comme
des générateurs d’hypothèses.

1.2 Problématique

Les principales méthodes de détection automatique décrites dans la littérature


sont les méthodes Proportional Reporting Ratio (PRR, Evans et al. 2001), Repor-
ting Odds Ratio (ROR, van Puijenbroek et al. 2002), Bayesian Confidence Propa-

gation Neural Network (BCPNN, Bate et al. 1998; Norén et al. 2006) et (Multi-
Item) Gamma Poisson Shrinker ((M)GPS, DuMouchel 1999; DuMouchel et Pregi-
bon 2001). La méthode PRR est utilisée à la fois par le système de pharmacovigilance
anglais (Medical Control Agency) et par le système de pharmacovigilance européen
EudraVigilance. La méthode ROR est utilisée sur la base nationale des Pays Bas. La

méthode BCPNN est utilisée sur la base de l’OMS tandis que la méthode MGPS est
utilisée par la FDA (Almenoff et al., 2005; Hauben et al., 2005). La France, pour sa
part, n’utilise pas encore de système de détection automatique. Néanmoins, le tra-
1.2 Problématique 4

vail de thèse de Frantz Thiessard (Thiessard, 2004), l’étude par simulation de Roux

et al. (2005) et ce travail réalisé en collaboration avec l’unité de pharmacovigilance


de l’Afssaps et le CRPV de Bordeaux (Inserm U. 687) témoignent de la volonté de
mettre en place un tel système à moyen terme.
Les méthodes de détection automatique citées plus haut reposent sur une re-

présentation simplifiée de la base de pharmacovigilance dans laquelle les données


sont agrégées de manière à obtenir une très grande table de contingence croisant
l’ensemble des événements indésirables et des médicaments. Chaque couple se voit
ensuite associer une mesure de disproportionnalité qui conduit par comparaison à un

seuil à la génération ou non d’un signal. Ces méthodes diffèrent sur la mesure de dis-
proportionnalité choisie, le modèle de probabilité à l’origine de cette mesure ainsi que
sur les seuils de génération d’alerte. De plus, elles ne présentent pas le même degré de
complexité. En effet, les méthodes PRR et ROR sont des méthodes simples de nature
fréquentiste alors que BCPNN et GPS sont des méthodes bayésiennes reposant sur

une modélisation des données plus complexe.


Une limite de ces méthodes réside dans les seuils actuellement utilisés qui ont été
déterminés de manière arbitraire, au mieux sur la seule base d’études rétrospectives
empiriques. Il nous a donc semblé intéressant de réfléchir à une détermination plus

objective de ces derniers, fondée en particulier sur des critères d’erreurs statistiques
tenant compte du nombre très important de comparaisons effectuées simultanément.
La prise en compte de la multiplicité des comparaisons est un problème statistique
qui a reçu un intérêt croissant ces dernières années, en grande partie motivé par

l’arrivée de technologies pour l’analyse de données génomiques que sont les biopuces.
Le fruit de ces travaux a été le développement d’une multitude de méthodes pour
contrôler ou estimer de nouveaux critères d’erreurs. Parmi eux, le False Discovery
Rate (FDR) proposé par Benjamini et Hochberg (1995) et défini comme l’espérance
1.3 Objectif 5

du taux de fausses découvertes a reçu un intérêt particulier dans la mesure où il est

adapté à l’exploration de jeux de données de grandes tailles.

1.3 Objectif

Ce travail a été initié par la volonté de proposer des seuils de détection pour les

méthodes existantes fondés sur le FDR. Pour ce faire, les méthodes ont été revisitées
dans le cadre des tests d’hypothèses, ce qui ne modifie en rien leur modèle statistique
sous-jacent mais conduit néanmoins à des stratégies de détection relativement diffé-
rentes. Nous nous sommes intéressés au FDR dans la mesure où ce critère semblait
a priori répondre au caractère exploratoire de l’analyse des données de pharmaco-

vigilance. La nature fréquentiste ou bayésienne des méthodes nous a conduit à son


estimation selon deux approches différentes. En ce qui concerne les méthodes fré-
quentistes, nous avons étudié les approches d’estimation du FDR par la modélisation
des degrés de signification à l’aide de mélanges de distributions (Storey, 2002) tandis

que pour les méthodes bayésiennes, l’approche envisagée s’est appuyée sur le cadre
de la théorie de la décision proposé par Müller et al. (2004).
Le plan de ce manuscrit est le suivant. Nous présentons dans le chapitre 2 les
principales méthodes de détection automatique. Le chapitre 3 expose l’extension de

ces méthodes au cadre des comparaisons multiples. Le chapitre 4 est consacré à la


présentation de deux études par simulations visant à comparer les stratégies de détec-
tion proposées à celles actuellement en vigueur. La première se fonde sur un modèle
de simulation utilisant des caractéristiques de la base française de pharmacovigilance
tandis que la deuxième reprend le modèle de simulation de Roux et al. (2005) qui

vise à reproduire un système complet de notifications spontanées. Le chapitre 5 in-


clut d’une part les résultats de ce travail sur l’ensemble des données françaises de
pharmacovigilance collectées entre 1984 et 2003. D’autre part nous présentons les
1.3 Objectif 6

résultats d’une étude rétrospective ayant pour objectif d’évaluer les méthodes pro-

posées en utilisation séquentielle à partir de cas d’alertes réels. Le chapitre 6 conclut


sur le travail réalisé.
Chapitre 2

Description des principales


méthodes de détection
automatique

2.1 Structure des données analysées

Toutes les méthodes de détection automatique de signaux citées en introduction


se fondent sur une représentation des données de pharmacovigilance sous la forme
d’une très grande table de contingence de dimension I × J croisant l’ensemble des
médicaments et des événements indésirables impliqués au moins une fois dans une
notification spontanée. Comme nous le verrons dans le chapitre 5, la taille de cette

table de contingence dépend fortement du degré de précision utilisé pour le codage


des événements indésirables et des médicaments. Cette table est aussi caractérisée
par une grande proportion de cellules vides dépendant, là encore, du codage utilisé.
Une grande partie des notifications spontanées envoyées aux CRPV implique

plusieurs médicaments et/ou plusieurs événements indésirables. Dans de tels cas,

7
2.1 Structure des données analysées 8

chacune des combinaisons médicament-événement indésirable présente dans la noti-

fication est reportée dans la table de contingence.


Les méthodes automatiques étudiées reposent sur des mesures de disproportion-
nalité calculées pour l’ensemble des couples ayant fait l’objet d’au moins une notifi-
cation spontanée. Ces dernières constituent les statistiques d’intérêt et sont calculées

pour un couple (i, j) par agrégation de la table I × J en une table de contingence


2 × 2 présentée dans le tableau 2.1.

Tab. 2.1: Représentation des données pour le couple (i, j).

Evénement Autres événement


indésirable j indésirables
Médicament i nij nij̄ ni.
Autres médicaments nīj nīj̄ nī.
n.j n.j̄ n

nij avec i ∈ {1, . . . I} et j ∈ {1, . . . J} indique donc le nombre de notifications


P
impliquant à la fois le médicament i et l’événement indésirable j. ni. = i nij ,
P P
n.j = j nij et n = ij nij représentent les comptes marginaux. Il faut néanmoins
noter que du fait de la multiplicité des couples impliqués dans certaines notifications
spontanées, ces comptes marginaux ne correspondent pas au nombre de notifications

impliquant le médicament i (ni. ), l’événement indésirable j (n.j ) ou les deux (n).


Dans la suite de l’exposé, les méthodes existantes sont passées en revue.
2.2 Les méthodes fréquentistes 9

2.2 Les méthodes fréquentistes

2.2.1 La méthode Reporting Odds Ratio (ROR)

La méthode ROR proposée par van Puijenbroek et al. (2002) consiste à estimer
pour chacun des couples (i, j) l’odds ratio ψij à partir de la table 2.1 :

nij nīj̄
ψ̂ij = .
nīj nij̄

Le logarithme de ψ̂ij est supposé suivre une loi normale dont la variance est estimée
à partir de la delta méthode :

1 1 1 1
var{ln(
c ψ̂ij )} = + + + .
nij nīj̄ nīj nij̄

Un signal est généré lorsque la borne inférieure de l’intervalle de confiance à 95%


de ln(ψ̂ij ) est strictement supérieure à 0.
De par sa définition, ψ̂ij n’est pas calculable dans les cas très rares où le médica-
ment i n’est associé qu’à l’événement indésirable j (nij̄ = 0) ou lorsque l’événement

indésirable j n’est associé qu’au médicament i (nīj =0).

2.2.2 La méthode Proportional Reporting Ratio (PRR)

La méthode PRR proposée par Evans et al. (2001) est basée sur le calcul du
risque relatif observé dans la table 2.1 :

nij /ni.
ϕ̂ij = .
nīj /nī.

De manière analogue à ψ̂ij , ϕ̂ij n’est pas calculable dans le cas où nīj = 0.
2.3 Les méthodes bayésiennes 10

La règle proposée par Evans et al. et utilisée au MCA pour la génération d’un

signal est fondée sur 3 critères : (i) ϕ̂ij ≥ 2, (ii) nij ≥ 3 et (iii) la statistique de χ2 à
1 degré de liberté ≥ 4.
D’autre part, van Puijenbroek et al. (2002) ont proposé le même type de règle de
décision que celle utilisée pour la méthode ROR. Le logarithme de ϕ̂ij est supposé

suivre une loi normale de variance estimée par :

1 1 1 1
var{ln(
c ϕ̂ij )} = + + + ,
nij ni. nīj nī.

et un signal est généré lorsque la borne inférieure de l’intervalle de confiance à 95%


de ln(ϕ̂ij ) est strictement supérieure à 0.

En pratique, les deux statistiques ψ̂ et ϕ̂ donnent des résultats très proches ce


qui s’explique par le fait que l’on observe pour la très grande majorité des couples
nij ≪ (nīj , nij̄ ) ≪ nīj̄ (Almenoff et al., 2007).

2.3 Les méthodes bayésiennes

2.3.1 La méthode Bayesian Confidence Propagation Neural Net-

work (BCPNN)

Le modèle

La méthode initialement proposée par Bate et al. (1998) repose sur 3 modèles
beta-binomiaux :

nij| pij ∼ Bi(n, pij ) avec pij ∼ Be(αij , βij )

ni.| pi. ∼ Bi(n, pi. ) avec pij ∼ Be(αi. , βi. )


n.j| p.j ∼ Bi(n, p.j ) avec p.j ∼ Be(α.j , β.j )
2.3 Les méthodes bayésiennes 11

dans lesquels pi. , p.j et pij indiquent respectivement la probabilité dans la base d’être

“exposé” au médicament i, d’observer l’événement indésirable j et de rencontrer les


deux. Les distributions des paramètres a posteriori sont donc aussi des lois beta :

p∗ij ≡ pij| nij ∼ Be(αij + nij , βij + n − nij )

p∗i. ≡ pi.| ni. ∼ Be(αi. + ni. , βi. + n − ni. )


p∗.j ≡ p.j| n.j ∼ Be(α.j + n.j , β.j + n − n.j ).

Dans la suite de l’exposé, le symbole * sera utilisé pour indiquer des variables
aléatoires conditionnelles aux observations appropriées. Les hyperparamètres propo-

sés par Bate et al. (1998) pour les distributions a priori sont les suivants :

1
αij = 1, βij = − 1, αi. = 1, βi. = 1, α.j = 1 et β.j = 1
E(p∗i. )E(p∗.j )

avec
αi. + ni. α.j + n.j
E(p∗i. ) = et E(p∗.j ) = .
αi. + βi. + n α.j + β.j + n

Bate et al. définissent donc deux lois uniformes pour p∗i. et p∗.j . Quant aux valeurs
choisies pour les hyperparamètres αij et βij , elles sont justifiées par le fait que l’es-
pérance a priori de pij correspond ainsi au produit des espérances a posteriori des
probabilités marginales.
Plus récemment, Norén et al. (2006) ont proposé de généraliser ces 3 modèles

beta-binomiaux à un modèle Dirichlet-multinomial afin de mieux prendre en compte


les dépendances existant entre la probabilité de la cellule considérée et les probabilités
2.3 Les méthodes bayésiennes 12

marginales correspondantes :

(nij , nij̄ , nīj , nīj̄ ) ∼ Mu(n, pij , pij̄ , pīj , pīj̄ )

avec (pij , pij̄ , pīj , pīj̄ ) ∼ Di(αij , αij̄ , αīj , αīj̄ ).

La distribution a posteriori de (pij , pij̄ , pīj , pīj̄ ) est donc aussi une loi de Dirichlet :

(pij , pij̄ , pīj , pīj̄ )∗ ∼ Di(γij , γij̄ , γīj , γīj̄ )

où γkl désigne αkl + nkl .


pi. , p.j et pij sont toujours distribuées selon des lois beta mais avec une paramé-
trisation légèrement différente :

p∗ij ∼ Be(γij , γij̄ + γīj + γīj̄ )

p∗i. = p∗ij + p∗ij̄ ∼ Be(γij + γij̄ , γīj + γīj̄ )

p∗.j = p∗ij + p∗īj ∼ Be(γij + γīj , γij̄ + γīj̄ ).

Les hyperparamètres choisis sont les suivants :

αij = qi. q.j α.. , αij̄ = qi. q.j̄ α.. , αīj = qī. q.j α.. , αīj̄ = qī. q.j̄ α.. ,

0.5
avec α.. = et
qi. q.j

ni. + 0.5 nī. + 0.5 n.j + 0.5 n.j̄ + 0.5


qi. = , qī. = , q.j = , q.j̄ = .
n+1 n+1 n+1 n+1
2.3 Les méthodes bayésiennes 13

Règle de décision utilisée pour la génération de signaux

La statistique d’intérêt est fondée sur l’Information Component défini pour la


cellule (i, j) comme !
p∗ij
IC∗ij = log2 .
p∗i. p∗.j

Un signal est généré si le quantile à 2.5% de la distribution de IC∗ij est plus grand
que 0 :

Q0.025 (IC∗ij ) > 0.

Que ce soit pour le modèle beta-binomial ou sa généralisation, la distribution de


IC∗ij n’a pas de forme analytique. La stratégie initiale décrite dans Bate et al. (1998)

consistait à en faire une approximation par une loi normale N{E(IC∗ij ), var(IC∗ij )},
les deux moments étant approximés par la delta méthode. Par la suite, ces deux
moments furent développés exactement dans l’article de Gould (2003) en utilisant le
fait que la fonction génératrice des moments d’une variable aléatoire Y = ln(X), où

X est distribuée selon une loi beta de paramètres (α, β), a la forme suivante :

Γ(α + t) Γ(α + β)
mY (t) = .
Γ(α + β + t) Γ(α)

où Γ indique la fonction gamma1 . Il est alors possible d’obtenir les moments d’ordre
1 et 2 de IC∗ij par dérivation à l’ordre 1 et à l’ordre 2 de la fonction génératrice des
Z ∞
1
Γ(x) = tx−1 e−t dt.
0
2.3 Les méthodes bayésiennes 14

moments de IC∗ij prise au point 0 :


1
E(IC∗ij ) = Ψ(αij + nij ) − Ψ(αij + βij + n)
ln(2)

−Ψ(αi. + ni. ) + Ψ(αi. + βi. + n) − Ψ(α.j + n.j ) + Ψ(α.j + β.j + n)
  
1 (2 + n)2
= Ψ(1 + nij ) − Ψ
ln(2) (1 + ni. )(1 + n.j )

−Ψ(1 + ni. ) + Ψ(2 + n) − Ψ(1 + n.j ) + Ψ(2 + n)

  
1 (2 + n)2
var(IC∗ij ) = ′
Ψ (1 + nij ) − Ψ ′
ln(2)2 (1 + ni. )(1 + n.j )

′ ′ ′ ′
+Ψ (1 + ni. ) − Ψ (2 + n) + Ψ (1 + n.j ) − Ψ (2 + n)

où Ψ et Ψ′ indiquent respectivement les fonctions digamma et trigamma2 .


Dans l’article de Norén et al. (2006), les auteurs reconnaissent que l’utilisation de

la loi normale s’avère trop approximative pour les cellules contenant peu de notifi-
cations alors même que ces dernières sont les plus représentées dans la base. Ils pro-
posent par conséquent une méthode pour estimer plus finement Q0.025 (IC∗ij ). Celle-ci
repose sur l’équation suivante :

Q ij
[
b 0.025 (IC∗ ) = mode(IC∗ ˆ
ij ) − ∆ij

ˆ ij désigne l’estimation de l’écart entre le mode de la distribution de


dans laquelle ∆
IC∗ij et son quantile à 2.5%. L’estimateur employé pour le mode de IC∗ij est identique
2
Les fonctions digamma Ψ et trigamma Ψ′ sont définies comme les dérivées première et seconde
du logarithme de la fonction gamma Γ :

d d2
Ψ(x) = ln Γ(x) et Ψ′ (x) = ln Γ(x)
dx dx2
2.3 Les méthodes bayésiennes 15

à celui utilisé pour estimer E(IC∗ij ) dans Bate et al. (1998) :

E(p∗ij )
[
mode(IC∗
ij ) = log2 .
E(p∗i. ) E(p∗.j )

∆ij est estimé à l’aide du modèle de régression suivant :

−1/2 −3/2
∆ij (γij ) = Ar γij + Br γij .

Les paramètres Ar et Br dépendent de r = γij / min(γi. , γ.j ). Ils sont estimés à l’aide
de simulations par Monte Carlo pour différentes configurations simulées basées sur
11 valeurs de r (0.0, 0.1, . . . , 1.0). Par la suite, pour une valeur observée de r, Ar

et Br sont calculés par interpolation linéaire. Le choix d’utiliser cette modélisation


plutôt que de recourir à l’estimation de Q0.025 (IC∗ij ) pour chaque couple (i, j) à l’aide
de simulations par Monte Carlo est justifié par la taille très importante de la base de
l’OMS.

2.3.2 La méthode Gamma Poisson Shrinker (GPS)

Le modèle

L’approche proposée par DuMouchel (1999) suppose que les nij sont distribués
selon une loi de Poisson :
nij ∼ Pn(λij eij )

où eij est une quantité fixe indiquant le nombre de notifications attendu dans la cellule
(i, j) en supposant l’indépendance entre les lignes (médicaments) et les colonnes
ni. n.j
(événements indésirables) de la table de contingence : eij = .
n
2.3 Les méthodes bayésiennes 16

La distribution a priori choisie pour les λij est un mélange de deux lois gamma :

λij ∼ ŵ Ga(α̂1 , β̂1 ) + (1 − ŵ) Ga(α̂2 , β̂2 ),

dans laquelle les hyperparamètres θ̂ = (α̂1 , β̂1 , α̂2 , β̂2 , ŵ) sont calculés par maximisa-
tion de la vraisemblance marginale des nij :

f (n; e, α1 , β1 , α2 , β2 , w) (2.1)
Y ∞ Z
= fPn (nij ; λij eij ){w fGa (λij ; α1 , β1 ) + (1 − w) fGa (λij ; α2 , β2 )}dλij
ij 0
Y 
= w fBn {nij ; α1 , β1 /(β1 + eij )} + (1 − w) fBn {nij ; α2 , β2 /(β2 + eij )}
ij

où n = {n11 , . . . , nIJ }, e = {e11 , . . . , eIJ } et fPn , fGa , fBn indiquent respectivement
les densités de probabilité de lois de Poisson, gamma et binomiale négative. Il s’agit

donc d’une approche bayésienne empirique.


La distribution a posteriori de λij est calculée de la manière suivante :

fPn (nij ; λij eij ){ŵ fGa (λij ; α̂1 , β̂1 ) + (1 − ŵ) fGa (λij ; α̂2 , β̂2 )}
f (λij| nij ) = R ∞
0
fPn (nij ; λij eij ){ŵ fGa (λij ; α̂1 , β̂1 ) + (1 − ŵ) fGa (λij ; α̂2 , β̂2 )}dλij

fPn (nij ; λij eij ){ŵ fGa (λij ; α̂1 , β̂1 ) + (1 − ŵ) fGa (λij ; α̂2 , β̂2 )}
=
ŵ fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )} + (1 − ŵ) fBn {nij ; α̂2 , β̂2 /(β̂2 + eij )}

fPn (nij ;λij eij ) fGa (λij ;α̂1 ,β̂1 )


ŵ fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )} fBn {nij ;α̂1 ,β̂1 /(β̂1 +eij )}
=
ŵ fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )} + (1 − ŵ) fBn {nij ; α̂2 , β̂2 /(β̂2 + eij )}

fPn (nij ;λij eij ) fGa (λij ;α̂2 ,β̂2 )


(1 − ŵ) fBn {nij ; α̂2 , β̂2 /(β̂2 + eij )} fBn {nij ;α̂2 ,β̂2 /(β̂2 +eij )}
+ .
ŵ fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )} + (1 − ŵ) fBn {nij ; α̂2 , β̂2 /(β̂2 + eij )}

(2.2)
2.3 Les méthodes bayésiennes 17

En définissant wij comme :

ŵ fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )}


wij =
ŵ fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )} + (1 − ŵ) fBn {nij ; α̂2 , β̂2 /(β̂2 + eij )}
" #−1
1 − ŵ fBn {nij ; α̂2 , β̂2 /(β̂2 + eij )}
= 1+ , (2.3)
ŵ fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )}

l’expression (2.2) devient :

fPn (nij ; λij eij ) fGa (λij ; α̂1 , β̂1 )


f (λij| nij ) = wij
fBn {nij ; α̂1 , β̂1 /(β̂1 + eij )}

fPn (nij ; λij eij ) fGa (λij ; α̂2 , β̂2 )


+ (1 − wij ) .
fBn {nij ; α̂2 , β̂2 /(β̂2 + eij )}

On en déduit que la distribution a posteriori de λij est un mélange de deux lois

gamma :

λij| nij ≡ λ∗ij ∼ wij Ga(α̂1 + nij , β̂1 + eij ) + (1 − wij ) Ga(α̂2 + nij , β̂2 + eij ). (2.4)

La méthode utilisée actuellement par la FDA propose en réalité un degré de


sophistication plus élevé pour le calcul du nombre de signaux attendu eij . Ce dernier
est calculé par stratification en tenant compte de variables comme l’âge ou le sexe

des patients. De plus, la méthode MGPS permet de s’intéresser à des associations


impliquant plusieurs médicaments et/ou plusieurs événements indésirables à l’aide
de modèles log-linéaires (DuMouchel et Pregibon, 2001; Agresti, 2002). Le travail
présenté ici s’est fondé uniquement sur le modèle de la méthode GPS.
2.4 Quelques remarques générales 18

Règle de décision utilisée pour la génération de signaux

La stratégie proposée initialement par DuMouchel (1999) consistait à ranger les


couples (i, j) en fonction de l’espérance a posteriori de E{log2 (λ)} :

E{log2 (λ∗ij )} = ln(2)−1 [wij {Ψ(α̂1 + nij ) − ln(β̂1 + eij )}

+(1 − wij ){Ψ(α̂2 + nij ) − ln(β̂2 + eij )}].

Plus tard, DuMouchel et Pregibon (2001) proposaient une autre possibilité consistant
à ranger les cellules selon le quantile à 5% de la distribution des λ∗ij : Q0.05 (λ∗ij ). Par
la suite, Szarfman et al. (2002) ont proposé le seuil de détection suivant :

Q0.05 (λ∗ij ) ≥ 2.

Cette règle de décision a notamment été utilisée dans une étude récente comparant
GPS à PRR (Almenoff et al., 2006).

2.4 Quelques remarques générales

D’autres méthodes ont été proposées mais ne semblent pas être employées actuel-

lement. On trouve par exemple une méthode utilisant le sequential probability ratio
test (Evans, 2003) ainsi que d’autres basées sur la distribution de Poisson, le calcul
du χ2 avec correction de Yates ou du Yule’s Q (van Puijenbroek et al., 2002).
Concernant les méthodes décrites plus haut, il est difficile de savoir de quelle

manière elles s’inscrivent effectivement dans le processus de surveillance des systèmes


de pharmacovigilance. La littérature rapporte néanmoins des travaux attestant de
leur utilité potentielle à travers des études rétrospectives (Lindquist et al., 2000;
Szarfman et al., 2002).
2.4 Quelques remarques générales 19

Actuellement, aucune méthode ne fait l’objet d’un consensus, les méthodes étant

finalement utilisées par les systèmes de pharmacovigilance les ayant développées.


Ceci s’explique aussi peut être par le fait que peu d’études comparant l’ensemble des
méthodes n’aient été publiées. Une étude sur données réelles a été proposée par van
Puijenbroek et al. (2002) mais en prenant BCPNN comme méthode de référence. La

seule étude de simulations visant à une comparaison de l’ensemble des méthodes a


été proposée par Roux et al. (2005) et indique que les méthodes bayésiennes sont les
plus performantes du point de vue de la sensibilité et spécificité.
Enfin, les seuils choisis pour la génération de signaux ont été le sujet de peu

d’investigations et sont, somme toute, arbitraires. L’objet du chapitre suivant est de


proposer un cadre statistique général permettant notamment d’assoir le choix de ces
seuils pour les principales méthodes de détection automatique.
Chapitre 3

Méthodes de détection
automatique revisitées dans le
cadre des comparaisons multiples

Les méthodes présentées dans le chapitre précédent s’appuient sur des seuils ne
prenant pas en compte la multiplicité des comparaisons réalisées si bien qu’aucun
critère statistique n’accompagne les listes de signaux générés. Il existe une littérature
abondante consacrée à la prise en compte de la multiplicité des comparaisons. Les

méthodes sont basées sur l’estimation ou le contrôle de critères d’erreurs tels que
le Family Wise Error Rate (FWER, Hochberg et Tamhane, 1987) défini comme la
probabilité de commettre une fausse découverte ou le False Discovery Rate (FDR,
Benjamini et Hochberg, 1995) défini comme l’espérance du taux de faux positifs. Ce

dernier étant moins restrictif que le FWER, il permet un gain de puissance et est plus
adapté pour les analyses dans lesquelles un très grand nombre de comparaisons est
réalisé. Depuis l’article de Benjamini et Hochberg (1995), beaucoup de procédures ont
été proposées pour estimer ou contrôler le FDR ou des quantités dérivées. La nature

20
3.1 Comparaisons multiples et méthodes fréquentistes 21

fréquentiste et bayésienne des méthodes de pharmacovigilance nous a conduit à nous

intéresser à deux types d’approches. La première se fonde sur la modélisation des


degrés de signification par un modèle de mélange tandis que la deuxième approche
utilise le cadre décisionnel de la statistique bayésienne.

3.1 Comparaisons multiples et méthodes fréquentistes

3.1.1 ROR, PRR et test d’hypothèses

L’objectif des méthodes de détection automatique est de générer des signaux


pour lesquels le nombre de cas notifiés est significativement supérieur à ce qui aurait
été observé en cas d’indépendance entre le médicament et l’événement indésirable
considéré dans la table de contingence. Si l’on prend l’exemple de la méthode ROR,

la mesure d’association étant l’odds ratio, il s’agit donc de tester pour un couple
donné (i, j) :
H0ij : ψij ≤ ψ0 versus H1ij : ψij > ψ0 . (3.1)

Le même raisonnement peut être aussi effectué avec la méthode PRR, la mesure
d’association d’intérêt devenant le risque relatif. Pour la méthode ROR, une “vraie
association dans la base” est définie par ψ > 1 ce qui conduit à choisir naturellement
ψ0 = 1. Néanmoins, on peut aussi s’intéresser à des associations plus fortes et donc

utiliser des valeurs pour ψ0 strictement supérieures à 1.


A partir de (3.1) on peut donc proposer le calcul des degrés de signification
suivant : pij = 1 − FN [ln(ψ̂ij ); ln(ψ0 ), var{ln(ψ̂ij )}1/2 ] où FN {ln(ψ̂ij ); a, b} indique la
fonction de répartition au point ln(ψ̂ij ) d’une loi normale N(a, b). En particulier, la
méthode proposée par van Puijenbroek et al. (2002) consiste à définir une région de

rejet à 2.5% pour les degrés de signification que ce soit pour la méthode ROR ou
3.1 Comparaisons multiples et méthodes fréquentistes 22

PRR. En revanche, il n’est pas possible de trouver d’équivalent à la règle de décision

proposée par Evans et al. (2001).

3.1.2 Test exact de Fisher et mid-P-values

Une grande proportion des couples dans la base étant associée à de faibles nombres
de notifications, nous proposons d’étudier le test de Fisher comme alternative aux
méthodes PRR et ROR. Ce test est simple et ne repose sur aucune approximation
de distribution. Dans la suite de l’exposé, il sera appelé RFET (pour Reporting Fi-

sher’s Exact Test) par souci d’homogénéité avec les appellations des autres méthodes
fréquentistes.
Pour une cellule donnée (i, j) le test est construit en supposant que les comptages
marginaux (ni. , n.j et n) sont fixes et la variable aléatoire Nij est distribuée selon

une loi hypergéométrique décentrée (Agresti, 2002). On a donc :

  
ni. n − ni. n
ψijij
nij n.j − nij
Pr(Nij = nij ; ni. , n.j , n, ψij ) = x=min(ni. ,n.j )    . (3.2)
X ni. n − ni. x
ψ
x n.j − x ij
x=max(0,ni. +n.j −n)

Lorsque ψij = 1, la formule (3.2) se réduit à la probabilité d’une loi hypergéométrique.

Les degrés de signification associés au test (3.1) sont calculés de la manière suivante :
pij = Pr(Nij ≥ nij | ni. , n.j , n, ψ0 ). Par ailleurs, comme le test de Fisher est connu
pour être conservatif, nous avons aussi étudié l’utilisation des mid-P-values définies
1
comme 2
Pr(Nij = nij ; ni. , n.j , n, ψ0 ) + Pr(Nij > nij ; ni. , n.j , n, ψ0 ) (Agresti, 2002).

Par la suite, l’association des mid-P-values avec le test exact de Fisher sera notée
midRFET.
3.1 Comparaisons multiples et méthodes fréquentistes 23

3.1.3 FDR et méthodes fréquentistes

Si l’on désigne par V et R les deux variables aléatoires correspondant respecti-


vement au nombre de fausses découvertes et au nombre de signaux générés, alors le
FDR tel qu’il est défini par Benjamini et Hochberg (1995) s’écrit :

 
V
FDR = E |R > 0 Pr(R > 0).
R

Plus récemment Storey (2002) a popularisé un critère dérivé du FDR : le pFDR


(pour positive FDR) défini comme

 
V
pFDR = E |R > 0 .
R

Ces deux critères sont asymptotiquement équivalents puisque Pr(R > 0) tend vers
1 lorsque le nombre de comparaisons augmente. Comme le nombre de comparaisons

réalisées en pharmacovigilance est très important, nous utiliserons indifféremment la


notation FDR.
L’approche proposée par Storey (2002) s’appuie sur la modélisation des statis-
tiques d’intérêt notées Pij supposées i.i.d selon un mélange de deux distributions :

f (p) = π0 f0 (p) + (1 − π0 )f1 (p), (3.3)

dans lequel f0 et f1 sont les densités de probabilité de Pij sous l’hypothèse nulle

et alternative. π0 représente donc la probabilité marginale de l’hypothèse nulle. En


particulier, lorsque les Pij sont des degrés de signification, Storey montre que le FDR
associé à une région de rejet pour les degrés de signification [0, γ] avec γ ∈ [0, 1] est
égal à
π0 F0 (γ)
FDR(γ) = (3.4)
F (γ)
3.1 Comparaisons multiples et méthodes fréquentistes 24

où F0 indique la fonction de répartition des degrés de signification au point γ sous

l’hypothèse nulle et F la fonction de répartition marginale au point γ. Il s’agit donc


de la probabilité a posteriori de l’hypothèse nulle.

Cas d’hypothèses simples

Dans le cas de tests d’hypothèses nulles simples, la distribution des degrés de


signification sous l’hypothèse nulle est uniforme. Le modèle (3.3) se ramène donc à

f (p) = π0 + (1 − π0 )f1 (p) (3.5)

et l’équation (3.4) peut donc s’exprimer comme

π0 γ
FDR(γ) = .
F (γ)

F (γ) peut être estimée en utilisant la distribution empirique des degrés de significa-
tion observés : P
ij 1[pij ≤γ]
F̂ (γ) =
m

où 1[·] représente la fonction indicatrice et m indique le nombre d’hypothèses testées.


La principale difficulté réside donc dans l’estimation de π0 .
Sans hypothèse distributionnelle sur f1 , le modèle (3.5) est non identifiable et
seule une borne supérieure de π0 peut être estimée ce qui conduit à surestimer le
FDR. Il existe un grand nombre de procédures destinées à estimer un majorant de

π0 . Il s’agit le plus souvent d’estimer π0 +(1−π0 ) inf p {f1 (p)}. C’est le cas par exemple
de la procédure Qvalue développée par Storey et Tibshirani (2003) qui est la plus
utilisée actuellement.
3.1 Comparaisons multiples et méthodes fréquentistes 25

La procédure Qvalue La procédure Qvalue s’appuie sur l’estimateur de π0 pro-

posé par Schweder et Spjøtvoll (1982). Cet estimateur repose sur l’hypothèse qu’il
existe une valeur λ ∈ [0, 1] telle que f1 est nulle pour toute valeur de p ≥ λ et donc
que F1 (p) = 1. Il s’ensuit d’après l’équation (3.5) :

F (λ) = π0 λ + (1 − π0 )

ce qui conduit à l’estimateur suivant :

1 − F̂ (λ)
π̂0 (λ) = . (3.6)
1−λ

L’approche de Storey et Tibshirani (2003) a pour objectif de calculer (3.6) lorsque λ


tend vers 1, c’est-à-dire f (1). Pour cela, π̂0 (λ) est calculé pour un ensemble de valeurs
de λ. Une fonction de lissage par splines cubiques est ensuite ajustée à l’ensemble de
ces points. L’estimation de π0 correspond à la valeur de cette fonction au point 1.

D’autres procédures sont aussi couramment citées telles que la procédure LBE
(pour Location Based Estimator ) qui a démontré de bonnes performances par si-
mulations (Dalmasso et al., 2005; Lai, 2007) et qui jouit de certaines propriétés
asymptotiques. Notre travail s’est principalement appuyé sur cette procédure.

La procédure Location Based Estimator LBE est fondée sur l’égalité sui-
vante :
E{ϕ(P )} E1 {ϕ(P )}
= π0 + (1 − π0 ) (3.7)
E0 {ϕ(P )} E {ϕ(P )}
| {z0 }
biais, ≥0

où E0 {ϕ(P )} et E1 {ϕ(P )} indiquent respectivement l’espérance d’une transformation


ϕ des degrés de signification sous l’hypothèse nulle et sous l’hypothèse alternative. La
transformation ϕ(p) = {− ln(1−p)}a avec a ∈ IR+ est choisie de manière à minimiser
3.1 Comparaisons multiples et méthodes fréquentistes 26

le terme positif dans l’équation (3.7) ce qui conduit à l’estimateur de π0 suivant :

1
P 1
P
Ê{ϕ(P )} m ij ϕ(pij ) m ij {− ln(1− pij )}a
π̂0 = = =
E0 {ϕ(P )} E0 {ϕ(P )} Γ(a + 1)

où Γ(·) indique la fonction gamma. Une propriété intéressante de l’estimateur LBE
est qu’il est asymptotiquement distribué selon une loi normale avec une variance
bornée par
 
1 Γ(2a + 1)
var(π̂
¯ 0(a) ) = −1 . (3.8)
m Γ(a + 1)2

Dalmasso et al. (2005) montrent que le biais de LBE diminue lorsque a augmente
alors que var(π̂
¯ 0(a) ) augmente avec a. Dans la suite, a est choisi de manière à ce que
l’écart type de LBE soit inférieur à 0.05.

Cas d’hypothèses unilatérales

Comme l’indique (3.1), les hypothèses testées dans le cas de la pharmacovigilance

sont unilatérales. Or les degrés de signification ne sont pas calculés sous H0 mais sous
l’hypothèse H0∗ : ψij = ψ0 . Par conséquent la distribution des degrés de signification
n’est pas uniforme sous H0 . Au vu des histogrammes des densités marginales ob-
servés sur les données de la base française de pharmacovigilance pour les différentes
méthodes (illustrés pour la méthode midRFET par la figure 3.1), nous faisons l’hy-

pothèse que la distribution f0 des degrés de signification sous H0 est une fonction
croissante résultant du mélange d’une distribution uniforme et d’une fonction crois-
sante f1∗ (p), pour laquelle il existe une valeur p0 ∈ [0, 1] telle que f1∗ (p0 ) = 0. Il en
résulte que le modèle (3.3) peut s’exprimer de la manière suivante :

f (p) = π0 f0 (p) + (1 − π0 )f1 (p)

= π0 {π0∗ + (1 − π0∗ )f1∗ (p)} + (1 − π0 )f1 (p) (3.9)


3.1 Comparaisons multiples et méthodes fréquentistes 27

et (3.4) comme suit :

π0 {π0∗ F0∗ (γ) + (1 − π0∗ ) F1∗ (γ)}


FDR(γ) = . (3.10)
F (γ)

En pratique, les valeurs de FDR supérieures à 0.15 ne nous intéressent pas si bien
que seules les faibles valeurs de γ seront considérées. Si l’on suppose qu’elles sont
inférieures à p0 , alors (3.10) se réduit à

π0 π0∗ γ
FDR(γ) = .
F (γ)

L’objectif devient donc d’estimer π0 π0∗ . Récemment Pounds et Cheng (2006) ont

étudié par simulation un cas particulier de la méthode LBE dans lequel ϕ est choisie
comme fonction identité. Dans le cas de tests unilatéraux, ils proposent d’appliquer
LBE sur la transformation P ∗ = 1 − 2|P − 21 |. Pour être complètement rigoureux, il
nous faut montrer que P ∗ a une distribution décroissante.

Lemme : Si P ∗ = 1 − 2|P − 21 | où P désigne une variable aléatoire définie sur [0, 1]
dont la densité de probabilité peut s’exprimer comme :

f (p) = π0 {π0∗ + (1 − π0∗ )f1∗ (p)} + (1 − π0 )f1 (p)

et où f1∗ et f1 sont des fonctions dérivables, convexes, respectivement croissantes et


décroissantes, alors la densité de probabilité de P ∗ est décroissante et peut s’exprimer
de la manière suivante :

fP ∗ (p∗ ) = π0 π0∗ + (1 − π0 π0∗ )f1P ∗ (p∗ ).


3.1 Comparaisons multiples et méthodes fréquentistes 28

Démonstration : Soient FP ∗ et F les fonctions de répartition de P ∗ et P .

FP ∗ (p∗ ) = Pr(P ∗ ≤ p∗ )

= Pr(P ∗ ≤ p∗| P ≤ 12 ) Pr(P ≤ 21 ) + Pr(P ∗ ≤ p∗| P > 21 ) Pr(P > 12 ).

Pour P ∈ [0, 21 ], on a P ∗ = 2P et pour P ∈ [ 12 , 1], on a P ∗ = 2(1 − P ). FP ∗ peut donc


s’écrire de la manière suivante :

FP ∗ (p∗ ) = Pr(2P ≤ p∗ ∩ P ≤ 12 ) + Pr{2(1 − P ) ≤ p∗ ∩ P > 21 }


p∗
+ Pr(P ≥ 1− p2 )

= Pr(P ≤ 2
)

= F ( p2 ) + 1 − F (1− p2 ).
∗ ∗

On a donc :
fP ∗ (p∗ ) = 12 f ( p2 ) + 21 f (1− p2 )
∗ ∗

et :

fP′ ∗ (p∗ ) = 41 f ′ ( p2 ) − 41 f ′ (1− p2 ).


∗ ∗

fP′ ∗ est négative puisque fP ∗ est convexe car définie comme combinaison linéaire
positive de deux fonctions convexes. Par conséquent, fP ∗ est décroissante.

De plus, la fonction de répartition de P peut être exprimée comme :

f (p) = π0 π0∗ + (1 − π0 π0∗ )f1P (p),

ce qui conduit à :

fP ∗ (p∗ ) = + (1 − π0 π0∗ )f1P ( p2 )} + 21 {π0 π0∗ + (1 − π0 π0∗ )f1P (1− p2 )}


∗ ∗
1
2
{π0 π0∗

= π0 π0∗ + 21 (1 − π0 π0∗ ){f1P ( p2 ) + f1P (1− p2 )}.


∗ ∗
3.2 Comparaisons multiples et méthodes bayésiennes 29

On peut par conséquent appliquer les méthodes LBE, Qvalue ainsi que d’autres

telles que BUM (Pounds et Morris, 2003) ou SPLOSH (Pounds et Cheng, 2004) pour
estimer un majorant de π0 π0∗ .
ψ0 = 1 ψ0 = 2 ψ0 = 5
8

8
6

6
f (p )

f (p )

f (p )
4

4
2

2
π0π0* = 0.581 π0π0* = 0.437
π0π0* = 0.243
0

0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

(a) (b) (c)

Fig. 3.1: Histogrammes de la densité marginale des degrés de signification obtenus à


partir de la méthode midRFET sur les cellules non-vides de la base française (codage
ATC5 - HLT, 1984-2003) pour des valeurs de ψ0 = 1, 2 ou 5. Les lignes horizontales
matérialisent les estimations de π0 π0∗ obtenues avec la méthode LBE.

Il est à noter que l’approche proposée pour estimer un majorant de π0 π0∗ s’ap-
puie sur une modélisation des degrés de signification au moyen d’un mélange à trois

composantes (cf (3.9)) pour lesquelles nous avons choisi de recourir à très peu d’hy-
pothèses distributionnelles. La principale conséquence de ce choix est que l’ensemble
des poids des différentes composantes ne peut être estimé. En particulier, ni π0∗ , ni
même π0 , c’est-à-dire la proportion d’hypothèses nulles ne peuvent être obtenus sans

hypothèses distributionnelles supplémentaires sur f1∗ et f1 .

3.2 Comparaisons multiples et méthodes bayésiennes

Une grande partie des méthodes proposées pour l’estimation du FDR repose sur
la modélisation de la distribution marginale de la quantité d’intérêt au moyen de mé-
lange de distributions, une composante représentant généralement l’hypothèse nulle,
3.2 Comparaisons multiples et méthodes bayésiennes 30

l’autre ou les autres l’hypothèse alternative. Cette approche par modèle de mélange

a donné lieu à de nombreux travaux dans le cadre bayésien, développés pour l’ana-
lyse des biopuces dans les études comparatives en génomique (Broët et al. (2004);
Newton et al. (2004); Gottardo et al. (2006); Lewin et al. (2007)). Le modèle y est
formulé soit avec un mélange au niveau des observations ou de statistiques fonctions

des observations, soit au niveau de la distribution a priori des paramètres gouver-


nant l’expression différentielle des gènes. Le cadre bayésien conduit naturellement à
fonder la règle de décision sur la probabilité a posteriori de l’hypothèse nulle qui
dans le cas d’un modèle de mélange correspond à calculer pour chaque “individu” sa

probabilité d’appartenance à la composante nulle conditionnellement aux données.


Pour un ensemble d’individus sélectionnés à partir d’un seuil sur cette règle de déci-
sion, le FDR est simplement estimé par la moyenne de leur probabilité a posteriori
de l’hypothèse nulle. Cette quantité joue donc un rôle double en intervenant à la fois
dans la sélection des individus et dans l’estimation du FDR.

La méthode GPS étant fondée sur un modèle de mélange, il pourrait sembler


naturel d’envisager ce type d’approche. Néanmoins, comme il est souligné dans la
discussion de DuMouchel (1999), les deux composantes n’ont pas vocation à mo-
déliser les hypothèses en concurrence, en témoigne l’approche bayésienne empirique

utilisée pour la détermination des hyperparamètres. Nous verrons cependant, dans


la partie 3.2.2, que ce modèle a récemment été généralisé par Gould (2007) dans
l’esprit des travaux cités ci-dessus. L’approche que nous proposons s’appuie sur le
cadre décisionnel bayésien proposé par Müller et al. (2004) et ne repose pas sur la

modélisation par mélanges de distributions ce qui permet notamment de l’appliquer


directement aux deux méthodes bayésiennes existantes en pharmacovigilance.
3.2 Comparaisons multiples et méthodes bayésiennes 31

3.2.1 GPS et BCPNN dans le cadre bayésien de la théorie de la

décision

Estimation bayésienne du FDR et du FNR

Pour chacune des cellules (i, j) on définit d’une part zij ∈ {0, 1} comme l’indica-
trice du statut inconnu de l’hypothèse testée (zij = 0 signifie que l’hypothèse nulle
testée est vraie). D’autre part dij ∈ {0, 1} est l’indicatrice de la décision de générer
un signal. A partir de ces deux quantités, la proportion de fausses découvertes (FDP)

et de faux négatifs (FNP) s’écrivent de la manière suivante :

P P
ij (1
− zij )dij ij (1
− dij )zij
FDP = P et FNP = P .
ij dij m − ij dij

Comme le soulignent Müller et al. (2004), FDR = E(FNP) et FNR = E(FNP) sont
difficiles à obtenir car ces quantités font intervenir des ratios de variables aléatoires.
Ils proposent donc de s’intéresser à leur équivalent bayésien, à savoir les espérances

a posteriori de FDP et FNP que l’on notera FDR∗ et FNR∗ . En particulier, si l’on
considère que la décision dij se fonde uniquement sur les données observées alors le
calcul de FDR∗ et FNR∗ est direct :

P P
ij (1 − vij )dij ij (1
− dij )vij
FDR∗ = P et FNR∗ = P (3.11)
ij dij m − ij dij

où vij = Pr(zij∗ = 1) indique la probabilité a posteriori que l’hypothèse alternative

soit vraie.
La détermination de vij dépend à la fois de l’hypothèse nulle testée et du modèle
de probabilité supposé. Ainsi, si l’on utilise la méthode GPS et que l’on s’intéresse à
de vraies associations dans la base, alors vij = Pr(λ∗ij > 1). Dans le cas de BCPNN
on a vij = Pr(IC∗ij > 0). Plus généralement, pour une valeur donnée de RR0 et pour
3.2 Comparaisons multiples et méthodes bayésiennes 32

GPS, on peut définir vij de la manère suivante :

vij (GPS, RR0 ) = Pr(λ∗ij > RR0 )

= 1 − {wij FGa (RR0 ; α̂1 + nij , β̂1 + eij )

+(1 − wij ) FGa (RR0 ; α̂2 + nij , β̂2 + eij )}

où FGa (RR0 , s, t) indique la fonction de répartition d’une loi gamma de paramètre s
et t au point RR0 .
Dans le cas de BCPNN, on a :

vij (BCPNN, RR0 ) = Pr{IC∗ij > log2 (RR0 )}


 ∗ 
pij
= Pr ∗ ∗ > RR0 .
pi. p.j

La distribution exacte de IC∗ij n’a pas de forme analytique. Dans le cas de la version
initiale de la méthode BCPNN (Bate et al., 1998), la distribution de IC∗ij est supposée
être normale et il est donc facile de calculer vij . Cette approximation n’est plus faite
dans l’extension proposée par Norén et al. (2006) qui proposent uniquement une

nouvelle estimation de Q0.025 (IC∗ij ). Néanmoins, on peut obtenir pour chacune des
cellules (i, j) la distribution de IC∗ij à l’aide de simulations par Monte Carlo. Cette
solution est cependant très coûteuse en temps de calcul, en particulier si l’on souhaite
obtenir une précision raisonnable pour vij (BCPNN, RR0 ).

Règles de décision pour la génération de signaux

La règle de décision (dij ) que nous avons choisi d’étudier est celle proposée par

Müller et al. (2004). Elle se fonde sur vij et les auteurs ont montré qu’elle était
optimale selon plusieurs fonctions de coûts combinant FDR∗, FNR∗ ou des quantités
3.2 Comparaisons multiples et méthodes bayésiennes 33

apparentées. dij est donc définie de la manière suivante : dij = 1[vij >1−α] où 1[·]

indique la fonction indicatrice.


Les règles de décision en vigueur pour BCPNN et GPS (décrites dans les para-
graphes 2.3.1 page 13 et 2.3.2 page 18) peuvent être formulées dans le cadre déci-
sionnel proposé par Müller et al.. Dans le cas de la méthode BCPNN, la règle de

décision utilisée par l’OMS correspond à définir l’hypothèse testée et la décision pour
la génération d’un signal sur la base de RR0 = 1 et α = 0.025. Pour GPS, la règle de
décision proposée par Szarfman et al. (2002) revient à utiliser RR0 = 2 et à générer
des signaux en fixant α à 0.05.

Remarquons que dans les articles de DuMouchel (1999) et de DuMouchel et Pre-


gibon (2001), les cellules sont rangées selon E{log2 (λ∗ij )} ou Q0.05 (λ∗ij ). L’approche
proposée ici diffère en ce que les cellules sont classées par rapport à 1 − vij .

Estimation bayésienne de la sensibilité et de la spécificité

La sensibité (Se) et la spécificité (Sp) observées sont définies de la manière sui-


vante : P P
ij zij dij ij (1
− dij )(1 − zij )
Se = P et Sp = P .
ij zij m − ij zij

McLachlan et al. (2006) proposent d’estimer ces deux quantités en remplaçant zij
par son espérance a posteriori vij ce qui conduit aux estimateurs suivants :

P P
∗ ij vij dij ∗ ij (1
− dij )(1 − vij )
Se = P et Sp = P .
ij vij m − ij vij
3.2 Comparaisons multiples et méthodes bayésiennes 34

3.2.2 Autres approches proposées pour la prise en compte des

comparaisons multiples à partir du modèle GPS

Deux approches différentes de celle étudiée dans ce travail ont récemment été
proposées par Gould (2007) à partir du modèle GPS. La première, reprenant une idée

de Roux et al. (2005), propose de donner une interprétation aux deux composantes
du modèle de mélange de DuMouchel (1999). Chaque cellule se voit donc associer
une indicatrice zij de son appartenance à l’une des deux lois gamma.

λij| zij ∼ (1 − zij ) Ga(α1 , β1 ) + zij Ga(α2 , β2 ).

zij est supposé suivre a priori une loi de Bernouilli de paramètre w lui même distribué

selon une loi beta de paramètres ξ et 1 avec ξ choisi entre 3 et 4.


La statistique d’intérêt est la suivante :

Pr(zij = 0 | n, e, α1 , β1 , α2 , β2 , ξ) = (3.12)
Z 1 " #−1
1 − w fBn {nij ; α2 , β2 /(β2 + eij )}
1+ f (w| n, e, α1 , β1 , α2 , β2 , ξ) dw
p=0 w fBn {nij ; α1 , β1 /(β1 + eij )}

avec f (w| n, e, α1 , β1 , α2 , β2 , ξ) ∝

Y
fBe (w; ξ, 1) w fBn {nij ; α1 , β1 /(β1 + eij )}
ij

+ (1 − w) fBn {nij ; α1 , β1 /(β1 + eij )} .

Notons que dans le travail de Roux et al. (2005), il s’agissait simplement de wij (cf

(2.3), page 17) correspondant au terme entre crochets de l’équation (3.12).


Cette approche se veut plus subjective que celle proposée par DuMouchel (1999)
dans la mesure où l’utilisateur doit spécifier les hyperparamètres des deux lois gamma
3.2 Comparaisons multiples et méthodes bayésiennes 35

et déterminer de ce fait la distribution a priori de λij en présence et en absence

d’association. Les cellules sont classées selon (3.12) qui tient compte naturellement
de la multiplicité des comparaisons (Scott et Berger, 2006) sans que pour autant ne
soit proposé de seuil de détection basé sur des critères tels que le FDR.
La seconde approche proposée par Gould (2007) consiste à utiliser la procédure

Qvalue de Storey et Tibshirani (2003) sur Pr(λ∗ij ≤ RR0 ) = 1 − vij (GPS, RR0 )
(cf (3.12)) ; l’idée étant que sous l’hypothèse nulle λij ≤ RR0 , Pr(λ∗ij ≤ RR0 ) est,
de manière analogue aux degrés de signification, distribuée selon une loi uniforme.
Cependant, cette hypothèse ne semble pas vérifiée en pratique sur nos données comme

l’illustre la figure 3.2 pour RR0 = 1. En effet, on observe un pic important pour les
valeurs de Pr(λ∗ij ≤ 1) proches de 1.
4
3
2
1
0

0.0 0.2 0.4 0.6 0.8 1.0

Pr(λij* ≤ 1)

Fig. 3.2: Histogramme de la distribution de Pr(λ∗ij ≤ 1) obtenu à partir des données


de la base française (codage ATC5 - HLT, 1984-2003) à partir de cellules avec nij ≥ 3.
3.3 Quelques remarques 36

3.3 Quelques remarques

Partant avec l’idée de proposer des seuils de détection plus objectifs se basant
sur la prise en compte de la multiplicité des comparaisons, ce travail nous a conduit

d’une part à la proposition d’un nouveau modèle pour la détection automatique de


signaux, à savoir midRFET, et d’autre part à la proposition de statistiques d’inté-
rêt alternatives pour les méthodes existantes : les degrés de signification pour les
méthodes fréquentistes et la distribution a posteriori de l’hypothèse nulle pour les

méthodes bayésiennes. Des méthodes existantes, nous ne conservons finalement que


les modèles de probabilité sous-jacents, les règles de décision ainsi que les seuils de
détection ayant été modifiés.
Le tableau 3.1 récapitule l’ensemble des méthodes étudiées.

Modèle Méthodes existantes Nouvelles méthodes


Statistique Décision H0ij Statistique Décision
ROR Borne inf. >0 ψij ≤ ψ0 degré de FDR
normal de l’int. de signification
conf. à 95%
de ln(ψ̂ij )
PRR ϕ̂ij ≥ 2, nij ≥ 3, χ21 ≥ 4
normal Borne inf. >0 ϕij ≤ ϕ0 degré de FDR
de l’int. de signification
conf. à 95%
de ln(ϕ̂ij )
RFET ψij ≤ ψ0 degré de FDR
hypergéométrique signification
midRFET ψij ≤ ψ0 Mid-P-value FDR
hypergéométrique
BCPNN Q0.025 (IC∗ij ) >0 ICij ≤ RR0 Pr(H0∗ij ) FDR
Dirichlet- Monte Carlo
multinomial
GPS E{log2 (λ∗ij )} classement λij ≤ RR0 E{log2 (λ∗ij )} FDR†
Poisson- Q0.05 (λ∗ij ) classement λij ≤ RR0 Q0.05 (λ∗ij ) FDR†
2 gamma ∗
Q0.05 (λij ) >2 λij ≤ RR0 Pr(H0∗ij ) FDR
†Ces cas correspondent à l’utilisation des règles de classement proposées par DuMouchel (1999) et
DuMouchel et Pregibon (2001) en association avec un seuil fondé sur le FDR.

Tab. 3.1: Tableau récapitulatif des méthodes étudiées.


3.3 Quelques remarques 37

Dans un souci de clarté, en l’absence de précision, les appellations ROR, RFET,

midRFET et BCPNN feront désormais références aux modèles de probabilité en as-


sociation avec les règles de classement proposées. En revanche, GPS sera utilisé pour
désigner uniquement le modèle de probabilité et nous préciserons systématiquement
la règle de classement utilisée.

Il s’agit donc maintenant d’évaluer l’apport de ces nouvelles méthodes par rap-
port aux méthodes existantes mais aussi de caractériser et comparer l’ensemble des
approches proposées afin de conclure sur l’éventuelle supériorité de l’une d’entres
elles. C’est l’objet des deux chapitres suivants.
Chapitre 4

Étude de simulations

La seule étude de simulations comparant l’ensemble des méthodes de détection

déjà existantes en pharmacovigilance a été proposée par Roux et al. (2005) selon un
modèle de simulation décrit dans Roux et al. (2003, 2007). Dans cette étude, pour
chaque couple médicament i événement j, le nombre de notifications nij obtenu sur
une période ∆t = [t, t + ∆] est supposé suivre une loi de Poisson :

nij (∆t ) ∼ Po{RRij · Ti (t) · Ij · pij (t)}

où

– RRij indique pour l’événement j, le risque relatif lié à l’exposition au médica-


ment i,
– Ti (t) indique la fréquence d’exposition au médicament i, c’est-à-dire le nombre
de patients exposés au médicament i au temps t,

– Ij indique l’incidence de base de l’événement j et


– pij (t) indique la probabilité de notification du couple médicament i événement
j au temps t.

38
39

Le système de notifications spontanées est simulé sur une période de 10 ans pour

150 médicaments et 100 événements indésirables. Le statut d’un couple est défini à
partir de RRij qui vaut 1 en cas d’absence d’association (90% des couples), ou qui
suit une loi exponentielle sur l’intervalle [1.2, 10]. Le plan de simulation affecte aussi
une date de “mise sur le marché” aux médicaments ainsi qu’un niveau de gravité,

sous forme de variable binaire, aux événements indésirables. La quantité clef de cette
modélisation est la probabilité de notification pij (t). Cette dernière varie au cours du
temps en fonction de règles floues basées sur la date de lancement du médicament,
la gravité de l’événement ainsi que du nombre de notifications cumulées au temps

t. La fréquence d’exposition obéit aussi à des règles floues déterminées sur la base
de l’ancienneté du médicament et dépend d’une exposition maximale prenant trois
valeurs : 3 millions, 300 000 et 30 000. Enfin, pour chaque événement j, l’incidence
de base est choisie parmi deux valeurs : 1/50 000 et 1/10 000.
Le plan de simulation que nous proposons n’a pas pour but de simuler un système

complet de notifications mais plutôt d’obtenir des données ressemblant aux données
étudiées du point de vue des risques observés (nij /eij ) et des comptes marginaux
(ni. , n.j et n). Pour ce faire, des caractéristiques de la base étudiée sont utilisées dans
le processus de génération des données.

L’objectif global de cette étude par simulations est de comparer les performances
des différentes méthodes ainsi que d’évaluer la qualité des estimateurs proposés pour
différentes quantités caractéristiques : le FDR dans le cas des méthodes fréquentistes,
le FDR, le FNR, la sensibilité et la spécificité dans le cas des méthodes bayésiennes.

Dans la première partie de ce chapitre, nous présentons la procédure de simulation


des données proposée. Nous exposons ensuite les résultats de la comparaison des
méthodes fréquentistes d’une part, et des méthodes bayésiennes d’autre part avant
de présenter les résultats de la comparaison de l’ensemble des méthodes évaluées.
4.1 Modèle de simulation 40

Pour terminer, nous confrontons ces résultats à ceux obtenus à partir d’une étude

par simulations utilisant des données générées suivant le modèle de Roux et al. (2005).

4.1 Modèle de simulation

Le plan de simulation s’appuie sur la représentation des données sous la forme


d’une table de contingence. Pour chaque jeu de simulation s, un vecteur de notifica-
tions ns = (ns11 , . . . , nsIJ ) de longueur égale au nombre de cellules de la base française
est généré selon une loi multinomiale

ns ∼ Mu(n, ps )

où n correspond à la somme des nij observés dans la base de pharmacovigilance


étudiée et ps = (ps11 , . . . , psIJ ).
La génération de ps se fait de la manière suivante. Deux vecteurs temporaires
sont générés selon deux lois de Dirichlet utilisant les comptes marginaux de la base
française comme paramètres :

(psw1. , psw2. , . . . , pswI.) ∼ Di(n1. , n2. , . . . , nI. )

(psw.1 , psw.2, . . . , psw.J ) ∼ Di(n.1 , n.2 , . . . , n.J ). (4.1)

s
D’autre part, pour chaque cellule (i, j), un risque temporaire rwij est généré selon
l’exponentiel d’une loi logistique de paramètres 0 et 0.5.
Le calcul de psij se fait à partir de ces trois quantités :

s
rwij pswi. psw.j
psij = P s s s .
ij rwij pwi. pw.j
4.1 Modèle de simulation 41

Les probabilités marginales d’être exposé au médicament i ou d’observer l’événement

indésirable j sont respectivement :

X X
psi. = psij et ps.j = psij .
j i

Les comptes marginaux sont calculés de la manière suivante :

X X X
nsi. = nsij , ns.j = nsij , et ns = nsij .
j i ij

Les méthodes de génération de signaux sont fondées sur différentes mesures d’as-
sociation. Pour la méthode PRR, il s’agit du risque relatif :

psij /psi.
ϕsij = s .
(p.j − psij )/(1 − psi. )

Pour les méthode ROR, RFET, et midRFET, la mesure d’intérêt est l’odds ratio :

psij (1 + psij − psi. − ps.j )


ψijs = ,
(psi. − psij ) (ps.j − psij )

tandis que pour les méthodes bayésiennes, c’est encore d’un autre risque dont il

s’agit :
psij
RRij = s s .
pi. p.j

Dans l’étude de simulations que nous avons menée, les différentes méthodes ont été
évaluées du point de vue de leur mesure d’association respective.
Le choix d’une distribution logistique ainsi que de ses paramètres a été fait sur
la base d’une comparaison graphique entre la distribution empirique du logarithme
des risques observés simulés (ln(nsij ) − ln(esij )) et celle observée sur la base française.
4.1 Modèle de simulation 42

La figure 4.1 illustre cette comparaison pour 50 jeux de simulations. Le nombre de

cellules non vides a aussi été pris en compte.

0.4
0.3
0.2
0.1
0.0

−5 0 5 10

Fig. 4.1: Histogrammes du logarithme des risques observés dans la base française
et dans les données simulées. L’histogramme pour les données simulées (gris) a été
obtenu à partir de 50 jeux de données.

Les jeux de données générés contenant un ou plusieurs comptes marginaux nuls

ont été systématiquement éliminés. Afin d’en réduire l’occurrence, les comptes mar-
ginaux de la base française inférieurs à 5 n’ont pas été utilisés pour le calcul des
vecteurs temporaires (cf (4.1)).
Finalement, 500 jeux de données ont été générés de dimension 634 × 756 avec n
égal à 1 196 487. Le nombre moyen de cellules non vides observé pour les jeux simulés

est de 103 131 contre 97 256 pour les données réelles.


Dans la majeure partie de l’étude par simulations, nous avons restreint l’analyse
aux cellules avec au moins trois notifications dans la mesure où peu de systèmes
accordent foi à des signaux générés sur la base d’une ou deux notifications. Lorsque

les analyses sont restreintes de cette manière, les mesures de disproportionnalité


4.2 Comparaison des approches fréquentistes 43

sont tout de même calculées à partir de l’ensemble des cellules, notamment en ce

qui concerne les comptes marginaux et les hyperparamètres du modèle GPS. Seules
les quantités caractéristiques sont calculées sur la base des cellules d’intérêt (m =
P
ij 1[nij ≥3] ).

Le FDR, le FNR, la sensibilité et la spécificité ont été estimés à partir de moyennes

calculées sur les 500 jeux de données.


Les calculs ont été réalisés à l’aide du logiciel R (R Development Core Team, 2008).
Par ailleurs, un package R nommé PhViD (pour Pharmacovigilance Detection) per-
mettant l’utilisation de l’ensemble des méthodes évaluées dans ce travail a été ré-

cemment mis à disposition sur le site du CRAN (http://cran.r-project.org/).


Son développement a été effectué en collaboration avec Antoine Poncet, ingénieur
statisticien recruté notamment pour ce projet dans notre unité.

4.2 Comparaison des approches fréquentistes

Les méthodes ROR et PRR étant basées sur des mesures d’association très
proches dans le contexte des données de pharmacovigilance, nous avons choisi de
restreindre l’analyse aux méthode ROR, RFET ainsi que midRFET dans la mesure

où elles reposent sur l’odds ratio comme mesure d’association.


Cette étude par simulations a pour objectif de comparer les performances des
trois méthodes du point de vue du FDR et d’évaluer la qualité de son estimation
avec la méthodologie proposée. Différentes hypothèses nulles basées sur ψ0 = 1, 2 et

5 ont été étudiées.


4.2 Comparaison des approches fréquentistes 44

4.2.1 Étude de la densité des degrés de signification

La figure 4.2 présente les distributions des degrés de signification calculés à partir
des méthodes ROR, RFET et midRFET dans le cas où l’hypothèse testée repose sur

ψ0 = 1. Cette figure montre tout d’abord que la distribution marginale (figures a,


d, g et j) et la distribution sous l’hypothèse alternative (figures c, f, i, l) des degrés
de signification est cohérente avec les hypothèses distributionnelles supposées dans
la partie 3.1.3.

En revanche la figure 4.2b montre que ce n’est pas le cas pour la méthode ROR
appliquée aux cellules non vides sous l’hypothèse nulle. En effet, on peut voir que la
distribution est fortement décroissante pour des petits degrés de signification alors
que cette dernière est supposée être constante à cette endroit. Cette décroissance
observée est le reflet du problème lié à l’approximation normale. Une proportion trop

grande de cellules sous l’hypothèse nulle est affectée de petits degrés de signification ce
qui aura pour conséquence une augmentation du nombre de faux positifs. La figure
4.2e montre que la distribution des degrés de signification sous l’hypothèse nulle
pour RFET est tout à fait conforme à celle supposée. Dans le cas de midRFET, on

observe une légère décroissance pour des petits degrés de signification. La figure A.1
proposée en annexe illustre l’ensemble des distributions des degrés de signification
sous l’hypothèse nulle pour les trois méthodes et les trois hypothèses testées (ψ0 = 1,
2 et 5). Elle confirme que les tendances observées pour ψ0 = 1 sont identiques pour

les autres hypothèses testées.


Les figures 4.2k et A.2a, b et c montrent qu’en restreignant l’analyse aux cellules
avec nij ≥ 3, la décroissance observée pour les petits degrés de signification est
considérablement réduite. Pour midRFET, les figures A.2g, h et i montrent que la

légère décroissance observée précédemment a totalement disparu.


4.2 Comparaison des approches fréquentistes 45

ROR : nij ≥ 1 RFET : nij ≥ 1 midRFET : nij ≥ 1 ROR : nij ≥ 3

0 1 2 3 4 5 6 7
10

12
6
8

0 2 4 6 8
f(p)

4
4

2
2
0

0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

(a) (d) (g) (j)

10
8

15
8 10

8
6

10
f0(p)

6
6
4

4
4

5
2

2
2
0

0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

(b) (e) (h) (k)


20

15
12

20
15

10
f1(p)

0 2 4 6 8
10

10
5
5

5
0

0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

(c) (f) (i) (l)

Fig. 4.2: Histogrammes des distributions marginales, sous H0 et sous H1 des degrés
de signification pour ROR, RFET et midRFET. Les histogrammes sont obtenus à
partir de 50 jeux de données et calculés à partir de (i) la méthode ROR appliquée
aux cellules non vides (a, b, c), (ii) la méthode RFET appliquée aux cellules non
vides (d, e, f), (iii) la méthode midRFET appliquée aux cellules non vides (g, h, i)
et (iv) la méthode ROR appliquée aux cellules avec nij ≥ 3 (j, k, l). Les hypothèses
testées sont basées sur ψ0 = 1. La première ligne représente la distribution marginale
des degrés de signification. Les deux dernières lignes représentent respectivement les
histogrammes de la distribution des degrés de signification avec ψij ≤ 1 (H0ij ) et
ψij > 1 (H1ij ).
4.2 Comparaison des approches fréquentistes 46

4.2.2 Estimation de π0 π0 ∗

La quantité clef pour l’estimation du FDR dans le cas des approches fréquentistes
est π0 π0 ∗. Mais, du fait de la procédure de simulation des données employée, cette
quantité nous est inconnue. Néanmoins la qualité de son estimation peut être évaluée

graphiquement comme l’illustrent les figures 4.3 et A.3.


Ces figures présentent les distributions marginales des degrés de signification
transformés (p∗ ) obtenues à partir des 500 jeux de simulation pour la méthode RFET
(figure 4.3) et la méthode ROR (figure A.3) et trois hypothèses nulles testées défi-

nies par ψ0 = 1, 2 et 5. Y sont aussi représentées les estimations moyennes de π0 π0∗


obtenues avec les procédures LBE et Qvalue.
Rappelons que l’objectif de la procédure Qvalue est d’estimer le minimum de la
distribution marginale qu’elle suppose être en p∗ = 1. On peut donc voir que la procé-
dure Qvalue sous-estime très légèrement cette valeur. Le majorant de π0 π0∗ qu’estime

LBE ne peut être représenté sur ces graphiques. En revanche, il est possible de mon-
trer qu’il est minoré par celui de la procédure Qvalue. On peut donc en conclure que
la procédure LBE se comporte bien. Dans la suite de l’exposé les résultats présen-
tés ont été obtenus à partir de cette dernière. D’autres procédures d’estimation de

π0 π0 ∗ ont par ailleurs été étudiées : la procédure BUM (Pounds et Morris, 2003) et la
procédure SPLOSH (Pounds et Cheng, 2004). Les résultats des estimations ne sont
pas présentés dans ce travail mais s’avèrent beaucoup moins satisfaisants que ceux
obtenus avec LBE ou Qvalue.

4.2.3 Comparaison des méthodes selon le FDR et son estimation

La figure 4.4 présente les courbes du FDR ainsi que de la moyenne de son esti-

mation obtenues à partir des méthodes ROR, RFET et midRFET, lorsque toutes les
cellules non vides sont considérées. En moyenne, 44 466 cellules (43.1% des cellules
4.2 Comparaison des approches fréquentistes 47

ψ0 = 1

0.50
0.45
f(p*)
0.40
0.35
0.30

0.0 0.2 0.4 0.6 0.8 1.0

(a)

ψ0 = 2
0.40
0.35
f(p*)
0.30
0.25
0.20

0.0 0.2 0.4 0.6 0.8 1.0

(b)

ψ0 = 5
0.20

LBE
Qvalue
0.15
f(p*)
0.10
0.05
0.00

0.0 0.2 0.4 0.6 0.8 1.0

(c)

Fig. 4.3: Estimations de π0 π0 ∗ obtenues avec LBE et Qvalue à partir de la dis-


tribution marginale des degrés de signification transformés (p∗ ) pour RFET. Les
histogrammes sont obtenus à partir des cellules non vides des 500 jeux de simula-
tions. Les lignes horizontales représentent les estimations obtenues pour π0 π0 ∗ avec
les procédures LBE et Qvalue. Les trois figures représentent les résultats pour les
trois hypothèses nulles testées.
4.2 Comparaison des approches fréquentistes 48

ψ0 = 1

0.30
0.25
0.20
0.15
0.10
0.05
0.00

0 5000 10000 15000 20000 25000


Nombre moyen de signaux générés
(a)

ψ0 = 2
0.30
0.25
0.20
0.15
0.10
0.05
0.00

0 2000 4000 6000 8000


Nombre moyen de signaux générés
(b)

ψ0 = 5
0.30
0.25
0.20
0.15
0.10
0.05
0.00

0 500 1000 1500 2000 2500


Nombre moyen de signaux générés
(c)

Fig. 4.4: Comparaison de ROR (noir), RFET (rouge) et midRFET (bleu) selon le
FDR et son estimation pour nij ≥ 1. Le FDR (courbes épaisses) et la moyenne des
estimations du FDR (courbes fines) sont représentés en fonction de la moyenne du
nombre de signaux générés. Les estimations du FDR sont obtenues avec la procédure
LBE. Les résultats sont présentés pour les trois hypothèses nulles testées (ψ0 = 1, 2
et 5). La règle de décision basée sur une région de rejet [0, 0.025] pour p et sur ψ0 = 1
est identifiée par les droites verticales.
4.2 Comparaison des approches fréquentistes 49

non vides) ont un odds ratio supérieur à 1, 17 985 (17.4%) ont un odds ratio supé-

rieur à 2 et 4 070 (3.9%) ont un odds ratio supérieur à 5. Le FDR et son estimation
sont calculés pour différentes régions de rejet [0, γ] des degrés de signification p et
sont représentés en fonction du nombre moyen de signaux générés correspondant.
Ces figures montrent que quelle que soit l’hypothèse testée, le FDR obtenu avec la

méthode ROR (courbes épaisses noires) est toujours supérieur à celui obtenu avec les
méthodes RFET (courbes épaisses rouges) et midRFET (courbes épaisses bleues) qui
présentent quant à elles des performances identiques de ce point de vue. Les mauvaises
performances observées pour la méthode ROR étaient attendues au vu de la distribu-

tion observée des degrés de signification sous l’hypothèse nulle (cf figure 4.2b). Si l’on
s’intéresse maintenant à l’estimation du FDR, la figure 4.4 montre qu’en moyenne,
le FDR est toujours surestimé avec la méthode RFET (courbes fines rouges). Ce
résultat, compatible avec une stratégie de contrôle du FDR, était attendu compte
tenu de la procédure d’estimation utilisée (LBE) et du respect des hypothèses distri-

butionnelles observé (cf figure 4.2d, e, f). Néanmoins, on note que la surestimation
du FDR est relativement importante. Pour la méthode ROR (courbes fines noires),
le FDR est systématiquement sous-estimé pour les mêmes raisons qu’évoquées pré-
cédemment. En ce qui concerne la méthode midRFET (courbes fines bleues), les

estimations obtenues sont particulièrement bonnes dans le cas ψ0 = 1. Pour ψ0 = 2


et 5, le FDR est surestimé mais moins qu’avec la méthode RFET.
La figure 4.5 présente le même type de résultats que la figure 4.4 mais pour
les cellules avec nij ≥ 3. Le nombre moyen de ces dernières est égal à 47 316, soit

45% des cellules non vides. Sur ces 47 316 cellules, 23 160 (48.9%) ont un odds ratio
supérieur à 1, 10 154 (21.5%) ont un odds ratio supérieur à 2 et 2 553 (5.4%) ont
un odds ratio supérieur à 5. Cette figure montre que les méthodes RFET (courbes
épaisses rouges) et midRFET (courbes épaisses bleues) présentent des performances
4.2 Comparaison des approches fréquentistes 50

ψ0 = 1

0.30
0.25
0.20
0.15
0.10
0.05
0.00

0 5000 10000 15000 20000 25000


Nombre moyen de signaux générés
(a)

ψ0 = 2
0.30
0.25
0.20
0.15
0.10
0.05
0.00

0 2000 4000 6000 8000


Nombre moyen de signaux générés
(b)

ψ0 = 5
0.30
0.25
0.20
0.15
0.10
0.05
0.00

0 500 1000 1500 2000 2500


Nombre moyen de signaux générés
(c)

Fig. 4.5: Comparaison de ROR (noir), RFET (rouge) et midRFET (bleu) selon le
FDR et son estimation pour nij ≥ 3. Le FDR (courbes épaisses) et la moyenne des
estimations du FDR (courbes fines) sont représentés en fonction de la moyenne du
nombre de signaux générés. Les estimations du FDR sont obtenues avec la procédure
LBE. Les résultats sont présentés pour les trois hypothèses nulles testées (ψ0 = 1, 2
et 5). La règle de décision basée sur une région de rejet [0, 0.025] pour p et sur ψ0 = 1
est identifiée par les droites verticales.
4.2 Comparaison des approches fréquentistes 51

légèrement meilleures que la méthode ROR (courbes épaisses noires) du point de

vue du FDR pour ψ0 = 2 et 5. Par ailleurs, la figure 4.5 montre que le FDR est
surestimé par la méthode RFET (courbes fines rouges) et sous-estimé par la méthode
ROR (courbes fines noires) pour des petites valeurs. La méthode midRFET (courbes
fines bleues) semble, là encore, fournir un bon compromis entre ces deux méthodes

puisque le FDR est surestimé en moyenne mais moins qu’avec la méthode RFET.
On peut remarquer que dans le cas nij ≥ 3, la méthode midRFET conduit à une
surestimation du FDR quel que soit ψ0 alors que pour nij ≥ 1, des estimations non
biaisées sont observées pour ψ0 = 1 (cf figure 4.4a). Ceci peut être expliqué par

l’étude de la distribution observée des degrés de signification. La légère décroissance


observée dans le cas nij ≥ 1 (cf figure A.1g, h, i) va dans le sens d’une sous-estimation
du FDR tandis que la procédure utilisée pour l’estimation de π0 π0 ∗ va dans le sens
d’une surestimation de ce dernier. Aussi, il semble que pour ψ0 = 1 ces deux biais se
compensent.

D’autre part, les résultats présentés par les figures 4.4 et 4.5 semblent indiquer
que les estimations du FDR obtenues avec les méthodes RFET (courbes fines rouges)
et midREFT (courbes fines bleues) sont plus conservatrices lorsque ψ0 augmente. Ce
phénomène, illustré plus clairement à travers la figure 4.6, est probablement lié au

fait que le biais de l’estimateur LBE tend à augmenter avec ψ0 mais notre procédure
de simulation des données ne permet pas de le vérifier dans la mesure où π0 π0 ∗ est
inconnu.
Dans les figures 4.4 et 4.5, les lignes verticales illustrent les résultats obtenus avec

la règle de décision proposée par van Puijenbroek et al. (2002), c’est-à-dire pour une
région de rejet des degrés de signification égale à [0, 0.025] et ψ0 = 1. L’utilisation de
cette règle de décision pour la méthode ROR sur l’ensemble des cellules non vides (cf
figure 4.4a) conduit à générer en moyenne 23 574 signaux associés à un FDR de 15.7%
4.2 Comparaison des approches fréquentistes 52

ψ0 = 1 ψ0 = 1

Degrés de signification : 1=0.0001, 2=0.001, 3= 0.005,


3 4=0.01, 5=0.025, 6=0.05, 7=0.1, 8=0.125, 9=0.15

3
ROR
RFET
midRFET
2

2
34 5 6 7 8 9 3 4 5 6 7 8 9
12 1 2
1

1
6 7 8 9 9 6 7 8 99
3 4 5 7 8 3 4 5 7 8
12 1 2
6 6
5 5
0

0
4 4
3 3
2 2
1 1
−1

−1
0.00 0.02 0.04 0.06 0.08 0.10 5000 10000 15000 20000
FDR Nombre moyen de signaux générés
(a) (d)

ψ0 = 2 ψ0 = 2
3

3
2

12 3 4 5 1 2 3 4 5
6 7 6 7
8 9 8 9
1

12 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9
8 9 8 9
7 7
6 6
5 5
0

4 4
3 3
2 2
1 1
−1

−1

0.00 0.05 0.10 0.15 2000 3000 4000 5000 6000 7000 8000 9000
FDR Nombre moyen de signaux générés
(b) (e)

ψ0 = 5 ψ0 = 5

1 1
3

2 2
3 4 3 4
5 5
6 6
2

1 1
7 8 7 8
2 9 2 9
3 4 5 3 4 5
6 6
7 8 9 7 8 9
1

7 8 9 7 8 9
6 6
5 5
0

4 4
3 3
2 2
1 1
−1

−1

0.00 0.05 0.10 0.15 0.20 500 1000 1500 2000 2500
FDR Nombre moyen de signaux générés
(c) (f)

Fig. 4.6: Biais relatif observé dans l’estimation du FDR pour ROR, RFET et mi-
dRFET. Le biais relatif ({moyenne des estimations du FDR - FDR}/FDR) est re-
présenté en fonction du FDR (a, b, c) et en fonction du nombre moyen de signaux
générés (d, e, f). Les résultats sont présentés pour les cellules avec nij ≥ 3. Les
nombres figurant sur les courbes correspondent aux seuils de rejet de l’hypothèse
nulle pour les degrés de signification indiqués dans la légende de la figure a.
4.3 Comparaison des approches bayésiennes 53

et estimé en moyenne à 5.9%. Cette même règle de décision appliquée aux méthodes

RFET et midRFET aboutit respectivement à 13 905 et 16 894 signaux associés à des


FDR de 5.6% et 8.3%. De la même manière, si l’on restreint l’analyse aux cellules
avec au moins trois notifications, la figure 4.5 montre que l’utilisation de chacune
des trois méthodes conduit à un nombre relativement différent de signaux générés et

justifie donc l’intérêt de fonder une règle de décision sur (ou d’associer à une liste de
signaux générés) un critère d’erreur global comme le FDR.

4.3 Comparaison des approches bayésiennes

La première partie de cette étude est consacrée à la comparaison des différentes

règles de classement proposées pour le modèle GPS. Nous comparons ensuite les
modèles GPS et BCPNN en utilisant la règle de classement basée sur la probabilité
a posteriori de l’hypothèse nulle.
Dans cette étude, nous avons choisi de restreindre l’analyse aux cellules avec au

moins trois notifications dans la mesure où les méthodes bayésiennes ne reposent sur
aucune approximation de lois et qu’il n’y a donc pas lieu d’anticiper de problèmes
particuliers lorsque l’ensemble des cellules est pris en compte. Plusieurs hypothèses
nulles ont été testées, basées sur des valeurs de RR0 allant de 1 à 5. Sur cet ensemble

restreint de cellules d’intérêt, les nombres moyens de cellules avec un risque supérieur
à 1, 2, 3, 4 ou 5 sont respectivement égaux à 23 160 (48.9%), 10 028 (21.2%), 5 510
(11.6%), 3 501 (7.4%) et 2 434 (5.1%).
Le modèle GPS repose sur une détermination des hyperparamètres par maximi-
sation de la vraisemblance marginale (cf (2.1)). Pour ce faire, la fonction que nous

avons programmée fait appel à la fonction R nlm(). Pour chaque jeu de simulation,
la convergence de l’algorithme a été contrôlée au moyen d’un indicateur retourné par
cette fonction (nlm()$code=1).
4.3 Comparaison des approches bayésiennes 54

4.3.1 GPS et règles de classement

La figure 4.7 présente les résultats de la comparaison des règles de classement


proposées par DuMouchel (1999) et DuMouchel et Pregibon (2001), respectivement
notées E(λ∗ ) et Q0.05 (λ∗ ) à celle proposée dans ce travail notée Pr(H∗0 ). Cette figure

montre que Pr(H∗0 ) (courbes − ⋆ −) est une meilleure règle de classement du point
de vue du FDR. Néanmoins, pour de faibles valeurs de FDR (< 1 ou 2%), les figures
4.7b, d, f, h et j indiquent que les performances de Pr(H∗0 ) et Q0.05 (λ∗ ) (courbes
− + −) sont très proches.

D’autre part, la figure 4.7 montre que les estimations fournies par FDR∗ (courbes
violette) ne sont pas biaisées pour RR0 = 1 et 3. En revanche, pour RR0 = 2
le FDR est surestimé tandis que pour RR0 = 4 et 5, il est sous-estimé. On note
donc que l’évolution du biais n’est pas monotone avec RR0 . La figure 4.8 illustre
d’une part la variabilité de la proportion de fausses découvertes pour les 500 jeux

de simulation à partir desquels est estimé le “vrai” FDR. D’autre part, elle présente
la variabilité de son estimation (FDR∗). Les figures a, c, e, g et i montrent que la
variance de FDP augmente avec RR0 . Quant aux figures b, d, f, h et l, elles montrent
que les biais d’estimation observés dans la figure 4.7 ne sont pas le résultat d’une

variabilité trop grande de FDR∗ . L’approche proposée pour l’estimation du FDR


repose nécessairement sur un bon ajustement du modèle aux données. Le modèle de
simulation des données proposé dans ce travail diffère du modèle GPS et les biais
observés semblent donc plutôt témoigner des limites de ce dernier à s’adapter aux

données générées. Néanmoins les figures 4.7 et 4.8 montrent que le biais reste modéré
et qu’il est compatible avec une stratégie de contrôle du FDR pour des valeurs de
RR0 ≤ 3.
4.3 Comparaison des approches bayésiennes 55

E(λ*) et Pr(H0*) Q0.05(λ*) et Pr(H0*)


RR0 = 1 * *
0.08

0.08
° +
* *
°* *
° * *
0.04

0.04
° +
° * *
° ° * +*
°° ° ° °° ° ° * +
*
°° + +
0.00

0.00
°
°°°°°°
°°°°°°°°° *° *°* * * * * * +
+ +
+
+
+++++++++
+ *++
+*++++ * + +* *
*+*++*++ +
0 5000 10000 15000 20000 0 5000 10000 15000 20000
Nombre moyen de signaux générés Nombre moyen de signaux générés
(a) (b)
* + *
RR0 = 2 °
* °* + * *
°
0.08

0.08
° * °* + * *
° °
° ° ° *° * + * *
° °° ° ° * +
0.04

0.04
° ° * *
°° °° °° ° ° ° + *
°
°° * * +
+* *
* +* *
° ° ° **
+ +
+ *
° ° * +
+* *
0.00

0.00
°°°°° * * * * * * * * +++++++ +
++ + ++
++++++++++
* +
* ** * * *
0 1000 2000 3000 4000 5000 6000 7000 0 1000 2000 3000 4000 5000 6000 7000
Nombre moyen de signaux générés Nombre moyen de signaux générés
(c) (d)

° +
+
RR0 = 3
** **
0.08

0.08

+
+
°° * *
°° +
+
* *
+
0.04

0.04

°°
°° * *
+
°° * + *
°°
° °
° *
++ ++ *
++++
0.00

0.00

° ° °* * * * * * *
* * * +++++++ +* +* *+* +
* *+ * *

0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500 3000 3500
Nombre moyen de signaux générés Nombre moyen de signaux générés
(e) (f)
* + *
RR0 = 4 *° *
+ * *
° +
0.08

0.08

+
° * * + * *
° +
* + *
* *
° ° ++
0.04

0.04

° ° * * ++ * *
° ° * + *
°° ° * *
* *
° °° ** + *
° *+ *
0.00

0.00

+*
*°* * * * * * * ++++++* +* *+* +* +
*
0 500 1000 1500 2000 2500 0 500 1000 1500 2000 2500
Nombre moyen de signaux générés Nombre moyen de signaux générés
(g) (h)

RR0 = 5
°
0.08

0.08

*° *
° ° * + *
* *
° ° +
0.04

0.04

* * * *
° °
° ° * * * *
°
°° **
* +
**+
*
° °
0.00

0.00

+
* ** * * * * * * +* *+* +* + * + * *
++++

0 500 1000 1500 0 500 1000 1500


Nombre moyen de signaux générés Nombre moyen de signaux générés
(i) (j)

Fig. 4.7: Comparaison selon le FDR et son estimation des différentes règles de
classement pour GPS. Le FDR (courbes noires) et la moyenne des FDR∗ (courbes
violette) sont représentés en fonction du nombre moyen de signaux générés pour
RR0 = 1, 2, 3, 4 et 5. Les symboles ◦, + et ⋆ représentent respectivement E(λ∗ ),
Q0.05 (λ∗ ) et Pr(H∗0 ).
4.3 Comparaison des approches bayésiennes
0.00 0.02 0.04 0.06 0.08 0.10
56

0.00 0.02 0.04 0.06 0.08 0.10


RR0 = 1 FDR
FDR* moyen

0 5000 10000 15000 20000 0 5000 10000 15000 20000

(a) (b)
0.00 0.02 0.04 0.06 0.08 0.10

0.00 0.02 0.04 0.06 0.08 0.10


RR0 = 2

0 1000 2000 3000 4000 5000 6000 7000 0 1000 2000 3000 4000 5000 6000 7000

(c) (d)
0.00 0.02 0.04 0.06 0.08 0.10

0.00 0.02 0.04 0.06 0.08 0.10

RR0 = 3

0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500 3000 3500

(e) (f)
0.00 0.02 0.04 0.06 0.08 0.10

0.00 0.02 0.04 0.06 0.08 0.10

RR0 = 4

0 500 1000 1500 2000 2500 0 500 1000 1500 2000 2500

(g) (h)
0.00 0.02 0.04 0.06 0.08 0.10

0.00 0.02 0.04 0.06 0.08 0.10

RR0 = 5

0 500 1000 1500 0 500 1000 1500

(i) (j)

Fig. 4.8: Variabilité du FDR et de son estimation pour GPS basé sur Pr(H∗0 ). Le
FDR (courbes épaisses noires) et la moyenne des FDR∗ (courbes épaisses violette)
sont représentés en fonction du nombre moyen de signaux générés pour RR0 = 1, 2,
3, 4 et 5. Les courbes fines grises (figures a, c, e, g et i) représentent les quantiles à
2.5% et 97.5% de la distribution des FDPs tandis que les courbes fines en violet clair
(figures b, d, f, h et j) représentent les quantiles à 2.5% et 97.5% de la distribution
des FDR∗s .
4.4 Comparaison à partir du modèle de simulations proposé 57

4.3.2 Comparaison de GPS et BCPNN basés sur Pr(H∗0)

Les figures 4.9 à 4.12 illustrent les résultats de la comparaison de GPS et BCPNN
fondés sur la règle de classement proposée (Pr(H∗0 )) pour les différentes quantités
caractéristiques estimées : le FDR, le FNR, la sensibilité et la spécificité. En ce qui

concerne BPCNN, la distribution de IC∗ij a été obtenue pour chacune des cellules
considérées au moyen de 50 000 simulations par Monte Carlo. Les figures 4.9 à 4.12
montrent que les performances des deux modèles sont identiques quels que soient la
caractéristique étudiée et le seuil RR0 (courbes noires). En revanche les estimations

sont très différentes. D’une manière générale, pour des valeurs de RR0 ≤ 3, les
estimations obtenues avec le modèle GPS (courbes − ⋆ −) sont meilleures que celles
obtenues avec le modèle BCPNN (courbes − ◦ −). En particulier, les figures 4.9a, b, c
montrent que le FDR est sous-estimé de manière importante avec le modèle BCPNN.
Pour RR0 = 4, le modèle BCPNN fournit de meilleures estimations que le modèle

GPS pour le FDR (figure 4.9d) et pour la spécificité (figure 4.12d). Pour RR0 = 5,
les estimations obtenues avec le modèle BCPNN sont globalement plus satisfaisantes
que celles obtenues avec le modèle GPS. En effet, ce dernier sous-estime de manière
importante le FDR et surestime la spécificité.

4.4 Comparaison de l’ensemble des méthodes à partir

du modèle de simulations proposé

Plusieurs points sont à souligner pour conclure sur les résultats de cette étude
par simulations.
En ce qui concerne les méthodes fréquentistes, les limites de la méthode ROR
apparaissent clairement et la restriction à des cellules avec au moins trois notifica-

tions ne semble pas suffisante lorsque l’objectif est d’estimer le FDR. La méthode
4.4 Comparaison à partir du modèle de simulations proposé 58

RR0 = 1 RR0 = 2
0.10

0.10
*
°* * *
°
0.08

0.08
°* *
*
*
0.06

0.06
°
° * *°
°
* *
°
0.04

0.04
° *
* *° °
°
*
0.02

0.02
° * °
*° *

*° °
**°°
°
°
0.00

0.00
* °°* * °*
* ** * * ° * ° * * * * *° * °

0 5000 10000 15000 20000 0 1000 2000 3000 4000 5000 6000 7000

Nombre moyen de signaux générés Nombre moyen de signaux générés


(a) (b)
RR0 = 3 RR0 = 4
0.10

0.10 °
°
* *
**
0.08

0.08

° °
* °* *
°
0.06

0.06

° ° *
* °*
°
°
0.04

0.04

* *
° °*
°
* ° *
°*
0.02

0.02

°
*° °
° *
*
*° **°° *
0.00

0.00

°*
* * * * °* °* °* * * * *° * ° * ° *°

0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500

Nombre moyen de signaux générés Nombre moyen de signaux générés


(c) (d)
RR0 = 5
0.10

°
°
0.08

*
°
°
0.06

* *
°
°
*
0.04

*
° °
° °* *
0.02

° ° *
*
°° * ° *
0.00

*
* * * *° * ° * ° °°*

0 500 1000 1500

Nombre moyen de signaux générés


(e)

Fig. 4.9: Comparaison selon le FDR et son estimation de BCPNN et GPS basés
sur Pr(H∗0 ). Le FDR (courbes noires) et le FDR∗ moyen (courbes violette pour GPS
et vertes pour BCPNN) sont représentés en fonction du nombre moyen de signaux
générés pour RR0 = 1, 2, 3, 4 et 5. Les symboles ◦ et ⋆ représentent respectivement
les résultats obtenus avec BCPNN et GPS.
4.4 Comparaison à partir du modèle de simulations proposé 59

RR0 = 1 RR0 = 2

0.30
0.5

** ** ° °
** ** *
* ° **

0.25
° °
0.4

** °
°** ** ° ° °

0.20
° °
**° ° * ** * °
0.3

** * * * * *° * ° °
° ** ° * * * °* °

0.15
° * * *° °
° ** ° * *° °
°** * *
0.2

* * *° *
°*

0.10
* * *° * °*
* * *
0.1

0.05
0.00
0.0

0 5000 10000 15000 20000 0 1000 2000 3000 4000 5000 6000 7000

Nombre moyen de signaux générés Nombre moyen de signaux générés


(a) (b)
RR0 = 3 RR0 = 4
0.20

0.10
0.08
0.15

** ** * ° °
* **° *
0.06

° * ° ** ° ° °
° ° **°
° °
0.10

* ** * ° **° °
* * * * °* °* ° ** ° °
* * ° °* °
0.04

°* °* ° °
* * *° ° °* °* °
* *° * ° °* °
* * ° ** *° * *° *
0.05

* * °* °
0.02

*
0.00

0.00

0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500

Nombre moyen de signaux générés Nombre moyen de signaux générés


(c) (d)
RR0 = 5
0.10
0.08
0.06

* ** *
* * * *° * *
0.04

*° * ° * *
°* ° * *
°* ° *
°* °° * *°
* °° *° *°
0.02


0.00

0 500 1000 1500

Nombre moyen de signaux générés


(e)

Fig. 4.10: Comparaison selon le FNR et son estimation de BCPNN et GPS basés
sur Pr(H∗0 ). Le FNR (courbes noires) et le FNR∗ moyen (courbes violette pour GPS
et vertes pour BCPNN) sont représentés en fonction du nombre moyen de signaux
générés pour RR0 = 1, 2, 3, 4 et 5. Les symboles ◦ et ⋆ représentent respectivement
les résultats obtenus avec BCPNN et GPS.
4.4 Comparaison à partir du modèle de simulations proposé 60

RR0 = 1 RR0 = 2
1.0

1.0
0.8

0.8
°**
°** °
° ** ° *
°
° ** ** ° *
0.6

0.6
* ° *°
** * °
*°° **° °
**
*°° **° °
0.4

0.4
°°* **° °
* *
° ** °* °
*° *° °
0.2

0.2
* °° **° * °
** ** °
** **
0.0

0.0
0 5000 10000 15000 20000 0 1000 2000 3000 4000 5000 6000 7000

Nombre moyen de signaux générés Nombre moyen de signaux générés


(a) (b)
RR0 = 3 RR0 = 4
1.0

1.0
0.8

0.8

* * °
0.6

0.6

* *°
*° * °* °* °
°
* * ° °* °
* °* ° °* °
** ° * ° °* °
0.4

0.4

**° ° * °° °
°** ° °
° *°
°** ° °° *°
* ° °*
0.2

0.2

** °°* °* °
* * * °° * *°
* **
0.0

0.0

0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500

Nombre moyen de signaux générés Nombre moyen de signaux générés


(c) (d)
RR0 = 5
1.0
0.8
0.6

*°°
*°° *
*° *
°° * °
°°**
0.4

° ** °
°*
°** *
* °
0.2

*° ** ° *
** *
**
0.0

0 500 1000 1500

Nombre moyen de signaux générés


(e)

Fig. 4.11: Comparaison selon la sensibilité et son estimation de BCPNN et GPS


basés sur Pr(H∗0 ). La sensibilité (courbes noires) et la moyenne de son estimation
(courbes violette pour GPS et vertes pour BCPNN) sont représentées en fonction du
nombre moyen de signaux générés pour RR0 = 1, 2, 3, 4 et 5. Les symboles ◦ et ⋆
représentent respectivement les résultats obtenus avec BCPNN et GPS.
4.4 Comparaison à partir du modèle de simulations proposé 61

RR0 = 1 RR0 = 2

0.970 0.975 0.980 0.985 0.990 0.995 1.000


1.00

* ** * * ° * ° * °* * * * * *° * ° * °* *°
*°° ° **°°
*° ** °
° *°
0.98

* * °
° ° *
*
* *° °
0.96

° *
° *
*
° * °
0.94

° *
*
*
0.92

°
*
0.90

0 5000 10000 15000 20000 0 1000 2000 3000 4000 5000 6000 7000

Nombre moyen de signaux générés Nombre moyen de signaux générés


(a) (b)
RR0 = 3 RR0 = 4
1.000

1.000
* * * * °* °* °* °* * * * *° * ° * ° *° *° *
*° °
*° °°** *
0.998

0.998

* °°*
°° *
°°*
* *
0.996

0.996

° °*
*° ° *
*
° *
0.994

0.994

* ° °
*
°
°°
0.992

0.992

**
0.990

0.990

0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500

Nombre moyen de signaux générés Nombre moyen de signaux générés


(c) (d)
RR0 = 5
1.000

* * * *° * ° * ° °* ° * °° *
°° °**
° ° **
° ° *
0.998

° *° *
° *°
0.996

°
0.994
0.992
0.990

0 500 1000 1500

Nombre moyen de signaux générés


(e)

Fig. 4.12: Comparaison selon la spécificité et son estimation de BCPNN et GPS


basés sur Pr(H∗0 ). La spécificité (courbes noires) et la moyenne de son estimation
(courbes violette pour GPS et vertes pour BCPNN) sont représentées en fonction du
nombre moyen de signaux générés pour RR0 = 1, 2, 3, 4 et 5. Les symboles ◦ et ⋆
représentent respectivement les résultats obtenus avec BCPNN et GPS.
4.4 Comparaison à partir du modèle de simulations proposé 62

midRFET conduit à de meilleures estimations du FDR en accord avec la stratégie

de contrôle induite par les procédures comme LBE ou Qvalue.


Dans le cas des méthodes bayésiennes, cette étude par simulation montre que la
qualité de l’estimation des caractéristiques d’intérêt dépend fortement de l’hypothèse
testée. Elle révèle aussi que la règle de classement Pr(H∗0 ) est meilleure que celles

proposées jusqu’alors pour le modèle GPS du point de vue du FDR. Il est vrai
cependant que les différences semblent marginales entre Q0.05 (λ∗ ) et Pr(H∗0 ) pour des
valeurs de FDR inférieures à 1 ou 2%.
La figure 4.13 illustre les résultats de la comparaison du FDR des différentes mé-

thodes pour des cellules associées à au moins trois notifications. Elle montre que les
performances des méthodes bayésiennes (courbes en tirets longs violets pour GPS
et en tirets-points verts pour BCPNN) sont très légèrement supérieures à celles ob-
servées pour les méthodes RFET (courbes en tirets courts rouges) et midRFET
(courbes pleines bleues). On voit aussi que les performances de la méthode ROR

(courbes en pointillés noirs) sont moins bonnes que celles des autres méthodes et que
cette différence semble s’accroı̂tre lorsque le risque testé augmente.
La figure 4.14 permet de comparer les estimations obtenues avec midRFET,
BCPNN et GPS basé sur Pr(H∗0 ). Les méthodes RFET et ROR ne sont pas re-

présentées dans la mesure où leur estimation du FDR est moins satisfaisante que
celle obtenue avec midRFET (cf figures 4.4 et 4.5). Cette figure illustre le fait que s’il
est vrai que la méthodologie employée pour l’estimation du FDR dans le cas des mé-
thodes fréquentistes permet de s’assurer du contrôle de ce dernier, la surestimation

occasionnée est très importante en comparaison de celle observée pour les méthodes
bayésiennes.
4.4 Comparaison à partir du modèle de simulations proposé 63

ψ0 = 1 , RR0 = 1

0.10
midRFET
RFET
ROR

0.08
BCPNN
GPS

0.06
0.04
0.02
0.00

0 5000 10000 15000 20000


Nombre moyen de signaux générés
(a)

ψ0 = 2 , RR0 = 2
0.10
0.08
0.06
0.04
0.02
0.00

0 1000 2000 3000 4000 5000 6000 7000


Nombre moyen de signaux générés
(b)

ψ0 = 5 , RR0 = 5
0.10
0.08
0.06
0.04
0.02
0.00

0 500 1000 1500


Nombre moyen de signaux générés
(c)

Fig. 4.13: Comparaison du FDR obtenu avec midRFET, ROR, BCPNN et GPS
basé sur Pr(H∗0 ). Le FDR est calculé pour des cellules avec nij ≥ 3.
4.4 Comparaison à partir du modèle de simulations proposé 64

ψ0 = 1 , RR0 = 1

0.10
midFET
GPS
BCPNN

0.08
0.06
0.04
0.02
0.00

0 5000 10000 15000 20000


Nombre moyen de signaux générés
(a)

ψ0 = 2 , RR0 = 2
0.10
0.08
0.06
0.04
0.02
0.00

0 1000 2000 3000 4000 5000 6000 7000


Nombre moyen de signaux générés
(b)

ψ0 = 5 , RR0 = 5
0.10
0.08
0.06
0.04
0.02
0.00

0 500 1000 1500


Nombre moyen de signaux générés
(c)

Fig. 4.14: Comparaison du FDR et de son estimation pour midRFET, BCPNN et


GPS basé sur Pr(H∗0 ). Le FDR est représenté par les courbes en gras. Le FDR et son
estimation sont calculés pour des cellules avec nij ≥ 3.
4.5 Comparaison à partir du modèle de simulations de Roux et al. 65

4.5 Comparaison à partir du modèle de simulations

de Roux et al.

Il est difficile de comparer les conclusions du travail de Roux et al. (2005) aux

nôtres dans la mesure où le plan de simulation ainsi que les méthodes évaluées dif-
fèrent de manière importante. Nous avons donc choisi d’évaluer l’approche proposée
à partir de 500 jeux de données simulés sous le modèle de Roux et al. (2003) briève-
ment décrit en introduction de ce chapitre. Les méthodes retenues pour cette étude

sont ROR, midRFET, BCPNN et GPS basé sur Pr(H∗0 ). Le FDR et son estimation
ont été calculés en considérant les cellules avec au moins trois notifications. Sur ces
500 jeux de données, les nombres moyens de cellules avec au moins une et au moins
trois notifications sont respectivement égaux à 10 503 (70.0%) et 7 321 (48.8%) pour

un total de 15 000 cellules. Compte tenu du modèle de simulation, les méthodes n’ont
été évaluées que sur la base d’associations d’intérêt définies par RR0 = 1 pour les
méthodes bayésiennes et ψ0 = 1 pour les méthodes fréquentistes.
La figure 4.15a montre les courbes de FDR obtenues pour l’ensemble des méthodes

évaluées. L’allure des courbes conduit aux mêmes conclusions sur les performances
des méthodes du point de vue du FDR que celles énoncées dans le cas de notre
modèle de simulations. Au niveau des estimations du FDR représentées en couleurs
sur la figure 4.15b, les tendances semblent, là encore, être relativement proches de
celles obtenues avec notre modèle de simulation excepté pour GPS (courbe en tirets

violets) pour qui FDR∗ conduit à une surestimation assez importante du FDR. Ce
comportement reste néanmoins compatible avec une stratégie de contrôle de ce cri-
tère, à la différence de la sous-estimation qui se retrouve ici confirmée pour ROR.
Plus généralement, les estimations obtenues dans cette étude par simulations sont

moins satisfaisantes que dans l’étude précédente ce qui pourrait s’expliquer par le fait
4.5 Comparaison à partir du modèle de simulations de Roux et al. 66

ψ0 = 1 , RR0 = 1

0.10
midRFET
ROR
0.08 BCPNN
GPS
0.06
0.04
0.02
0.00

0 200 400 600 800


Nombre moyen de signaux générés
(a)

ψ0 = 1 , RR0 = 1
0.10
0.08
0.06
0.04
0.02
0.00

0 200 400 600 800


Nombre moyen de signaux générés
(b)

Fig. 4.15: Comparaison du FDR et de son estimation pour ROR, midRFET,


BCPNN et GPS basé Pr(H∗0 ) à partir du plan de simulation de Roux et al. (2003).
La figure a présente le FDR pour chacune des méthodes. Dans la figure b, le FDR
apparait en grisé tandis que les estimations sont représentées en couleur et en gras.
Le FDR et son estimation sont calculés pour des cellules avec nij ≥ 3.
4.6 Conclusion des simulations 67

que la définition d’une véritable association diffère entre les deux études par simula-

tions. En effet, dans l’approche proposée par Roux et al., la nature des associations
est définie préalablement à travers un risque lié à l’exposition au médicament en
“population générale”. Ce risque correspond bien à celui dont on aimerait disposer en
réalité. Cependant, il ne correspond pas directement à celui évalué par les méthodes

de détection automatiques qui sont appliquées sur des notifications restructurées en


table de contingence.

4.6 Conclusion des simulations

Au terme de ces études par simulations, GPS semble être le modèle le plus inté-
ressant dans la mesure où les estimations du FDR obtenues à partir de la règle de
classement proposée sont les plus satisfaisantes pour des RR0 ≤ 3 qui sont vraisem-
blablement les valeurs d’intérêt majeur. Il présente aussi l’avantage par rapport au

modèle BCPNN d’être beaucoup moins lourd d’un point de vue computationnel pour
la détermination de la distribution a posteriori de l’hypothèse nulle puisque cette der-
nière a une forme analytique. Finalement, le cadre utilisé pour la prise en compte
des comparaisons multiples permet aussi d’estimer d’autres quantités d’intérêt que

sont le FNR, la sensibilité et la spécificité.


Chapitre 5

Application aux données


françaises de pharmacovigilance

La première partie de cette application s’inscrit dans le prolongement direct de


l’étude par simulation. L’approche proposée est utilisée sur les données françaises
de pharmacovigilance collectées entre 1984 et 2003 dont les caractéristiques ont été
utilisées pour la génération des jeux de données de simulations.
Néanmoins, l’application de méthodes de détection automatique sur une base figée

ne peut, en réalité, constituer qu’une première étape. Le véritable objectif est bien
d’utiliser régulièrement ces outils sur une base de pharmacovigilance constamment
alimentée par des notifications spontanées. Aussi, la deuxième partie de ce chapitre
est consacrée à l’étude de l’application de ces méthodes en utilisation séquentielle à

travers une analyse rétrospective ainsi qu’à leur évaluation au regard de leur capacité
de détection de cas d’alertes réels.

68
5.1 Comparaison des méthodes sur les données de 1984-2003 69

5.1 Comparaison des méthodes sur les données fran-

çaises de 1984-2003

5.1.1 Les données

Les données utilisées pour cette application correspondent aux 209 833 notifica-
tions spontanées collectées par le système de pharmacovigilance français entre 1984

et 2003. Ces données initialement fournies par l’Afssaps ont été recodées par Frantz
Thiessard au cours de son travail de thèse selon la classification ATC (Anatomi-
cal Therapeutical Clinical, Miller et Britt, 1995) pour les médicaments et selon la
classification MeDRA (Medical Dictionary for Regulatory Activities, Brown et al.,
1999) pour les événements indésirables (Thiessard, 2004). La classification ATC est

arborescente et présente 5 niveaux de précision allant du groupe anatomique (code


à une lettre dénommé ATC1) à la dénomination commune internationale (code à 7
caractères ATC7). Nous avons travaillé à partir des médicaments codés en ATC5,
ce qui correspond au premier niveau de regroupement de la classification ATC. La

classification MedDRA présente 5 niveaux de précision (System Organ Class (SOC),


High-Level Group Terms (HLGT), High-Level Terms (HLT), Preferred Terms (PT)
et Lower-Level Terms (LLT)). Nous avons choisi de travailler à partir de la classifica-
tion de précision moyenne HLT. Avec ce codage utilisé, les données collectées entre

1984 et 2003 impliquent 672 classes de médicaments et 820 classes d’événements in-
désirables. Le nombre de cellules de la table de contingence ainsi constituée est donc
égal à 551 040 dont 97 256 (17.6%) sont des cellules non vides et 47 520 (8.6%) ont
des nij ≥ 3. Les résultats présentés dans la suite ont été obtenus en considérant que
les signaux potentiels devaient être impliqués dans au moins trois notifications.
5.1 Comparaison des méthodes sur les données de 1984-2003 70

5.1.2 Estimation des quantités caractéristiques

La figure 5.1 présente les résultats de l’estimation du FDR par ROR, midRFET,
BCPNN et GPS basé sur Pr(H∗0 ). Pour BCPNN, les estimations des distributions de
IC∗ij ont été obtenues à l’aide de 500 000 simulations par Monte Carlo. Dans le cas

{ψ0 = 1, RR0 = 1}, les résultats sont similaires à ceux obtenus par simulations (cf
figure 4.14a, page 64). Pour {ψ0 = 2, RR0 = 2} et {ψ0 = 3, RR0 = 3} (dans le cas
des méthodes bayésiennes), on voit apparaitre de légères différences. Par exemple,
pour {ψ0 = 2, RR0 = 2}, les estimations obtenues avec GPS et midRFET sont plus

proches que celles observées dans les simulations (cf figure 4.14b, page 64). Il faut
bien évidemment rappeler que les résultats de l’étude par simulations présentaient
des estimations moyennes. Pour les cas {ψ0 = 4, RR0 = 4} et {ψ0 = 5, RR0 = 5},
les différences semblent s’accentuer entre les résultats obtenus par simulation et ceux
de l’application. En particulier, pour RR0 = 5, on observe que l’estimation du FDR

obtenue avec BCPNN est supérieure à celle de midRFET.


Au regard de ces résultats, se manifeste l’intérêt d’avoir préalablement étudié par
simulation le comportement des différentes approches selon un modèle de simulation
“proche” des données réelles. Pour RR0 ≤ 3, les similitudes observées entre les résul-

tats de l’étude par simulations et ceux de cette application nous rendent confiants
quant aux estimations obtenues avec GPS. Le tableau 5.1 présente les estimations
des quantités caractéristiques obtenues avec GPS pour différentes valeurs de Pr(H∗0 ).
Il y figure, en particulier, le cas où l’approche proposée et la règle de décision de

Szarfman et al. (2002) (Q0.05 (λ∗ ) ≥ 2) sont formellement identiques et conduisent


donc à la même liste de signaux.
5.1 Comparaison des méthodes sur les données de 1984-2003 71

ψ0 = 1 , RR0 = 1 ψ0 = 2 , RR0 = 2
0.10

0.10
midRFET
ROR
BCPNN
GPS
0.08

0.08
0.06

0.06
0.04

0.04
0.02

0.02
0.00

0.00
0 5000 10000 15000 20000 0 1000 2000 3000 4000 5000 6000 7000
Nombre de signaux générés Nombre de signaux générés
(a) (b)

ψ0 = 3 , RR0 = 3 ψ0 = 4 , RR0 = 4
0.10

0.10
0.08

0.08
0.06

0.06
0.04

0.04
0.02

0.02
0.00

0.00

0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500 3000
Nombre de signaux générés Nombre de signaux générés
(c) (d)

ψ0 = 5 , RR0 = 5
0.10
0.08
0.06
0.04
0.02
0.00

0 500 1000 1500 2000


Nombre de signaux générés
(e)

Fig. 5.1: Comparaison des estimations du FDR sur la base de pharmacovigilance


française.
5.1 Comparaison des méthodes sur les données de 1984-2003 72

α Signaux FDR∗ FNR∗ Se∗ Sp∗


RR0 = 1
0.010 7640 0.001 0.420 0.313 1.000
0.025 8976 0.004 0.401 0.367 0.999
0.050 10442 0.008 0.379 0.424 0.996
0.100 12623 0.020 0.344 0.507 0.989
0.150 14547 0.034 0.313 0.576 0.979
0.200 16223 0.048 0.286 0.633 0.966
0.250 17772 0.063 0.261 0.682 0.951
0.300 19261 0.080 0.236 0.727 0.934
0.400 22118 0.115 0.189 0.803 0.890
0.500 24803 0.151 0.147 0.863 0.838
RR0 = 2
0.010 2764 0.001 0.138 0.309 1.000
0.025 3181 0.003 0.130 0.355 1.000
0.050 3591 0.007 0.122 0.399 0.999
0.100 4150 0.016 0.112 0.457 0.998
0.150 4625 0.027 0.103 0.504 0.997
0.200 5066 0.040 0.096 0.544 0.995
0.250 5461 0.053 0.090 0.579 0.992
0.300 5851 0.068 0.084 0.610 0.990
0.400 6673 0.103 0.072 0.670 0.982
0.500 7661 0.148 0.060 0.731 0.971
RR0 = 3
0.010 1823 0.001 0.068 0.368 1.000
0.025 2091 0.003 0.063 0.422 1.000
0.050 2356 0.007 0.058 0.473 1.000
0.100 2679 0.015 0.051 0.534 0.999
0.150 2895 0.023 0.047 0.572 0.998
0.200 3168 0.036 0.043 0.618 0.997
0.250 3349 0.046 0.040 0.646 0.996
0.300 3522 0.058 0.037 0.671 0.995
0.400 3919 0.087 0.031 0.723 0.992
0.500 4369 0.125 0.026 0.773 0.987

Tab. 5.1: Estimation des quantités caractéristiques avec GPS et Pr(H∗0 ) sur les
données de pharmacovigilance française. Le tableau présente pour différents seuils
α sur Pr(H∗0 ) et différentes valeurs RR0 le nombre de signaux générés ainsi que
les estimations de FDR, FNR, Se et Sp. La ligne en gras correspond au cas où
l’approche proposée et la règle de décision de Szarfman et al. (2002) (Q0.05 (λ∗ ) ≥ 2)
sont formellement identiques.
5.1 Comparaison des méthodes sur les données de 1984-2003 73

5.1.3 Comparaison des signaux générés

Au vu des résultats des simulations montrant des performances très proches entre
les méthodes proposées du point de vue du FDR (cf figure 4.13, page 63), se pose
la question de la proportion de signaux partagés. La figure 5.2 présente pour ROR,

midRFET, BCPNN et GPS basé sur Pr(H∗0 ), l’évolution de la proportion de signaux


communs entre les méthodes prises deux à deux, ou plus, en fonction du nombre de
signaux générés. Concernant BCPNN, cette figure laisse entrevoir que ce pourcentage
est très faible lorsque le nombre de signaux générés est faible au regard de l’hypothèse

testée. La principale raison de ce résultat est que le nombre de simulations par Monte
Carlo réalisé (500 000) ne permet pas d’avoir une précision suffisamment grande pour
le calcul de Pr(H∗0 ). Il en résulte qu’un grand nombre de cellules ont des probabilités
a posteriori de l’hypothèse nulle identiques, et de manière plus problématique égales
à 0. Par exemple, dans le cas de RR0 = 1, ce dernier est égal à 3 474. En dehors de

ces problèmes numériques, les méthodes partagent au moins 80% de signaux quelle
que soit l’hypothèse testée et ce pourcentage tend à augmenter lorsque le nombre de
signaux générés augmente (courbes en pointillés rouges). Les principales différences
sont observées entre les méthodes bayésiennes et ROR et plus particulièrement entre

BCPNN et ROR lorsque RR0 ≥ 3 (courbes en tirets). Pour de faibles nombres


de signaux générés au regard de l’hypothèse testée, ce sont GPS et midRFET qui
partagent le plus de signaux. Lorsque le nombre de signaux générés augmente, la
proportion de signaux communs entre ROR et midRFET tend vers 1.

La figure 5.3 illustre le même type de résultats mais en fonction du FDR estimé
avec GPS pour {ψ0 = 1, RR0 = 1}. Cette figure met l’accent sur les différences entre
les méthodes pour des nombres relativement importants de signaux générés. En effet,
d’après le tableau 5.1, un FDR estimé proche de 1% (0.008) conduit à la génération
de 10 442 signaux avec le modèle GPS basé sur Pr(H∗0 ). De la même manière, un FDR
5.1 Comparaison des méthodes sur les données de 1984-2003 74

ψ0 = 1 , RR0 = 1 ψ0 = 2 , RR0 = 2
1.00

1.00
0.95

0.95
0.90

0.90
0.85

0.85
GPS − BCPNN
0.80

0.80
GPS − midRFET
GPS − ROR
BCPNN − midRFET
0.75

0.75
BCPNN − ROR
midRFET − ROR
GPS − ROR − midRFET
0.70

0.70
GPS − BCPNN − ROR − midRFET

0 5000 10000 15000 20000 0 1000 2000 3000 4000 5000 6000 7000
Nombre de signaux générés Nombre de signaux générés
(a) (b)

ψ0 = 3 , RR0 = 3 ψ0 = 4 , RR0 = 4
1.00

1.00
0.95

0.95
0.90

0.90
0.85

0.85
0.80

0.80
0.75

0.75
0.70

0.70

0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500 3000
Nombre de signaux générés Nombre de signaux générés
(c) (d)

ψ0 = 5 , RR0 = 5
1.00
0.95
0.90
0.85
0.80
0.75
0.70

500 1000 1500 2000


Nombre de signaux générés
(e)

Fig. 5.2: Proportion de signaux communs entre les méthodes proposées en fonction
du nombre de signaux générés. L’évolution de cette proportion est illustrée pour
différents {ψ0 , RR0 }.
5.1 Comparaison des méthodes sur les données de 1984-2003 75

ψ0 = 1 , RR0 = 1

1.00
0.95
0.90
0.85

GPS − BCPNN
0.80

GPS − midRFET
GPS − ROR
BCPNN − midRFET
0.75

BCPNN − ROR
midRFET − ROR
GPS − ROR − midRFET
0.70

GPS − BCPNN − ROR − midRFET

0.00 0.02 0.04 0.06 0.08 0.10

FDR estimé par GPS

Fig. 5.3: Proportion de signaux communs entre les méthodes proposées pour {ψ0 =
1, RR0 = 1} en fonction du FDR estimé par GPS basé sur Pr(H∗0 ).

estimé proche de 5% (0.048) conduit à la génération de 16 223 signaux. Les figures

correspondant à l’ensemble des hypothèses testées sont fournies en annexe (figure


B.1).
Enfin, dans le cas de GPS, la proportion de signaux communs entre les trois règles
de classement a aussi été étudiée et est illustrée par la figure 5.4 dans le cas RR0 = 1.
Elle montre d’importantes différences lorsque le nombre de signaux est faible (figure

5.4a). Pour E(λ∗ ) et Pr(H∗0 ), la proportion de signaux communs ne cesse d’augmenter.


Ce résultat est en accord avec les résultats des simulations qui montrent que le FDR
des deux méthodes tend à devenir très proche lorsque le nombre de signaux générés
augmente (cf figure 4.7a, page 55). Concernant Q0.05 (λ∗ ) et Pr(H∗0 ), on constate que

passé un certain seuil, la proportion de signaux communs diminue (figure 5.4b). Là
encore, ce résultat est en accord avec celui observé par simulation dans la mesure où
5.1 Comparaison des méthodes sur les données de 1984-2003 76

ψ0 = 1 , RR0 = 1

1.0
0.8
0.6
0.4
0.2

Pr(H0*) − Q0.05(λ*)
Pr(H0*) − E(λ*)
0.0

0 5000 10000 15000 20000


Nombre de signaux générés
(a)

ψ0 = 1 , RR0 = 1
1.00
0.95
0.90
0.85
0.80
0.75
0.70

0.00 0.02 0.04 0.06 0.08 0.10


FDR estimé par GPS
(b)

Fig. 5.4: Proportion de signaux communs entre E(λ∗ ) et Pr(H∗0 ) d’une part, et entre
Q0.05 (λ∗ ) et Pr(H∗0 ) d’autre part, pour GPS et RR0 = 1 en fonction du nombre de
signaux générés (figure a) et du FDR estimé par GPS basé sur Pr(H∗0 ) (figure b).
5.2 Évaluation séquentielle à partir de cas d’alertes réels 77

les différences entre les deux règles de classement se manifestent lorsque le nombre

de signaux augmente (cf figure 4.7b).

5.2 Évaluation séquentielle à partir de cas d’alertes réels

L’ensemble du travail présenté jusqu’à présent à été appliqué sur une base de

données figée dans le temps. Il est bien évident qu’en pratique, les méthodes de
détection automatique sont destinées à être appliquées régulièrement sur des données
alimentées constamment. Cette partie est donc consacrée à l’étude de l’utilisation
séquentielle des différentes méthodes. Ne disposant que des données de la période
1984-2003, cette étude séquentielle a donc été réalisée de manière rétrospective.

De plus, ce travail s’est aussi attaché à l’évaluation des différentes méthodes du


point de vue de la détection de cas d’alertes réels dans la continuité du travail réa-
lisé par Thiessard (2004). En reprenant l’ensemble des comptes rendus des réunions
du comité technique de pharmacovigilance sur la période 1995 - juin 2002, Frantz

Thiessard a établi une liste de 429 alertes (en utilisant les dictionnaires ATC5-HLT).
Ces alertes correspondent à des enquêtes lancées par l’Afssaps ce qui ne signifie pas
pour autant qu’elles aient abouties à la mise en évidence de véritables associations.
Dans cette étude, nous considérons que ces alertes constituent des signaux de ré-

férence à partir desquels les capacités de détection des méthodes sont évaluées et
comparées. Cette définition de signaux de référence n’est néanmoins pas exempte
de défaut dans la mesure où elle postule que les méthodes de détection automa-
tique doivent au moins détecter les alertes mises en évidence par les experts. Or
les pharmacologues ne se fondent pas uniquement sur les informations recueillies à

partir des notifications spontanées. Par exemple, certaines alertes sont identifiées à
partir d’alertes européennes ou, plus rarement, d’études récemment publiées. Ainsi
nous verrons qu’un certain nombre de ces signaux de référence n’est même associé
5.2 Évaluation séquentielle à partir de cas d’alertes réels 78

à aucune notification spontanée. Cette limite tend à pénaliser les performances des

méthodes de détection automatique. En revanche, elle n’est pas problématique dans


le cas de leur comparaison.

5.2.1 Plan d’analyse

Pour cette étude, les données utilisées correspondent aux cas notifiés entre le 1er
janvier 1995 et le 30 juin 2002. Cette décision a été prise pour éviter des problèmes
de codage rencontrés lors du transfert de la base de pharmacovigilance des Hospices

Civils de Lyon à l’Agence du Médicament (actuellement Afssaps) entre 1994 et 1995.


L’analyse séquentielle a donc été réalisée à partir du 1er janvier 1996, de manière à
avoir un recul de un an pour la première analyse. Elle a été réalisée tous les mois jus-
qu’au 1er juillet 2002 compris. La figure 5.5 présente l’évolution du nombre de couples

médicament-événements présentant au moins une et au moins trois notifications dans


la base française “créée” à partir de janvier 1995.
377 des 429 signaux de référence sélectionnés par Frantz Thiessard ont été initia-
lement retenus car ils couvraient la période d’analyse séquentielle. 53 d’entre eux ont
été retirés de l’analyse dans la mesure où aucune notification n’avaient été enregistrée

au 1er juillet 2002. 15 autres ont été éliminés de l’analyse car les codes ATC étaient
trop peu précis pour être interprétables. Il y avait notamment des codes appartenant
aux catégories V03 et V07 respectivement intitulées “all other therapeutic products”
et “all other non-therapeutic products”. Finalement, le nombre de signaux de réfé-

rence utilisés pour cette analyse est égal à 309 dont 262 sont associés à au moins
trois notifications au 1er juillet 2002. Les 47 signaux de référence avec moins de trois
notifications au terme de l’analyse sont listés dans le tableau B.1 présenté en annexe.
De plus, une des particularités du système de pharmacovigilance français, est que

les pharmacovigilants affectent un score d’imputabilité aux notifications spontanées


5.2 Évaluation séquentielle à partir de cas d’alertes réels 79

nij ≥ 1
nij ≥ 3

70000
60000
50000
40000
30000
20000
10000

1996 1997 1998 1999 2000 2001 2002

Fig. 5.5: Évolution au cours du temps du nombre de couples médicament-


événements présentant au moins une et au moins trois notifications dans la base
française “créée” au 1er janvier 1995.

attestant de leur plausibilité ainsi que de l’état des connaissances bibliographiques


(Bégaud et al., 1985). Nous avons donc considéré que des couples pour lesquels les
scores d’imputabilité attestaient d’une connaissance bibliographique (codée “B3”)
dans au moins 80% des cas notifiés au cours de l’année 1995 correspondaient à des

signaux déjà analysés. Ainsi, au 1er janvier 1996, 950 couples sont considérés comme
connus et donc “détectés” par les méthodes, parmi lesquels figurent 25 signaux de
référence.

5.2.2 Premier scénario : Mise en place d’un système de détection

automatique

Dans ce scénario, nous avons évalué les méthodes dans le cas de la mise en place

d’un système de détection automatique. En concertation avec le groupe collaboratif


5.2 Évaluation séquentielle à partir de cas d’alertes réels 80

de ce projet1 , nous avons convenu qu’une analyse mensuelle de 100 signaux par

l’ensemble des pharmacologues des 31 CRPV était un scénario réaliste. Ainsi, pour
chacune des méthodes évaluées, 79 analyses mensuelles ont été réalisées portant ainsi
le nombre de signaux “analysés” au 1er juillet 2002 à 8 850 (950 + 7 900).

Comparaison des méthodes de détection automatique

Dans un premier temps, la comparaison a porté sur le modèle GPS basé sur Pr(H∗0 )
et Q0.05 (λ∗ ), midRFET et ROR. Les degrés de signification et Pr(H∗0 ) ont été calculés

à partir de {ψ0 = 1, RR0 = 1}. Nous avons aussi considéré qu’un prérequis de trois
notifications spontanées était nécessaire à la génération d’un signal, ce choix ayant
pour conséquence d’éliminer toute détection potentielle des 47 signaux de référence
ayant moins de trois notifications au terme de la période d’analyse.
Le tableau 5.2 présente le nombre de signaux détectés au 1er juillet 2002. Elle

montre que c’est le modèle GPS qui permet de détecter le plus nombre de signaux de
référence à savoir 180, soit 58.3% des 309 signaux de référence et 68.7% des signaux de
référence associés à au moins trois notifications au terme de l’analyse. On remarque
aussi que les signaux détectés par les méthodes diffèrent légèrement et que midRFET

inclut l’ensemble des signaux de référence détectés par ROR. Le nombre de signaux
de référence commun à l’ensemble des méthodes est égal à 164.
L’évaluation des règles de classement fondées sur {ψ0 = 2, RR0 = 2} a aussi
été effectuée avec midRFET et GPS basé sur Pr(H∗0 ). Elle conduit à un nombre de

signaux de référence détectés bien inférieur à celui observé pour {ψ0 = 1, RR0 = 1} :
respectivement 138 et 146 pour midRFET et GPS. Par ailleurs, pour ces deux mé-
thodes (basées sur {ψ0 = 1, RR0 = 1}) nous avons aussi conduit l’analyse séquentielle
1
C. Kreft-Jaı̈s, P. Auriche, I. Bidault (Afssaps), F. Thiessard (Inserm-Bordeaux 2 U. 897/LE-
SIM), B. Bégaud, A. Fourrier-Réglat, F. Haramburu, G. Miremont-Salamé (Inserm-Bordeaux 2 U.
657/ Centre de Pharmacovigilance)
5.2 Évaluation séquentielle à partir de cas d’alertes réels 81

GPS Pr(H∗0 ) GPS Q0.05 (λ∗ ) midRFET ROR


GPS Pr(H∗0 ) 180 178 169 166

GPS Q0.05 (λ ) - 180 167 164
midRFET - - 174 171
ROR - - - 171

Tab. 5.2: Nombre de signaux de référence détectés par GPS basé sur Pr(H∗0 ) et
Q0.05 (λ∗ ), midRFET et ROR - Scénario 1.

en considérant l’ensemble des couples avec au moins une notification. Les résultats
illustrés dans le tableau 5.3 montrent que 181 signaux de référence sont détectés avec
GPS, soit un couple de plus que précédemment. En revanche, pour midRFET, ce

nombre devient inférieur à celui observé précédemment (166 contre 174).

GPS Pr(H∗0 ) GPS Pr(H∗0 ) midRFET midRFET


nij ≥ 3 nij ≥ 1 nij ≥ 3 nij ≥ 1
GPS Pr(H∗0 ) nij ≥3 180 179 - -
GPS Pr(H∗0 ) nij ≥1 - 181 - -
midRFET nij ≥3 - - 174 161
midRFET nij ≥1 - - - 166

Tab. 5.3: Comparaison des signaux de référence détectés dans les cas nij ≥ 3 et
nij ≥ 1 pour GPS basé sur Pr(H∗0 ) et pour midRFET - Scénario 1.

Nous comparons maintenant les méthodes du point de vue des délais de détection
des signaux de référence. Ces délais sont calculés comme la différence entre la date

de détection des signaux de référence et la date de leur première notification. Dans


le cas où le signal de référence est déjà présent au début de l’analyse, c’est la date
du 1er janvier 1996 qui est retenue. En cas de non détection, le délai de détection
est considéré comme censuré au 1er juillet 2002. La première analyse porte sur la

comparaison des délais de détection des 309 signaux de référence. Pour ce faire, nous
avons utilisé le test non paramétrique de Friedman (Friedman, 1937). En cas d’égalité
5.2 Évaluation séquentielle à partir de cas d’alertes réels 82

des délais de détection (notamment en cas de censure), le rang utilisé correspond au

rang moyen.
Le tableau 5.4 présente les résultats de la comparaison des rangs moyens des
délais de détection des 309 signaux de référence. Il montre que le modèle GPS avec
la règle de classement proposée présente le meilleur rang moyen de détection. La

comparaison des rangs de ces quatre méthodes à l’aide du test de Friedman conduit
à rejeter l’hypothèse d’égalité des délais de détection (p = 4.98 10−6 ).

GPS Pr(H∗0 ) GPS Q0.05 (λ∗ ) midRFET ROR


2.36 2.45 2.52 2.67

Tab. 5.4: Rangs moyens dans le délai de détection des 309 signaux de référence pour
GPS basé sur Pr(H∗0 ) et Q0.05 (λ∗ ), midRFET et ROR - Scénario 1.

Le test de rang de Friedman ne permettant pas de différencier les délais censurés


des autres délais, nous avons réalisé la même analyse sur les 164 signaux de réfé-
rence détectés par l’ensemble des méthodes de détection automatique. Le tableau 5.5

montre que l’ordre des rangs moyens de détection reste inchangé. Le test de Friedman
demeure également très en faveur du rejet de l’hypothèse d’égalité des rangs avec un
degré de signification égal à 8.12 10−5 .

GPS Pr(H∗0 ) GPS Q0.05 (λ∗ ) midRFET ROR


2.30 2.44 2.49 2.77

Tab. 5.5: Rangs moyens dans le délai de détection des 164 signaux de référence pour
GPS basé sur Pr(H∗0 ) et Q0.05 (λ∗ ), midRFET et ROR - Scénario 1.

La comparaison des deux règles de classement pour le modèle GPS sur l’ensemble
des 309 signaux de référence montre que le rang moyen de détection avec Pr(H∗0 ) est

inférieur à celui de GPS Q0.05 (λ∗ ) (1.46 contre 1.54) et le degré de signification du
test de Friedman est égal à 2.66 10−4 .
5.2 Évaluation séquentielle à partir de cas d’alertes réels 83

Cette analyse concernant la comparaison des délais de détection des 4 méthodes

étudiées est donc en faveur de l’utilisation du modèle GPS avec la règle de classement
proposée.

Comparaison des délais de détection entre GPS et les alertes en comité

technique de pharmacovigilance

La deuxième partie de cette analyse concerne l’étude du délai entre la date de


détection des signaux de référence par le modèle GPS avec Pr(H∗0 ) et la date d’alerte

en comité technique. Un délai négatif traduit une détection plus précoce du signal
de référence avec le modèle GPS. La figure 5.6 montre l’histogramme des 180 délais
observés pour les signaux de référence détectés et illustre leur très large amplitude.
Les délais moyen et médian sont respectivement égaux à −190 et −49 jours.
25
20
15
10
5
0

−2000 −1000 0 1000 2000

Délais en jours

Fig. 5.6: Histogramme des 180 délais observés entre la date de détection par le
modèle GPS basé sur Pr(H∗0 ) et la date d’alerte en comité technique - Scénario 1.
5.2 Évaluation séquentielle à partir de cas d’alertes réels 84

A travers ce scénario, nous avons montré que les méthodes de détection auto-

matique permettent de détecter une proportion importante des signaux de référence


malgré les limites évoquées en introduction de cette partie. Cette analyse fondée sur
un nombre identique de signaux analysés chaque mois nous a aussi permis de compa-
rer de manière équitable les différentes méthodes et règles de classement étudiées. Il

en ressort que le modèle GPS en association avec Pr(H∗0 ) permet de détecter le plus
de signaux de référence dans le délai le plus court.
Cette étude montre aussi que les méthodes de détection ne deviennent réellement
efficaces que pour des associations impliquant au moins trois notifications. Cela ne

signifie pas pour autant qu’il faut restreindre l’analyse aux cellules avec au moins
trois notifications. En effet, si l’on prend l’exemple du modèle GPS, nous avons vu
que le nombre de signaux de référence détectés à partir des cellules non vides était
même supérieur à celui observé pour des cellules avec nij ≥ 3. Néanmoins, il faut
être conscient que la capacité du modèle GPS pour la détection de telles associations

semble limitée.
Dans la suite nous avons reconduit l’analyse séquentielle avec pour objectif d’éva-
luer les capacités de détection de GPS en association avec le FDR.

5.2.3 Deuxième scénario : Utilisation en routine de GPS

Dans cette analyse le modèle GPS basé sur la règle de classement Pr(H∗0 ) est utilisé
sur données restreintes aux couples avec au moins trois notifications. Pour chacune

des 79 analyses réalisées, le seuil de détection pour Pr(H∗0 ) est choisi en fonction
d’une valeur estimée de FDR égale à 5%. La figure 5.7 montre le nombre de nouveaux
signaux analysés chaque mois. Au 1er janvier 1996, l’utilisation du FDR à 5% ainsi que
des scores bibliographiques conduit à la génération de 2424 signaux parmi lesquels

figurent 74 signaux de référence. Dans l’idée d’une utilisation en routine, ces 2 424
5.2 Évaluation séquentielle à partir de cas d’alertes réels 85

signaux ont déjà été analysés au cours des mois précédents et l’on s’intéresse surtout

aux signaux générés à partir de janvier 1996. La figure 5.7 montre que le nombre de
nouveaux signaux varie entre 89 et 273 et tend à diminuer au cours du temps. Au
1er juillet 2002, le nombre de signaux analysés est égal à 13 650.

°
2000
1000
500

°
° °
°
200

°° °
°°
°° ° °° °°° ° ° °° °
° ° °°° ° ° °
° °° ° ° °° ° °° °° ° °
° ° ° ° °° ° ° ° °°
°°
° ° °
° °
°°
100

° ° ° °° ° °°
°
° ° ° °

1996 1997 1998 1999 2000 2001 2002

Fig. 5.7: Évolution du nombre de nouveaux signaux générés à partir du modèle


GPS basé sur Pr(H∗0 ) et d’un seuil de 5% pour le FDR∗ - Scénario 2.

La figure 5.8 montre l’évolution du seuil de détection sur la statistique Pr(H∗0 )


pour obtenir un FDR estimé de 5%. Si l’on suppose que la qualité de l’estimation de ce
dernier ne varie pas au cours du temps, alors on voit que le seuil sur Pr(H∗0 ) augmente
avec le temps ce qui est un argument supplémentaire en faveur de l’utilisation de

FDR∗ comme règle de décision.


Au 1er juillet 2002, 216 signaux de référence sont détectés, soit 69.9% des 309
signaux de référence et 82.4% des 262 signaux de référence avec au moins trois no-
tifications. Les signaux de référence détectés incluent la totalité de ceux détectés
5.2 Évaluation séquentielle à partir de cas d’alertes réels 86

0.19
°°°°°°
°°°
°°
°
°°
°
° °°°°
0.18 °
°°°° ° °°°°°°
°
°°°°
°°°
°° °°
°°
°
°°°°°
0.17

°° °°
°°
°°
°°°
°
° °
° ° °° °
0.16

°
°°°

°
°
°
0.15

1996 1997 1998 1999 2000 2001 2002

Fig. 5.8: Évolution du seuil sur Pr(H∗0 ) pour FDR∗ = 5% lors de l’utilisation de
GPS - Scénario 2.

dans le scénario précédent (y compris ceux des autres méthodes). Les tableaux B.2

et B.3 présentés en annexe listent les 216 signaux de référence détectés par le modèle
GPS dans ce scénario et les 46 signaux de référence non détectés mais avec plus
de trois notifications au 1er juillet 2002. Dans ce dernier tableau, les 12 signaux de
référence pour lesquels le risque observé (RRij /eij ) ne dépasse jamais 1 tout au long

de l’analyse sont aussi indiqués.


La figure 5.9 présente l’histogramme des délais entre la date de détection par
le modèle GPS avec Pr(H∗0 ) et la date d’alerte en comité technique pour les 216
signaux de référence. Parmi ces derniers, 148 sont détectés avant la date d’alerte en
comité technique. Les délais médian et moyen sont respectivement égaux à −234

et −384 jours. Le tableau 5.6 illustre ce type de résultats en fonction du nombre


de notifications associées aux signaux de référence au 1er juillet 2002. Il montre que
5.2 Évaluation séquentielle à partir de cas d’alertes réels 87

les performances en termes de rapidité et de pourcentage de signaux de référence

détectés augmente lorsque l’on s’intéresse à signaux de référence très notifiés.

30
20
10
0

−2000 −1000 0 1000 2000

Délais en jours

Fig. 5.9: Histogramme des 216 délais observés entre la date de détection par le
modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5% et la date d’alerte en comité technique
- Scénario 2.

Ce scénario conduit à analyser un plus grand nombre de signaux que dans le


scénario un (13 650 contre 8 850). Nous avons donc simulé une analyse fondée sur un

seuil plus restrictif pour le FDR, à savoir à 1%. La figure 5.10 présente (de la même
manière que la figure 5.7) le nombre de signaux analysés chaque mois. On peut
voir qu’en dehors de la première étape nécessitant l’analyse de 1 253 signaux (1 620
signaux générés − 367 signaux connus du point de vue des scores bibliographiques),
le nombre de signaux varie entre 57 et 152. Au terme de cette analyse, le nombre de

signaux analysés est égal à 8454, en comptant les 950 couples connus du point de vue
des scores bibliographiques, ce qui est moins que le nombre de signaux analysés au
cours du scénario 1. Néanmoins, les résultats obtenus sont meilleurs dans la mesure où
5.2 Évaluation séquentielle à partir de cas d’alertes réels 88

Nb de Nb de Nb de signaux % de signaux délai délai


notifications signaux de de référence de référence moyen médian
er
au 1 juil. 02 référence détectés détectés
≥3 262 216 82.4% −384 −234
≥5 231 195 84.4% −493 −304
≥ 10 178 161 90.4% −620 −409
≥ 25 122 111 91.0% −692 −422
≥ 50 74 69 93.2% −851 −561
≥ 100 36 34 94.4% −958 −619

Tab. 5.6: Capacité de détection du modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5%
en fonction du nombre de notifications associé aux signaux de référence au 1er juillet
2002 - Scénario 2.

°
1000
500
200

°
° °
°° ° °
° ° ° °°
100

°° ° ° ° ° °
° ° ° ° ° ° ° ° °°
° °° ° ° °°° °
° ° °
° °°°
° ° ° ° ° °° °
° ° ° °
° ° °
°
° °° ° ° ° °°
° ° ° °
° °°
°
50

1996 1997 1998 1999 2000 2001 2002

Fig. 5.10: Évolution du nombre de nouveaux signaux générés à partir du modèle


GPS basé sur Pr(H∗0 ) et FDR∗ = 1% - Scénario 2.
5.2 Évaluation séquentielle à partir de cas d’alertes réels 89

191 signaux de référence sont détectés contre 180 précédemment. De plus, les délais

entre la date de détection et la date d’alerte en comité technique de pharmacovigilance


sont en moyenne et en médiane respectivement égaux à −356 et −155 ce qui traduit
une meilleure anticipation que dans le scénario 1. Évidemment, dans ce scénario,
il est tout de même nécessaire d’évaluer un grand nombre de signaux lors de la

première analyse et il n’est pas évident que suffisamment de ressources humaines soit
mobilisables pour cette première étape. Il n’en reste pas moins que si l’on souhaite
mettre en place un système de détection qui soit réactif par rapport aux alertes
d’actualité, il semble nécessaire de faire cette analyse préliminaire qui vise à réaliser

d’une certaine manière “l’état des lieux du système”.


Chapitre 6

Conclusion

De par la nature des données traitées, les méthodes de détection automatique sont

fondamentalement des outils d’analyse exploratoire. Néanmoins, la mise en place d’un


cadre statistique visant à tenir compte de la multiplicité des comparaisons permet
de fonder la génération de signaux sur la base de seuils liés à des critères d’erreurs
directement interprétables. Evidemment, les quantités caractéristiques estimées dans
ce travail ne peuvent être interprétées au niveau général de l’identification d’associa-

tions médicamenteuses. Il s’agit avant tout de caractéristiques permettant d’évaluer


les capacités statistiques des méthodes en prenant comme référentiel les données sur
lesquelles elles sont appliquées.
L’approche présentée est simple à mettre en place et ne modifie pas les modèles

de probabilité des différentes méthodes. Elle consiste tout d’abord à proposer de


nouvelles règles de classement, à savoir les degrés de signification pour les méthodes
fréquentistes et les probabilités a posteriori de l’hypothèse nulle pour les méthodes
bayésiennes. De ce point de vue, nous avons montré à travers l’étude par simulation

et dans une moindre mesure à travers l’évaluation séquentielle à partir de cas réels
la supériorité de la règle de classement proposée sur celles existantes dans le cas
du modèle GPS. Concernant les autres méthodes, étant donné l’absence de référence

90
91

quant à la possibilité d’ordonner les cellules selon une statistique d’intérêt, nous avons

considéré les règles de décision en vigueur comme des cas particuliers de l’approche
proposée.
Dès lors que l’on travaille à partir d’une règle de classement, deux stratégies
de détection sont envisageables et correspondent aux deux scénarios étudiés lors de

l’évaluation séquentielle des méthodes à partir des cas d’alertes réels. La première
consiste à analyser un certain nombre de signaux ordonnés selon la statistique de
classement, ce nombre étant fixé au regard des capacités d’analyses des systèmes
de pharmacovigilance avec la possibilité à tout moment d’estimer les quantités ca-

ractéristiques. La deuxième stratégie, plus proche de ce qui semble être fait par les
principaux systèmes de pharmacovigilance, consiste à fixer préalablement un seuil
de détection, dans notre cas sur la base de FDR∗. Le nombre de signaux à analyser
devient donc variable mais semble diminuer au cours du temps.
Ces stratégies de détection reposent fondamentalement sur le prérequis d’une

estimation sans biais du FDR ou tout du moins sur une estimation donnant des
garanties sur le contrôle de celui-ci. Or, l’étude par simulation montre que malgré
des performances opérationnelles très proches à nombre de signaux générés égal, la
qualité d’estimation du FDR varie de manière importante d’une méthode à l’autre.

Ainsi, pour le modèle BCPNN, on observe une importante sous-estimation du FDR


pour des RR0 d’intérêt majeurs reflétant probablement une modélisation des don-
nées moins satisfaisante que celle obtenue avec le modèle GPS. En ajoutant à cela
la lourdeur computationnelle due à l’estimation de Pr(H∗0 ) par Monte Carlo, il nous

semble donc que l’utilisation de ce modèle avec l’approche proposée est peu inté-
ressante. L’approche d’estimation du FDR pour les méthodes fréquentistes présente
l’avantage de garantir un contrôle de ce critère sous réserve du respect des hypothèses
distributionnelles, ce qui n’est pas le cas pour la méthode ROR, mais au prix d’une
92

surestimation relativement importante même dans le cas de midRFET. Au terme de

deux études par simulation et de l’évaluation séquentielle à partir de cas d’alertes


réels, il semble donc que ce soit le modèle GPS en association avec la règle de décision
proposée qui fournisse les résultats les plus satisfaisants.
Il faut toutefois noter que des travaux récents dans le domaine de l’analyse des

données de génomique explorent les limites de l’utilisation des méthodes d’estimation


du FDR en présence de dépendances. En particulier, Qiu et al. (2005) ont montré
par simulations que plusieurs estimateurs du FDR (dont Qvalue) pouvaient être en-
tachés dans ce cas d’une variance importante. Les scénarios étudiés sont néanmoins

très pessimistes dans la mesure où les données sont générées sous une structure de
dépendance complète (tous les gènes sont corrélés) et sur un nombre relativement
restreint de gènes (1 255). Il n’en demeure pas moins que certaines formes de dé-
pendance entre événements ou entre médicaments existent très vraisemblablement
dans les données de pharmacovigilance analysées. Par conséquent, les récents dé-

veloppements ayant pour objectif d’améliorer les qualités des estimateurs du FDR
par l’utilisation d’informations supplémentaires disponibles constituent des sources
d’inspiration précieuses (Ferkingstad et Frigessi, 2008; Leek et Storey, 2008).
Plus généralement, la prise en compte d’informations supplémentaires semble être

d’autant plus attrayante qu’elle doit aussi permettre d’augmenter les chances de gé-
nérer des signaux pertinents. La méthode GPS permet déjà de prendre en compte,
par stratification, certaines caractéristiques des patients à l’origine des notifications
pour la détermination du nombre attendu eij . Très récemment Prieto-Merino et al.

(2008) ont utilisé le modèle bayésien hiérarchique de Berry et Berry (2004) ainsi que
des méthodes de classification non supervisées afin de prendre en compte les corré-
lations observées entre événements indésirables dans la base de pharmacovigilance
pour améliorer le calcul du ROR. En ce qui concerne les médicaments, une voie d’ex-
93

ploration pourrait être de prendre en compte les mécanismes d’actions des principes

actifs à travers l’utilisation, par exemple, de profils d’affinité aux différents récepteurs
moléculaires.
Pour conclure, l’évaluation rétrospective des approches proposées à partir de cas
réels vient confirmer l’utilité de ces outils de détection automatique. Par conséquent,

en parallèle des perspectives de recherche méthodologique citées plus haut, il paraı̂t


essentiel de travailler à la mise en place rapide d’un système de détection automatique
en France.
Bibliographie

Agresti, A. (2002). Categorical data analysis. Wiley Interscience.

Almenoff, J. S., Lacroix, K. K., Yuen, N. A., Fram, D. et DuMouchel, W. (2006). Com-
parative performance of two quantitative safety signalling methods : Implications for use in a
pharmacovigilance department. Drug Safety, 29(10):875–887.

Almenoff, J. S., Pattishall, E. N., Gibbs, T. G., DuMouchel, W., Evans, S. J. W. et Yuen, N.
(2007). Novel statistical tools for monitoring the safety of marketed drugs. Clinical Pharmacology
& Therapeutics, 82(2):157–166.

Almenoff, J. S., Tonning, J. M., Gould, A. L., Szarfman, A., Hauben, M., Ouellet-
Hellstrom, R., Ball, R., Hornbuckle, K., Walsh, L., Yee, C., Sacks, S. T., Yuen, N. A.,
Patadia, V., Blum, M., Johnston, M., Gerrits, C., Seifert, H. et LaCroix, K. K. (2005).
Perspectives on the use of data mining in pharmacovigilance. Drug Safety, 28(11):981–1007.

Bate, A., Lindquist, M., Edwards, I. R., Olsson, S., Orre, R., Lansner, A. et De Freitas,
R. M. (1998). A bayesian neural network method for adverse drug reaction signal generation.
European Journal of Clinical Pharmacology, 54(4):315–321.

Benjamini, Y. et Hochberg, Y. (1995). Controlling the false discovery rate : a practical and
powerful approach to multiple testing. Journal of the Royal Statistical Society, Series B, 57(1):
289–300.

Berry, S. M. et Berry, D. A. (2004). Accounting for multiplicities in assessing drug safety : A


three-level hierarchical mixture model. Biometrics, 60(2):418–426.

Brown, E. G., Wood, L. et Wood, S. (1999). The medical dictionary for regulatory activities
(MedDRA). Drug Safety, 20(2):1999.

Broët, P., Lewin, A., Richardson, S., Dalmasso, C. et Magdelenat, H. (2004). A mixture
model-based strategy for selecting sets of genes in multiclass response microarray experiments.
Bioinformatics, 20(16):2562–2571.

Bégaud, B., Evreux, J. C., Jouglard, J. et Lagier, G. (1985). Imputabilité des effets inattendus
ou toxiques des médicaments : actualisation de la méthode utilisée en france. Thérapie, 40(2):111–
118.

Bégaud, B., Martin, K., Haramburu, F. et Moore, N. (2002). Rates of spontaneous reporting
of adverse drug reactions in france. JAMA, 288:1588.

Dalmasso, C., Broët, P. et Moreau, T. (2005). A simple procedure for estimating the false
discovery rate. Bioinformatics, 21(5):660–668.

94
BIBLIOGRAPHIE 95

DuMouchel, W. (1999). Bayesian data mining in large frequency tables, with an application to
the fda spontaneous reporting system. The American Statistician, 53(3):177–190.

DuMouchel, W. et Pregibon, D. (2001). Empirical bayes screening for multi-item associations.


In KDD ’01 : Proceedings of the Seventh ACM SIGKDD International Conference on Knowledge
Discovery and Data Mining, pages 67–76.

Evans, S. (2003). Sequential probability ratio tests applied to public health problems. Controlled
Clinical Trials, 24:67S.

Evans, S. J., Waller, P. C. et Davis, S. (2001). Use of proportional reporting ratios (PRRs) for
signal generation from spontaneous adverse drug reaction reports. Pharmacoepidemiology and
Drug Safety, 10(6):483–486.

Ferkingstad, E. et Frigessi, A. (2008). Unsupervised empirical bayesian multiple testing with


external covariates. Annals of Applied Statistics, 2(2):714–735.

Friedman, M. (1937). The use of ranks to avoid the assumption of normality implicit in the
analysis of variance. Journal of the American Statistical Association, 32(200):675–701.

Gottardo, R., Raftery, A. E., Yeung, K. Y. et Bumgarner, R. (2006). Bayesian robust


inference for differential gene expression in cdna microarrays with multiple samples. Biometrics,
62:10–18.

Gould, A. L. (2003). Practical pharmacovigilance analysis strategies. Pharmacoepidemiology and


Drug Safety, 12(7):559–574.

Gould, A. L. (2007). Accounting for multiplicity in the evaluation of ”signals” obtained by data
mining from spontaneous report adverse event databases. Biometrical Journal, 49:151–165.

Hauben, M., Madigan, D., Gerrits, C. M., Walsh, L. et van Puijenbroek, E. P. (2005). The
role of data mining in pharmacovigilance. Expert Opinion on Drug Safety, 4(5):929–948.

Hochberg, Y. et Tamhane, A. C. (1987). Multiple Comparison Procedures. Wiley.

Lai, Y. (2007). A moment-based method for estimating the proportion of true null hypotheses and
its application to microarray gene expression data. Biostatistics, 8(4):744–755.

Leek, J. T. et Storey, J. D. (2008). A general framework for multiple testing dependence.


Proceedings of the National Academy of Sciences, 105(48):18718–18723.

Lewin, A., Bochkina, N. et Richardson, S. (2007). Fully bayesian mixture model for differen-
tial gene expression : Simulations and model checks. Statistical Applications in Genetics and
Molecular Biology, 6:Article 36.

Lindquist, M., Ståhl, M., Bate, A., Edwards, I. et Meyboom, R. H. B. (2000). A retrospective
evaluation of a data mining approach to aid finding new adverse drug reaction signals in the who
international database. Drug Safety, 23(6):533–542.

McLachlan, G. J., Bean, R. W. et Ben-Tovim Jones, L. (2006). A simple implementation of a


normal mixture approach to differential gene expression in multiclass microarrays. Bioinforma-
tics, 22(13):1608–1615.

Miller, G. C. et Britt, H. (1995). A new drug classification for computer systems : the ATC
extension code. International Journal of Bio-Medical Computing, 40(2):121–124.
BIBLIOGRAPHIE 96

Müller, P., Parmigiani, G., Robert, C. et Rousseau, J. (2004). Optimal sample size for
multiple testing : the case of gene expression microarrays. Journal of The American Statistical
Association, 99:990–1001.

Newton, M. A., Noueiry, A., Sarkar, D. et Ahlquist, P. (2004). Detecting differential gene
expression with a semiparametric hierarchical mixture method. Biostatistics, 5(2):155–176.

Norén, G. N., Bate, A., Orre, R. et Edwards, I. R. (2006). Extending the methods used to
screen the who drug safety database towards analysis of complex associations and improved
accuracy for rare events. Statistics in Medicine, 25(21):3740–3757.

Pounds, P. et Cheng, C. (2006). Robust estimation of the false discovery rate. Bioinformatics,
22(16):1979–1987.

Pounds, S. et Cheng, C. (2004). Improving false discovery rate estimation. Bioinformatics,


20(11):1737–1745.

Pounds, S. et Morris, S. W. (2003). Estimating the occurrence of false positives and false negatives
in microarray studies by approximating and partitioning the empirical distribution of p-values.
Bioinformatics, 19(10):1236–1242.

Prieto-Merino, D., Evans, S. J. W., Whittaker, J., Smeeth, L. et Spiegelhalter, D. J.


(2008). Different groupings of drug adverse events in a bayesian analyses. In 29th Annual
Conference of the International Society for Clinical Biostatistics.

Qiu, X., Klebanov, L. et Yakovlev, A. (2005). Correlation between gene expression levels
and limitations of the empirical bayes methodology for finding differentially expressed genes.
Statistical Applications in Genetics and Molecular Biology, 4:Article34.

R Development Core Team (2008). R : A Language and Environment for Statistical Computing.
R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0.

Roux, E., Thiessard, F., Fourrier, A., Bégaud, B. et Tubert-Bitter, P. (2005). Evaluation of
statistical association measures for the automatic signal generation in pharmacovigilance. IEEE
Transactions on Information Technology in Biomedicine, 9(4):518–527.

Roux, E., Thiessard, F., Fourrier-Reglat, A., Bégaud, B. et P., T.-B. (2003). Spontaneous
reporting system modelling for data mining methods evaluation in pharmacovigilance. In Work-
shop Intelligent Data Analysis in Medicine and Pharmacology.

Roux, E., Thiessard, F., Fourrier-Réglat, A., Bégaud, B. et Tubert-Bitter, P. (2007).


Advances in Statistical Methods for the Health Sciences, chapitre Spontaneous Reporting System
Modelling for the Evaluation of Automatic Signal Generation Methods in Pharmacovigilance,
pages 75–92. Birkhauser.

Schweder, T. et Spjøtvoll, E. (1982). Plots of p-values to evaluate many tests simultaneously.


Biometrika, 69(3):493–502.

Scott, J. G. et Berger, J. O. (2006). An exploration of aspects of bayesian multiple testing.


Journal of Statistical Planning and Inference, 136(7):2144–2162.

Storey, J. D. (2002). A direct approach to false discovery rates. Journal of the Royal Statistical
Society, Series B, 64(3):479–498.
BIBLIOGRAPHIE 97

Storey, J. D. et Tibshirani, R. (2003). Statistical significance for genome-wide studies. Procee-


dings of the National Academy of Sciences, 100:9440–9445.

Szarfman, A., Machado, S. et O’Neill, R. (2002). Use of screening algorithms and computer
systems to efficiently signal higher-than-expected combinations of drugs and events in the US
FDA’s spontaneous reports database. Drug Safety, 25(6):381–392.

Thiessard, F. (2004). Détection des effets indésirables des médicaments par un système de géné-
ration automatisée du signal adapté à la base nationale française de pharmacovigilance. Thèse
de doctorat, Université Victor Segalen - Bordeaux 2.

Thiessard, F., Roux, E., Miremont-Salamé, G., Fourrier-Réglat, A., Haramburu, F.,
Tubert-Bitter, P. et Bégaud, B. (2005). Trends in spontaneous adverse drug reaction reports
to the French pharmacovigilance system (1986-2001). Drug Safety, 28(8):731–740.

van der Heijden, P. G., Van Puijenbroek, E. P., Van Buuren, S. et Van der Hofstede, J. W.
(2002). On the assessment of adverse drug reactions from spontaneous reporting systems : the
influence of under-reporting on odds ratios. Statistics in Medicine, 21(14):2027–2044.

van Puijenbroek, E. P., Bate, A., Leufkens, H. G., Lindquist, M., Orre, R. et Egberts,
A. C. (2002). A comparison of measures of disproportionality for signal detection in spontaneous
reporting systems for adverse drug reactions. Pharmacoepidemiology and Drug Safety, 11(1):3–10.
Annexe A

Résultats complémentaires pour


l’étude de simulations

98
99

ψ0 = 1 ψ0 = 2 ψ0 = 5
7

7
ROR
6

6
5

5
4

4
3

3
2

2
1

1
0

0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

(a) (b) (c)


7

7
RFET
6

6
5

5
4

4
3

3
2

2
1

1
0

0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

(d) (e) (f)


7

midRFET
6

6
5

5
4

4
3

3
2

2
1

1
0

0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

(g) (h) (i)

Fig. A.1: Histogrammes de la distribution des degrés de signification sous H0 pour


ROR, RFET et midRFET avec nij ≥ 1. Les histogrammes sont obtenus à partir
de 50 jeux de données simulés et des degrés de signification pour lesquels ψij ≤ ψ0 .
Les figures tronquent la distribution des degrés de signification proches de 1 afin de
représenter plus clairement la distribution des petits degrés de signification.
100

ψ0 = 1 ψ0 = 2 ψ0 = 5
7

7
ROR
6

6
5

5
4

4
3

3
2

2
1

1
0

0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

(a) (b) (c)


7

7
RFET
6

6
5

5
4

4
3

3
2

2
1

1
0

0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

(d) (e) (f)


7

midRFET
6

6
5

5
4

4
3

3
2

2
1

1
0

0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

(g) (h) (i)

Fig. A.2: Histogrammes de la distribution des degrés de signification sous H0 pour


ROR, RFET et midRFET avec nij ≥ 3. Les histogrammes sont obtenus à partir
de 50 jeux de données simulés et des degrés de signification pour lesquels ψij ≤ ψ0 .
Les figures tronquent la distribution des degrés de signification proches de 1 afin de
représenter plus clairement la distribution des petits degrés de signification.
101

ψ0 = 1

0.50
0.45
f(p*)
0.40
0.35
0.30

0.0 0.2 0.4 0.6 0.8 1.0

(a)

ψ0 = 2
0.40
0.35
f(p*)
0.30
0.25
0.20

0.0 0.2 0.4 0.6 0.8 1.0

(b)

ψ0 = 5
0.20

LBE
Qvalue
0.15
f(p*)
0.10
0.05
0.00

0.0 0.2 0.4 0.6 0.8 1.0

(c)

Fig. A.3: Estimations de π0 π0 ∗ obtenues avec LBE et Qvalue à partir de la distri-


bution marginale des degrés de signification transformés (p∗ ) pour ROR. Les histo-
grammes sont obtenus à partir des cellules non-vides des 500 jeux de simulations.
Les lignes horizontales représentent les estimations obtenues pour π0 π0 ∗ avec les
procédures LBE et Qvalue. Les trois figures représentent les résultats pour les trois
hypothèses nulles testées.
Annexe B

Résultats complémentaires pour


l’application

102
103

ψ0 = 1 , RR0 = 1 ψ0 = 2 , RR0 = 2
1.00

1.00
0.95

0.95
0.90

0.90
0.85

0.85
GPS − BCPNN
0.80

0.80
GPS − midRFET
GPS − ROR
BCPNN − midRFET
0.75

0.75
BCPNN − ROR
midRFET − ROR
GPS − ROR − midRFET
0.70

0.70
GPS − BCPNN − ROR − midRFET

0.00 0.02 0.04 0.06 0.08 0.10 0.00 0.02 0.04 0.06 0.08 0.10
FDR estimé par GPS FDR estimé par GPS
(a) (b)

ψ0 = 3 , RR0 = 3 ψ0 = 4 , RR0 = 4
1.00

1.00
0.95

0.95
0.90

0.90
0.85

0.85
0.80

0.80
0.75

0.75
0.70

0.70

0.00 0.02 0.04 0.06 0.08 0.10 0.00 0.02 0.04 0.06 0.08 0.10
FDR estimé par GPS FDR estimé par GPS
(c) (d)

ψ0 = 5 , RR0 = 5
1.00
0.95
0.90
0.85
0.80
0.75
0.70

0.00 0.02 0.04 0.06 0.08 0.10


FDR estimé par GPS
(e)

Fig. B.1: Proportion de signaux communs entre les méthodes proposées en fonction
du FDR estimé par GPS. L’évolution de cette proportion est illustrée pour différents
{ψ0 , RR0 }.
Tab. B.1: Signaux de référence (47) avec moins de 3 notifications spontanées au 1er juillet 2002.

ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT
A-M-J
A01AB 10013862 2001-12-04 ANTIINFECTIEUX POUR TRAITEMENT ORAL LOCAL Duodenal ulcers and perforation
A02BX 10027678 1996-09-30 AUTRES MEDICAMENTS POUR L’ULCERE GASTRO-DUODENAL ET LE Gastrointestinal signs and symptoms NEC
REFLUX GASTRO-OESPHAGIEN (RGO)
A07AA 10008028 1998-07-23 ANTIBIOTIQUES Cerebellar coordination and balance distur-
bances
A07EC 10035777 1996-09-30 ACIDE AMINOSALICYLIQUE ET ANALOGUES Poisoning and toxicity
A08AA 10046971 1997-09-15 MEDICAMENTS CONTRE L’OBESITE A ACTION CENTRALE Cardiac valve disorders NEC
A12AA 10007602 1998-12-17 CALCIUM Cardiac and vascular procedural complications
B02BB 10057181 1998-12-17 FIBRINOGENE Vascular hypotensive disorders
C02AA 10022398 1997-02-28 ALCALOIDES DU RAUWOLFIA Inner ear signs and symptoms
C02AA 10052769 1997-02-28 ALCALOIDES DU RAUWOLFIA Vertigos NEC
C04AX 10046591 1997-04-01 AUTRES VASODILATATEURS PERIPHERIQUES Urinary tract signs and symptoms NEC
D07AB 10012736 1997-07-15 CORTICOIDES D’ACTIVITE MODEREE (GROUPE II) Diarrhoea (excl infective)
G01AD 10014624 1998-10-21 ACIDES ORGANIQUES Encephalopathies toxic and metabolic
G03AA 10037555 1999-06-22 PROGESTATIFS ET ESTROGENES EN ASSOCIATION FIXE Purpura and related conditions
J01AA 10030206 1997-12-04 TETRACYCLINES Oesophageal ulcers and perforation
J01CG 10037573 1996-12-19 INHIBITEURS DE BETALACTAMASES Pustular conditions
J01CG 10040786 1996-12-19 INHIBITEURS DE BETALACTAMASES Skin structures and soft tissue infections
J01GA 10011879 1998-07-23 STREPTOMYCINES Hearing losses
J01XX 10027654 2001-01-09 AUTRES ANTIBACTERIENS Allergic conditions NEC
J05AE 10002700 2000-10-17 INHIBITEURS DE PROTEASE Anterior pituitary hyperfunction
J05AE 10013316 2000-10-17 INHIBITEURS DE PROTEASE Lactation disorders
J05AE 10021109 2000-10-17 INHIBITEURS DE PROTEASE Hypothalamic and pituitary disorders NEC
J05AE 10038909 1996-09-12 INHIBITEURS DE PROTEASE Retinal, choroid and vitreous infections and in-
flammations
J07AG 10028323 2002-02-18 VACCINS ANTIHAEMOPHILUS INFLUENZAE B Muscle pains
J07AL 10007602 1998-02-23 VACCINS ANTIPNEUMOCOCCIQUES Cardiac and vascular procedural complications
J07AL 10057181 1998-02-23 VACCINS ANTIPNEUMOCOCCIQUES Vascular hypotensive disorders
J07BL 10007935 1998-09-10 VACCINS CONTRE LA FIEVRE JAUNE Central nervous system and spinal infections
J07BL 10027187 1998-09-10 VACCINS CONTRE LA FIEVRE JAUNE Meningitis NEC
L01AA 10035777 1997-10-16 MOUTARDES A L’AZOTE Poisoning and toxicity
L01BC 10007580 1998-02-11 ANALOGUES DE LA PYRIMIDINE Cardiac infections
L01BC 10034494 1998-02-11 ANALOGUES DE LA PYRIMIDINE Noninfectious pericarditis
M01AE 10005049 1997-12-04 DERIVES DE L’ACIDE PROPIONIQUE Bladder infections and inflammations
M01AE 10046577 1997-12-04 DERIVES DE L’ACIDE PROPIONIQUE Urinary tract infections
M01AE 10052776 2000-08-26 DERIVES DE L’ACIDE PROPIONIQUE Musculoskeletal and connective tissue infec-
tions and inflammations NEC
M01AE 10057192 2000-08-26 DERIVES DE L’ACIDE PROPIONIQUE Muscle and soft tissue infections
M01AH 10052776 2000-08-26 COXIBS Musculoskeletal and connective tissue infec-

104
tions and inflammations NEC
M01AH 10057192 2000-08-26 COXIBS Muscle and soft tissue infections
Tab. B.1: Signaux de référence (47) avec moins de 3 notifications spontanées au 1er juillet 2002.

ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT
A-M-J
M01AX 10052776 2000-08-26 AUTRES ANTIINFLAMMATOIRES ANTIRHUMATISMAUX NON STEROI- Musculoskeletal and connective tissue infec-
DIENS tions and inflammations NEC
M01AX 10057192 2000-08-26 AUTRES ANTIINFLAMMATOIRES ANTIRHUMATISMAUX NON STEROI- Muscle and soft tissue infections
DIENS
N02AC 10004607 1996-01-04 DERIVES DE LA DIPHENYLPROPYLAMINE Bile duct infections and inflammations
N03AX 10018305 2001-10-09 AUTRES ANTIEPILEPTIQUES Glaucomas (excl congenital)
N05AH 10007635 2002-02-05 DIAZEPINES, OXAZEPINES ET THIAZEPINES Cardiomyopathies
N06AX 10019281 2000-06-29 AUTRES ANTIDEPRESSEURS Heart failures NEC (excl ventricular failure)
N06BC 10004607 1996-01-04 DERIVES DE LA XANTHINE Bile duct infections and inflammations
N07CA 10012401 2001-08-17 ANTIVERTIGINEUX Depressive disorders
R06AX 10010447 1999-03-01 AUTRES ANTIHISTAMINIQUES A USAGE SYSTEMIQUE Congenital male reproductive tract disorders
R06AX 10010661 1999-03-01 AUTRES ANTIHISTAMINIQUES A USAGE SYSTEMIQUE Congenital urethral disorders
R06AX 10025517 1999-03-01 AUTRES ANTIHISTAMINIQUES A USAGE SYSTEMIQUE Male reproductive tract disorders congenital

105
Tab. B.2: Signaux de référence (216) détectés par le modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5% - Scénario 2.

ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT
A-M-J
A01AB 10030206 1999-09-07 ANTIINFECTIEUX POUR TRAITEMENT ORAL LOCAL Oesophageal ulcers and perforation
A01AD 10021982 1998-10-21 AUTRES MEDICAMENTS POUR TRAITEMENT ORAL LOCAL Inflammatory disorders following infection
A02BC 10010301 2002-04-16 INHIBITEURS DE LA POMPE A PROTONS Confusion and disorientation
A02BC 10011168 2002-04-16 INHIBITEURS DE LA POMPE A PROTONS Cortical dysfunction NEC
A02BC 10013305 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Erection and ejaculation conditions and disor-
ders
A02BC 10013322 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Male gonadal function disorders
A02BC 10034374 2002-04-16 INHIBITEURS DE LA POMPE A PROTONS Perception disturbances
A02BC 10040466 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Sexual arousal disorders
A02BC 10040675 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Breast disorders NEC
A02BC 10041273 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Sodium imbalance
A03AA 10024385 1999-04-27 ANTICHOLINERGIQUES DE SYNTHESE : ESTERS AVEC GROUPEMENT Leukopenias NEC
AMINE TERTIAIRE
A03AX 10002220 1996-01-11 AUTRES MEDICAMENTS POUR LES DESORDRES FONCTIONNELS IN- Anaphylactic responses
TESTINAUX
A03AX 10009193 1996-01-11 AUTRES MEDICAMENTS POUR LES DESORDRES FONCTIONNELS IN- Circulatory collapse and shock
TESTINAUX
A03AX 10019833 1998-02-18 AUTRES MEDICAMENTS POUR LES DESORDRES FONCTIONNELS IN- Hepatocellular damage and hepatitis NEC
TESTINAUX
A03FA 10013929 1996-03-07 STIMULANTS DE LA MOTRICITE INTESTINALE Dyskinesias and movement disorders NEC
A06AA 10052566 1996-05-22 LAXATIFS LUBRIFIANTS Rashes, eruptions and exanthems NEC
A07A 10024689 1996-10-31 ANTIINFECTIEUX INTESTINAUX Liver function analyses
A07AA 10003788 1998-07-23 ANTIBIOTIQUES Auditory nerve disorders
A07AA 10011879 1998-07-23 ANTIBIOTIQUES Hearing losses
A07AA 10024385 1997-02-26 ANTIBIOTIQUES Leukopenias NEC
A07DA 10019833 2001-06-05 RALENTISSEURS DE LA MOTRICITE INTESTINALE Hepatocellular damage and hepatitis NEC
A07EC 10018365 1996-09-30 ACIDE AMINOSALICYLIQUE ET ANALOGUES Glomerulonephritis and nephrotic syndrome
A07EC 10029137 1996-09-30 ACIDE AMINOSALICYLIQUE ET ANALOGUES Nephritis NEC
A07EC 10029150 1996-09-30 ACIDE AMINOSALICYLIQUE ET ANALOGUES Nephropathies and tubular disorders NEC
A08AA 10037401 1997-09-15 MEDICAMENTS CONTRE L’OBESITE A ACTION CENTRALE Pulmonary hypertensions
A10BB 10019833 1998-02-26 SULFAMIDES, DERIVES DE L’UREE Hepatocellular damage and hepatitis NEC
A11AA 10019833 1996-02-15 POLYVITAMINES AVEC ELEMENTS MINERAUX Hepatocellular damage and hepatitis NEC
A11HA 10019833 1996-02-15 AUTRES PREPARATIONS VITAMINIQUES NON ASSOCIEES Hepatocellular damage and hepatitis NEC
A12CB 10040786 2000-06-13 ZINC Skin structures and soft tissue infections
A12CB 10040788 2000-06-13 ZINC Skin and subcutaneous tissue bacterial infec-
tions
A13A 10012736 1997-07-15 TONIQUES Diarrhoea (excl infective)
B01AB 10013305 1998-11-19 GROUPE DE L’HEPARINE Erection and ejaculation conditions and disor-
ders

106
B01AB 10018987 1999-12-07 GROUPE DE L’HEPARINE Haemorrhages NEC
B01AC 10024385 1998-08-31 INHIBITEURS DE L’AGREGATION PLAQUETTAIRE, HEPARINE EXCLUE Leukopenias NEC
Tab. B.2: Signaux de référence (216) détectés par le modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5% - Scénario 2 (suite).

ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT
A-M-J
B01AC 10026847 1996-09-12 INHIBITEURS DE L’AGREGATION PLAQUETTAIRE, HEPARINE EXCLUE Marrow depression and hypoplastic anaemias
B02AA 10039912 1996-09-12 ACIDES AMINES Seizures and seizure disorders NEC
B03XA 10043411 2000-03-07 AUTRES PREPARATIONS ANTIANEMIQUES Therapeutic drug monitoring analyses
B05AA 10019833 1998-09-10 SUBSTITUTS DU SANG ET FRACTIONS PROTEIQUES PLASMATIQUES Hepatocellular damage and hepatitis NEC
B05AA 10053567 1997-11-13 SUBSTITUTS DU SANG ET FRACTIONS PROTEIQUES PLASMATIQUES Coagulopathies
B06AA 10012736 1997-07-15 ENZYMES Diarrhoea (excl infective)
C01BC 10019833 2000-02-16 ANTIARYTHMIQUES, CLASSE IC Hepatocellular damage and hepatitis NEC
C01BD 10043712 1999-02-15 ANTIARYTHMIQUES, CLASSE III Thyroid disorders NEC
C01BG 10019833 1996-02-15 AUTRES ANTIARYTHMIQUES DE CLASSE I Hepatocellular damage and hepatitis NEC
C01DX 10042129 1997-04-24 AUTRES VASODILATATEURS EN CARDIOLOGIE Stomatitis and ulceration
C01DX 10047283 2000-09-12 AUTRES VASODILATATEURS EN CARDIOLOGIE Ventricular arrhythmias and cardiac arrest
C02CA 10002700 1999-09-07 ALPHA-BLOQUANTS Anterior pituitary hyperfunction
C02CA 10013316 1999-09-07 ALPHA-BLOQUANTS Lactation disorders
C02CA 10021109 1999-09-07 ALPHA-BLOQUANTS Hypothalamic and pituitary disorders NEC
C03AA 10033646 1998-09-10 THIAZIDIQUES NON ASSOCIES Acute and chronic pancreatitis
C03DB 10038443 1998-06-13 AUTRES DIURETIQUES EPARGNEURS POTASSIQUES Renal failure and impairment
C04AX 10029306 2001-01-11 AUTRES VASODILATATEURS PERIPHERIQUES Neurological signs and symptoms NEC
C04AX 10039912 1996-03-07 AUTRES VASODILATATEURS PERIPHERIQUES Seizures and seizure disorders NEC
C05AX 10012736 1997-07-15 AUTRES ANTIHEMORROIDAIRES A USAGE TOPIQUE Diarrhoea (excl infective)
C05CA 10019833 1996-02-15 BIOFLAVONOIDES Hepatocellular damage and hepatitis NEC
C05CX 10019833 1996-02-15 AUTRES MEDICAMENTS AGISSANT SUR LES CAPILLAIRES Hepatocellular damage and hepatitis NEC
C08EA 10037908 1999-10-12 DERIVES DE LA PHENYLALKYLAMINE Rate and rhythm disorders NEC
C09AA 10024972 1998-11-23 INHIBITEURS DE L’ENZYME DE CONVERSION (IEC) NON ASSOCIES Lower respiratory tract inflammatory and im-
munologic conditions
C09AA 10036451 2002-03-12 INHIBITEURS DE L’ENZYME DE CONVERSION (IEC) NON ASSOCIES Potassium imbalance
C09AA 10043131 1996-03-07 INHIBITEURS DE L’ENZYME DE CONVERSION (IEC) NON ASSOCIES Taste disorders
C09AA 10052828 1998-11-23 INHIBITEURS DE L’ENZYME DE CONVERSION (IEC) NON ASSOCIES Eosinophilic disorders
C10AA 10007772 1998-05-20 INHIBITEURS DE L’HMG-COA REDUCTASE Cataracts (excl congenital)
C10AA 10013305 1999-06-22 INHIBITEURS DE L’HMG-COA REDUCTASE Erection and ejaculation conditions and disor-
ders
C10AA 10013322 2001-12-04 INHIBITEURS DE L’HMG-COA REDUCTASE Male gonadal function disorders
C10AA 10028640 2002-03-12 INHIBITEURS DE L’HMG-COA REDUCTASE Myopathies
C10AA 10033646 1999-10-12 INHIBITEURS DE L’HMG-COA REDUCTASE Acute and chronic pancreatitis
C10AA 10033979 2002-03-12 INHIBITEURS DE L’HMG-COA REDUCTASE Parenchymal lung disorders NEC
C10AA 10040466 1999-06-22 INHIBITEURS DE L’HMG-COA REDUCTASE Sexual arousal disorders
C10AA 10040675 2001-12-04 INHIBITEURS DE L’HMG-COA REDUCTASE Breast disorders NEC
C10AA 10043234 1998-02-26 INHIBITEURS DE L’HMG-COA REDUCTASE Tendon disorders
C10AB 10034971 1998-09-10 FIBRATES Photosensitivity conditions
D01AE 10040786 2000-06-13 AUTRES ANTIFONGIQUES A USAGE TOPIQUE Skin structures and soft tissue infections

107
D01AE 10040788 2000-06-13 AUTRES ANTIFONGIQUES A USAGE TOPIQUE Skin and subcutaneous tissue bacterial infec-
tions
Tab. B.2: Signaux de référence (216) détectés par le modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5% - Scénario 2 (suite).

ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT
A-M-J
D02AC 10052566 1996-05-22 PARAFFINE ET PRODUITS GRAS Rashes, eruptions and exanthems NEC
D06AX 10018913 1996-06-27 AUTRES ANTIBIOTIQUES A USAGE TOPIQUE Haemolyses NEC
D06AX 10024385 1996-06-27 AUTRES ANTIBIOTIQUES A USAGE TOPIQUE Leukopenias NEC
D06AX 10034607 1997-11-13 AUTRES ANTIBIOTIQUES A USAGE TOPIQUE Peripheral neuropathies NEC
D06BA 10012435 2000-09-12 SULFAMIDES Dermatitis and eczema
D06BA 10015151 2000-09-12 SULFAMIDES Erythemas
D09AA 10027654 2001-01-09 PANSEMENTS AVEC ANTIINFECTIEUX Allergic conditions NEC
D10AD 10007635 2001-12-04 RETINOIDES ANTIACNEIQUES A USAGE TOPIQUE Cardiomyopathies
D10AF 10019833 1997-03-27 ANTIINFECTIEUX POUR LE TRAITEMENT DE L’ACNE Hepatocellular damage and hepatitis NEC
G01AD 10012736 1997-07-15 ACIDES ORGANIQUES Diarrhoea (excl infective)
G01AD 10019833 1996-02-15 ACIDES ORGANIQUES Hepatocellular damage and hepatitis NEC
G01AD 10021982 1998-10-21 ACIDES ORGANIQUES Inflammatory disorders following infection
G01AX 10040786 2000-06-13 AUTRES ANTIINFECTIEUX ET ANTISEPTIQUES Skin structures and soft tissue infections
G01AX 10040788 2000-06-13 AUTRES ANTIINFECTIEUX ET ANTISEPTIQUES Skin and subcutaneous tissue bacterial infec-
tions
G02CB 10029306 2000-01-04 INHIBITEURS DE LA PROLACTINE Neurological signs and symptoms NEC
G03AC 10007962 2002-06-04 PROGESTATIFS Central nervous system vascular disorders
NEC
G03AC 10008193 2002-06-04 PROGESTATIFS Cerebrovascular and spinal vascular disorders
NEC
G03AC 10014524 1999-09-21 PROGESTATIFS Non-site specific embolism and thrombosis
G03AC 10019833 1999-09-21 PROGESTATIFS Hepatocellular damage and hepatitis NEC
G03XA 10019833 1996-01-19 ANTIGONADOTROPHINES ET ANALOGUES Hepatocellular damage and hepatitis NEC
J01AA 10003828 1996-03-07 TETRACYCLINES Autoimmunity analyses
J01AA 10019833 1996-03-07 TETRACYCLINES Hepatocellular damage and hepatitis NEC
J01AA 10024972 1996-03-07 TETRACYCLINES Lower respiratory tract inflammatory and im-
munologic conditions
J01CA 10006555 2001-02-20 PENICILLINES A LARGE SPECTRE Bullous conditions
J01CA 10037573 1996-12-19 PENICILLINES A LARGE SPECTRE Pustular conditions
J01CA 10040786 1996-12-19 PENICILLINES A LARGE SPECTRE Skin structures and soft tissue infections
J01CE 10037573 1996-12-19 PENICILLINES SENSIBLES AUX BETALACTAMASES Pustular conditions
J01CF 10037573 1996-12-19 PENICILLINES RESISTANTES AUX BETALACTAMASES Pustular conditions
J01CF 10040786 1996-12-19 PENICILLINES RESISTANTES AUX BETALACTAMASES Skin structures and soft tissue infections
J01CR 10006555 2001-02-20 ASSOCIATIONS DE PENICILLINES, INHIBITEURS DE BETALACTAMASES Bullous conditions
J01CR 10037573 1996-12-19 ASSOCIATIONS DE PENICILLINES, INHIBITEURS DE BETALACTAMASES Pustular conditions
J01CR 10040786 1996-12-19 ASSOCIATIONS DE PENICILLINES, INHIBITEURS DE BETALACTAMASES Skin structures and soft tissue infections
J01DA 10002055 1998-11-19 CEPHALOSPORINES ET APPARENTES Anaemias haemolytic NEC
J01DA 10009653 1997-11-13 CEPHALOSPORINES ET APPARENTES Clostridia infections
J01DA 10009888 1997-11-13 CEPHALOSPORINES ET APPARENTES Colitis (excl infective)

108
J01DA 10037573 1996-12-19 CEPHALOSPORINES ET APPARENTES Pustular conditions
J01DA 10040786 1996-12-19 CEPHALOSPORINES ET APPARENTES Skin structures and soft tissue infections
Tab. B.2: Signaux de référence (216) détectés par le modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5% - Scénario 2 (suite).

ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT
A-M-J
J01DH 10037573 1996-12-19 CARBAPENEMS Pustular conditions
J01FA 10006555 1998-02-26 MACROLIDES Bullous conditions
J01FA 10037573 1996-12-19 MACROLIDES Pustular conditions
J01FA 10040786 1996-12-19 MACROLIDES Skin structures and soft tissue infections
J01MB 10002220 1996-01-11 AUTRES QUINOLONES Anaphylactic responses
J01MB 10009193 1996-01-11 AUTRES QUINOLONES Circulatory collapse and shock
J01XC 10018913 1996-06-27 ANTIBACTERIENS STEROIDIENS Haemolyses NEC
J01XC 10024385 1996-06-27 ANTIBACTERIENS STEROIDIENS Leukopenias NEC
J01XC 10034607 1997-11-13 ANTIBACTERIENS STEROIDIENS Peripheral neuropathies NEC
J04AB 10019833 1997-04-24 ANTIBIOTIQUES Hepatocellular damage and hepatitis NEC
J05AE 10018987 1996-07-15 INHIBITEURS DE PROTEASE Haemorrhages NEC
J05AF 10011085 1999-03-30 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NUCLEOSIDIQUES Ischaemic coronary artery disorders
J05AF 10019833 1997-09-11 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NUCLEOSIDIQUES Hepatocellular damage and hepatitis NEC
J05AF 10024581 1997-09-11 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NUCLEOSIDIQUES Lipid metabolism and deposit disorders NEC
J05AF 10027416 1997-09-11 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NUCLEOSIDIQUES Metabolic acidoses (excl diabetic acidoses)
J05AF 10033646 1997-09-11 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NUCLEOSIDIQUES Acute and chronic pancreatitis
J05AG 10019833 2000-03-07 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NON NUCLEOSIDIQUES Hepatocellular damage and hepatitis NEC
J05AG 10040993 1998-06-08 INHIBITEURS DE LA TRANSCRIPTASE REVERSE NON NUCLEOSIDIQUES Sleep disorders NEC
J06BA 10002055 1999-02-02 IMMUNOGLOBULINES HUMAINES POLYVALENTES Anaemias haemolytic NEC
J07AF 10003550 2002-02-18 VACCINS ANTIDIPHTERIQUES Asthenic conditions
J07AF 10028323 2002-02-18 VACCINS ANTIDIPHTERIQUES Muscle pains
J07AG 10003550 2002-02-18 VACCINS ANTIHAEMOPHILUS INFLUENZAE B Asthenic conditions
J07AH 10003550 2002-02-18 VACCINS ANTIMENINGOCOCCIQUES Asthenic conditions
J07AH 10028323 2002-02-18 VACCINS ANTIMENINGOCOCCIQUES Muscle pains
J07AJ 10003550 2002-02-18 VACCINS CONTRE LA COQUELUCHE Asthenic conditions
J07AJ 10028323 2002-02-18 VACCINS CONTRE LA COQUELUCHE Muscle pains
J07AL 10006484 1998-02-23 VACCINS ANTIPNEUMOCOCCIQUES Bronchospasm and obstruction
J07AL 10028323 2002-02-18 VACCINS ANTIPNEUMOCOCCIQUES Muscle pains
J07AM 10003550 2002-02-18 VACCINS ANTITETANIQUES Asthenic conditions
J07AM 10028323 2002-02-18 VACCINS ANTITETANIQUES Muscle pains
J07AN 10044756 1998-01-12 VACCINS ANTITUBERCULEUX Tuberculous infections
J07AX 10006484 1998-02-23 AUTRES VACCINS BACTERIENS Bronchospasm and obstruction
J07BC 10003550 2002-02-18 VACCINS CONTRE L’HEPATITE Asthenic conditions
J07BC 10028323 2002-02-18 VACCINS CONTRE L’HEPATITE Muscle pains
J07BF 10003550 2002-02-18 VACCINS CONTRE LA POLIOMYELITE Asthenic conditions
J07BF 10028323 2002-02-18 VACCINS CONTRE LA POLIOMYELITE Muscle pains
J07X 10006484 1998-02-23 AUTRES VACCINS Bronchospasm and obstruction
J07X 10007602 1998-02-23 AUTRES VACCINS Cardiac and vascular procedural complications
L01AA 10029150 1997-10-16 MOUTARDES A L’AZOTE Nephropathies and tubular disorders NEC

109
L01AD 10033979 1996-04-30 NITROSOUREES Parenchymal lung disorders NEC
L01BC 10011085 1998-02-11 ANALOGUES DE LA PYRIMIDINE Ischaemic coronary artery disorders
Tab. B.2: Signaux de référence (216) détectés par le modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5% - Scénario 2 (suite).

ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT
A-M-J
L01BC 10042600 1998-02-11 ANALOGUES DE LA PYRIMIDINE Supraventricular arrhythmias
L01XD 10033372 2001-12-04 MEDICAMENTS UTILISES DANS LA THERAPIE PHOTODYNAMIQUE Pain and discomfort NEC
L01XX 10016286 1997-01-16 AUTRES ANTINEOPLASIQUES Febrile disorders
L02AE 10022097 1999-07-02 ANALOGUES DE L’HORMONE ENTRAINANT LA LIBERATION DE GONA- Injection and infusion site reactions
DOTROPHINES
L02BA 10007962 1997-01-16 ANTIESTROGENES Central nervous system vascular disorders
NEC
L02BA 10008193 1997-01-16 ANTIESTROGENES Cerebrovascular and spinal vascular disorders
NEC
L02BB 10019833 1996-05-22 ANTIANDROGENES Hepatocellular damage and hepatitis NEC
L03A 10006484 1998-02-23 CYTOKINES ET IMMUNOMODULATEURS Bronchospasm and obstruction
L03AB 10012219 2001-02-13 INTERFERONS Deliria
L03AB 10012401 2001-02-13 INTERFERONS Depressive disorders
L03AB 10038837 2000-04-04 INTERFERONS Retinal bleeding and vascular disorders (excl
retinopathy)
L03AB 10038861 2000-04-04 INTERFERONS Retinal embolism and thrombosis
L03AB 10038869 2000-04-04 INTERFERONS Retinal haemorrhagic disorders
L03AB 10042459 2001-02-13 INTERFERONS Suicidal and self-injurious behaviour
L04AA 10019833 2000-08-22 IMMUNOSUPPRESSEURS SELECTIFS Hepatocellular damage and hepatitis NEC
M01AB 10012435 1997-06-26 DERIVES DE L’ACIDE ACETIQUE ET APPARENTES Dermatitis and eczema
M01AE 10038443 2001-06-05 DERIVES DE L’ACIDE PROPIONIQUE Renal failure and impairment
M01AH 10011907 2002-06-04 COXIBS Death and sudden death
M01AH 10017847 2000-07-11 COXIBS Gastric ulcers and perforation
M01AX 10006555 1996-10-31 AUTRES ANTIINFLAMMATOIRES ANTIRHUMATISMAUX NON STEROI- Bullous conditions
DIENS
M01AX 10021982 1996-10-31 AUTRES ANTIINFLAMMATOIRES ANTIRHUMATISMAUX NON STEROI- Inflammatory disorders following infection
DIENS
M03BA 10019833 1996-09-12 ESTERS DE L’ACIDE CARBAMIQUE Hepatocellular damage and hepatitis NEC
M03BA 10052566 1996-09-12 ESTERS DE L’ACIDE CARBAMIQUE Rashes, eruptions and exanthems NEC
M04AA 10052566 1996-09-12 INHIBITEURS DE LA SYNTHESE DE L’ACIDE URIQUE Rashes, eruptions and exanthems NEC
N01AX 10037908 1997-02-06 AUTRES ANESTHESIQUES GENERAUX Rate and rhythm disorders NEC
N02AC 10002113 1996-04-25 DERIVES DE LA DIPHENYLPROPYLAMINE Anal and rectal disorders NEC
N02AE 10019833 1996-09-12 DERIVES DE L’ORIPAVINE Hepatocellular damage and hepatitis NEC
N02AX 10022398 1997-10-15 AUTRES OPIOIDES Inner ear signs and symptoms
N02AX 10039912 1997-10-15 AUTRES OPIOIDES Seizures and seizure disorders NEC
N02AX 10052769 1997-10-15 AUTRES OPIOIDES Vertigos NEC
N02BE 10002113 1996-04-25 ANILIDES Anal and rectal disorders NEC
N02BE 10004607 1996-01-04 ANILIDES Bile duct infections and inflammations
N02BE 10019833 1997-01-16 ANILIDES Hepatocellular damage and hepatitis NEC

110
N03AA 10019833 1996-09-12 BARBITURIQUES ET DERIVES Hepatocellular damage and hepatitis NEC
N03AA 10052566 1996-09-12 BARBITURIQUES ET DERIVES Rashes, eruptions and exanthems NEC
Tab. B.2: Signaux de référence (216) détectés par le modèle GPS basé sur Pr(H∗0 ) et FDR∗ = 5% - Scénario 2 (suite).

ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT
A-M-J
N03AG 10013929 2000-11-22 DERIVES D’ACIDE GRAS Dyskinesias and movement disorders NEC
N03AG 10029292 1996-12-26 DERIVES D’ACIDE GRAS Neurologic visual problems NEC
N03AG 10047559 1996-12-26 DERIVES D’ACIDE GRAS Visual field disorders
N03AG 10053567 1997-06-26 DERIVES D’ACIDE GRAS Coagulopathies
N04BC 10029306 1997-04-24 AGONISTES DOPAMINERGIQUES Neurological signs and symptoms NEC
N04BX 10028342 1999-09-07 AUTRES DOPAMINERGIQUES Muscle tone abnormal
N05AH 10018009 1996-06-27 DIAZEPINES, OXAZEPINES ET THIAZEPINES Gastrointestinal stenosis and obstruction NEC
N05AH 10052736 1996-06-27 DIAZEPINES, OXAZEPINES ET THIAZEPINES Non-mechanical ileus
N05AN 10038443 2001-03-20 LITHIUM Renal failure and impairment
N05CA 10043555 1997-04-07 BARBITURIQUES NON ASSOCIES Thrombocytopenias
N05CB 10019833 1996-09-12 BARBITURIQUES EN ASSOCIATION Hepatocellular damage and hepatitis NEC
N05CB 10052566 1996-09-12 BARBITURIQUES EN ASSOCIATION Rashes, eruptions and exanthems NEC
N05CF 10037180 1997-04-10 MEDICAMENTS RELIES AUX BENZODIAZEPINES Psychiatric symptoms NEC
N05CM 10003550 1997-04-24 AUTRES HYPNOTIQUES ET SEDATIFS Asthenic conditions
N06AB 10018987 1999-01-26 INHIBITEURS SELECTIFS DE LA RECAPTURE DE LA SEROTONINE Haemorrhages NEC
N06AB 10019833 2001-01-09 INHIBITEURS SELECTIFS DE LA RECAPTURE DE LA SEROTONINE Hepatocellular damage and hepatitis NEC
N06AB 10041273 1999-10-12 INHIBITEURS SELECTIFS DE LA RECAPTURE DE LA SEROTONINE Sodium imbalance
N06AX 10023226 2000-06-29 AUTRES ANTIDEPRESSEURS Joint related signs and symptoms
N06AX 10037908 2000-06-29 AUTRES ANTIDEPRESSEURS Rate and rhythm disorders NEC
N06AX 10039912 1996-02-01 AUTRES ANTIDEPRESSEURS Seizures and seizure disorders NEC
N07CA 10013929 2001-08-17 ANTIVERTIGINEUX Dyskinesias and movement disorders NEC
P01AA 10024689 1996-10-31 DERIVES DE L’HYDROXYQUINOLINE Liver function analyses
P03AX 10040786 2000-06-13 AUTRES ANTIPARASITAIRES EXTERNES, SCABICIDES INCLUS Skin structures and soft tissue infections
P03AX 10040788 2000-06-13 AUTRES ANTIPARASITAIRES EXTERNES, SCABICIDES INCLUS Skin and subcutaneous tissue bacterial infec-
tions
R05CB 10033788 1999-03-30 MUCOLYTIQUES Paraesthesias and dysaesthesias
R05DA 10004607 1996-01-04 ALCALOIDES DE L’OPIUM ET DERIVES Bile duct infections and inflammations
R06AX 10047283 1997-01-24 AUTRES ANTIHISTAMINIQUES A USAGE SYSTEMIQUE Ventricular arrhythmias and cardiac arrest
R07AB 10034607 2000-01-13 STIMULANTS RESPIRATOIRES Peripheral neuropathies NEC
R07AB 10034989 2000-01-13 STIMULANTS RESPIRATOIRES Physical examination procedures
S01JA 10002220 1996-02-19 COLORANTS Anaphylactic responses
S01JA 10009193 1996-02-19 COLORANTS Circulatory collapse and shock

111
Tab. B.3: Signaux de référence (46) avec au moins 3 notifications spontanées au 1er juillet 2002 et non détectés par le modèle GPS
basé sur Pr(H∗0 ) et FDR∗ = 5% - Scénario 2. La dernière colonne indique les signaux de référence pour lesquels le risque observé
est inférieur à 1 tout au long de l’analyse.

ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT RR <1
A-M-J
A01AB 10017847 2001-12-04 ANTIINFECTIEUX POUR TRAITEMENT ORAL LOCAL Gastric ulcers and perforation
A01AD 10019833 1998-10-21 AUTRES MEDICAMENTS POUR TRAITEMENT ORAL LOCAL Hepatocellular damage and hepatitis NEC ×
A02BC 10013316 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Lactation disorders
A02BC 10021109 1996-05-14 INHIBITEURS DE LA POMPE A PROTONS Hypothalamic and pituitary disorders NEC
A03AX 10027654 1996-06-27 AUTRES MEDICAMENTS POUR LES DESORDRES FONCTION- Allergic conditions NEC
NELS INTESTINAUX
A11AA 10012736 1997-07-15 POLYVITAMINES AVEC ELEMENTS MINERAUX Diarrhoea (excl infective)
A11HA 10012736 1997-07-15 AUTRES PREPARATIONS VITAMINIQUES NON ASSOCIEES Diarrhoea (excl infective)
A12AA 10057181 1998-12-17 CALCIUM Vascular hypotensive disorders
A13A 10019833 1996-02-15 TONIQUES Hepatocellular damage and hepatitis NEC
B01AA 10023226 1998-05-27 ANTIVITAMINES K Joint related signs and symptoms ×
B01AB 10012736 1997-07-15 GROUPE DE L’HEPARINE Diarrhoea (excl infective) ×
B01AB 10019833 1996-02-15 GROUPE DE L’HEPARINE Hepatocellular damage and hepatitis NEC ×
B02BD 10057181 1998-12-17 FACTEURS DE LA COAGULATION SANGUINE Vascular hypotensive disorders
B06AA 10019833 1996-02-15 ENZYMES Hepatocellular damage and hepatitis NEC
C03BA 10022398 1997-02-28 SULFAMIDES NON ASSOCIES Inner ear signs and symptoms
C03BA 10052769 1997-02-28 SULFAMIDES NON ASSOCIES Vertigos NEC
C05AX 10019833 1996-02-15 AUTRES ANTIHEMORROIDAIRES A USAGE TOPIQUE Hepatocellular damage and hepatitis NEC
C08DA 10013929 1997-04-24 DERIVES DE LA PHENYLALKYLAMINE Dyskinesias and movement disorders NEC
C08DB 10013929 1997-04-24 DERIVES DE LA BENZOTHIAZEPINE Dyskinesias and movement disorders NEC ×
C09AA 10029306 1996-03-07 INHIBITEURS DE L’ENZYME DE CONVERSION (IEC) NON ASSO- Neurological signs and symptoms NEC
CIES
D04AB 10012736 1997-07-15 ANESTHESIQUES A USAGE TOPIQUE Diarrhoea (excl infective) ×
D04AB 10019833 1996-02-15 ANESTHESIQUES A USAGE TOPIQUE Hepatocellular damage and hepatitis NEC ×
D07AB 10019833 1996-02-15 CORTICOIDES D’ACTIVITE MODEREE (GROUPE II) Hepatocellular damage and hepatitis NEC ×
D10AD 10012736 1997-07-15 RETINOIDES ANTIACNEIQUES A USAGE TOPIQUE Diarrhoea (excl infective) ×
D10AD 10019833 1996-02-15 RETINOIDES ANTIACNEIQUES A USAGE TOPIQUE Hepatocellular damage and hepatitis NEC
G03AA 10006513 1999-06-22 PROGESTATIFS ET ESTROGENES EN ASSOCIATION FIXE Bruising, ecchymosis and purpura
G03AA 10043555 1999-06-22 PROGESTATIFS ET ESTROGENES EN ASSOCIATION FIXE Thrombocytopenias ×
J01AA 10033788 1997-11-13 TETRACYCLINES Paraesthesias and dysaesthesias
J01CE 10040786 1996-12-19 PENICILLINES SENSIBLES AUX BETALACTAMASES Skin structures and soft tissue infections
J01DH 10040786 1996-12-19 CARBAPENEMS Skin structures and soft tissue infections
J01MA 10002220 1996-01-11 FLUOROQUINOLONES Anaphylactic responses
J01MA 10009193 1996-01-11 FLUOROQUINOLONES Circulatory collapse and shock
J07AL 10003550 2002-02-18 VACCINS ANTIPNEUMOCOCCIQUES Asthenic conditions
J07X 10057181 1998-02-23 AUTRES VACCINS Vascular hypotensive disorders
L01XX 10019833 1996-09-12 AUTRES ANTINEOPLASIQUES Hepatocellular damage and hepatitis NEC

112
L03AB 10013929 2000-10-17 INTERFERONS Dyskinesias and movement disorders NEC
Tab. B.3: Signaux de référence (46) avec au moins 3 notifications spontanées au 1er juillet 2002 et non détectés par le modèle GPS
basé sur Pr(H∗0 ) et FDR∗ = 5% - Scénario 2. La dernière colonne indique les signaux de référence pour lesquels le risque observé
est inférieur à 1 tout au long de l’analyse (suite).

ATC5 HLT Date d’alerte Traduction du code ATC5 Traduction du code MedDRA HLT RR <1
A-M-J
M01AX 10019833 1999-03-08 AUTRES ANTIINFLAMMATOIRES ANTIRHUMATISMAUX NON Hepatocellular damage and hepatitis NEC
STEROIDIENS
N01AX 10011907 1997-02-06 AUTRES ANESTHESIQUES GENERAUX Death and sudden death
N02BE 10027654 1996-05-22 ANILIDES Allergic conditions NEC
N04BX 10016286 1999-09-07 AUTRES DOPAMINERGIQUES Febrile disorders
N05CA 10052566 2001-05-15 BARBITURIQUES NON ASSOCIES Rashes, eruptions and exanthems NEC ×
N06AX 10011085 2000-06-29 AUTRES ANTIDEPRESSEURS Ischaemic coronary artery disorders
N06AX 10043555 2000-06-29 AUTRES ANTIDEPRESSEURS Thrombocytopenias ×
N06DA 10000032 1999-09-07 ANTICHOLINESTERASIQUES Cardiac conduction disorders
N07BB 10020774 1998-07-23 MEDICAMENTS UTILISES DANS LA DEPENDANCE ALCOO- Vascular hypertensive disorders NEC
LIQUE
R02AB 10027654 2001-01-09 ANTIBIOTIQUES Allergic conditions NEC

113
Annexe C

Publications

114

Vous aimerez peut-être aussi