Vous êtes sur la page 1sur 9

S T A T I S T I Q U E S

Georges MION, Stphane HERAULT, Nicolas LIBERT, Didier JOURNOIS

Elments indispensables de statistiques mdicales


Opus 5 - Analyses multivaries - rgression multiple rgression logistique - ACP
Dans les opus prcdents, nous nous sommes intresss ltude de la liaison entre deux variables seulement(1,2,3). Lapparition de logiciels de statistique a donn accs des analyses complexes qui permettent dtudier leffet simultan de plusieurs variables et de quantifier lassociation entre la variable tudie ou dpendante, dite variable explique et chacun des facteurs qui lui sont lis, dites variables expliquantes ou explicatives. Celles-ci sont galement dsignes par les termes de covariables, prdicteurs (4) ou encore variables indpendantes, dernire appellation qui est, nous le verrons, lorigine de graves confusions.
La variable tudie: explique ou dpendante Les variables explicatives: covariables ou indpendantes Particulirement utiles ltude de facteurs pronostiques(5), plusieurs modles danalyses multivaries ou multidimensionnelles sont utiliss: rgression multiple, rgression logistique, modle de Cox, etc. Ces analyses permettent de mettre en vidence, parmi les covariables, des facteurs pronostiques ou explicatifs indpendants les uns des autres, den liminer certaines, en apparence impliques, mais en fait redondantes, car lies dautres covariables, et dutiliser ces facteurs la fois dans des buts thrapeutiques et des tudes cliniques (6). Pour expliquer leur signification, nous reprendrons un exemple numrique (Tableau I) de lEBM Journal (7) qui prsente habituellement les rsultats dessais randomiss sous la formulation plus intuitive de rduction relative du risque. Cette RRR est la diffrence entre les taux dvnements survenus dans les groupes tmoin (TET) et exprimental (TEE), divise par le taux dvnements chez les tmoins : RRR = TEE - TET TET

Je progresserai dauta nt mi vous mautorisez rgres eux que ser. [Bruno Bettelheim]

PREMIRE TAPE: ANALYSES UNIDIMENSIONNELLES


Avant de se lancer dans une tude multidimensionnelle, il est comme pour tout travail scientifique indispensable de chercher avec du bon sens, dans la culture mdicale et surtout dans la littrature, de la faon la plus exhaustive possible, les facteurs pertinents susceptibles dtre impliqus dans la gense ou le pronostic de la pathologie tudie. Une fois que ces covariables ont t identifies, la premire tape consistera toujours en une srie danalyses unidimensionnelles (encore appeles univaries) pour slectionner les variables qui seront introduites secondairement dans le modle multidimensionnel. En effet il est peu probable quune variable lie au pronostic en association dautres ne le soit pas au moins en partie toute seule. Dans le cas de deux variables (explique et expliquante) quantitatives, on calcule un coefficient de corrlation (2). Lorsque la variable explique est de nature qualitative (cest lexemple que nous dvelopperons) ou censure (cas de la survie, encore appele variable tronque), quelle que soit la nature des variables expliquantes, la force de lassociation est dlivre sous la forme dun risque relatif ou dun oddsratio.

CALCUL DES ODDS ET DES OR: La cote ou odds est le rapport entre le nombre de patients qui prsentent lvnement et le nombre de patients qui ne le prsentent pas. Ainsi, pour le groupe tmoin, lodds est : Cote = c/d = 9/21 = 0,43 en revanche, le risque est le rapport: Risque = c/c+d = 9/30 = 0,30.

Georges MION

Pour des vnements frquents, le Evnement numrateur c augmente plus vite que le dnominateur (par exemGroupes + Total ple si c = 12, d = 18, odds = 12/18 = 0,66 alors que R = 12/30 = 0,4). a b a+b Lutilisation des odds exagre Exprimental 1 29 30 artificiellement les risques. c d c+d Lorsquil est utilis pour rsuTmoins mer les rsultats dune synthse 9 21 30 (mta-analyse par exemple), lOR a+c b+d (ou rapport de cotes suivant la Total terminologie franaise plutt abs10 50 60 conse de prime abord) indique la Tableau 1. cote pour un patient du groupe exprimental de dvelopper un effet indsirable, comparativement celle dun tmoin. Lodds ratio, toujours accompagn dun intervalle de confiance calcul par les logiciels, sobtient donc en divisant lodds du groupe exprimental par lodds du groupe tmoin : a/b ad OR = = = (ou produits croiss ) c/d bc = 0,08
29

QUEST CE QUUN ODDS-RATIO(OR) ?


Les cliniciens sont peu familiariss avec les concepts peu intuitifs des cotes, qui entravent la comprhension, la bonne utilisation et lapplication clinique des OR.
URGENCE PRATIQUE - 2010 No102

S T A T I S T I Q U E S

SIGNIFICATION DES OR: Si on considre le tableau, il est facile de se rendre compte quun OR de 1 signifie que la probabilit dtre malade est la mme chez les sujets du groupe exprimental et les tmoins (pas deffet). En revanche, un OR diffrent de 1 signifie quil y a un lien entre les deux variables (traitement et effet). Si OR 1 les sujets du groupe exprimental ont un plus grand risque dtre malades que les tmoins. Les traitements efficaces produisent en revanche des OR < 1, ce qui va dans le mme sens quun risque relatif (RR) dvnements indsirables (RR = TEE/TET) infrieur 1. DANGERS DE LUTILISATION DES OR: Alors que les odds-ratios, de plus en plus utiliss dans la littrature mdicale, sont des mesures valides lorsquils sont utiliss bon escient, il faut tre trs attentif ne pas les interprter abusivement comme des risques relatifs, en particulier lorsque lincidence de la pathologie tudie est leve (8). LOR est en effet toujours suprieur au risque relatif. Dans de nombreux essais contrls qui tudient des vnements indsirables frquents, les OR deviennent trs diffrents des RR et le rapprochement entre OR et RR compltement erron. Il nest licite que si la pathologie tudie est rare et que le risque relatif (RR) est faible; dans ce cas seulement, OR et RR deviennent voisins. Confondre un OR avec une estimation prcise du RR survalue la fois les bnfices et les inconvnients du traitement. COMMENT LUTILISATION DES OR SEST-ELLE RPANDUE ? Le concept des OR est issu des tudes cas-tmoins sur les effets indsirables des mdicaments, ou denqutes de cohorte sur lexposition des facteurs de risque, comme le tabac. Dans ces tudes, il nest pas possible de calculer les RR, parce que la prvalence de lvnement indsirable nest pas connue. Mais dans ces situations, on peut calculer lOR en comparant lodds dun vnement indsirable dans le groupe traitement celui du groupe tmoin, ou en comparant les odds dexposition au risque dans le groupe vnement et le groupe non-vnement. Comme les tudes cas-tmoins sont gnralement utilises pour tudier des vnements rares, la survaluation du risque due la confusion des OR avec les RR reste en principe ngligeable(7).

ANALYSES MULTIVARIES
Le but des analyses multivaries est de slectionner, parmi lensemble des liaisons statistiques mises en vidence par les analyses univaries, la ou les covariables qui expliquent de faon indpendante la survie ou la maladie (6). CONFUSION - INTERACTION: Le principal problme des analyses univaries est en effet quelles ne tiennent pas compte de liens potentiels entre variables expliquantes: elles ne permettent pas didentifier parmi les covariables lies au pronostic ou la cause dune maladie, lesquelles le sont indpendamment des autres. En revanche, lanalyse multivarie peut mettre en vidence des liens entre covariables et liminer progressivement celles qui ne sont pas des facteurs prdictifs indpendants entre eux (de la maladie ou de lvolution) et quon dsigne sous le terme de facteurs de confusion. - facteur de confusion (4) : la prsence dune covariable provoque une erreur systmatique destimation de lassociation entre la variable dpendante et une autre covariable.
30

- interaction entre deux covariables: lassociation dune covariable avec la variable explique varie selon la valeur dune autre covariable. Ainsi, le risque relatif est diffrent selon la prsence ou non dune caractristique chez un malade (6). Quand il na pas t possible de contrler les facteurs de confusion a priori, par exemple en stratifiant la randomisation, il est possible de limiter les dgts en les contrlant lors de lanalyse multivarie, qui permet dajuster a posteriori les comparaisons sur ces facteurs (9). Ainsi, lanalyse multivarie dcante les variables pour ne retenir au final que celles qui suffisent expliquer sans redondance le modle. Elle permet non seulement de dsigner les variables indpendantes entre elles et de fournir la force des liaisons sous forme dodds-ratio, mais aussi dtablir des scores dits prdictifs (6) qui permettent dapprocher un pronostic dune part, de slectionner ensuite des populations plus homognes de malades lors dtudes ultrieures. Mais attention: seules les variables introduites dans le modle sont considres. Si on dit souvent que ces variables sont indpendantes cest uniquement pour expliquer quelles sont indpendantes entre elles. Il est tout fait possible quune autre variable, oublie, non incluse dans lanalyse, soit un bien meilleur prdicteur que celles qui ont t inclues. Le terme indpendant ne signifie donc pas indpendant de toute variable possible mais seulement indpendant des variables tudies. On conoit quil suffit dinclure dans une analyse une variable dont on veut assurer la promotion en association avec quelques autres dont le caractre li est assez mdiocre pour confrer le statut envi de variable indpendante celle qui, en prsence de variables mieux choisies, aurait peut tre t limine. Cette finesse mthodologique justifie elle seule la ncessit absolue dune analyse prliminaire des donnes acquises par tous les mdia disponibles de faon proposer lanalyse multiple un modle pertinent. Un autre pige frquent est dliminer tort une variable de la liste de celles qui sont lies la survenue dun vnement, alors quen ralit elle lui est lie. Ce phnomne peut simplement dcouler du modle. En effet il est rare que lon applique une analyse multiple lensemble de la population que lon souhaite dcrire. Le plus souvent cette analyse porte sur un chantillon. Il suffit que celui-ci ne soit pas reprsentatif de la population globale pour que lon soit port vers cette erreur. Il suffit dtre reprsentatif direz-vous juste titre! Oui mais on ne peut pas savoir si on lest ou non tant que le caractre li de la variable en question na pas au moins t dcrit une fois Un exemple typique est par exemple de sous-estimer le rle de la concentration dalbumine dans une tentative de prdiction du pouvoir oncotique du plasma parce quon a ralis ltude en ranimation o la plupart des patients sont hypoalbuminmiques La mme tude ralise dans un laboratoire danalyse mdicale en ville aurait conclu diffremment. On voit donc que le modle retenu doit tre proche de celui sur lequel on voudra faire porter nos prdictions futures. Ceci est une fois de plus une incitation consulter la littrature qui abonde danalyses divergentes, car elle est nourrie dchantillons diffrents (et aussi derreurs, mais cest un autre sujet). ANALYSES PAS A PAS: Le pas zro (le seul qui cote en somme) consiste choisir les covariables introduire dans le modle multidimensionnel tester. Pour introduire des covariables dans le modle, et pour ne pas passer ct de lune dentre elles, on retient
URGENCE PRATIQUE - 2010 No102

S T A T I S T I Q U E S

au dpart toutes les variables lies la variable explique avec un seuil de signification p = 0,20 voire 0,25. En effet, bien que ce soit une exception, certaines variables indpendantes entre elles peuvent ne pas tre lies significativement avec la variable explique en analyse unidimensionnelle et trouver leur caractre li seulement en analyse multivarie. Les logiciels statistiques proposent des analyses dites pas pas. Deux stratgies, peu prs quivalentes sont possibles: ascendante ou descendante. Dans la mthode ascendante, on introduit en premier la covariable la plus significativement associe la variable explique. Puis on tudie chaque pas limpact sur lexplication du pronostic de lintroduction dans le modle de la covariable suivante. Bien entendu, on ne garde en dfinitive que les covariables associes une significativit 0,05 au sein du modle multivari. Dans la mthode descendante, toutes les covariables sont introduites demble dans le modle. A chaque pas, on limine une variable du modle, de faon ce quil ne reste lors du dernier pas que les covariables associes significativement (p 0,05) la variable explique (le pronostic).

o les donnes sont souvent des variables binaires (obtention de la narcose ou non lors de linjection dun hypnotique par exemple) (10). Le modle requiert en principe certaines conditions : indpendance des observations entre elles, normalit de la distribution des variables quantitatives et linarit de leur relation avec la variable dpendante pour certains (4). Si, pour une variable, cette condition nest pas remplie, on peut la transformer en variable ordinale en crant des classes. Il est surtout fondamental que les effectifs soient importants. On recommande un effectif minimum N de 400 et en principe, on ne doit pas analy ser plus de N covariables (11). Accrochez-vous, le concept est un peu abstrait: la fonction logistique est linverse du logit qui, la probabilit p de survenue dun vnement binaire, fait correspondre le logarithme nprien de lodds (11) (la signification des coefficients est explique plus bas) : Logit ( p) = ln ( p ) = b0 + b1x1 + b2x2, etc. 1-p

RGRESSION MULTIPLE
La rgression linaire multiple est une gnralisation, k variables expliquantes, de la rgression linaire simple (2). Cest le modle de choix lorsque variables expliquantes et explique sont quantitatives. Elle permet de tester toutes les liaisons entre la variable explique et les covariables, en testant les coefficients de corrlation affectant chaque variable expliquante au sein du modle multidimensionnel (cest--dire niveau constant des autres covariables), encore appels coefficients de corrlation partiels (5,6). Lquation de la rgression multiple (6) fournit directement un score prdictif: y = a0 + a1x1 + a2x2 + a3x3 + etc y: variable explique ou dpendante x1, x2, x3: covariables a0: constante a1, a2 , a3: calculs partir des coefficients de corrlation partielle 1, 2, 3 Seuls les coefficients de corrlation partiels statistiquement diffrents de zro (2) confrent une covariable une valeur pronostique (5). Comme le coefficient de corrlation, les coefficients partiels mesurent galement lintensit de la relation (2) entre variable expliquante et explique. Un coefficient de corrlation multiple peut tre calcul en tenant compte simultanment de toutes les covariables. Son carr R2 permet de mesurer le pourcentage de variabilit de la variable explique dont rendent compte les covariables. Plus il est proche de 100%, plus le modle rend compte de la variabilit linaire totale.

La fonction logistique transpose cette relation, de distribution binomiale, en une relation de forme sigmode (Figure 1) entre la probabilit de survenue de lvnement (qui varie de 0 1) et les facteurs dexposition (covariables x).

Figure 1. Fonction logistique.

Lquation de la courbe, complexe et diversement prsente selon les sources (12), ne fournit pas directement de score prdictif, mais on dmontre (11) que les exponentielles b1, b2, etc. sont les odds-ratios des covariables correspondantes, qui permettent dtablir ces scores (6). p (M+/x1,x2, etc.)= 1 e(b0 + b1x1 + b2x2, etc.) = (-b0 - b1x1 - b2 x2, etc.) (b0 + b1x1 + b2 x2, etc.) 1+e 1+e

Se lit: probabilit de prsenter la maladie M (a peut tre le dcs) en cas dexposition aux covariables x1, x2, etc x1, x2, x3: covariables b0: constante b1, b2 : odds-ratio Lodds-ratio, qui varie entre zro et linfini, quantifie la force de lassociation entre la survenue de lvnement reprsent par la variable dichotomique et les variables explicatives. En labsence dassociation, il tend vers 1, linverse lorsque les variables sont fortement lies, il tend vers zro ou linfini (4). OR = 1 : la covariable xi naffecte pas le pronostic 0 < OR < 1 : facteur de bon pronostic OR > 1 : facteur de risque
31

RGRESSION LOGISTIQUE
La rgression logistique repose sur un principe analogue, mais adapt lanalyse dune variable explique dichotomique ou binaire (qualitative deux classes, comme le dcs ou la survie, la survenue ou non dune insuffisance rnale, etc.). Trs prise parce que les covariables peuvent tre quantitatives ou qualitatives (6), elle est aussi utilise en pharmacologie
URGENCE PRATIQUE - 2010 No102

S T A T I S T I Q U E S

En pratique, lissue de lanalyse univarie, deux catgories de variables expliquantes peuvent tre intgres dans le modle de dpart : celles pour lesquelles lassociation avec la variable dpendante est suffisamment forte (valeur de p 0,20 parfois 0,25) et celles qui ont une pertinence clinique avre (variables dites forces ). La dclinaison des procdures pas pas descendantes ou ascendantes permet de rechercher les phnomnes dinteraction ou de confusion prendre en compte lors de linterprtation. En fin danalyse, plusieurs modles peuvent savrer satisfaisants sur un plan statistique. Des tests dadquation permettent de retenir le modle le plus pertinent (4). Certaines variables seront imprativement conserves dans le modle : la variable explicative dintrt principal et les facteurs de confusion.

MODLE DE COX
Bas sur le mme principe que les deux modles prcdents, le modle de Cox, qui rpond aux mmes impratifs que la rgression logistique, sapplique aux variables expliques dites tronques ou censures, comme un taux de dcs ou un taux de rcidives (6). Il dcrit une fonction de risque instantan (9) partir du dlai de survenue (t) de lvnement: h (t) = h0 (t) x e (b1x1+b2x2, etc.) h(t): risque instantan h0(t): fonction de risque au temps 0 (cest une constante) x1, x2 : covariables b1, b2: ces coefficients reprsentent leffet de chaque covariable sur la survenue de lvnement. Si b est nul, la covariable na pas deffet; le risque instantan est augment si b est positif, diminu si b est ngatif. On remarque que le risque instantan se prsente comme le produit dune fonction de risque de base h0(t) commune tous les individus et dune fonction de rgression qui estime les risques relatifs instantans pour chaque covariable et des risques proportionnels pour les individus. Ces derniers, hazard-ratio des anglo-saxons (HR = eb), sont indpendants du temps, et proches du RR quand la prvalence de lvnement est faible (9).

traite (hyperespace) ds lors quune quatrime variable est introduite. De mme, si on a 20 covariables mesures chez 100 individus, prendre deux deux chacune des colonnes pour faire les graphes de toutes les combinaisons possibles serait non seulement fastidieux, mais ne prsenterait surtout aucun intrt. Le concept de lACP peut se comparer la prise dune photographie qui prtend reprsenter un objet tridimensionnel par une reprsentation deux dimensions. Le problme du photographe est de choisir langle de prise de vue qui rendra le plus fidlement compte de lobjet photographi. Similairement, celui de lACP est de choisir judicieusement le plan de projection du nuage de points ( 20 dimensions dans notre exemple) pour slectionner dans cette masse dinformation abstraite les dimensions saillantes les plus reprsentatives du nuage. Ces axes synthtiques, ou composantes principales, selon lesquels le nuage de points sloigne le plus de son centre dinertie peuvent tre la rsultante de linfluence dune ou plusieurs variables ou observations. Imaginez que le photographe tente de vous faire deviner lidentit dun animal en ne vous montrant que sa silhouette prise de face. Si cest un dromadaire, rien ne vous garantit quil ne sagit pas en fait dun chameau, simplement parce que langle danalyse nest pas le plus informatif. Il vous aurait fallu disposer dune vue de profil pour pouvoir conclure avec certitude (Figure 2). De la mme manire, lACP fournit les axes (et donc les plans) susceptibles de nous renseigner au mieux sur la forme du nuage de points.

ANALYSE EN COMPOSANTES PRINCIPALES (ACP)


A linverse des mthodes que nous venons de dcrire, dites prdictives, lanalyse en composantes principales, introduite en 1901 par Pearson et dveloppe par Hotelling en 1933, est une mthode multidimensionnelle dite descriptive. Elle permet de rsumer graphiquement un ensemble de donnes quantitatives. La plupart des rsultats denqutes ou de mesures se prsentent sous forme de tableaux de donnes avec en ligne les individus mesurs et en colonnes les covariables. Alors que nous visualisons intuitivement les objets dans un espace trois dimensions, lorsque nous publions, nous nutilisons dj plus que des graphiques deux dimensions pour exprimer linformation. La reprsentation graphique des donnes nest simple en effet que lorsque les variables sont peu nombreuses: plane pour deux variables (abscisse et ordonne de chaque point), tridimensionnelle si sajoute une troisime variable, mais devient impossible ou trop abs32

Figure 2. Dromadaire projet.

Dun point de vue technique, comme le tableau contient des mesures dunits diffrentes, certaines valeurs risquent dcraser les autres colonnes et de masquer leur importance. On procde comme nous lavions vu pour le calcul de lcart-rduit (1) la transformation du tableau par un centrage et une rduction des donnes: on soustrait la valeur de la moyenne de la colonne de chaque valeur (nouvelle moyenne de la colonne = 0). Puis on divise chaque valeur par lcart type de sa colonne (nouvel cart type de la colonne = 1). Les logiciels ddis recourent ensuite au calcul matriciel et la diagonalisation de la matrice dinertie pour fournir: - la matrice des vecteurs propres qui servent la projection des points sur des plans dfinis par les nouveaux axes. - les valeurs propres (une par axe) qui valuent la quantit ou linertie (variance) du nuage de points explique par chaque axe.
URGENCE PRATIQUE - 2010 No102

S T A T I S T I Q U E S

LACP fournit deux rsums graphiques qui permettent de dtecter quelles variables et observations influencent le plus les axes extraits : - la reprsentation directe des points-observations dans lespace des variables. - la reprsentation duale dans lespace des observations des points-variables, dont les coordonnes correspondent aux coefficients de corrlation de chaque variable pour les nouveaux axes.

EXPRESSION DES RSULTATS: EXEMPLE DE LENQUTE 2009 SUR LE BURNOUT


Pour illustrer lensemble de cette dmarche, nous cheminerons dans lanalyse multivarie dune enqute sur le burnout syndrome (BOS), dont nous avons publi les rsultats prliminaires en 2009 (13,14). Le BOS est un concept tridimensionnel mesurable notamment par le score labor dans les annes 70 par Christina Maslach Berkeley (15). Le Maslach Burnout Inventory (MBI) est devenu un instrument de mesure de rfrence qui comporte 22 items permettant de coter les trois composantes du BOS : 1. lpuisement motionnel, 2. la dshumanisation de la relation au patient, 3. la perte du sentiment daccomplissement personnel. MATRIEL ET MTHODES: Un questionnaire a t labor au cours de lanne 2008, dans le cadre dun sujet de thse. Mis en ligne en 2009, il ne pouvait prtendre - et ne prtendait pas - tre reprsentatif de la population explore: infirmiers et mdecins francophones travaillant dans le champ de lanesthsie, de la ranimation et des urgences. En effet, il ntait pas possible de savoir combien, parmi les personnes concernes, y rpondraient. Lobjectif principal de cette tude pilote tait seulement de cerner dans cette population les facteurs en lien avec le BOS mesur par le MBI. A cet effet ont t recueillis les donnes dmographiques et le mode dexercice, ainsi que des items mesurant la charge de travail, la fatigue, la perception subjective de la qualit de la vie prive et professionnelle, les scores de BOS (MBI), daddiction (score Face), de dpression (score Hands), lorganisation du repos de scurit, les tensions dans les rapports humains, ainsi que des items relatifs la sant physique, dont les habitudes addictives ou les traitements prescrits. Lensemble de la dmarche danalyse statistique a t prise en charge par le logiciel StatEL (module StatEL AD), que nous avons eu loccasion de prsenter dans cette revue (3). PREMIRE TAPE: STATISTIQUES DESCRIPTIVES: A lissue de lenqute, 1603 questionnaires ont t collects, manant de plus de 1000 mdecins anesthsistes ranima-

teurs (MAR), deux tiers pratiquant dans le secteur public, le reste dans le priv, 241 ranimateurs (15%) et 204 IADE (12%), peu durgentistes (Figure 3). On dnombrait 972 Hommes (60,3%) et 622 Femmes (38,6%). Leur prsence hebdomadaire lhpital tait de 52,9 14,3 heures, avec une activit clinique moyenne de 47,0 15,3 heures (0 -107) et une moyenne rapporte de 5,7 7,5 gardes par mois, avec des extrmes sujets caution (0-60). 40,8% craignaient quotidiennement de faire une erreur mdicale. 42,0 vivaient des situations de tension avec leurs suprieurs hirarchiques, 58,9% avec leurs collgues et 26,6% avec les patients. Le repos de scurit tait prvu et pris dans 69,2 % et 64,4 % des cas respectivement. Il servait au repos dans 47,8 % des cas ou des activits non cliniques (39,5%). 37,4% des sujets taient traits pour anxit, 19,5% pour dpression et 8,1% pour un tat de stress post-traumatique. 10,9% prenaient des anxiolytiques, 9,9% des antidpresseurs et 8,9% des somnifres. 12,1% souffraient dun ulcre gastroduodnal, 7,7% dune pathologie cardiovasculaire, 7,3% dune douleur chronique, 2,9% dune dysthyrodie, 2,2% dun cancer, 1,4% dun diabte, et 0,3% dune pilepsie. Enfin, 0,2% taient sropositifs pour le VIH. Si seulement 1,3% des individus avaient dj fait une tentative dautolyse, 32,3% reconnaissaient des penses suicidaires occasionnelles. 1,1% avouaient avoir t traits pour alcoolisme et 0,4% pour consommation de drogue. 68,3% choisiraient nouveau la mme spcialit, mais 39,7% envisageaient darrter prmaturment leur activit clinique. Enfin, 17,0% avaient dj t poursuivis en justice dans le cadre de leur activit professionnelle.

Figure 4. Rsultats : 3 composantes du BOS.

Figure 3. Mode dexercice principal.


URGENCE PRATIQUE - 2010 No102

Le calcul des diffrents scores partir des items cochs dans les questionnaires permettait de dfinir la variable dpendante, le score de Maslach, et de le confronter une trentaine de covariables. La valeur mdiane des diffrentes composantes (Figure 4) nest en elle-mme pas trs informative: Score dpuisement: 19,7 11,6 Score de dshumanisation: 9,4 6,4 Score daccomplissement : 34,3 9,4 La distribution des trois composantes du score est plus intressante et lvidence non gaussienne (Figure 5). 58% des individus ont des scores levs au MBI. 35, 17 et 5% ont respectivement une, deux ou trois des composantes dans la zone rouge dfinie par Maslach. Moins de 10% des soignants runissent des scores faibles dans les trois dimensions du MBI (Figure 6). Si ces rsultats sont intressants en soi, ils ne nous renseignent aucunement sur le lien de chacune de ces covariables avec le BOS.
33

S T A T I S T I Q U E S

Figure 5. Distribution des 3 composantes du BOS.

Fig.8 : LACP confirme dune part la validit du MBI: les scores dpuisement motionnel et de dshumanisation ont un poids prpondrant dans la variabilit du nuage. On souponne dores et dj un lien entre ces deux items, mais aussi avec la dpression et la fatigue (sous nuage rose). Inversement, le sentiment daccomplissement personnel se retrouve diamtralement oppos, et visiblement li au ressenti de la vie personnelle et professionnelle (nuage vert sombre). Le nuage violet nous laisse penser que les conduites addictives sont lies entre elles et vraisemblablement aux covariables du nuage rose. Enfin, si les gardes ou les astreintes se retrouvent comme on pouvait sy attendre sur des axes opposs (frquences inversement proportionnelles des unes et des autres), on peut prouver une relative surprise avec le fait que ce dterminant potentiel de la fatigue est sur laxe perpendiculaire au MBI, donc a priori peu ou pas influent. Cependant, vous pouvez noter que cette reprsentation ne rend compte que de 25% de linertie totale du nuage, ce qui reste assez faible pour une explication. Figure 8. ACP - 25-10-2009 couleur.

mettre en vidence les traits saillants qui nous serviront intuitivement par la suite (Figure 8). TRANSFORMATION DE LA VARIABLE EXPLIQUE (MBI): Il paraissait vain dtudier le lien entre chaque covariable et le MBI, mesure valide, certes, mais trop complexe. Il tait ncessaire de transformer ce score composite (MBI) en une variable explique dichotomique (BOS). En sappuyant sur la dfinition initiale de Maslach, il a t possible de sparer les sujets en deux groupes: ceux dont le MBI rvlait un score lev dans au moins une des trois composantes (score dpuisement>30, de dpersonnalisation>12 ou daccomplissement personnel< 33), soit 57,9% pour BOS = 1, et les autres: 42,1% de personnes exemptes de burnout: BOS = 0 (Figure 6). LTAPE DES ANALYSES UNIVARIES: Aprs avoir dfini prcisment la variable explique (BOS 0 ou 1), il a t ncessaire de tester pour chaque covariable, connue pour tre un facteur possible dexplication du BOS, ou potentiellement lie au score de Maslach selon lACP, si elle tait lie ou non au rsultat 0 ou 1. Pour les variables quantitatives, on a effectu une comparaison de moyennes, un test non paramtrique (3) si la covariable ntait pas distribue normalement, enfin un test du CHI2 pour comparer les pourcentages. On obtient ainsi une trentaine de comparaisons univaries (tableau II) pour lesquelles on a prcis le nombre de rponses analysables, les valeurs des covariables dans chaque groupe, ventuellement lodds-ratio, et surtout la valeur de p, en mettant en vidence les valeurs 0,20. Ce tableau qui montre limportant travail quil reste faire, donne des rsultats dj intressants pour la discussion ultrieure. En effet, le fait que deux variables soient mathURGENCE PRATIQUE - 2010 No102

Figure 6. Nombre ditem de BOS lev.

Figure 7. Rsultats sous forme de nuage de points.

DEUXIME TAPE: ANALYSE EN COMPOSANTES PRINCIPALES Aprs slection des questionnaires correctement remplis, nous nous sommes trouvs confronts un tableau denviron 1600 lignes et 70 colonnes. Dans la mesure o cette tude pilote ne pouvait matriser la reprsentativit de la population cible, il importait danalyser la photographie de limportante masse de donnes collectes. En effet, la variable dpendante tait ncessairement complexe, tridimensionnelle nous lavons dit, irrductible une mesure numrique unique et dcrite par un nuage de point (Figure7) suggrant des corrlations entre les composantes, mais dune manire peu informative. LACP, ralise dans StatEL, fournit un tableau qui prsente une analyse univarie de toutes les covariables quantitatives, croises deux deux, en calculant les valeurs de tous les coefficients de corrlation respectifs. Elle fournit surtout une analyse graphique, vue en coupe du nuage des covariables dans lespace, en permettant de faire pivoter les axes pour

34

S T A T I S T I Q U E S

matiquement lies ne diminue pas lintrt dtudier leurs relations (16): ainsi, si la proportion de BOS est indpendante du mode et du lieu dexercice, du sexe (prdicteur dans dautres tudes), de lge, ou du nombre denfants (p = 0,08), on observe en revanche que les conflits interpersonnels sont hautement lis lexistence dun BOS (Figure 9). La vie en couple a au contraire un effet protecteur.

Figure 9. Conflit au travail et BOS (%).

Tableau 2.

La charge de travail est faiblement significative. En ce qui concerne le repos de scurit, lanalyse univarie est instructive: alors que lapplication du repos de scurit est en voie de normalisation depuis 2003 (deux tiers des cas), cest la faon dont il est peru dans lquipe qui est lie au dveloppement dun burn out (Figure 10).

Figure 12. Epuisement vs dpression.

Figure 10. Repos de scurit et BOS.

Le ressenti subjectif de la qualit de vie professionnelle et personnelle est trs significativement lie au BOS (Figure 11).
Figure 13. BOS Fatigue vs EE.

LTAPE DE LANALYSE MULTIVARIE: Maintenant que nous disposons dune variable explique de nature binaire, lanalyse multivarie peut faire appel une rgression logistique, en incorporant dans le modle les covariables slectionnes en analyse univarie (p < 20%). StatEL propose un accs direct aux analyses multivaries (Figure 14). La fonction Rgression Logistique permet linFigure 14. Barre doutils rgression logistique de StatEl.

Figure 11. Qualit de vie (EVA).

Lanalyse univarie peut bien entendu porter sur les liens entre covariables. Maslach avait observ la liaison entre BOS, anxit et dpression. Lanalyse des donnes montre effectivement un lien significatif entre dpression et puisement, ou entre puisement et sensation de fatigue (Figure 12 et 13).
URGENCE PRATIQUE - 2010 No102

35

S T A T I S T I Q U E S

Figure 15. Introduction des covariables.

troduction dans le modle des covariables quantitatives et qualitatives (Figure 15). On veille ne pas analyser plus de N de covariables. Les normes calculs sont assums par StatEL qui fournit trs rapidement un rapport complet de lanalyse (tableau III). Ainsi, en analyse multivarie, on ne retrouve pas de lien indpendant entre BOS et prsence lhpital, nombre de gardes, cotation de la vie prive, penses suicidaires, conflits avec les collgues ou les suprieurs. En revanche, la rgression logistique montre un lien indpendant entre BOS et famille monoparentale (p=0,03), sexe (qui ne sortait pas en analyse univarie, ici p<0,01), perception de la qualit du travail (p<0,03), du niveau de fatigue (p<0,04), dpression (p<0,0002), tensions avec les patients (p=0,005) et dsir de quitter prmaturment la profession (p=0,03). StatEL teste galement la significativit du modle global : le Test du Rapport de Vraisemblance montre quil existe au moins un estimateur du modle qui est significativement diffrent de 0 (ici p<0,0000001). Le logiciel tudie enfin lad-

quation du modle de rgression : le modle reste correct sil ny a pas plus de 5% de covariate patterns mal ajusts (ici 4,4%). DERNIRE TAPE Il doit tre admis sans rserve que lien ne signifie pas rapport de causalit. Ltat dpressif est il la cause ou le rsultat du BOS? Cette tude ne permet absolument pas dy rpondre. En revanche, la transformation du score au MBI en une variable dichotomique, prliminaire oblig une analyse

Figure 16. BOS catgoris.

Figure 17. BOS catgoris - fatigue.

Tableau 3. Rsultat de lanalyse multivarie.

Figure 18. BOS catgoris - arrt prmatur.

RFRENCES BIBLIOGRAPHIQUES:
1. - Mion G, Daban JL, Bordier E. lments indispensables de statistiques mdicales 2 Comparaison de moyennes (distribution normale). Urgence Pratique 2007 ; 85 : 13-18. 2. - Mion G, de Rudnicky S. Elments indispensables de statistiques mdicales 3 Lien entre deux paramtres quantitatifs : rgression et corrlation. Urgence Pratique 2008 ; 91 : 21-25. 3. - Mion G. Elments indispensables de statistiques mdicales 4 mthodes non paramtriques. Urgence Pratique 2009; 93: 21-27. 4. - Aminot I, Damon MN. Rgression logistique : intrt dans lanalyse de donnes relatives aux pratiques mdicales. Rev Med Ass Maladie 2002 ; 33 : 137-143. 5. - Lacaine F, Huguier M. Analyses multidimensionnelles. Application ltude des facteurs pronostiques. Concours Med 1984; 106: 15551562. 6. - Huguier M, Flahault A. Les analyses multidimensionnelles. In: Huguier M, Flahault A, eds. Biostatistiques au quotidien 2e dition, Paris: Elsevier; 2003. p 157-177. 7. - Sackett DL, Deeks JJ, Altman DG. A bas les odds ratios ! EBM Journal 1997 ; 6 : 5-7.
36
URGENCE PRATIQUE - 2010 No102

S T A T I S T I Q U E S

multivarie des covariables associes au BOS, nempche pas daller plus loin dans lanalyse en catgorisant les rponses au MBI, ici en 5 classes (Figure 16). Ainsi, lintensit du BOS est fortement corrle la fatigue ressentie (Figure 17) ou au dsir de quitter la profession (Figure 18).

ltre lissue dun raisonnement - clinique ou pidmiologique - et les facteurs de confusion doivent avoir t reprs, sous peine derreurs non seulement dans linterprtation du modle, mais aussi dans sa conception, ce qui peut avoir des rpercussions bien plus difficiles corriger.  n
Georges MION1, Stphane HERAULT2, Nicolas LIBERT1, Didier JOURNOIS3

CONCLUSION
Linformatique rend apparemment simples ces analyses complexes. Cette simplicit ne doit pas faire oublier quune analyse na de valeur quen fonction de la pertinence de ses objectifs. Les variables intgres dans les modles doivent

1. Ecole du Val-de-Grce, Paris. 2. Socit ad Science, Paris 3. Ple Anesthsie-Ranimation-Recherche Clinique, Universit Paris Descartes et Hpital Europen Georges Pompidou, Paris @: georges.mion@santarm.fr

8. - Ho KM, Marshall RJ, Walters S. Use of odds ratios on anaesthesia related studies. Anaesth Intensive Care. 2003 ; 31 : 392-5. 9. - Timsit JF, Alberti C, Chevret S. Le modle de Cox. Rev Mal Respir 2005 ; 22 : 1058-64. 10. - Lu W, Bailey JM. Reliability of pharmacodynamic analysis by logistic regression: a computer simulation study. Anesthesiology 2000 ; 92: 985-92. 11. - Bewick V, Cheek L, Ball J. Statistics review 14: Logistic regression. Crit Care 2005 ; 9 : 112-8. 12. - Pace NL. Independent predictors from stepwise logistic regression may be nothing more than publishable P values. Pace NL. Anesth Analg. 2008 ; 107 : 1775-8. 13. - Mion G, Libert N, Journois D. Syndrome dpuisement professionnel : les anesthsistes au bord du burn out. Quotidien du mdecin N8651 du 5 novembre 2009 ; 3-4. 14. - Mion G, Libert N, Petitjeans F, Journois D. Premiers rsultats de lenqute 2009 sur le burnout en anesthsie-ranimation-urgences. Ranoxyo 2009 ; 25 : 94-95. 15. - Maslach C, Schaufeli WB, Leiter MP. Job burnout. Annu Rev Psychol 2001; 52: 397-422. 16. - Squara P. Mathematic coupling of data: a frequently misused concept. Intensive Care Med 2008 ; 34 : 1916-21.

R evue de presse

URGENCE PRATIQUE - 2010 No102

37

Vous aimerez peut-être aussi