Vous êtes sur la page 1sur 41
UFR Sciences exacte et naturelles Département Mathématiques Complexe des Cézeaux 63177 AUBIERE Cedex Association Atmo

UFR Sciences exacte et naturelles

Département Mathématiques Complexe des Cézeaux 63177 AUBIERE Cedex

Mathématiques Complexe des Cézeaux 63177 AUBIERE Cedex Association Atmo Auvergne La Pardieu 21 allée Evariste

Association Atmo Auvergne La Pardieu 21 allée Evariste Galois 63170 AUBIERE

Master 2 ème Statistiques et Traitement De Données

Etude statistique sur les effets à court terme de l’exposition aux pollens et moisissures sur la consommation de médicaments antiallergiques

Abdellah EL HAYATE

de médicaments antiallergiques Abdellah EL HAYATE Responsable de stage : M. Serge PELLIER Stage du 15

Responsable de stage : M. Serge PELLIER

Stage du 15 Mars au 15 Septembre 2010

Remerciements

Avant tout, c’est avec un grand plaisir que je remercie toutes les personnes qui ont contribuées, de près ou de loin, à l’élaboration de ce travail.

Mes remerciements vont tout d’abord à Monsieur Serge PELLIER, directeur d’Atmo Auvergne, pour m’avoir proposé ce stage, sa disponibilité et son attention.

Je profite également de l’occasion, qu’il m’est donné ici, pour remercier le Professeur Denis CAILLAUD et le Docteur Jérôme LECADET pour leurs recommandations et leurs conseils.

Un grand merci et une réelle reconnaissance, à toute l’équipe d’Atmo Auvergne, pour sa bonne humeur et sa convivialité.

Je tiens enfin à remercier tous les professeurs du Master STD pour le bon encadrement apporté tout au long de l’année.

Rapport de stage

Sommaire

Rapport de stage Sommaire Sommaire   1 Introduction 4 I. Présentation de l’entreprise 5
Rapport de stage Sommaire Sommaire   1 Introduction 4 I. Présentation de l’entreprise 5
Rapport de stage Sommaire Sommaire   1 Introduction 4 I. Présentation de l’entreprise 5

Sommaire

 

1

Introduction

4

I.

Présentation de l’entreprise

5

1.

Historique

5

2.

Personnel

5

3.

Rôle

6

4.

Pollen

7

II.

Présentation de l’étude

8

1.

Présentation

8

III.

Méthodes statistiques

13

IV.

Applications et résultats

16

1.

Analyse descriptive

16

1.1 Indicateur d’exposition aux pollens

16

1.2 Facteurs de confusion

18

1.3 Modélisation

20

2.

Résultats

23

 

2.1

Pollens

23

2.2

Moisissures

27

Conclusion

29

Bilan

30

Références bibliographiques

31

Annexes

 

32

29 Bilan 30 Références bibliographiques 31 Annexes   32 Abdellah EL HAYATE Page 3
29 Bilan 30 Références bibliographiques 31 Annexes   32 Abdellah EL HAYATE Page 3

Rapport de stage

Introduction

Rapport de stage Introduction Dans le cadre de ma formation universitaire en Master Professionnel de Statistiques
Rapport de stage Introduction Dans le cadre de ma formation universitaire en Master Professionnel de Statistiques
Rapport de stage Introduction Dans le cadre de ma formation universitaire en Master Professionnel de Statistiques

Dans le cadre de ma formation universitaire en Master Professionnel de Statistiques et Traitement de Données (S.T.D), j’ai effectué un stage de fin d’études de 6 mois au sein d’Atmo Auvergne, association agréée pour la surveillance de la qualité de l’air en Auvergne.

Au cours de ce stage, j’ai dû appliquer des analyses statistiques dans le cadre d’une étude sanitaire. L’objectif principal de ce projet était l’étude statistique des effets à court terme de l’exposition aux pollens et moisissures sur la consommation de médicaments antiallergiques.

Mon travail a consisté à consolider d’abord les données nécessaires puis à les analyser en appliquant des méthodes statistiques adéquates aux types de données et aux objectifs visés. J’ai ensuite mis en forme les résultats trouvés en vue de leur interprétation par les partenaires impliqués dans ce projet.

J’ai utilisé le logiciel R pour mettre en œuvre les analyses statistiques appliquées pour cette étude.

le logiciel R pour mettre en œuvre les analyses statistiques appliquées pour cette étude. Abdellah EL
le logiciel R pour mettre en œuvre les analyses statistiques appliquées pour cette étude. Abdellah EL

Rapport de stage

Rapport de stage I. Présentation de l’entreprise 1. Historique Les premières mesures de pollution atmosphérique dans

I. Présentation de l’entreprise

1.

Historique

Les premières mesures de pollution atmosphérique dans l’agglomération clermontoise ont été effectuées dans les années 1966-1967 par le Laboratoire Municipal de la ville de Clermont-Ferrand. A cette époque, quelques centaines d’analyses étaient réalisées chaque année devenant progressivement quelques milliers au début des années 1970. Le réseau s’est alors doté d’appareils semi-automatiques puis automatiques à la fin des années 1980. Les mesures ne concernaient que l’acidité forte, les fumées noires et le monoxyde de carbone. Ce dernier polluant était prélevé à hauteur d’homme tous les jours vers 14 heures dans les dix carrefours les plus circulés de l’agglomération clermontoise.

En 1986, une association de gestion de réseau, l’Association pour la Mesure de la Pollution Atmosphérique de l’Agglomération Clermontoise (Ampac), regroupant trois catégories de partenaires (État, Collectivités Locales et Industriels) fut constituée et agréée au titre de la

taxe parafiscale sur la pollution atmosphérique. La présidence fut confiée à un élu clermontois, le poste de trésorier à un représentant du monde industriel tandis que le secrétariat général de l’association fut assuré par la Direction Régionale de l’Industrie et de la Recherche (DRIR). L’exploitation du réseau continua d’être assurée dans un premier temps, par le Laboratoire Municipal. L’extension au niveau régional de l’association fut décidée en

1989.

L’AMPAC prit alors une nouvelle dimension avec l’embauche des premiers personnels propres à l’association et l’arrivée de matériels plus performants. Elle devint capable de différencier les molécules polluantes. Cet effort de modernisation, de régionalisation et d’automatisation toujours plus poussé fut accéléré par le biais de la Loi sur l’Air et de l’Utilisation Rationnelle de l’Énergie du 30 décembre 1996.

Afin d’affirmer son caractère régional et son appartenance à un réseau national de surveillance et d’information sur la qualité de l’air, l’AMPAC prit en 1999 le nom d’« Atmo Auvergne » et adhéra en 2000 à la Fédération Atmo France.

2. Personnel La figure 1 représente l’organigramme d’Atmo Auvergne [1].

Atmo France. 2. Personnel La figure 1 représente l’organigramme d’Atmo Auvergne [1]. Abdellah EL HAYATE Page
Atmo France. 2. Personnel La figure 1 représente l’organigramme d’Atmo Auvergne [1]. Abdellah EL HAYATE Page

Rapport de stage

Rapport de stage Figure 1 : Organigramme d’ATMO Auvergne au 1 e r juillet 2010 3.
Rapport de stage Figure 1 : Organigramme d’ATMO Auvergne au 1 e r juillet 2010 3.

Figure 1 : Organigramme d’ATMO Auvergne au 1 er juillet 2010

3. Rôle

Atmo Auvergne a pour missions :

d'assurer la mise en œuvre de tous moyens de mesures, surveillance, observations et traitements des données collectées permettant d'aboutir à une perception précise et objective de l'état de la qualité de l'air en Auvergne,

d'effectuer toute campagne de mesures, programme de surveillance spécifique notamment à la demande d'une collectivité territoriale ou d'une administration, dès lors que la mission spécifique demandée est susceptible de contribuer à une meilleure connaissance de la qualité de l'air et des phénomènes de pollutions atmosphériques,

d'assurer, à partir notamment d'une étude historique des données recueillies sur la qualité de l'air, corrélées avec les données météorologiques, la conception et la mise en œuvre d'outils de prévision fiables sur la qualité de l'air et les risques de pollution atmosphérique,

d'assurer la transmission à l'Administration et à la Banque de Données de la Qualité de l'Air (BDQA), des informations recueillies,

et à la Banque de Données de la Qualité de l'Air (BDQA), des informations recueillies, Abdellah
et à la Banque de Données de la Qualité de l'Air (BDQA), des informations recueillies, Abdellah

Rapport de stage

Rapport de stage  d'assurer une information régulière du public sur l'état de la qualité de

d'assurer une information régulière du public sur l'état de la qualité de l'air et de porter

à sa connaissance les résultats de toutes études relatives à la pollution atmosphérique ou à l'utilisation de l'énergie et de publier les résultats par tout moyen approprié,

de pouvoir en cas de dépassement ou risque de dépassement de seuils de concentration de substances polluantes dans l'atmosphère, seuils fixés par décret, se voir déléguer par l'autorité administrative compétente la mission d'informer le public sur les valeurs mesurées, les conseils et recommandations que doivent suivre les populations exposées,

de réaliser ou contribuer à toute étude ou bilan relatifs à la qualité de l'air et de

participer à tout échange, réflexion, consultation, manifestation et initiative concourant

à

son objet social.

4. Pollen

initiative concourant à son objet social. 4. Pollen Figure 2 : Bulletin allergo-pollinique Les mesures de

Figure 2 : Bulletin allergo-pollinique

Les mesures de pollens se font généralement de mars à septembre. Un compteur volumétrique, placé dans une zone de forte densité de population à Clermont-Ferrand, est utilisé. L'air est aspiré à raison de 10 litres/minute, débit comparable à celui de la respiration humaine. Les pollens se déposent sur une bande de cellophane circulaire. Chaque semaine, les bandes sont ramassées. Les analystes procèdent alors au découpage de la bande en tranche

bandes sont ramassées. Les analystes procèdent alors au découpage de la bande en tranche Abdellah EL
bandes sont ramassées. Les analystes procèdent alors au découpage de la bande en tranche Abdellah EL

Rapport de stage

Rapport de stage journalière, puis à sa coloration afin de mettre en évidence les pollens. Une

journalière, puis à sa coloration afin de mettre en évidence les pollens. Une lecture minutieuse au microscope permet de comptabiliser les pollens, en distinguant les différentes familles (taxons). Les quantités de pollen des principaux taxons permettent de définir l'indice pollinique de la semaine (figure 2), représentatif du risque allergique.

II. Présentation de l’étude

1. Présentation

Les pollinoses regroupent les manifestations cliniques dues à une allergie aux pollens. Il s’agit le plus souvent d’une rhinite allergique ou “rhume des foins” très souvent associée à une conjonctivite allergique. Elle est également souvent associée à un asthme et elle peut se compliquer par des infections locales (sinusites en particulier).

La rhinite pollinique touche 10 à 20 % de la population générale en Europe. En France, 18,5 % des adultes de 20 à 60 ans sont atteints et, chez les adolescents de 13-14 ans, la prévalence varie entre 11 et 27 % selon la région d’étude. Tout comme l’ensemble des maladies allergiques, la rhinite pollinique est en augmentation constante depuis plusieurs dizaines d’années, en particulier en milieu urbain.

Par ailleurs, la rhinite allergique (ensemble plus large regroupant les rhinites dues à d’autres allergènes que les pollens) représente un coût socio-économique important et entraîne une altération de la qualité de vie. Enfin, elle peut être associée à un asthme, maladie inflammatoire chronique des voies aériennes dont l’évolution peut être grave.

Ces éléments épidémiologiques, socio-économiques et cliniques, la possibilité d’engager des actions visant à prévenir les crises durant la saison pollinique (information du public ou des médecins, aménagement paysager) et l’existence du Réseau National de Surveillance Aérobiologique (RNSA) – réseau de mesure des comptes polliniques dans l’atmosphère de 50 villes françaises ont motivé un intérêt particulier pour étudier les allergies polliniques et améliorer leur prévention. Un des axes de ce travail concerne la production de connaissances sur la relation exposition-risque reliant la concentration pollinique aérienne et le risque de pollinose, qui pourrait permettre, à terme, de déterminer des seuils d’information/alerte à visée du public.

2. Littérature sur la relation exposition-risque

Jusqu’à présent, les études sur le sujet ont principalement cherché à définir des seuils “cliniques”, c’est-à-dire des seuils pour lesquels le pollen provoque des manifestations cliniques chez un sujet sensibilisé ou aggrave une symptomatologie préexistante. Ces études ont porté uniquement sur des populations spécifiques (sujets allergiques à un ou plusieurs pollens allergisants). Par ailleurs, les méthodes statistiques pour analyser les données étaient le plus souvent inappropriées. Les résultats de ces études ne peuvent donc répondre à la question de la relation exposition-risque en population générale.

donc répondre à la question de la relation exposition-risque en population générale. Abdellah EL HAYATE Page
donc répondre à la question de la relation exposition-risque en population générale. Abdellah EL HAYATE Page

Rapport de stage

Rapport de stage Les analyses de séries temporelles sont l’outil de choix pour analy ser les

Les analyses de séries temporelles sont l’outil de choix pour analyser les effets à court terme d’un pollen en prenant en compte la dépendance des séries de données entre elles et les facteurs de confusion potentiels. Cet outil a été très utilisé dans le champ de la pollution atmosphérique mais peu dans le champ des pollinoses puisque seules sept études ont été réalisées, parmi lesquelles une seule, au Canada, visait à étudier la relation pollens-rhino- conjonctivite allergique.

3. Objectifs

En 2000 et 2001, une étude de faisabilité a été mise en place à Clermont-Ferrand sur ces deux années polliniques, afin d’étudier les variations journalières des niveaux de pollens en relation avec l’incidence des rhino-conjonctivites allergiques (RCA) en population générale [2], en utilisant :

- un indicateur sanitaire construit à partir des informations fournies par l’assurance maladie sur les médicaments prescrits sur ordonnance et délivrés en pharmacie.

- un indicateur d’exposition aux pollens fourni par le RNSA.

L’objectif principal est la quantification de la relation entre l’exposition à divers pollens allergisants mesurés à Clermont-Ferrand et le risque de RCA pour les années 2003 à 2009, en utilisant les analyses de séries temporelles comme outil statistique. La relation entre l’exposition à l’Aletranria et le risque de RCA sera étudiée pour la première fois et concernera les deux saisons 2008 et 2009.

4. Construction de l’indicateur de santé

Cet indicateur de santé représente le nombre de cas de rhinite et/ou conjonctivite allergique par jour. Les données concernant cet indicateur sont fournies par CnamTS. Le régime général d’assurance maladie des travailleurs salariés dispose, dans chaque Caisse Primaire d’Assurance Maladie (CPAM), d’une base de données où sont enregistrées toutes les prestations remboursées aux assurés sociaux. La mise en place, à partir de 1997, d’un codage du médicament offre l’opportunité de disposer d’une information qualitative et quantitative. En effet, le codage par la pharmacie des médicaments délivrés permet d’abord de disposer d’une identification précise des produits prescrits et remboursés et, sur une période et pour un secteur géographique particulier, il permet aussi d’identifier les personnes concernées par cette consommation.

5. Population étudiée

Les données de la base Erasme Auvergne ont permis d’identifier tous les sujets ayant bénéficié d’une délivrance d’au moins un des médicaments figurant dans une liste préétablie (tableau 1), prescrits sur ordonnance et remboursés par la Sécurité Sociale. Les médicaments cibles étaient :

• des antihistaminiques per os (par la bouche) ;

Les médicaments cibles étaient : • des antihistaminiques pe r os (par la bouche) ; Abdellah
Les médicaments cibles étaient : • des antihistaminiques pe r os (par la bouche) ; Abdellah

Rapport de stage

Rapport de stage • des formes locales pour le traitement des RCA qui se répartissaient en

• des formes locales pour le traitement des RCA qui se répartissaient en cinq classes :

- préparations nasales à base d’antihistaminiques,

- préparations nasales à base d’anti-inflammatoires stéroïdiens,

- préparations nasales à base d’anticholinergiques,

- préparations nasales à base de produits anti-allergiques,

- préparations nasales à base de produits anti-allergiques non antihistaminiques,

- des collyres anti-allergiques locaux, à base d’antihistaminiques ou non.

Pour chaque bénéficiaire de soins identifié dans la base Erasme Auvergne, les informations suivantes ont été recueillies :

concernant le bénéficiaire : âge et sexe ;

concernant chaque médicament prescrit faisant partie d’une ordonnance identifiée à partir de la liste de médicaments figurant dans le tableau 1 :

- identification des médicaments : code CIP (Club Inter Pharmaceutique) et nom commercial,

- date de délivrance,

- date de prescription,

- quantité délivrée (nombre de boîtes).

de prescription, - quantité délivrée (nombre de boîtes). Tableau 1 : Liste des médicaments antiallergiques Abdellah

Tableau 1 : Liste des médicaments antiallergiques

quantité délivrée (nombre de boîtes). Tableau 1 : Liste des médicaments antiallergiques Abdellah EL HAYATE Page
quantité délivrée (nombre de boîtes). Tableau 1 : Liste des médicaments antiallergiques Abdellah EL HAYATE Page

Rapport de stage

Rapport de stage Afin d’étudier la relation entre la concentration pollinique aérienne et le risque de

Afin d’étudier la relation entre la concentration pollinique aérienne et le risque de RCA, le choix a été fait de construire un indicateur très spécifique de cette pathologie. Un cas de RCA a été défini selon les critères d’âge et de traitement suivants :

- les sujets identifiés devaient avoir plus de 5 ans, le diagnostic de pollinose étant rare et difficile à faire avant cet âge.

- un cas était un sujet ayant bénéficié, un jour donné, d’une délivrance en pharmacie comportant un traitement par antihistaminiques per os associé soit à un traitement local pour rhinite allergique soit à un traitement pour conjonctivite allergique, soit aux deux.

L’indicateur sanitaire a été construit en agrégeant chaque jour le nombre de cas de RCA et en considérant la population étudiée dans son ensemble (5 ans ou plus) et par classe d’âge (5-

14 ans, 15-44 ans, 45-64 ans et 65 ans et plus).

6. Données d’exposition

Le RNSA [3] est une association loi 1901 qui gère un réseau de 50 capteurs de pollens répartis sur l’ensemble du territoire français. Les capteurs sont de type volumétrique permettant un comptage journalier des différents pollens recueillis.

En 1995, le RNSA avait fait l’objet d’une évaluation scientifique par le Réseau national de santé publique (RNSP) ayant conclu que le RNSA constituait un système environnemental performant de recueil et d’analyse des pollens atmosphériques. En particulier, un dispositif de formation initiale et des procédures d’assurance qualité garantissent la qualité des données recueillies.

À Clermont-Ferrand, il existe un seul capteur situé sur le toit de l’hôpital Montpied, à 30 m de hauteur. L’analyse des prélèvements réalisés sur ce capteur est prise en charge par l’équipe technique d’Atmo Auvergne.

prise en charge par l’équipe technique d’Atmo Auvergne. Pollens étudiés 11 pollens allergisants significativement

Pollens étudiés

11 pollens allergisants significativement impliqués dans les allergies respiratoires à Clermont-Ferrand (8 pollens d’arbres et 3 d’herbacées) ainsi qu’un pollen non allergisant, le pollen de pin, pris comme témoin (tableau 3) ont été étudiés.

Les pollens observés sont tous issus de plantes anémophiles strictes sauf le saule qui est anémophile et entomophile (tableau 3). Leur diamètre est le plus souvent compris entre 20 et

30 µm.

Deux indices sont utilisés pour caractériser le niveau d’allergénicité des pollens:

- l’index d’allergénicité, mesuré à partir de la fréquence de sensibilisation de la population générale à chaque pollen, celle-ci étant estimée à partir d’études épidémiologiques : il varie entre 1 (fort) et 4 (exceptionnel).

à pa rtir d’études épidémiologiques : il varie entre 1 (fort) et 4 (exceptionnel). Abdellah EL
à pa rtir d’études épidémiologiques : il varie entre 1 (fort) et 4 (exceptionnel). Abdellah EL

Rapport de stage

Rapport de stage - le “potentiel allergisant” qu i mesure la capacité de chaque pollen à

- le “potentiel allergisant” qui mesure la capacité de chaque pollen à engendrer une réaction allergique : il varie entre 0 (nul) et 5 (très fort).

Les pollens étudiés ici permettent, dans la grande majorité des cas, d’identifier une famille de plantes et non une espèce (une exception cependant pour le noisetier puisqu’il n’en existe qu’une seule espèce en Europe). Or le niveau d’allergénicité de différentes plantes d’une même famille peut varier de façon assez importante, comme c’est le cas par exemple de la famille des cyprès où le pollen identifié peut correspondre au cyprès commun (Cupressus sempervirens) (index d’allergénicité fort), le genévrier commun (Juniperus communis) (index d’allergénicité moyen) et les thuyas (Thuya occidentalis) (index d’allergénicité rare).

huyas (Thuya occidentalis) (index d’allergénicité rare). Tableau 2 : caractéristiques des pollens étudiés

Tableau 2 : caractéristiques des pollens étudiés

rare). Tableau 2 : caractéristiques des pollens étudiés Cofacteurs Les moyennes journalières relatives à l’ozone

Cofacteurs

Les moyennes journalières relatives à l’ozone ont été fournies par la station urbaine du centre ville de Clermont-Ferrand (Source : ATMO Auvergne).

Les données météorologiques suivantes ont été fournies par la station Météo France d’Aulnat, qui se situe à 5 kms à l’est de Clermont-Ferrand : température maximale journalière, humidité relative minimale journalière, quantité de précipitations en millimètres par jour.

relative minimale journalière, quantité de précipitations en millimètres par jour. Abdellah EL HAYATE Page 12
relative minimale journalière, quantité de précipitations en millimètres par jour. Abdellah EL HAYATE Page 12

Rapport de stage

Rapport de stage III. Méthodes statistiques Pour cette étude, je me suis basé sur l’analyse des

III. Méthodes statistiques

Pour cette étude, je me suis basé sur l’analyse des séries temporelles. Elle consiste à étudier l’association entre les variations temporelles d’un nombre d’événements de santé avec les variations temporelles du niveau d’indicateurs environnementaux sur la même période et pour le même pas de temps. Cette approche a été largement utilisée dans le domaine de la pollution atmosphérique et ses effets sur la santé.

Les études épidémiologiques temporelles reposent sur des données agrégées par unité de temps, tant pour la mesure de l’exposition que pour la mesure de l’état de santé. L’indicateur d’exposition caractérise l’exposition de la population dans son ensemble. L’indicateur de santé caractérise un groupe de personnes, la population d’une zone urbaine, par exemple.

Dans notre étude, l’indicateur d’exposition aux pollens est agrégé et reflète l’exposition journalière de la population de l’agglomération clermontoise au contenu pollinique de l’air ambiant. L’indicateur sanitaire est également agrégé et représente le nombre journalier de cas de RCA dans la population étudiée.

Les modèles de régression pour données non gaussiennes (ne suivant pas une loi normale) ont été étudiés pendant de nombreuses années. Ce n’est qu’en 1972 que Nelder et Wedderburn ont unifié ce type de modèles dans un cadre plus général, celui des modèles linéaires généralisés (GLM) [4]. Ces derniers regroupent dans un même cadre synthétique des modèles de régression pour réponses discrètes et continues permettant de faciliter leur analyse par des méthodes communes, qu’il s’agisse de régression linéaire classique pour données continues, de régression logistique pour données binaires ou de régression de Poisson pour données de comptage.

Une hypothèse de base des GLM qui permet l’établissement de résultats asymptotiques est l’indépendance des observations. Cette hypothèse est très restrictive dans les séries temporelles où les observations, successives dans le temps, sont souvent corrélées entre elles (autocorrélation de la série). Le contrôle de cette autocorrélation est nécessaire pour effectuer des inférences statistiques correctes sur les paramètres d’intérêt. Comme elle est le plus souvent le résultat de facteurs externes influençant le phénomène étudié, le contrôle de ces facteurs permet généralement de la réduire considérablement.

Les GLM partagent un certain nombre de caractéristiques, dont la linéarité. En effet, les variables explicatives interviennent linéairement dans le prédicteur. En général, la forme de la relation entre la variable à expliquer et les variables explicatives est fixée a priori de façon paramétrique. L’espérance µ = E[Y] est liée par l’intermédiaire de la fonction de lien g à une combinaison linéaire (le prédicteur) des variables explicatives, , …, , représentant les

des variables explicatives, , …, , représentant les facteurs de confusion et de la variable explicative
des variables explicatives, , …, , représentant les facteurs de confusion et de la variable explicative

facteurs de confusion et de la variable explicative d’intérêt, , qui représente dans notre

étude l’indicateur d’exposition au pollen :

d’intérêt, , qui représente dans notre étude l’indicateur d’exposition au pollen : Abdellah EL HAYATE Page
d’intérêt, , qui représente dans notre étude l’indicateur d’exposition au pollen : Abdellah EL HAYATE Page
d’intérêt, , qui représente dans notre étude l’indicateur d’exposition au pollen : Abdellah EL HAYATE Page
d’intérêt, , qui représente dans notre étude l’indicateur d’exposition au pollen : Abdellah EL HAYATE Page

Rapport de stage

Rapport de stage Y est la variable à expliquer et représente l’indica teur sanitaire. Sa distribution

Y est la variable à expliquer et représente l’indicateur sanitaire. Sa distribution est

supposée appartenir à la famille exponentielle. Les , j = 0, …, p + 1 sont des paramètres à

estimer.

Les , j = 0, …, p + 1 sont des paramètres à estimer. Pour le

Pour le traitement statistique on a utilisé une extension non paramétrique des GLM. Il s’agit des modèles additifs généralisés (GAM) [5] qui diffèrent des GLM par le fait que la forme de la réponse à chaque variable explicative dépend directement des données, par l’intermédiaire d’une fonction non paramétrique, au lieu de dépendre d’un modèle a priori. La flexibilité des GAM est particulièrement intéressante dans notre étude du fait de la variété des formes de réponses pouvant exister entre l’indicateur sanitaire d’une part, l’indicateur d’exposition et les facteurs de confusion, d’autre part.

Dans un GAM, les termes linéaires sont donc remplacés par des fonctions non paramétriques de lissage décrivant la relation entre une fonction de la moyenne de la

la relation entre une fonction de la moyenne de la variable à expliquer, g(µ), et la
la relation entre une fonction de la moyenne de la variable à expliquer, g(µ), et la

variable à expliquer, g(µ), et la j-ième variable explicative :

à expliquer, g(µ), et la j-ième variable explicative : Les GAM permettent, en particulier, de tester

Les GAM permettent, en particulier, de tester statistiquement si la relation entre l’indicateur sanitaire et la variable explicative d’intérêt, , est significativement différente

d’intérêt, , est significativement différente d’une relation linéaire et de visualiser graphiquement la

d’une relation linéaire et de visualiser graphiquement la forme de cette relation. Lorsque celle-ci est linéaire, le modèle (2) peut être écrit :

celle-ci est linéaire, le modèle (2) peut être écrit : Ce modèle, tel qu’implémenté sous le

Ce modèle, tel qu’implémenté sous le logiciel R, peut cependant surestimer l’effet de la

variable explicative d’intérêt (l’exposition au pollen, ) et sous-estimer l’incertitude (la

variance) de cette variable.

estimer l’incertitude (la variance) de cette variable. Une alternative consiste à utiliser un GLM pénalisé,
estimer l’incertitude (la variance) de cette variable. Une alternative consiste à utiliser un GLM pénalisé,

Une alternative consiste à utiliser un GLM pénalisé, i.e., représenter les par des

utiliser un GLM pénalisé, i.e., représenter les par des fonctions de lissage par régression spline cubique

fonctions de lissage par régression spline cubique pénalisée [6]. Dans ce cas, les fonctions ,

j = 1, …, p sont remplacées par un ensemble de fonctions de base splines cubiques. Chacune de ces fonctions est associée à un terme de pénalité qui assure par l’intermédiaire d’un paramètre de lissage un certain degré de courbure dans l’estimation des fonctions . Ce

degré de courbure dans l’estimation des fonctions . Ce paramètre de lissage représente l’import ance relative

paramètre de lissage représente l’importance relative de la contrainte de courbure par rapport au critère d’adéquation aux données. Des valeurs élevées du paramètre de lissage donnent plus de poids au terme de pénalité et produisent des courbes lisses, tandis que des valeurs faibles produisent des courbes bruitées. C’est ce dernier modèle qui a été utilisé pour estimer les risques relatifs de RCA associés à l’exposition aux pollens.

utilisé pour estimer les risques relatifs de RCA associés à l’exposition aux pollens. Abdellah EL HAYATE
utilisé pour estimer les risques relatifs de RCA associés à l’exposition aux pollens. Abdellah EL HAYATE

Rapport de stage

Rapport de stage Modélisation de la relation concentration pollinique-risque de RCA Dans cette étude, l’indicateur
Rapport de stage Modélisation de la relation concentration pollinique-risque de RCA Dans cette étude, l’indicateur

Modélisation de la relation concentration pollinique-risque de RCA

Dans cette étude, l’indicateur sanitaire correspond à des comptes journaliers de cas de RCA dans la population de l’agglomération clermontoise. Ce type de données, qui prend des valeurs entières positives, est classiquement modélisé sous l’hypothèse d’une distribution de Poisson de loi de probabilité :

d’une distribution de Poisson de loi de probabilité : où est le nombre attendu de cas

distribution de Poisson de loi de probabilité : où est le nombre attendu de cas de

est le nombre attendu de cas de RCA au jour t et k = 0, 1, 2,…

Les comptes journaliers de RCA peuvent être influencés par différents facteurs exogènes tels que les variations saisonnières, les conditions météorologiques, la pollution atmosphérique, le contenu pollinique de l’air, etc. Le nombre attendu de délivrances de médicaments peut alors être exprimé par :

délivrances de médicaments peut alors être exprimé par : où β décrit l’augmentation du logarithme du

où β décrit l’augmentation du logarithme du risque relatif de RCA par unité d’accroissement de la concentration pollinique aérienne. Les fonctions sont des fonctions

pollinique aérienne. Les fonctions sont des fonctions de lissage par régression spline cubique pénalisée

de lissage par régression spline cubique pénalisée associées aux différents facteurs de confusion étudiés (tendance, température, humidité relative, précipitations, pollution atmosphérique).

Les équations (4) et (5) sont les parties respectivement aléatoire et systématique du modèle (3) avec comme distribution, la distribution de Poisson, et comme fonction de lien, la fonction logarithmique. Dans ce cas (distribution de Poisson), la variance est égale à la moyenne.

L’étude de la relation à court terme entre la concentration pollinique dans l’air ambiant et le nombre journalier de RCA présente certaines difficultés liées principalement au contrôle des facteurs de confusion. En effet, ces séries journalières présentent souvent des tendances à long terme, des variations saisonnières, des variations hebdomadaires, etc. D’autres facteurs interviennent à plus court terme comme facteurs de confusion, notamment la température, l’humidité relative, les précipitations ou la pollution atmosphérique. Ces facteur temporels et environnementaux peuvent interférer dans la relation entre les variations journalières du nombre de grains de pollens et celles de RCA et doivent donc être pris en compte dans l’analyse. Il s’agit donc de construire des modèles qui permettent d’estimer le risque de RCA lié à l’exposition journalière aux pollens indépendamment de ces facteurs de confusion.

Le modèle final a été estimé en utilisant la procédure GAM implémentée dans le programme MGCV du logiciel R [7]. L’analyse a été réalisée en considérant la population d’étude dans son ensemble puis par classe d’âge (5-14, 15-44, 45-64 et 65 ans et plus).

dans son ensemble puis par classe d’âge (5 -14, 15-44, 45-64 et 65 ans et plus).
dans son ensemble puis par classe d’âge (5 -14, 15-44, 45-64 et 65 ans et plus).

Rapport de stage

Rapport de stage IV. Applications et résultats Afin de réaliser les objectifs de cette étude, mon

IV. Applications et résultats

Afin de réaliser les objectifs de cette étude, mon travail a consisté d’abord à collecter les données nécessaires pour l’étude. Il fallait dans un premier temps récupérer les données concernant la consommation des médicaments auprès de la CnamTS, et calculer pour chaque année les cas de rhino-conjonctive allergique pour tous les âges et ensuite par classe d’âges, et consolider après cet indicateur sanitaire avec les facteurs de confusions météorologiques (température maximale, humidité minimale, précipitation) et de pollution atmosphérique (ozone).

J’ai ensuite effectué des analyses descriptives pour tous les facteurs de l’étude pour voir la distribution de chacun d’eux et pour observer les possibilités de relations qui peuvent ressortir à partir de cette étude.

L’analyse statistique sera basée sur les modèles additifs généralisés, qui vont nous servir à calculer les risques relatifs représentant l’association à court terme entre l’exposition aux pollens et le risque de RCA.

Enfin, j’ai effectué le même travail pour les moisissures représentées par l’Alternaria sur deux saisons (2008-2009)

1. Analyse descriptive

Les statistiques descriptives de base : les minimum, maximum, moyennes, quartiles s’obtiennent avec la commande :

Summary(nom.variable)

Cette commande produit, comme son nom l’indique, un résumé des propriétés de l’objet auquel elle s’applique. Si cet objet est une variable, summary donne les caractéristiques principales de cette variable. Si c’est un modèle, elle donne un ensemble d’informations relatives aux paramètres du modèle.

1.1 Indicateur d’exposition aux pollens

Le graphe 1 présente le nombre de cas de RCA pour les années 2003 et 2004 à Clermont- Ferrand. On constate que le nombre de RCA atteint son maximum au mois de juin concomitamment avec une pollinisation importante.

de RCA atteint son maximum au mois de juin concomitamment avec une pollinisation importante. Abdellah EL
de RCA atteint son maximum au mois de juin concomitamment avec une pollinisation importante. Abdellah EL

Rapport de stage

Rapport de stage Graphe 1 : Nombre de cas RCA Le tableau 3 décrit le nombre
Rapport de stage Graphe 1 : Nombre de cas RCA Le tableau 3 décrit le nombre

Graphe 1 : Nombre de cas RCA

Le tableau 3 décrit le nombre de cas de RCA pour chaque classe d’âge pour les années 2003 et 2004 à Clermont-Ferrand, on voit que la consommation des médicaments antiallergiques est plus fréquente pour la classe d’âge de 15 à 44 ans.

Classe d'âge

   

1 er quartile

 

3 ème quartile

 
 

(ans)

Période étudié (jours)

Moyenne

Médiane

Maximum

Tous âges

731

18,83

7

13

25

188

5 à 14

731

4,90

2

3

7

37

15

à 44

731

12,80

5

9

17

110

45

à 64

731

6,60

4

6

9

33

65

et plus

731

4,50

3

4

6

11

Tableau 3 : Distribution du nombre journalier de cas de RCA par classe d’âge

La concentration moyenne de grains de pollens était variable d’un pollen à l’autre (tableau 4) avec une moyenne journalière d’au moins 8 grains/m 3 pour le plantain, le platane et le saule et d’au plus 50 grains/m 3 pour les graminées, bouleau, chêne, et frêne.

Pollen

Période de pollinisation (jours)

Moyenne

1 er quartile

Médiane

3 ème quartile

Maximum

Armoise

48

3

1

2

4

12

Plantain

261

7

2

3

5

18

Graminées

325

50

2

9

32

580

Platane

66

7

2

4

10

23

Chêne

137

58

2

10

55

480

Saule

111

6

1

3

7

68

Bouleau

152

84

2

18

91

503

frêne

142

63

3

11

31

462

Aulne

121

15

1

3

11

209

Cupressacées

306

28

1

5

27

389

Noisetier

104

30

1

3

20

295

Tableau 4 : Distribution du nombre journalier de grains de pollens par

1 3 20 295 Tableau 4 : Distribution du nombre journalier de grains de pollens par
1 3 20 295 Tableau 4 : Distribution du nombre journalier de grains de pollens par
1 3 20 295 Tableau 4 : Distribution du nombre journalier de grains de pollens par

Abdellah EL HAYATE

Page 17

Rapport de stage

Rapport de stage 1.2 Facteurs de confusion La distribution des facteurs météorologiques étudiés est présentée dans

1.2 Facteurs de confusion

La distribution des facteurs météorologiques étudiés est présentée dans le tableau 5. La température maximale moyenne était de 17,3 °C, l’humidité relative était en moyenne de 49 % et les précipitations moyennes journalières étaient de 1.5 mm sur la période 2003-2004. Les variations journalières des variables météorologiques sont représentées sur la figure 4. Concernant l’indicateur de pollution atmosphérique, l’ozone a été choisi, ce polluant se développant particulièrement au printemps et en été (saison de la pollinisation).

 

Période

moyenne

minimum

1 er quartile

Médiane

3 e quartile

Maximum

Température maximale(°C)

731

17,3

-5

11

17

24

39

Humidité relative(%)

731

49,0

10

36

48

61

97

Précipitation(mm)

731

1,5

0

0

0

1

39

Tableau 5 : Distribution journalière des facteurs météorologiques

5 : Distribution journalière des facteurs météorologiques Graphe 2 : Précipitation Ce graphique décrit les

Graphe 2 : Précipitation

Ce graphique décrit les quantités de précipitations (en mm) à Clermont-Ferrand pour les deux années 2003-2004. On remarque que cette quantité est très faible dans les périodes de pollinisation.

On remarque que cette quantité est très faible dans les périodes de pollinisation. Abdellah EL HAYATE
On remarque que cette quantité est très faible dans les périodes de pollinisation. Abdellah EL HAYATE

Rapport de stage

Rapport de stage Graphe 3 : Température maximale Ce graphique donne la courbe des températures maximales.
Rapport de stage Graphe 3 : Température maximale Ce graphique donne la courbe des températures maximales.

Graphe 3 : Température maximale

Ce graphique donne la courbe des températures maximales. On constate qu’il a la même allure que celui des cas de RCA ce qui montre la relation entre l’augmentation de la température et le risque de RCA.

l’augmentation de la température et le risque de RCA. Graphe 4 : Humidité relative Ce graphique

Graphe 4 : Humidité relative

Ce graphique décrit l’humidité relative en (%) pour les deux années 2003 et 2004. On remarque que quand l’humidité relative est faible, les cas de RCA augmentent.

Concernant l’indicateur de pollution atmosphérique, la concentration moyenne de l’ozone atteint 71.2 µg/m 3 . On notera que les niveaux d’ozone sont les plus élevés entre avril et septembre, c’est-à-dire pendant la plus grande partie de la saison pollinique (tableau 7 et graphe 5).

 

Période

moyenne

minimum

1 er quartile

Médiane

3 e quartile

Maximum

Ozone

731

71,2

3

52

70

87

153

Tableau 6 : Distribution journalière d’Ozone par µg/m3

3 52 70 87 153 Tableau 6 : Distribution journalière d’Ozone par µg/m3 Abdellah EL HAYATE
3 52 70 87 153 Tableau 6 : Distribution journalière d’Ozone par µg/m3 Abdellah EL HAYATE

Rapport de stage

Rapport de stage Graphe 5 : Ozone 1.3 Modélisation L’étude de la relation à court terme
Rapport de stage Graphe 5 : Ozone 1.3 Modélisation L’étude de la relation à court terme

Graphe 5 : Ozone

1.3

Modélisation

L’étude de la relation à court terme entre la concentration pollinique dans l’air ambiant et le nombre journalier de RCA présente certaines difficultés liées principalement au contrôle des facteurs de confusion. En effet, ces séries journalières présentent souvent des tendances à long terme, des variations saisonnières, des variations hebdomadaires, etc. D’autres facteurs interviennent à plus court terme comme facteurs de confusion, notamment la température, l’humidité relative, les précipitations ou la pollution atmosphérique. Ces facteurs temporels et environnementaux peuvent interférer dans la relation entre les variations journalières du nombre de grains de pollens et celles de RCA et doivent donc être pris en compte dans l’analyse. Il s’agit donc de construire des modèles qui permettent d’estimer le risque de RCA lié à l’exposition journalière aux pollens indépendamment de ces facteurs de confusion.

Pour gérer cette problématique, de nouvelles variables ont été créées :

Une variable tendance

Nom.data.frame$trend_c(1 :T)

Cette commande crée un vecteur qu’on dénomme « trend » (de longueur T) contenant les nombres de 1 à T.

Une variable jour de la semaine

Nom.var.weekdays(nom.vecteur.date)

Une variable mois de l’année

 Une variable mois de l’année Nom.var_month(nom.vecteur.date) Abdellah EL HAYATE
 Une variable mois de l’année Nom.var_month(nom.vecteur.date) Abdellah EL HAYATE
 Une variable mois de l’année Nom.var_month(nom.vecteur.date) Abdellah EL HAYATE

Rapport de stage

Rapport de stage  Une variable saison Mois=as.numeric(months(nom.vecteur.date))

Une variable saison

Mois=as.numeric(months(nom.vecteur.date))

Nom.vecteur.saison=mois>numero.mois1&mois<numero.mois2

la première instruction fabrique un vecteur mois numérique, composé de nombres compris entre 1 et 12, la valeur 1 correspondant à janvier, la valeur 2 à février, etc. la deuxième instruction fabrique un vecteur avec des T (true) et des F (false) selon que le numéro du mois est compris strictement entre 3 et 10 (par exemple pour l’été) ou non.

entre 3 et 10 (par exemple pour l’été) ou non. Ecriture du modèle L’écriture du modèle

Ecriture du modèle

L’écriture du modèle est, en général du type :

nom.modèle_type.modèle(écriture.du.modèle, loi.de.probabilité, données,conditions)

Les variables expliquées et explicatives sont de tous types : variables réelles, catégorielles, etc. Elles se présentent sous forme non transformée ou sous forme d’une fonction (logarithme, polynomiale, exponentielle et autres fonctions paramétriques ou non paramétriques).

Le modèle peut être un modèle lm, glm, gam, etc.

La loi de distribution peut être : la loi binomiale ( binomial ), la loi normale ( gaussian ), la loi gamma ( Gamma ), la loi normale inverse ( inverse.gaussian ), la loi de poisson ( pois son ), la famille de lois dépendant d’une quasi-vraisemblance ( quasi ).

Notre modèle contiendra alors les variables suivantes :

la tendance et la saisonnalité = s(trend) ce qui permet d'enlever l'effet saison et

tendance : trend=1,2,3,

T=longueur série

semaine = jour de la semaine = variable catégorielle avec 7 jours

j.feries =1 ou 0 selon qu'on soit en jour férié ou non

ete, fevrier,noel, pac et toussaint sont les vacances = 1 ou 0 selon que l'on soit en

vacances ou non.

ozone pour prendre en compte l'effet de l'ozone

température maximale

humidité relative

précipitations

pollen

Et le modèle gam s’écrira de la manière suivante :

Et le modèle gam s’écrira de la manière suivante :
Et le modèle gam s’écrira de la manière suivante :
Et le modèle gam s’écrira de la manière suivante :

Rapport de stage

Rapport de stage Résumés des modèles La commande summary que nous connaissons déjà, lorsqu’elle est appliquée
Rapport de stage Résumés des modèles La commande summary que nous connaissons déjà, lorsqu’elle est appliquée

Résumés des modèles

La commande summary que nous connaissons déjà, lorsqu’elle est appliquée à un modèle, donne un résumé des caractéristiques de ce modèle. Elle peut être utilisée à tout moment mais, en fin de modélisation, elle permet de fournir l’estimation des coefficients de la régression ainsi que leur intervalle de confiance.

Il y a deux types de summary qu’on utilise souvent en modélisation. Il s’agit des deux commandes summary.glm et summary.gam.

Summary.glm(mod.fit)

La sortie de cette commande (figue 3) est classique : valeurs de dispersions des estimateurs des coefficients de la régression, significativité, coefficient de dispersion, déviance, déviance résiduelle, corrélations etc. :

déviance, déviance résiduelle, corrélations etc. : Pour le second type : Figure 3 Summary.gam(mod.profit)

Pour le second type :

Figure 3

Summary.gam(mod.profit)

résiduelle, corrélations etc. : Pour le second type : Figure 3 Summary.gam(mod.profit) Abdellah EL HAYATE Page
résiduelle, corrélations etc. : Pour le second type : Figure 3 Summary.gam(mod.profit) Abdellah EL HAYATE Page

Rapport de stage

Rapport de stage Figure 4 Ici, outre les déviances et le paramètre de dispersion, la sortie
Rapport de stage Figure 4 Ici, outre les déviances et le paramètre de dispersion, la sortie

Figure 4

Ici, outre les déviances et le paramètre de dispersion, la sortie comporte un ensemble de résultats concernant les variables explicatives sous forme non paramétriques. Ainsi, la probabilité Pr(F) représente la significativité de la dimension non linéaire du coefficient : si le résultat est significatif, cela veut dire que la part non linéaire n’est pas négligeable et tenir compte que de la composante linéaire n’est pas suffisant.

Pour obtenir le risque relatif on applique la commande suivante :

Exp(coef(mod.fit))

2. Résultats

2.1

Pollens

Pour voir l’association entre le risque de RCA et l’exposition aux pollens, on va étudier le risque relatif pour un accroissement interquartile des niveaux de pollens. On a utilisé les intervalles interquartiles pour avoir une bonne mesure de la dispersion des données d'une variable. Par exemple, quand la concentration pollinique aérienne de graminées augmentait de

Par exemple, quand la concentration pollinique aérienne de graminées augmentait de Abdellah EL HAYATE Page 23
Par exemple, quand la concentration pollinique aérienne de graminées augmentait de Abdellah EL HAYATE Page 23

Rapport de stage

Rapport de stage 30 grains/m 3 , le nombre de cas de RCA (tous âges confondus)

30 grains/m 3 , le nombre de cas de RCA (tous âges confondus) augmentait de 5 % (RR = 1,05

[1,03-1,07]).

 

Intervalle interquartile

Risque relatif

IC 95%

Armoise

3

0,96

[0,95-1,00]

Plantain

3

1,01

[0,98-1,03]*

Graminées

30

1,05

[1,03-1,07]*

Platane

8

1,06

[1,01-1,09]*

Chêne

53

1,01

[1,00-1,03]*

Saule

6

1,00

[0,98-1,02]

Bouleau

89

1,07

[1,05-1,10]*

Frêne

28

1,08

[1,04-1,11]*

Aulne

10

0,99

[0,95-1,02]

Cyprès

26

1,01

[1,00-1,03]*

Noisetier

18

1,04

[1,00-1,07]*

Tableau 7 : Risques relatifs RCA tous âges

D’après le tableau 8, on constate qu’en général les relations exposition-risque étaient positives (RR supérieurs à 1) pour tous les pollens sauf les pollens d’aulne et de pin (pour ce dernier, ce résultat était attendu). L’association était statistiquement significative pour les graminées, le platane, le chêne, le bouleau, le frêne, le cyprès, et le noisetier : le risque relatif variait entre 1,01 (cyprès et chêne) et 1,08 (frêne).

De la même manière, en étudiant cette relation pour chacune des classes d’âge (tableau 9), on trouve les résultats suivants :

 

5-14 ans

15-44 ans

45-65ans

65ans et plus

 

Intervalle

Risque

 

Risque

 

Risque

 

Risque

 

interquartile

relatif

IC 95%

relatif

IC 95%

relatif

IC 95%

relatif

IC 95%

Armoise

3

1,04

[0,94-1,15]

1,02

[0,94-1,12]

1,06

[0,97-1,13]

0,97

[0,94-1,01]

Plantain

3

1,08

[1,02-1,14]*

0,99

[0,97-1,04]

1,07

[1,01-1,13]*

1,04

[1,01-1,08]*

Graminées

30

1,06

[1,03-1,09]*

1,07

[1,04-1,10]*

1,04

[1,02-1,06]*

1,06

[1,04-1,08]*

Platane

8

1,02

[0,98-1,05]

1,03

[0,98-1,06]

1,07

[1,00-1,16]*

1,02

[0,96-1,10]

Chêne

53

1,10

[1,06-1,20]*

1,06

[1,01-1,13]*

1,05

[1,01-1,11]*

1,03

[1,00-1,07]

Saule

6

1,01

[0,98-1,07]

1,02

[1,00-1,07]*

1,03

[0,97-1,12]

1,00

[0,93-1,11]

Bouleau

89

1,07

[1,01-1,15]

1,10

[1,05-1,16]*

1,07

[1,02-1,11]*

1,06

[0,99-1,12]

Frêne

28

1,08

[1,01-1,15]*

1,12

(1,08-1,17]*

1,07

[1,03-1,10]*

1,05

[1,04-1,10]*

Aulne

10

1,06

[0,96-1,14]

1,00

[0,90-1,10]

1,01

[0,96-1,06]

1,09

[1.02-1,16]*

Cyprès

26

1,02

[0.98-1,06]

1,01

[1,00-1,03]*

1,01

[1,00-1,05]*

1,07

[1,01-1,18]*

Noisetier

18

0,98

[0,94-1,03]

1,04

[0,98-1,07]

1,03

[1,01-1,06]*

1,02

[0,98-1,06]

Tableau 8 : Risques relatifs RCA par classe d’âge

[1,01-1,06]* 1,02 [0,98-1,06] Tableau 8 : Risques relatifs RCA par classe d’âge Abdellah EL HAYATE Page
[1,01-1,06]* 1,02 [0,98-1,06] Tableau 8 : Risques relatifs RCA par classe d’âge Abdellah EL HAYATE Page

Rapport de stage

Rapport de stage Chez les 5-14 ans, le risque relatif de RCA était supérieur à 1

Chez les 5-14 ans, le risque relatif de RCA était supérieur à 1 pour tous les pollens d’arbres allergisants (bouleau, cyprès, chêne, platane, frêne, saule, aulne) sauf le noisetier et variait entre 1,01 (saule) et 1,10 (chêne). Il n’était cependant statistiquement significatif que pour le bouleau, le chêne et le frêne. Pour les herbacées, le risque relatif variait entre 1,04 (armoise) et 1,08 (plantain) et n’était statistiquement significatif que pour les graminées et le plantain.

Chez les 15-44 ans, le risque relatif était positif pour tous les pollens d’arbres allergisants, et variait entre 1,00 (aulne) et 1,12 (frêne). Il était statistiquement significatif pour le bouleau, le cyprès, le chêne, le frêne et le saule. Pour les herbacées, le risque relatif n’était positif que pour les graminées et l’armoise mais ne restait statistiquement significatif que pour les graminées.

Chez les 45-64 ans, le risque relatif était positif pour tous les pollens d’arbres allergisants sauf le saule et l’aulne et variait entre 1,01 (cyprès, aulne) et 1,07 (frêne). Il était statistiquement significatif pour tous sauf le saule et l’aulne. Pour les herbacées, le risque relatif était positif et statistiquement significatif pour les graminées et le plantain.

Concernant les 65 ans et plus, le risque relatif était positif pour tous les pollens d’arbres allergisants variant entre 1,00 (saule) et 1,09 (aulne). Il était statistiquement significatif pour le cyprès, le chêne, l’aulne, et le frêne. Pour les herbacées, le risque relatif n’était positif et statistiquement significatif que pour les graminées (1,06) et le plantain (1,04).

Afin de voir l’évolution de cette relation au cours du temps, en suivant la même démarche faite pour les deux années 2003-2004, j’ai effectué une analyse globale sur une longue période de l’année 2000 jusqu’à l’année 2009 en excluant l’année 2002 (en raison de l’absence de données). Cette analyse a donné les résultats suivants :

 

Intervalle interquartile

Risque relatif

IC 95%

Armoise

3

1,01

[0,97-1,10]

Plantain

3

1,02

[0,96-1,06]

Graminées

54

1,05

[1,03-1,06]*

Platane

8

1,06

[0,97-1,14]

Chêne

55

1,05

[1,01-1,09]*

Saule

6

1,06

[0,99-1,09]

Bouleau

58

1,08

[1,04-1,11]*

Frêne

35

1,10

[1,05-1,14]*

Aulne

29

0,99

[0,97-1,01]

Cyprès

19

1,02

[1,00-1,04]*

Noisetier

25

1,03

[1,00-1,06]*

Ambroisie

6

0.96

[0.92-0.99]

Tableau 9

Noisetier 25 1,03 [1,00-1,06]* Ambroisie 6 0.96 [0.92-0.99] Tableau 9 Abdellah EL HAYATE Page 25
Noisetier 25 1,03 [1,00-1,06]* Ambroisie 6 0.96 [0.92-0.99] Tableau 9 Abdellah EL HAYATE Page 25

Rapport de stage

Rapport de stage     5-14 ans 15-44 ans 45-64ans 65ans et plus   Intervalle Risque
   

5-14 ans

15-44 ans

45-64ans

65ans et plus

 

Intervalle

Risque

 

Risque

 

Risque

 

Risque

 

interquartile

relatif

IC 95%

relatif

IC 95%

relatif

IC 95%

relatif

IC 95%

Armoise

3

1,02

[0,98-1,06]

1,01

[0,96-1,06]

1,02

[0,97-1,07]

0,98

[0,92-1,04]

Plantain

3

1,07

[1,01-1,13]*

0,98

[0,94-1,02]

1,04

[0,99-1,09]

1,06

[1,01-1,11]*

Graminées

54

1,06

[1,02-1,09]*

1,05

[1,04-1,08]*

1,03

[1,01-1,05]*

1,07

[1,05-1,09]*

Platane

8

1,02

[0,97-1,07]

1,04

[0,98-1,11]

1,07

[1,00-1,14]*

1,02

[0,95-1,09]

Chêne

55

1,08

[1,02-1,14]*

1,06

[1,00-1,12]*

1,06

[1,01-1,11]

1,03

[1,00-1,06]*

Saule

6

1,05

[0,97-1,13]

1,07

[1,01-1,13]*

1,06

[1,00-1,12]*

1,04

[0,98-1,10]

Bouleau

58

1,06

[1,01-1,11]*

1,11

[1,06-1,16]*

1,07

[1,02-1,12]*

1,04

[0,97-1,11]

Frêne

35

1,08

[1,04-1,15]*

1,12

[1,07-1,17]*

1,05

[1,03-1,07]*

1,04

[1,01-1,07]*

Aulne

29

1,07

[0,97-1,17]

1,01

[0,96-1,06]

1,03

[0,98-1,08]

1,10

[1,03-1,17]*

Cyprès

19

1,03

[0,98-1,08]

1,04

[1,00-1,08]*

1,03

[1,00-1,07]

1,09

[1,03-1,15]

Noisetier

25

0,98

[0,95-1,02]

1,03

[0,97-1,09]

1,04

[1,01-1,07]*

1,02

[0,97-1,07]

Ambroisie

6

0,92

[0,87-0.98]

0.94

[0,89-1,99]

1.03

[0.98-1.08]

0.96

[0,92-1,00]

Tableau 10

Notre étude a montré une augmentation significative du risque de cas de RCA associée à une augmentation de la concentration pollinique des graminées, frêne, bouleau et noisetier (tableau 9 et 10), en tenant compte de la pollution atmosphérique et des facteurs météorologiques. Dans cette étude, la période de pollinisation des herbacés était associée à une augmentation significative de la consommation de médicaments antiallergiques.

les

connaissances épidémiologiques et cliniques disponibles sur les allergies, validant la démarche méthodologique adoptée :

Les

résultats

observés

dans

notre

étude

de

faisabilité

sont

cohérents

avec

Le sens de la relation observée, positive, quoique statistiquement significative uniquement pour 6 pollens, est cohérent avec le fait qu’il existe une relation causale entre l’exposition à des pollens allergisants et c le fait qu’il existe une relation causale entre l’exposition à des pollens allergisants et la survenue de symptômes allergiques dans une population sensibilisée.

Le profil de distribution des risques par classes d’âge observé pour le frêne, le bouleau, le noisetier de distribution des risques par classes d’âge observé pour le frêne, le bouleau, le noisetier et le cyprès est cohérent avec l’observation clinique :

Pour le bouleau, le chêne et le frêne, le profil observé (risque maximum pour la classe d’âge des 15-44 ans) correspond à la distribution classique de la fréquence des allergies respiratoires observées en clinique et en épidémiologie,

de la fréquence des allergies respiratoires observées en clinique et en épidémiologie, Abdellah EL HAYATE Page
de la fréquence des allergies respiratoires observées en clinique et en épidémiologie, Abdellah EL HAYATE Page

Rapport de stage

Rapport de stage  Le même constat peut être fait pour les pollens de cyprès où

Le même constat peut être fait pour les pollens de cyprès où le risque est maximal pour les plus âgés.

Pour les graminées, les associations étaient maximales pour les jeunes et les plus âgés. L’allergie aux graminées est tout à fait classique. Il est probable que les adultes connaissent parfaitement leur allergie et se traitent dès les beaux jours.

2.2

Moisissures

Concernant les moisissures, on a fait l’étude de l’Alternaria sur les années 2008-2009 à Clermont-Ferrand. Alternaria est une moisissure cosmopolite qui se développe dans la nature principalement sur les végétaux en décomposition, sur les foins, mais aussi à l’intérieur sur les produits alimentaires, les textiles, le sol ou les papiers peints. On la trouve principalement en été car elle est très résistante à la chaleur.

en été car elle est très résistante à la chaleur. Graphe 6 : la distribution d’Alternaria

Graphe 6 : la distribution d’Alternaria

 

Période

moyenne

minimum

1 er quartile

Médiane

3 e quartile

Maximum

Alternaria

233

115

20

40

80

140

580

Tableau 11 : Distribution journalière d’Alternaria

Le graphique 6 et le tableau 11 décrivent l’Alternaria. On constate que le nombre atteint son maximum aux mois de juillet et août et que la présence de cette moisissure prend fin début octobre.

Pour voir l’association entre le risque de RCA et l’exposition à l’Alternaria, on va suivre la même démarche qui a été menée pour les pollens, c'est-à-dire, en considérant les mêmes facteurs de confusion et le même modèle statistique.

en considérant les mêmes facteurs de confusion et le même modèle statistique. Abdellah EL HAYATE Page
en considérant les mêmes facteurs de confusion et le même modèle statistique. Abdellah EL HAYATE Page

Rapport de stage

Rapport de stage   Intervalle interquartile Risque relatif IC 95% Alternaria 100 0.97 [0.92-1.02]]
 

Intervalle interquartile

Risque relatif

IC 95%

Alternaria

100

0.97

[0.92-1.02]]

D’après la valeur du risque relatif (RR=0.97) on constate l’existence d’une relation négative entre l’Alternaria et la consommation des médicaments anti-allergiques.

négative entre l’ Alternaria et la consommation des médicaments anti-allergiques. Abdellah EL HAYATE Page 28
négative entre l’ Alternaria et la consommation des médicaments anti-allergiques. Abdellah EL HAYATE Page 28

Rapport de stage

Rapport de stage Conclusion L’ étude de faisabilité, réalisée à Clermont Ferrand, a permis de quantifier

Conclusion

L’étude de faisabilité, réalisée à Clermont Ferrand, a permis de quantifier la relation

exposition-risque pour certains pollens. Les résultats de l’analyse globale de 2000 jusqu’à

2009 a confirmé ce qui était trouvé dans les publications précédentes (2000 à 2004) avec des

nouvelles associations créées avec l’évolution temporelle. Globalement, elle a confirmé

l’augmentation significative de la consommation des médicaments antiallergiques liée à

l’exposition aux pollens de frêne, bouleau, graminées, et également a montré des associations

significatives pour le chêne, et dans une moindre mesure pour le noisetier et le cyprès.

Concernant les moisissures, les analyses indiquent une association négative entre la

consommation des médicaments antiallergiques et l’exposition à l’Alternaria. Pour cette

dernière, l’étude de faisabilité a été menée sur des séries de courte durée (deux saisons), il

serait opportun d’ajouter d’autres saisons afin d’avoir des résultats plus pertinents.

opportun d’ajouter d’autres saisons afin d’avo ir des résultats plus pertinents. Abdellah EL HAYATE Page 29
opportun d’ajouter d’autres saisons afin d’avo ir des résultats plus pertinents. Abdellah EL HAYATE Page 29

Rapport de stage

Bilan

Rapport de stage Bilan Au terme de ce stage, je peux dire que celui- ci m’a
Rapport de stage Bilan Au terme de ce stage, je peux dire que celui- ci m’a
Rapport de stage Bilan Au terme de ce stage, je peux dire que celui- ci m’a

Au terme de ce stage, je peux dire que celui-ci m’a été très bénéfique autant sur le plan professionnel que personnel.

En effet, mon rôle étant d’analyser les données, j’ai réellement pu utiliser et mettre en application mes connaissances sur les méthodes statistiques apprises au cours de mon cursus. Ce stage m’a permis aussi de connaitre de nouveaux modèles statistiques, notamment les modèles additifs généralisés.

De plus, j’ai amélioré mes compétences dans l’utilisation du logiciel R, celui-ci étant le logiciel principalement utilisé pour les analyses statistiques.

En plus d’avoir renforcé mes connaissances techniques, ce stage m’a notamment aidé à améliorer mon sens du relationnel. Ce stage m’a donc permis d’apprécier l’importance de la collaboration entre scientifiques de spécialités différentes mais complémentaires et de m’investir dans une étude dans le cadre de la recherche scientifique.

Ce fut pour moi une expérience très enrichissante aussi bien au niveau technique qu’au niveau relationnel.

expérience très enrichissante aussi bien au niveau technique qu’au niveau relationnel. Abdellah EL HAYATE Page 30
expérience très enrichissante aussi bien au niveau technique qu’au niveau relationnel. Abdellah EL HAYATE Page 30

Rapport de stage

Rapport de stage Références bibliographiques [1] Rapport annuel 2010 Atmo Auvergne [2] Short-term effect of

Références bibliographiques

[1] Rapport annuel 2010 Atmo Auvergne

[2]

Short-term

effect

of

pollen

exposure

on

antiallergic

drug

consumption.

Volume

99,Septembre, 2007

 

[3]

Site web RNSA: http://rnsa.asso.fr

 

[4] Generalized Linear Model

[5] GAM - Generalized Additive Models - avec R

[6] Lecadet J, Quénel P, Thibaudon M, Baris B, Caillaud D. La morbidité liée aux pollens peut-elle être estimée et surveillée à partir des données de l’Assurance maladie? Revue française d’allergologie et d’immunologie Clinique 2002;42:645-9.

[7]

[8] Wood S.N, Augustain N.H. GAMs with integrated model selection using penalized regression splines and applications to environmental modeling.

www.ruwpa.st-and.ac.uk/depm/Downloadables/wagam.pdf

applications to environmental modeling. www.ruwpa.st-and.ac.uk/depm/Downloadables/wagam.pdf Abdellah EL HAYATE Page 31
applications to environmental modeling. www.ruwpa.st-and.ac.uk/depm/Downloadables/wagam.pdf Abdellah EL HAYATE Page 31

Rapport de stage

Annexes

Rapport de stage Annexes Annexe 1 Distribution des concentrations polliniques aériennes journalières et comparaisons
Rapport de stage Annexes Annexe 1 Distribution des concentrations polliniques aériennes journalières et comparaisons
Rapport de stage Annexes Annexe 1 Distribution des concentrations polliniques aériennes journalières et comparaisons

Annexe 1

Distribution des concentrations polliniques aériennes journalières et comparaisons avec le nombre de cas journaliers de RCA, tous âges, 2003-2004

Annexe 2

Distribution des concentrations polliniques aériennes journalières et comparaisons avec le nombre de cas journaliers de RCA, tous âges, 2000-2008

Annexe 2

Risques relatifs tous âges

Annexe 3

Risques relatifs par classes d’âges

Annexe 2 Risques relatifs tous âges Annexe 3 Risques relatifs par classes d’âges Abdellah EL HAYATE
Annexe 2 Risques relatifs tous âges Annexe 3 Risques relatifs par classes d’âges Abdellah EL HAYATE

Rapport de stage

Rapport de stage Annexe 1 Distribution des concentrations polliniques aériennes journalières et comparaisons avec le

Annexe 1

Distribution des concentrations polliniques aériennes journalières et comparaisons avec le nombre de cas journaliers de RCA, tous âges, 2003-2004

journalières et comparaisons avec le nombre de cas journaliers de RCA, tous âges, 2003-2004 Abdellah EL
journalières et comparaisons avec le nombre de cas journaliers de RCA, tous âges, 2003-2004 Abdellah EL

Rapport de stage

Rapport de stage Abdellah EL HAYATE Page 34
Rapport de stage Abdellah EL HAYATE Page 34
Rapport de stage Abdellah EL HAYATE Page 34
Rapport de stage Abdellah EL HAYATE Page 34
Rapport de stage Abdellah EL HAYATE Page 34
Rapport de stage Abdellah EL HAYATE Page 34
Rapport de stage Abdellah EL HAYATE Page 34

Rapport de stage

Rapport de stage Abdellah EL HAYATE Page 35
Rapport de stage Abdellah EL HAYATE Page 35
Rapport de stage Abdellah EL HAYATE Page 35
Rapport de stage Abdellah EL HAYATE Page 35
Rapport de stage Abdellah EL HAYATE Page 35
Rapport de stage Abdellah EL HAYATE Page 35
Rapport de stage Abdellah EL HAYATE Page 35

Rapport de stage

Rapport de stage Annexe 2 Distribution des concentrations polliniques aériennes journalières et comparaisons avec le

Annexe 2

Distribution des concentrations polliniques aériennes journalières et comparaisons avec le nombre de cas journaliers de RCA, tous âges, 2000-2008

journalières et comparaisons avec le nombre de cas journaliers de RCA, tous âges, 2000-2008 Abdellah EL
journalières et comparaisons avec le nombre de cas journaliers de RCA, tous âges, 2000-2008 Abdellah EL

Rapport de stage

Rapport de stage Abdellah EL HAYATE Page 37
Rapport de stage Abdellah EL HAYATE Page 37
Rapport de stage Abdellah EL HAYATE Page 37
Rapport de stage Abdellah EL HAYATE Page 37
Rapport de stage Abdellah EL HAYATE Page 37
Rapport de stage Abdellah EL HAYATE Page 37
Rapport de stage Abdellah EL HAYATE Page 37

Rapport de stage

Rapport de stage Annexe 3 Risques relatifs tous âges Abdellah EL HAYATE Page 38

Annexe 3

Risques relatifs tous âges

Rapport de stage Annexe 3 Risques relatifs tous âges Abdellah EL HAYATE Page 38
Rapport de stage Annexe 3 Risques relatifs tous âges Abdellah EL HAYATE Page 38

Rapport de stage

Rapport de stage Tous âges 2005-2006   Intervalle interquartile Risque relatif IC 95% Armoise 3 0,98

Tous âges 2005-2006Rapport de stage   Intervalle interquartile Risque relatif IC 95% Armoise 3 0,98 [0,96-1,01]

 

Intervalle interquartile

Risque relatif

IC 95%

Armoise

3

0,98

[0,96-1,01]

Plantain

3

1,01

[1,00-1,04]*

Graminées

42

1,23

[1,12-1,28]*

Platane

5

1,03

[1,01-1,06]*

Chêne

52

1,06

[1,02-1,11]*

Saule

2

1,00

[0,99-1,02]

Bouleau

108

1,10

[1,03-1,17]*

Frêne

12

1,04

[1,00-1,08]*

Aulne

3

1,00

[0,98-1,04]

Cyprès

24

1,00

[0,99-1,05]

Noisetier

8

1,01

[0,98-1,06]

Tous âges 2007-2008[0,99-1,05] Noisetier 8 1,01 [0,98-1,06]   Intervalle interquartile Risque relatif IC 95%

 

Intervalle interquartile

Risque relatif

IC 95%

Armoise

5

0,99

[0,97-1,01]

Plantain

7

0,98

[0,96-1,03]

Graminées

43

1,07

[1,04-1,13]*

Platane

7

1,01

[1,00-1,04]*

Chêne

94

1,03

[1,00-1,09]*

Saule

7

0,97

[0,95-1,00]

Bouleau

38

1,04

[1,01-1,10]*

Frêne

33

1,08

[1,04-1,12]*

Aulne

59

1,03

[0,99-1,05]

Cyprès

15

1,02

[1,00-1,09]*

Noisetier

25

1,02

[1,00-1,04]*

Cyprès 15 1,02 [1,00-1,09]* Noisetier 25 1,02 [1,00-1,04]* Abdellah EL HAYATE Page 39
Cyprès 15 1,02 [1,00-1,09]* Noisetier 25 1,02 [1,00-1,04]* Abdellah EL HAYATE Page 39

Rapport de stage

Rapport de stage Annexe 4 Risques relatifs par classes d’âges Abdellah EL HAYATE Page 40

Annexe 4

Risques relatifs par classes d’âges

Rapport de stage Annexe 4 Risques relatifs par classes d’âges Abdellah EL HAYATE Page 40
Rapport de stage Annexe 4 Risques relatifs par classes d’âges Abdellah EL HAYATE Page 40

Rapport de stage

Rapport de stage Classes d’âge 2005 -2006   5-14 ans   15-44 ans   45-65ans 65ans

Classes d’âge 2005-2006 -2006

 

5-14 ans

 

15-44 ans

 

45-65ans

65ans et plus

 

Intervalle

Risque

 

Risque

 

Risque

 

Risque

 

interquartile

relatif

IC 95%

relatif

IC 95%

relatif

IC 95%

relatif

IC 95%

Armoise

3

0,92

[0,88-0,99]

0,94

[0,92-1,01]

0,95

[0,90-1,00]

0,95

[0,90-1,00]

Plantain

3

1,08

[1,01-1,17]*

1,02

[0,97-1,09]

1,05

[1,01-1,10]*

1,01

[0,93-1,10]

Graminées

42

1,03

[1,00-1,07]*

1,13

[1,02-1,24]*

1,03

[0,98-1,09]

1,02

[1,00-1,05]*

Platane

5

1,18

[1,10-1,28]*

1,03

[1,00-1,06]*

1,30

[1,18-1,42]*

1,18

[1,04-1,25]*

Chêne

52

1,02

[1,00-1,05]*

1,03

[1,01-1,05]*

1,01

[0,97-1,06]

1,01

[0,96-1,07]

Saule

2

0,99

[0,95-1,04]

1,01

[0,96-1,08]

1,06

[1,01-1,10]*

1,05

[1,01-1,11]*

Bouleau

108

1,15

[1,07-1,43]*

1,22

[1,10-1,32]*

1,12

[1,06-1,19]*

1,09

[1,02-1,17]*

Frêne

12

1,04

[1,00-1,10]*

1,13

[1,04-1,23]*

1,02

[1,00-1,05]*

1,03

[1,00-1,07]*

Aulne

3

1,00

[0,97-1,10]

1,00

[0,95-1,06]

1,00

[0,96-1,05]

1,02

[0,96-1,10]

Cyprès

24

1,02

[0,97-1,09]

1,01

[1,97-1,05]

1,02

[0,98-1,05]

0,99

[0,95-1,06]

Noisetier

8

0,99

[0,95-1,01]

1,00

[0,98-1,03]

1,01

[0,97-1,06]

1,00

[0,97-1,04]

Classes d’âge 2007-2008 -2008

 

5-14 ans

15-44 ans

45-65ans

65ans et plus

 

Intervalle

Risque

 

Risque

 

Risque

 

Risque

 

interquartile

relatif

IC 95%

relatif

IC 95%

relatif

IC 95%

relatif

IC 95%

Armoise

5

0,94

[[0,92-0,98]

0,97

[0,94-1,00]

0,95

[0,93-0,99]

0,98

[0,92-1,04]

Plantain

7

0,96

[0,89-1,03]

0,98

[0,90-1,09]

1,01

[0,97-1,05]

1,05

[1,01-1,11]

Graminées

43

1,03

[1,00-1,07]*

1,05

[1,01-1,09]*

1,02

[0,98-1,07]

1,07

[1,02-1,12]*

Platane

7

1,08

[1,02-1,14]*

1,23

[1,11-1,34]*

1,15

[1,08-1,23]*

1,01

[0,95-1,07]

Chêne

94

1,02

[1,00-1,05]*

1,03

[1,00-1,06]*

1,05

[1,01-1,11]*

1,04

[1,00-1,09]*

Saule

7

1,01

[0,95-1,09]

1,05

[1,01-1,08]

1,05

[1,01-1,08]

1,03

[0,98-1,07]

Bouleau

38

1,12

[1,05-1,20]*

1,19

[1,10-1,28]*

1,10

[1,03-1,18]*

1,06

[1,01-1,10]*

Frêne

33

1,20

[1,10-1,31]*

1,24

[1,12-1,31]*

1,11

[1,06-1,19]*

1,04

[1,00-1,09]*

Aulne

59

1,01

[0,95-1,06]

1,00

[0,95-1,06]

1,00

[0,93-1,10]

0,99

[1,95-1,05]

Cyprès

15

1,00

[0,96-1,02]