Vous êtes sur la page 1sur 7

Informatique et Santé Collection dirigée par P. Degoulet et M. Fieschi Paris, Springer-Verlag France 1994

Volume 7 : Informatisation de l'Unité de Soins du Futur

Rédacteurs J.Demongeot, P. Le Beux et G.Weil

Le système d'information géographique de santé : un outil pour les soins de demain

Jérôme Fauconnier

Service d'Information et d'Informatique Médicales CHU de Grenoble, France

Abstract

Government offices, universities, commercial organisations or local authorities make extensive use of Geographical Information Systems (GIS). In the medical field, however, GIS remains undeveloped although potentially it usefulness is wide-ranging : epidemiology, public health policies, hospital assessment and planning could all benefit, for example. Computerisation makes available medical information allowing data processing with spatial references. It is now possible to work in vector mode with user-friendly software permitting direct user creation of customised applications to analyse medical data with a geographical approach.

Informatique et Santé: Springer-Verlag France, Paris 1994 (7) 211-222

1 - Introduction

Connaître et comprendre pour décider ; cette nécessité s'applique au moins autant en médecine que dans les autres domaines. Nous voyons notre monde quotidien changer de plus en plus vite, et l'information, qui en est l'image instantanée, devient de plus en plus difficilement assimilable directement. Sa représentation classique, sous des formes longtemps satisfaisantes, est maintenant peu adaptée. Les décisions ne peuvent plus être prises sur la base seule d'idées toutes faites, de négociations entre groupes de pression, ou d'après des règlements qui tiennent compte de rapports rapidement dépassés. Elles nécessitent de connaître quasi instantanément les

informations sur les besoins sanitaires, l'état de santé de la population, en tenant compte des connaissances et des sources d'information nouvelles. L'opinion publique pu en prendre douloureusement conscience à plusieurs reprises ces dernières années. Les systèmes d'information géographique (SIG) sont une réponse à ces impératifs dans le domaine de la santé :

pouvoir mettre à jour une base de données en temps réel, intégrer de nouvelles sources de nature différentes, les combiner et les analyser pour présenter l'information de façon efficace et directement utilisable pour la prise de décision. On peut ainsi passer du domaine de la représentation à celui de la décision. Ces bases de données ne se bornent pas à donner les informations brutes de la carte traditionnelle, mais sont des outils intelligents et interactifs, capables de donner des images vivantes de l'environnement grâce à leur capacité à prendre en compte à tout moment de nouveaux paramètres. Nés de l'essor de l'informatique, tout d'abord réservés aux professionnels de la géographie, ils ont vus rapidement leur champ d'application s'étendre dans tous les domaines où la prise de décision rapide en fonction de données

aménagement

spatiales est primordiale : environnement, gestion des réseaux (eau, électricité, téléphone urbain, marketing, prospection géologique

),

2 - Les composants d'un système d'information géographique

Le concept de SIG date des années 60, et a étendu son champ d'application au fur et à mesure des progrès de l'informatique : manipulation d'un nombre croissant d'informations, amélioration des interfaces, nombre croissant de fonctions, en même temps qu'il devenait disponible à beaucoup grâce à la microinformatique.

On peut définir ce concept comme "un système de base de données dans lequel les données sont spatialement référencées et sur lequel agissent un ensemble de procédures afin de produire des informations sur les entités spatiales dans la base de données"(Chevallier-Nuttall). Pratiquement, il s'agit donc d'un ensemble d'outils comprenant :

une base de données à deux composantes :

une spatiale, pour le stockage des coordonnées d'objets géographiques (communes, villes, routes

)

une classique, qui gère les données (attributs) qui sont attachées aux objets géographiques (nombre d'habitants, type de végétation, incidence d'une maladie )

un gestionnaire de ces bases de données, comportant les fonctions habituelles de tri, requête, recherche croisée dans des fichiers différents &nbsp

des outils d'opérations spatiales (calcul de distance, de proximité, d'itinéraire optimal

),

de calcul et de

combinaison des données des outils de saisie des données spatiales, et notamment cartographiques : table à digitaliser ou scanner

des outils de représentation des données, et notamment cartographiques

2.1

Saisie de l'information géographique*

Elle utilise plusieurs méthodes . Les plus classiques utilisent les cartes existantes ; on peut utiliser une table à digitaliser, qui permet de saisir point par point, ligne par ligne chacun des éléments de la carte (limite de

communes, courbes de niveaux, routes, maisons, villes

"crayon numérique" adapté. Ces éléments seront enregistrés sous forme numérique, avec leurs coordonnées spatiales, après que l'on a donné le référentiel géographique au système de saisie. On peut également utiliser un numériseur d'images (scanner), qui permettra à partir de la représentation de points enregistrés de reconstituer les éléments géographiques homogènes, soit automatiquement (certains logiciels l'effectuent avec plus ou moins de bonheur), soit manuellement, à l'aide de la souris On conçoit que cette étape soit la plus fastidieuse, et il existe actuellement des fonds de carte déjà numérisés disponibles soit grâce à l'IGN, soit par l'intermédiaire de sociétés spécialisées. La numérisation est donc actuellement affaire de spécialistes, et le seul argument qui puisse faire envisager de saisir soi-même la base de données géographique est économique. Une base de données très détaillée et précise peut être coûteuse. Cependant, il ne faut pas sous estimer le temps nécessaire à cette tâche, et les difficultés qui peuvent surgir. Il faut donc préférer l'achat de bases de données numériques existantes, ou, si elles n'existent pas, le recours à une société de services spécialisée dans ce domaine. Il faut enfin savoir que l'IGN terminera cette année la numérisation de toutes ses cartes au 1:50000 et prévoit peu après l'an 2000 la numérisation de toutes ses cartes au 1:25000 Un certain nombre d'entre elles sont d'ores et déjà disponibles. Les autres méthodes de saisie de l'information géographique sont plus destinés à des spécialistes. Tout d'abord, les données fournies par des satellites comme SPOT (résolution de 20m x 20m) permettent de disposer

directement d'informations sur des phénomènes géologiques, environnementaux, climatiques

directement en suivant sur le papier les motifs avec un

)

directement

référencés dans l'espace, et ce sur des surfaces importantes. Il existe également des outils de saisie informatique directe des coordonnées spatiales. Ils utilisent la technologie GPS (Global Positioning System), qui s'est rendu célèbre durant la guerre du golfe par sa capacité à guider par tous temps les avions et les missiles avec une précision remarquable. Ce système est basé sur un récepteur, qui capte les signaux de satellites géostationnaires. Lorsqu'il peut recevoir quatre satellites en même temps, par intégration des différences entre leurs positions, il donnera instantanément les coordonnées de l'observateur en latitude, longitude et altitude, et ceci à un mètre près. Branché sur un micro-ordinateur portable, il permet, sur le terrain, de saisir instantanément la position de points de prélèvements d'environnement, ou de cas de maladie. Il n'est plus nécessaire de se rapporter à une carte existante ou à des unités administratives souvent peu adaptées.

2.2 La mise en forme des informations

Un SIG comprend deux types de bases de données : la base de données spatiale, qui décrit les coordonnées et la forme géographiques des éléments de la base, et la base de données des attributs, qui comprend les caractéristiques diverses de ces éléments. Ces deux bases peuvent être distinctes, ou intégrées dans une même entité, ce qui a des conséquences dans la gestion des données, notamment les tris ou les requêtes. Pour la représentation des données, deux types fondamentalement différents sont retrouvés, dont le choix conditionne les possibilités du logiciel:

1) Le mode "vecteur" : les données y sont représentées sous forme d'objets géographiques - point, ligne ou polygone - et stockées dans la base de données spatiale par leur limites ou leur direction. A chacun de ces objets, seront reliés leurs attributs. Ainsi, à l'objet "commune de Saint Pécugnac les Bains" pourront être

affectés la population de cette commune, le pourcentage de chômeurs, le nombre de cas incidents de grippe, etc (voir figure 1). 2) Le mode "point" ou "maille" (raster pour les anglo-saxons) est un mode où toute la zone géographique

étudiée est partagée en cellules d'égales tailles, à chacune desquelles correspond un ou plusieurs attributs. La résolution de la représentation est conditionnée par la taille des cellules (par exemple, une cellule peut représenter un carré de 50m sur 50m). Les données affectées dans ce type de représentation prendront une valeur différente dans chaque cellule en fonction de la zone homogène qu'elles représentent (voir figure 2). Les deux modes ne sont pas directement compatibles, et certains logiciels n'en proposent qu'un seul. Cependant, il existe des possibilités de transfert de l'un à l'autre. Le choix du mode dépendra des données disponibles :

Le mode "maille" est bien adapté aux données continues, pour lesquelles on dispose en chaque point de la carte

de la valeur de l'attribut (type de végétation : culture, forêt, prairie

Ce mode est celui qui correspond

le mieux au fonctionnement des ordinateurs, et il se prête naturellement aux analyses statistiques en raison de l'homogénéité spatiale de la distribution des données. Enfin, il permet d'intégrer directement les informations

satellitaires. Par contre, il nécessite la connaissance en chaque point de tous les attributs ce qui n'est pas souvent possible dans le domaine de la santé. Le mode "vecteur" est idéal pour la gestion des attributs, et notamment toutes les opérations sur leur base de données. Il correspond plus naturellement aux informations dans le domaine de la santé, ces dernières étant souvent disponibles pour des secteurs administratifs donnés. Le nombre d'information à manipuler est beaucoup moins important, puisque chaque objet n'a qu'un seule valeur pour un attribut donné. Par exemple, si on veut étudier une maladie donnée, en mode "maille", il faudra connaître le nombre de patients par cellule (pour chaque carré de 1km sur 1 km par exemple) et donc connaître leur localisation exacte sur la carte. Par contre, en mode "vecteur, il suffira de connaître le nombre de malades par commune ou par canton, données beaucoup plus facilement disponible dans les systèmes d'informations médicales Le mode "vecteur " est bien adapté à la production de cartes thématiques. Il donne une représentation "attendue" des données, puisque les objets correspondent souvent aux limites administratives ou naturelles connues. De plus, il permet facilement des requêtes sur les objets, par exemple "afficher l'incidence des cancers ORL dans les communes situées à moins de 20 km d'un incinérateur", ou bien "afficher les communes du département situées à plus de 35 mn de temps d'accès d'une maternité". En définitive, le mode vecteur est le plus utilisé dans le domaine médical à cause d'une gestion de données plus naturelle, mais également parce que les limites administratives sont celles des décideurs, et l'information

disponible (démographique, sanitaire, socio-économique

ou bien de données modélisables à partir de

sources discontinues (épidémies, données météorologiques ou de pollution

)

).

)

l'est d'abord pour eux. Par contre, pour toutes les

informations dont les attributs spatiaux sont continus, soit directement, soit par modélisation, on gagnera en richesse d'analyse et en rapidité d'évaluation, d'autant plus que les sources de données sont multiples.

2.3 Les opérations sur les données

Voici de façon très générale quelques possibilités d'opération possibles avec les SIG. Leur variété et leur facilité de mise en œuvre varie beaucoup selon les logiciels, et d'eux dépend en grande partie l'intérêt que peut en attendre. Les requêtes sur les bases de données C'est un des outils fondamentaux des SIG. Leur capacité à gérer la mise en correspondance des attributs et des données spatiales en fait tout l'intérêt. Grâce à des opérateurs de type "et", "ou", l'information disponible peut rapidement prendre un sens. Les questions seront du type : "Quelles sont les zones où les maladies pulmonaires chroniques sont significativement plus élevées, et où la pollution dépasse un certain seuil", ou bien "Représenter simultanément les services à fort taux de staphylocoque méthi-résistant et ceux à forte prescription d'antibiotiques de dernière génération". Les opérations sur les données spatiales Ces opérations sont nécessaires pour pouvoir modéliser des phénomènes, et tester ces modèles. Des opérations arithmétiques sur les coordonnées spatiales, des pondérations ou des combinaisons (addition, soustraction, intersection pour obtenir des zones composites) sont généralement disponibles. Les opérateurs spatiaux On utilise généralement des opérateurs de distance, pondérée ou non (en fonction de l'accessibilité par exemple), des opérateurs de surface, de contiguïté

3 - Les systèmes d'information géographique de Santé

3.1 Epidémiologie et environnement

Les données de pollution se prêtent particulièrement à l'analyse par les SIG, en raison de la diversité des sources. On peut ainsi mettre en évidence des relations entre certains polluants, certaines sources polluantes et certaines maladies, en tenant compte de facteurs météorologiques (vents dominants, précipitations, température,

humidité

Les anglo-saxons mènent ainsi un certain nombre d'études, mettant à profit leur système de code postal, dont la précision géographique est un atout certain. Il permet en Grande Bretagne de situer chaque habitant à 100 mètres près grâce à son code postal. Gatrell, en 1990, a pu évoquer la responsabilité de la proximité d'incinérateurs dans la survenue des cancers des voies aériennes grâce à une analyse statistique originale, mettant à profit la capacité de calcul de proximité et de surface d'un SIG (ArcInfo®). Les variations des grands fléaux infectieux, notamment parasitaires, sont liés fortement à l'environnement. La lutte à grande échelle contre les vecteurs de ces maladies ne peut passer que par la connaissance de ces facteurs. Aussi, les SIG sont ici mis à contribution pour traiter des données de provenance fort différentes, afin de mieux connaître les conditions de transmission et de diffusion de ces épidémies, et donc de mieux les prévenir. Roger (1993) a ainsi utilisé un SIG pour étudier l'influence des variations météorologiques et de végétations sur la diffusion de la trypanosomiase. L'idée était de déterminer la part respective des facteurs biotiques (variations du nombre de vecteurs, immunité de l'hôte, virulence du parasite), abiotiques (variations météorologiques) et historiques (mouvements de population) dans l'extension de la maladie et la survenue d'éventuelles épidémies. La bilharziose, pour laquelle existe un atlas de répartition mondiale, bénéficie actuellement grâce à l'OMS de ce type d'approche, afin de déterminer les conséquences éventuelles de changement de l'écosystème (déforestation, construction d'un barrage) sur l'incidence de la maladie.

),

topologiques (altitude, exposition dominante), d'habitat, socio-économiques

3.2 Planification sanitaire

L'intérêt des SIG est ici immédiat, tant les techniques d'analyse se rapprochent de celles déjà utilisées en marketing. On définit les caractéristiques principales d'une population cible (âge de la population, degré de dépendance, niveau socio-économique), celles de l'offre de soins (soins à domicile, médecins généralistes, centres de soins communautaire, secteurs d'assistants sociaux, pharmacies), celles du milieu (transports en commun, frontières naturelles ou artificielles, temps de déplacement entre les différents endroits). On peut ainsi déterminer des zones homogènes de besoins de santé, après avoir validé ces différents indicateurs, et permettre une adéquation optimale entre l'offre et la demande. L'évolutivité en temps réel de tels systèmes, à condition qu'ils soient renseignés en permanence, est également un atout de poids. Un exemple en est donné par Twigg (1990), qui a identifié en Grande-Bretagne des "zones de soins de santé primaire".

3.3 Les SIG et l'hôpital

On le voit, à l'heure actuelle, les SIG sont surtout utilisés dans le domaine de la recherche. C'est assez paradoxal quand on sait que leur essor est surtout lié aux possibilités d'aide à la décision qu'il apporte par l'intégration immédiate de données très diverses. Ainsi, le marketing, la gestion de réseaux de distribution complexes, l'administration urbaine, l'aménagement du territoire ne peuvent plus se passer de cet outil. On comprend donc que les décideurs, même dans un hôpital, puisse tirer parti de tels systèmes. L'hôpital est une entité spatiale, avec ses zones propres (pavillons, services)et leurs relations. Sans parler de la gestion quotidienne des réseaux électriques ou de fluide, ou bien de la disponibilité de lits de malade, les SIG peuvent rendre de grands services pour la surveillance de certains problèmes médicaux internes à l'établissement comme la surveillance des infections nosocomiales. Couplé à un système d'information intégré, il permet de disposer de données beaucoup plus riches que les informations de surveillance classique, puisqu'il est possible d'intégrer à la simple observation de cas groupés dans le temps la notion de "flux" de malades, en tenant compte

des mouvements antérieurs, du bloc opératoire utilisé, des salles d'examens complémentaires fréquentées

diffusion des épidémies ou bien des résistances aux antibiotiques peut être étudiée plus finement, et ainsi permettre une prévention mieux ciblée.

La

3.4 Pour l'avenir : le SIG et l'organisation des soins

L'unité de soins du futur devra nécessairement utiliser les possibilités des SIG. En effet, la mise en place de structures coordonnées entre un centre hospitalier de référence et des réseaux locaux de soins devra intégrer une masse d'informations sur le système de santé. Ces données devront être analysées et présentées de manière à

permettre que ces structures soient adaptées en permanence aux populations à qui elles sont proposées, et mises à jour en permanence. Des systèmes d'informations géographiques spécifiques pourront être l'extension naturelle de réseaux de type "télémédecine", permettant en temps réel à la fois de répondre aux besoins des usagers, et de connaître l'état de santé de la population grâce à des indicateurs spécifiques. Une des limitations actuelles de l'utilisation des SIG est le temps nécessaire au recueil des données. Cette opération coûteuse et fastidieuse n'est pas rentable immédiatement, et il est difficile de provoquer de tels investissements à long terme. Cependant, le recueil automatique des données médicales grâce à des systèmes d'information ou à des réseaux de télémédecine permettront la disponibilité permanente de ces données. Les utilisateurs de tels systèmes pourront se consacrer à l'analyse et l'élaboration d'indicateurs spécifiques, et permettront que l'information médicale ne guise pas dans de profonds cimetières de données, mais accomplisse sa vocation première : permettre de mieux comprendre et améliorer la prise en charge de la santé de la population. Les systèmes d'information géographiques de santé peuvent dès maintenant apporter l'outil d'aide à l'organisation des soins de demain. Leurs dangers ne doivent pas être négligés, et la réflexion sur la confidentialité des données que provoque tout système de partage de l'information devra être approfondi. En effet, la connaissance des références spatiales élargit la notion d'anonymat : il n'est pas besoin de savoir le nom d'un homme, âgé de 36 ans, boulanger dans la commune de Saint Sainfoin les Alouettes -2800 habitants- pour l'identifier et connaître ses problèmes de santé. Ce problème majeur devra être strictement réglé avant d'envisager l'utilisation routinière de ces systèmes. D'aujourd'hui, où ces outils sont utilisés quasi exclusivement par des chercheurs, à demain, où ils deviendront incontournables pour l'organisation et l'analyse du système de soins, se dessine une période intermédiaire où les apports possibles et les limites souhaitables devront être définis.

Références

[1] Chevalier-Nuttal I. : Le système d'information géographique : outil d'aide à l'analyse et à la décision ; application à la santé publique. Mémoire de Santé Publique. DES de Médecine et Santé Communautaire. Université C. Bernard-Lyon I. [2] Gatrell AC., Dunn CE. GIS in epidemiology research : analysing cancer of the larynx in North West England. North West Regional Research Laboratory. Lancaster University, Research Report N·12. [3] Roger DJ., Williams BG; Monitoring trypanosomiasis in space and time. Parasitology. 1993 ; 106 Suppl :

S77-92.

[4] Twigg L. Health based geographic information systems : their potentiel examined in ligth of existing data sources. Soc. Sci Med.1990; 30(1) : 143-155.

Figure 1 : Codage des données en mode vecteur Chaque objet est défini par ses

Figure 1 : Codage des données en mode vecteur Chaque objet est défini par ses données spatiales (coordonnées des vecteurs de son contour pour les polygones, coordonnées des vecteurs pour les lignes, coordonnées pour les points). Chaque attribut n'est défini qu'une seule fois pour chaque objet

n'est défini qu'une seule fois pour chaque objet Figure 2 : Codage des données en mode

Figure 2 : Codage des données en mode maillage. Chaque "maille" possède ses coordonnées dans l'espace et une valeur pour chaque attribut

Point

SOURCE

Ligne

Surface

Point SOURCE Ligne Surface Exemples de calculs sur des objets géographiques en santé et environnement (a)

Exemples de calculs sur des objets géographiques en santé et environnement

(a)

Impact du niveau de pollution en un point en fonction de deux capteurs

(b)

Impact du niveau de pollution en un point en fonction du réseau routier

(c)

Impact du niveau de pollution en un point en fonction d'une zone contaminée

(d)

Impact du niveau de pollution d'un cours d'eau en fonction de capteurs

(e) Interpolation de la pollution d'un cours d'eau en fonction des informations sur certains de ses affluents

(f)

Estimation de la pollution d'un cours d'eau traversant une zone contaminée

(g)

Estimation de la contamination d'une zone en fonction d'échantillons recueillis ponctuellement

(h)

Estimation de la pollution d'une zone autour d'un cours d'eau contaminé

(i)

Impact de la pollution par zone administrative en fonction de données sur une zone polluée fournies

par satellite

D'après DJ Briggs (in Geographical and Environmental Epidemiology : methods for Small-Area Studies.Elliot, Cuzick, English and Stern Ed. Oxford University Press. Oxford 1992.