Académique Documents
Professionnel Documents
Culture Documents
Sommaire
1 REMERCIEMENTS......................................................................................................................... 0 2 RESUME ........................................................................................................................................ 2 3 INTRODUCTION............................................................................................................................. 4 3.1 PRESENTATION DU GROUPE THALES ......................................................................................... 4 3.1.1 Les origines................................................................................................................... 4 3.1.2 THALES aujourdhui ...................................................................................................... 7 3.1.3 THALES Air Systems Division et le site de Bagneux...................................................... 9 3.2 OBJECTIFS DU STAGE ET MISSION PROPOSEE .......................................................................... 12 4 LA RECONNAISSANCE DE CIBLES NON-COOPERATIVE (NCTR) ........................................... 14 4.1 PROBLEMATIQUE GENERALE .................................................................................................. 14 4.1.1 Les techniques coopratives ....................................................................................... 14 4.1.2 Les techniques non coopratives : origines et justification............................................ 14 4.1.3 Le NCTR radar............................................................................................................ 15 4.2 LA FUSION DE DONNEES POUR LIDENTIFICATION NCTR............................................................ 17 4.2.1 Les systmes multicapteurs et multiparamtres........................................................... 17 4.2.2 Lapproche bayesienne ............................................................................................... 18 4.2.3 La thorie de lvidence de Dempster Shafer............................................................ 19 4.2.4 La thorie des ensembles floues et des possibilits ..................................................... 21 4.2.5 Un cadre commun pour des probabilits, croyances et possibilits .............................. 24 4.2.6 Dautres techniques pour lintgration .......................................................................... 25 4.3 UN MODELE DIMPLEMENTATION CONCRET BASE SUR LA LOGIQUE FLOUE .................................... 26 4.3.1 Schma gnral .......................................................................................................... 26 4.3.2 Les fonctions dappartenance et de densit de possibilit ............................................ 28 4.3.3 Calcul de la possibilit et la ncessit.......................................................................... 29 4.3.4 Intgration spatiale et intgration temporelle................................................................ 29 4.3.5 Prise de dcision ......................................................................................................... 30 5 DES OUTILS POUR LEVALUATION DES PERFORMANCES .................................................... 32 5.1 FONCTIONS DEVALUATION .................................................................................................... 32 5.1.1 Fonction A ............................................................................................................. 33 5.1.2 Fonction B ............................................................................................................. 33 5.1.3 Fonction C ............................................................................................................. 34 5.1.4 Fonction taux derreur et taux de russite .................................................................... 35 5.2 MESURES SUR LES MATRICES DE CONFUSION .......................................................................... 35 5.2.1 Erreur quadratique ...................................................................................................... 37 5.2.2 Indicateurs de prcision............................................................................................... 37 5.2.3 Coefficient kappa......................................................................................................... 38 6 ETUDE SUR LINTEGRATION TEMPORELLE POUR LA VARIABLE POSSIBILITE................... 40 6.1 DESCRIPTION DU CONTEXTE DE SIMULATION ET DES DONNEES UTILISEES ................................... 40 6.2 LES RESULTATS EN ABSENCE DINTEGRATION TEMPORELLE ....................................................... 41 6.3 LES OPERATEURS DE MOYENNE ............................................................................................. 43 6.3.1 La mthode k sur M ............................................................................................... 43 6.3.2 Moyennes gnralises............................................................................................... 45 6.3.3 Ordered Weighted Average (OWA).............................................................................. 48 6.3.4 Conclusions sur les oprateurs de moyenne................................................................ 59 6.4 NORMES TRIANGULAIRES ...................................................................................................... 59 6.4.1 t-normes de Hamacher................................................................................................ 61 6.4.2 t-norme de Frank......................................................................................................... 63 6.4.3 t-normes de Dombi...................................................................................................... 64 6.4.4 t-normes de Yager....................................................................................................... 66 6.4.5 Conclusions sur les t-normes triangulaires................................................................... 68
6.5 ESSAIS DE DOUBLE INTEGRATION ........................................................................................... 70 6.5.1 Moyenne exponentielle................................................................................................ 70 6.5.2 Double norme ........................................................................................................ 73 6.5.3 Intgration hybride : k sur M + double norme drastique .................................... 74 6.5.4 Conclusions sur la double intgration .......................................................................... 77 6.6 LAPPROCHE LEAKY BUCKET ............................................................................................ 78 7 QUELQUES CONSIDERATIONS ET PERSPECTIVES AUTOUR DE LA VARIABLE NECESSITE ............. 82 8 CONCLUSION.............................................................................................................................. 84 9 REFERENCES BIBLIOGRAPHIQUES.......................................................................................... 86
1 Remerciements
A Thales, je tiens remercier ma responsable de stage madame Marie-Christine Souty de sa confiance, ses conseils, sa disponibilit et sa gentillesse pendant toute la dure de mon stage. Je tiens aussi remercier monsieur Roch Settineri de mavoir propos ce sujet de stage, de mavoir fait confiance depuis notre premire rencontre et de mavoir bien accueilli au sein de son quipe. Je remercie monsieur Michel Moruzzis pour ses conseils techniques et son aide avec la relecture critique de mon rapport. Je tiens galement remercier monsieur Jean-Pierre Larvor de mavoir accueilli au sein du service dont il assume la direction. Merci enfin lensemble des personnes du service pour leur disponibilit pour rpondre mes questions ainsi que de leur convivialit qui a contribu rendre mon stage trs agrable. Muchas gracias a todos.
A lENST, je tiens remercier ma correspondante de stage Florence Tupin de ses conseils et de sa disponibilit. Je tiens aussi remercier madame Isabelle Bloch de ses orientations et son amabilit lors de notre rencontre.
2 Rsum
Mon stage sest droul entre les mois de juillet et septembre 2004 Thales Air Defence, sur le site de Bagneux, et plus concrtement au sein de lquipe qui travaille sur la reconnaissance non - cooprative de cibles ariennes (NCTR) appartenant au service RBPEF de Joint Radar Sensors. Jai commenc par faire de la recherche bibliographique sur les systmes NCTR et jai tudi un modle concret utilisant les outils mathmatiques du domaine de la logique floue et la thorie des possibilits. Dans le cadre de ce modle, jai travaill sur des diffrentes approches dintrt concernant lintgration temporelle des donnes floues, lobjectif de mon stage tant ltude et comparaison des diffrentes stratgies envisageables ce propos. Des donnes issues de mesures radar relles ont t mises ma disposition. Tout dabord, jai dcid dtablir une mtrique varie, raliste et cohrente pour lvaluation des performances des divers algorithmes, travers la dfinition de quelques fonctions dvaluation, de critres concrets pour la dfinition des taux derreur et de russite et de quelques mesures sur les matrices de confusion associes chaque processus de classification. Par la suite, je suis parti de lapproche k sur M utilise initialement Thales et jai valu ses performances pour toutes les valeurs possibles du paramtre k (pour M fix). Jai tudi aussi dautres oprateurs de moyenne, notamment des moyennes gnralises et des OWA (avec plusieurs approches pour ceux-ci: distributions de poids naves, MEOWAs et apprentissage du vecteur de poids). Ces oprateurs mont permit de constater lexistence dun compromis entre ladoption dapproches plus risques (taux de russite et taux derreur plus levs) quand lon se place prs de loprateur min et le choix de postures plus conservatrices (moins discriminantes mais aussi avec un taux derreur plus petit) du cot du max. Les normes triangulaires mont permit daller au del de loprateur min jusqu la limite impose par la t-norme drastique, en poursuivant la tendance observe pour les oprateurs de moyenne. Aprs ltude initiale de ces oprateurs, jai valu lapproche consistant effectuer une double intgration laide dune moyenne exponentielle et aussi laide des normes triangulaires. Les performances observes mont permit de constater des diffrences importantes dans la nature des paramtres intgrer, qui ont du tre prises en compte afin damliorer le processus didentification jusqu' arriver une stratgie hybride visant une double intgration par t-norme drastique prcde par un filtrage k sur M pour les paramtres que lon estime moins fiables. Finalement, jai propos un algorithme original, inspir des mthodes leaky bucket propres au domaine de la gestion du trafic rseau, qui repose sur les principes de lintgration hybride et qui nous permet de profiter de ses avantages, en ajoutant une plus grande simplicit, une meilleure versatilit et une optimisation des ressources en termes de temps de calcul et utilisation de mmoire.
Non-cooperative air target recognition (NCTR) represents an emerging field of research in which fuzzy logic and possibility theory are likely to play a major role in the near future. During my internship at the Joint Radar Sensors unit from Thales Air Defence in Bagneux (near Paris), a concrete model for a NCTR system circumscribed to this theoretical framework was taken into account following an initial stage of bibliographic research, and performances of several strategies for fuzzy data time integration were studied and compared. Data from real radar measures were used for all our integration simulations. Only possibility measures were considered for the analysis, mainly due to the limitations imposed by a short-period internship. First of all, a set of tools for measuring algorithm performances was proposed and defined with the aim of providing a varied, realistic and coherent approach for the evaluation of the different fusion methods later to be considered. These tools included several evaluation functions and some specific criteria for the definition of the main success and error (misclassification) rates, as well as the selection of a certain number of concrete measures intended to evaluate the quality of the recognition process through the use of confusion matrixes. kth out of M approach for time integration was the first to be evaluated, and the performances obtained for all possible values of k were measured. After that, other averaging operators were studied, namely generalised means and OWA (including several different implementations of this last concept, such as intuitive weights distributions, Maximum Entropy OWAs and weights vector learning). The results obtained showed a compromise between the choice of higher risk operators (with higher values for both misidentification and success rates), the level of risk apparently increasing towards the min operator, and the adoption of other operators closer to max, which resulted in more conservative strategies (their discrimination power being lower, they actually presented reduced values for both misclassification and success rates). Triangular norms allowed me to go beyond the min operator frontier and reach the boundary imposed by the so-called drastic t-norm, all the while observing a continuity in the behaviour and properties of the operators under study, as well as a correlation in their performances. After that, I decided to consider the possibility of performing a double integration through the use of an exponential time average first, and a t-norm afterwards, for the fusion of the newly integrated values with those obtained in the past and in order to add some sort of recursive memory or persistence to our system. This new approach pointed out the intrinsic differences between the different parameters considered and suggested the convenience of taking these particularities into account so as to improve the general identification performances. This led up to the proposal of a hybrid integration strategy consisting of an double drastic t-norm preceded by a kth out of M error filter and so that the latter should be adjusted for each parameter as a function of the level of robustness and reliability associated to the parameter itself. Finally, an original algorithm inspired of the leaky bucket techniques, which are commonly used in other domains such as that of network traffic management, was proposed. This approach followed the principles of hybrid integration and allows us to enjoy its advantages, adding a greater simplicity, more versatility and a most welcomed optimisation in terms of computational resources.
3 Introduction
Le contenu de ce rapport de stage a t structur en quatre sections principales, au del de celles correspondant au rsum, les conclusions, les remerciements et les rfrences bibliographiques : On peut trouver une premire section dintroduction, dans laquelle on fera une brve description du groupe Thales et puis de Thales Air Defence jusqu arriver au niveau de la section dans laquelle jai travaill pendant ces trois derniers mois. On retrouvera ici aussi une description des objectifs initiaux et la mission propose dfinissant mon sujet de stage. Ensuite, on prsentera le cadre thorique dans lequel se place le stage, notamment celui de la fusion de donnes applique aux techniques NCTR. On prsentera ici le modle concret pour le systme de reconnaissance avec lequel on travaillera dans la suite. Ce chapitre constitue la synthse du travail de recherche bibliographique ralis pendant les premires semaines de mon stage et a comme but primordial de fournir une perspective gnrale sur le domaine de rfrence considr. Une troisime partie prsentera les outils mathmatiques choisis pour lvaluation et la comparaison des performances des diffrents algorithmes que lon considrera pour notre tude sur lintgration temporelle. On combinera des mesures traditionnelles sur les matrices de confusion avec des fonctions dvaluation dont jai dvelopp le concept, de nature intuitive ou suivant les observations faites par les professionnels de Thales, et toujours considrant les besoins spcifiques relatifs au problme traiter. Finalement, on trouvera la partie la plus importante du rapport, au cours de laquelle on utilise les outils dont on vient de parler pour raliser une tude sur les diffrentes approches possibles pour lintgration temporelle de la variable possibilit. On considrera quelques oprateurs plutt classiques et on arrivera proposer un algorithme dintgration original qui semble apporter de nombreux avantages par rapport aux autres.
1
Cette dcennie sera galement marque par la diversification des activits, avec principalement le dveloppement acclr de la commutation tlphonique, tout d'abord par croissance interne puis, en 1976, avec l'acquisition des filiales franaises de l'Amricain ITT (Le Matriel Tlphonique - LMT - et la socit Lignes Tlgraphiques et Tlphoniques - LTT) et du Sudois Ericsson (Socit Franaise des Tlphones Ericsson). La socit participe, galement sous l'gide des pouvoirs publics, au dveloppement en France de l'industrie des semi-conducteurs silicium. Et en 1979, elle reprend sa socit mre Thomson-Brandt la socit d'imagerie mdicale CGR (Compagnie Gnrale de Radiologie).
Paralllement, une politique active de croissance externe (acquisitions et alliances au sein de jointventures) est mene, principalement en Europe, qui permet d'attnuer le dclin des ventes. L'addition des chiffres d'affaires des socits entres dans le primtre de consolidation depuis 1990 s'lve 5 milliards de francs. L'acquisition la plus importante de la priode a t la reprise, finalise en dcembre 1989, des activits d'lectronique de dfense du groupe Philips, savoir les socits hollandaise Signaal, belge MBLE et franaise TRT (dnominations sociales modifies depuis, pour les deux dernires), qui a apport un chiffre d'affaires de 4,5 milliards de francs en 1990. Au travers de ces acquisitions, Thomson-CSF a tout d'abord acquis ou consolid sa prsence sur l'ensemble des segments de l'lectronique de dfense et toff son trs large spectre, dsormais comparable celui de ses grands concurrents amricains. Mais la socit a galement accru la part de ses activits d'lectronique professionnelle civile : sur les 15 milliards acquis, environ 11 milliards concernent l'lectronique de dfense et 4 milliards les applications civiles. Enfin, elle a, en quelques annes, dvelopp sa prsence industrielle hors des frontires nationales : en 1989, 95 % du chiffre d'affaires consolid provenait des implantations franaises ; six ans plus tard, en 1995, les filiales trangres ont contribu pour plus de 20 % aux ventes consolides. En 1995, pour renforcer la performance de son organisation oprationnelle, Thomson-CSF achve le processus de filialisation initi pour partie quelques annes plus tt. Entre 1996 et 1997, la cession des participations dans le Crdit Lyonnais et dans SGS-Thomson (devenu ST Microelectronics) gnrent des ressources qui permettent de financer la poursuite du dveloppement international lensemble des domaines de la scurit civile.
dcembre 2000 Thomson-CSF, devenu Thales, annonce la cration avec l'Amricain Raytheon de la premire joint-venture transatlantique entre industriels de la dfense. En 2001, il y a une poursuite du recentrage des activits : Thales prend le contrle total de plusieurs de ses joint-ventures en dfense et en aronautique, et se retire d'Alcatel Space; en IT&S, priorit est donne aux activits synergiques et en forte croissance, principalement le positionnement par satellite et les oprations scurises. La structure de l'actionnariat volue : le flottant frle les 40%, tandis qu'Alcatel se dsengage partiellement et que l'Etat franais passe sous la barre des 33%, au profit de l'actionnariat salari. De 2001 2003, dans un contexte gopolitique et conomique profondment boulevers la suite des attentats du 11 septembre 2001, poursuite du recentrage des activits civiles et confirmation de la stratgie multi-domestique : Thales prend le contrle total de plusieurs de ses joint-ventures en dfense et en aronautique, et se retire dAlcatel Space ; Thales Defence Ltd, devenue la deuxime socit de dfense britannique, est retenue dans plusieurs programmes ou appels doffres prioritaires du ministre de la Dfense du Royaume. En IT & S, les dsinvestissements sont poursuivis dans les secteurs non stratgiques, dont certains sont fortement dficitaires, tandis que les activits lies au domaine de la scurit civile prennent de plus en plus dimportance. Fin 2003, Thales lance une initiative majeure, Thales SHIELD, marquant lengagement du groupe dans les systmes et technologies qui sappliquent lensemble des domaines de la scurit civile.
groupe contre plus de 95 % la fin des annes 1980. Cette volution rsulte de la politique de croissance externe hors du territoire national, conduite depuis plus de dix ans. Dans le domaine de la dfense en particulier, o les clients sont des Etats nationaux, lapproche "multidomestique" saffirme comme un axe stratgique majeur du groupe : disposer dune implantation industrielle locale permet en effet dapporter au client une rponse adapte ses attentes, et de raliser sur place une partie importante des dveloppements spcifiques quil demande, tout en lui assurant le niveau technologique de premier plan dun leader mondial.
ariennes, Thales est notamment impliqu dans les besoins de renouvellement de lensemble des infrastructures de lOTAN (interoprabilit des systmes allis lchelle continentale et des forces projetes) via sa filiale commune avec Raytheon, la socit Thales Raytheon Systems (TRS). Aprs son implication dans des grands projets a niveau europen et amricain, dont ceux associes aux technologies M3R(Radar Mobile, Multifonctions et Modulaire) font un bon exemple, Thales a poursuivi en 2003 le dveloppement de nouveaux programmes comme Rapsodie (futur radar de surveillance au sol de larme franaise), Cobra (radar de contrebatterie, ralis dans le cadre du GIE EuroArt) et Martha, premier systme au monde capable de piloter simultanment des systmes darmes trs courte, courte et moyenne portes, dvelopp pour larme de terre franaise depuis 2000.
La Division de Systmes Ariens du groupe Thales a en charge les domaines de la gestion du trafic arien, la dfense arienne et dautres projets comme le Galileo europen. Elle regroupe plusieurs directions oprationnelles dont Joint Radar Sensors.
10
Au sein du dpartement Dfense Arienne, la direction oprationnelle Joint Radar Sensor (JRS) a la particularit dtre un regroupement entre plusieurs services de lancien Thales Air Defence (TAD) et de Thales Naval Nederland (TNN). Ses missions incluent la conception et fabrication de systmes radar pour les marchs civils et militaires, et notamment pour la dfense arienne, le domaine naval, la gestion du trafic arien, la surveillance du sol et la localisation darmes . Project & Engineering (P&E) est un dpartement de Joint Radar Sensors (JRS). Son rle est de dfinir les nouveaux produits et de raliser des tudes amont. P&E est galement responsable de larchitecture radar, et traite un projet jusqu la signature du contrat. Cest ensuite le dpartement Radar Operations qui ralise le programme.
La partie du service P&E sur le site de Bagneux ajoute les lettres RB (Radar Bagneux) sa dnomination (RBPE). Functional Analysis & Algorithms (RBPEF), est donc le service de P&E Bagneux qui participe la dfinition des traitements radar, la ralisation de simulations fonctionnelles et la conduite dtudes amonts. Il comprise une trentaine de personnes. La section Traitements Non-Cooperative Target Recognition (NCTR), est une section du service RBPEF qui travaille sur le sujet de lidentification de cibles ariennes non cooprative . Ils travaillent sur des tudes portant sur des radars futurs qui sont en cours de dveloppement Thales, mais aussi sur des radars existants pour lesquels le client demande une fonction NCTR.
11
12
13
14
Daprs quelques sources non officielles [27], les origines des techniques NCTR pourraient se trouver au milieu des annes 1970, avec le programme militaire amricain Musketeer, o lon a essay dutiliser le radar pour obtenir une signature unique de chaque modle davion ennemi partir du nombre et des caractristiques techniques de ses moteurs. La nouvelle technologie a du attendre une dizaine dannes pour que les moyens informatiques ncessaires se soient suffisamment dvelopps. Depuis 1985, les F15C de lUSAF incorporaient dj des modes NCTR pour le combat. Pendant la premire Guerre du Golfe, entre 1990 et 1991, les ROE (Rules of Engagement ou Rgles dengagement ) de lUSAF spcifiaient la ncessit dune double identification des cibles de la part des chasseurs amricains avant de lancer une attaque. Une de ces identifications pouvait tre fournie par les AWACS, lautre tant de type NCTR. En plus, ces techniques rendaient possible lutilisation de missiles air-to-air de type BVR (Beyond Visual Range, ou au del du champ visuel ), qui pouvaient tre utiliss des longues distances avec la sret de ne pas dtruire des cibles amies. Pour beaucoup danalystes, cest grce aux techniques NCTR que les F-15C furent les seuls chasseurs de la coalition avoir pu oprer sur lIrak, au dtriment dautres modles comme les F-14 de lpoque. Au cours des dix annes suivant le premier conflit du Golfe, le NCTR t incorpor dautres chasseurs modernes, notamment aux F-14, F-16 et F-18 amricains, quelques F-15 vendus des gouvernements trangers par les USA, aux Tornado britanniques et aux Mirage franais. Parmi les atouts principaux de lapproche NCTR on trouve : Dans le domaine civil, une protection face des possibles problmes techniques ou humains traditionnellement associs aux techniques coopratives. Dans le domaine militaire, Une meilleure comprhension de la situation tactique et une meilleure estimation des possibles menaces en combat, ce qui peut rendre possible, par exemple, une rponse stratgique hirarchise face aux cibles identifies. - Une rduction du risque de dommage fratricide. - En termes dfensifs, une raction plus efficace face une menace relle (rduction du temps de raction, possibilit de choisir les systmes darmement en fonction de la cible dtecte, etc.). - En termes dattaque, lutilisation des techniques de type BVR comme on a dj comment, ce qui implique une diminution considrable du risque pris par rapport une situation o lon est oblig dtablir un contact visuel. - En termes de surveillance, ces techniques peuvent tre utilises pour optimiser le processus gnral de dtection, identification, localisation et pistage, en adaptant les moyens utiliss (par exemple la forme donde) au type de cible identifie en premire instance. -
15
Le radar est capable de fournir plusieurs paramtres physiques associs la cible considre, qui peuvent tre classifis, par exemple, dans trois domaines : Cinmatique. Paramtres tels que laltitude, la vitesse, lacclration, la vitesse ascensionnelle, lorientation, etc. Elles peuvent tre utiles pour faire la distinction entre des grands groupes de cibles (missiles, hlicoptres, chasseurs, etc.). Haute Rsolution Distance (HRD). Paramtres telles que la longueur, la Surface Equivalente Radar (SER ou RCS en anglais), le profil Distance, etc. Elles peuvent apporter des informations plus spcifiques permettant de distinguer entre des cibles grandes et petites, par exemple. Doppler. Lanalyse des donnes procdant des parties mobiles, qui seront la cause de singularits sur le spectre mesur, peut nous fournir des informations trs utiles pour lidentification. Les niveaux la sortie de chacun des filtres Doppler utiliss permettent de caractriser le spectre de la cible.
Dans leur article de 1998, Delhotte et Moruzzis [5] proposent un modle schmatique pour les systmes de reconnaissance radar NCTR qui se structure sur 4 points : 1. Mesure des caractristiques physiques de la cible identifier en utilisant des formes donde appropries et des techniques typiques dans le domaine des mesures radar (Doppler, HRD, 1D et 2D ISAR, etc.). Extraction des lidentification. paramtres pertinents pour
2.
3.
Fusion spatiale et temporelle des donnes obtenues et comparaison avec une base de donnes auxiliaire (construite off-line partir de connaissances pralables) jusqu lobtention dune valeur de confiance pour chaque classe considre. Prise dune dcision finale en ce qui concerne la possible identit de la cible.
4.
Les performances du processus didentification dpendent de plusieurs facteurs quil faut prendre en compte : la qualit des mesures radar (rsolution, SNR, erreur de mesure, etc.) le degr de complmentarit et redondance entre les capteurs le choix des variables et paramtres considrer loptimalit du processus de fusion de donnes la reprsentativit et lexhaustivit du contenu de la base de donnes utilise le critre utilis pour la prise de dcision finale
16
17
Intuitivement, on peut ici tablir une correspondance avec le modle de la fusion globale dans le domaine de la fusion de donnes, puisque cette architecture permet de prendre une dcision directe partir de toutes les informations venant de toutes les sources, sans perte dlments de jugement cause de sous-traitements locaux ; dans ce modle globale aucun information nest nglige au prix dune complexit plus grande. Dans la pratique, on peut considrer des modles hybrides dans lesquels on fait quelques combinaisons pour certains paramtres niveau local conduisant des paramtres drivs (imaginons, par exemple, la fusion locale de tous les paramtres cinmatiques pour une cible donne), que lon enverra au sous-systme central et que lon considrera de manire conjointe avec dautres paramtres lmentaires ou drivs pour la prise finale de dcisions globales. Il faudra, en tout cas, essayer darriver avoir un compromis entre les avantages et les inconvnients associs chacune des approches exposes.
Au del de larchitecture considre, le processus de fusion de donnes comportera toujours quatre tapes bien dfinies : modlisation, estimation, combinaison et dcision, pour lesquelles on devra choisir un formalisme mathmatique concret. Dans les sous-sections suivantes on fera une petite description des formalismes les plus utiliss dans le cadre de la reconnaissance de cibles NCTR.
B A
X (P B
,)
X (P A
18
Ceci dit, une mesure de probabilit vrifie, quels que soient les vnements A et B :
Si Pr est une mesure de probabilit dfinie sur X, une distribution de probabilit p est une fonction qui associe la valeur Pr(A) tout vnement A dun systme {A1, A2, } qui est complet, cest dire, tel que les vnements soient disjoints et vrifient = = . Dans le cas de lidentification de cibles, on supposera que chaque objet appartient une et une seule classe I entre N classes possibles et on appellera x la mesure fournie par le capteur considr un instant donn. Afin de calculer la probabilit dappartenance de la cible chaque classe, on a besoin de certaines connaissances pralables propos des classes susceptibles dtre identifies, notamment : les probabilits a priori pour chaque classe P(J) la densit de probabilit conditionnelle a priori pour chaque classe P(x/J).
Et finalement, on peut retenir la classe qui maximise la probabilit a posteriori . Naturellement, cette approche plutt simple peut tre enrichie avec des concepts plus complexes (en introduisant, par exemple, la notion de cots de dcision), mais lide sous-jacente reste toujours la mme. Puisque la mesure x peut-tre un vecteur, lapproche bayesienne offre une mthode assez intuitive et directe pour la fusion spatiale et temporelle de donnes, et elle peut tre utilise indiffremment pour travailler avec des donnes discrtes ou continues. En tout cas, le lecteur intress trouvera plus dinformations dans la riche littrature disponible sur le sujet. Notre intention ntant pas celle deffectuer une description approfondie de cette approche, on sarrte ici et on continue avec la prsentation des principales techniques de fusion dans le domaine NCTR.
1 )A
i
...2 ,1 i
(rP
)x / I (P
19
On appelle cadre de discernement lensemble dhypothses considres. Une masse de croyance est une fonction m qui attribue un coefficient compris entre 0 et 1 aux parties de X de telle sorte que :
On appelle lment focal toute partie non vide E de X telle que m(E)0 et on note E leur ensemble. On appelle corps dvidence le couple (E,m).
Ds lors quun jeu de masses a t dfini sur lensemble des parties de X, il devient possible de calculer la plausibilit dun lment A de P(X). La fonction de plausibilit est donc dfinie grce la relation :
Lorsquune masse est affecte une partie B de E, nul ne sait a priori sur quel lment particulier de B cette masse peut tre attribue. Lors du calcul de la plausibilit de A, on considre que pour chaque lment B dont lintersection avec A est non nulle, cette masse est attribue uniquement sur les lments communs A et B. Cela revient, en dfinitive, attribuer toute lincertitude en faveur de A. Par consquent la plausibilit reprsente la probabilit maximale quil serait possible destimer si tous les vnements sexprimaient en faveur de A. Dans le mme esprit, on dfinie la fonction de croyance dun sous-ensemble quelconque A de P(X) par :
Inversement au calcul prcdent, qui dfinissait une probabilit maximale, la crdibilit reprsente en fait une probabilit minimale. Comme prcdemment pour toutes les parties B telles que on considre que lincertitude va en dfaveur de llment A. Par consquent toute la masse attribue B est en dfinitive concentre sur les lments de B qui nappartiennent pas lintersection AB. Seules les parties B telles que BA contribuent donc au calcul de cette probabilit infrieure. Intuitivement, on observe que dans le cas dune ignorance totale sur un vnement A, aucun lment focal nintervient en sa faveur ni en sa dfaveur, cest dire quaucun lment focal nest inclus dans A ni intersection non vide avec A et
Dune faon gnrale, les masses de croyance nous permettent de calculer la probabilit des hypothses du cadre de discernement considr en attribuant chaque hypothse incluse dans une partie A une masse gale la masse totale de A divise par le nombre dhypothses contenues dans A (distribution qui-rpartie) et en additionnant lensemble des masses qui lui sont attribues. Si |A| reprsente le cardinal de A on a alors la relation suivante :
1 ) A (leB )A ( leB
1 ) A (leB )A ( lP
+ +
A A A (m
1 ) A ( lP )A ( lP
)A ( lP
1 ) A ( lP
)A ( lP
)i
) A ( leB
)A ( leB
H( P
)A ( leB
dans
et par consquent
= . De mme, tous les lments focaux ont une , ce qui implique que = = .
B A
) (
B mB
) (
B m0 B
0
20
) (m
1 )A (m ) X ( P
) (
et
A leB
) (
A P l
On peut vrifier que la consistance entre la plausibilit, la crdibilit et la probabilit dune hypothse exprime par la relation suivante est bien vrifie :
)i
4.2.3.1
En prsence de plusieurs sources dinformations fournissant chacune un jeu de masses sur un mme cadre de discernement, la rgle de Dempster permet de construire un jeu de masses unique par sommation orthogonale. Une particularit de cette rgle rsulte de ce que les lments focaux de la masse issue de la combinaison sont gnralement diffrents des lments focaux des masses lmentaires, si bien que la premire tape de cette rgle doit tre consacre la dfinition de lensemble des lments focaux de la masse rsultant de la combinaison. Soient m1() et m2() les masses lmentaires fournies par deux sources dinformations indpendantes sur un mme cadre de discernement E, soir m() la masse obtenue aprs combinaison de ces deux masses lmentaires, nous noterons : m() = m1()(+) m2(). Chaque lment focal de m() est le rsultat de lintersection dun lment focal de m1() avec un lment focal de m2(). Par consquent lensemble des lments focaux de m() est constitu par toutes les intersections possibles. Il convient dattribuer une masse chacun de ces lments. La premire tape de cette affectation se fait en attribuant pour chaque intersection dun lment du support de m1() avec un lment du support de m2() le produit des deux masses correspondantes. Puis pour chaque lment du support de m() on recense lensemble des intersections quie aboutissent cette lment et on additionne toutes les masses. La seconde tape, de normalisation, consiste diviser lensemble des masses par 1-K o K est le facteur de conflit qui se calcule en additionnant lensemble des masses qui sont attribues llment . La rgle de Dempster sexprime grce la relation suivante :
avec
)X(P B te A
) C( 2m )B ( 1m
K 1
)X(P B te A
A C B
) C( 2m )B ( 1m
H( lP
)i
H( P
)i
H ( lB e
C B
)A (m
21
La thorie des possibilits, drive de la thorie des ensembles flous et a t aussi introduite par L.Zadeh dans son article Fuzzy Sets as a Basis for a Theory of Possibility en 1978 [18]. Elle fournit une mthode pour formaliser des incertitudes subjectives sur des vnements, cest dire, dans quelle mesure la ralisation dun vnement est possible et dans quelle mesure on en est certain, sans toutefois avoir sa disposition lvaluation de la probabilit de cette ralisation, par exemple parce quon ne connat pas dvnement analogue auquel se rfrer, ou parce que lincertitude est la consquence dune absence de fiabilit des instruments dobservation ou dun doute de lobservateur lui-mme. Ces deux valuations subjectives se formalisent travers une mesure de possibilit et une mesure de ncessit. Etant donne un ensemble de rfrence X, une mesure de possibilit est une fonction dfinie sur lensemble P(X), prenant des valeurs dans [0,1], telle que : i) = = ii) famille densembles Ai P(X) ou sup indique le supremum des valeurs concernes, cest dire la plus grande dentre elles dans le cas fini. Une mesure de possibilit est totalement dfinie si lon attribue un coefficient de possibilit toute partie de lensemble de rfrence X, mais lon peut y arriver plus facilement si lon indique les coefficients attribus aux seules parties lmentaires de X, les singletons, un sous-ensemble quelconque de X pouvant tre regard comme lunion des singletons quil contient. Une distribution de possibilit est une fonction dfinie sur X, prenant ses valeurs dans [0,1], satisfaisant la condition de normalisation suivante : Lensemble des lments de X pour lesquels la distribution de possibilit est gale 1 est son noyau et celui des lments pour lesquels la distribution est diffrente de 0 est son support. Mesure et distribution de possibilit peuvent tre associes bijectivement. Quelques proprits dintrt concernant la possibilit sont :
1 )x (
X x pus
)=
Pour complter linformation dcrivant lincertitude dun vnement, la thorie des possibilits value aussi le degr avec lequel la ralisation de cet vnement est certaine, par l intermdiaire dune mesure de ncessit. Une mesure de ncessit N est une fonction dfinie sur lensemble P(X) des parties de lensemble de rfrence fini X, prenant des valeurs dans [0,1], telle que : i) = = ii) famille densembles Ai P(X) ou inf indique linfimum des valeurs concernes, cest dire la plus grande dentre elles dans le cas fini. Les axiomes dfinissant mesure de possibilit et mesure de ncessite son duaux et donc on peut dfinir le concept de distribution de ncessit partir dun raisonnement similaire celui utilis pour le cas antrieur. En fait, tant donn un ensemble de rfrence X, et soit le complmentaire de toute partie A de X, une mesure de ncessite N peut tre obtenue partir de la donne dune mesure de possibilit , par :
)
)i (
...2 ,1
A(
A( N
X (P A
fni
... 2 ,1
( =
i
)=
1 )A ( )A ( 1 ) A ( ,)A ( xam ) X (P )B ,A (
)i (
...2 ,1
1 ) X(
pus
...2 ,1
( =
i
)=
1 ) X(
, 0 ) (
,0 ) (
22
La dualit entre possibilit et ncessite est mise en vidence grce aux proprits suivantes pour une partie A de X:
Les deux dernires relations indiquent que tout vnement dont on est, au moins un peu, certain est tout fait possible, et quon ne peut avoir la moindre certitude sur un vnement qui nest que relativement possible. 4.2.4.1 Lagrgation de composantes floues
Dans le domaine de la logique floue, la fusion des avis diffrents sur la caractrisation dun mme critre ou des prfrences obtenues par diverses ventualits partir de lutilisation de plusieurs critres est accompli par le choix et utilisation dun oprateur dagrgation, qui dterminera la faon dont interviennent chacun des lments dans le rsultat agrg cherch. Soit donc un ensemble X sur lequel sont dfinis des sous-ensembles flous A1, An . On cherche un oprateur h dfini sur [0,1]n, valeurs dans [0,1], qui permette de construire un rsultat agrg A partir des sous-ensembles considrs. Les oprateurs envisageables sont trs nombreux et peuvent tre groups dans des diffrentes familles : - Oprateurs de moyenne (moyennes classiques, OWAs, intgrales floues ) - Normes et conormes triangulaires - Sommes symtriques - Oprateurs adaptatifs On parlera plus en dtail de certains oprateurs de moyenne (classiques, OWA), ainsi que des normes et conormes triangulaires, dans le cadre de ltude dcrit dans la section ddie la variable possibilit.
0 )A ( N 1 1 )A ( 0 1 ))A ( N 1,)A ( )A ( N
)A ( )A ( N (xam )A (
)=
= =
x(
1 (
A x fni
A(N
X (P
23
En ce qui concerne le reste, on peut faire ici une description trs rapide, afin den avoir une ide intuitive : Les intgrales floues de Choquet et Sugeno sont des operateurs idempotents, continus, croissants et compris entre le minimum et le maximum. Soit un espace mesur flou (, B, ), o B est une -algbre de parties de et une mesure floue sur B et soit une fonction mesurable f dfinie sur et valeurs dans [0,1]. On note = > . Lintgrale de Sugeno de f est dfinie par :
]1, 0 [
On y trouve comme cas particulier les statistiques dordre et donc le minimum, le maximum et la mdiane. Les intgrales de Choquet dfinies par rapport une mesure additive sont quivalentes une moyenne arithmtique pondre, dans laquelle les poids wi affects aux valeurs xi sont gaux ({xi}). Les sommes symtriques sont des oprateurs qui se caractrisent par avoir une proprit dautodualit, qui correspond linvariance du rsultat de lopration par inversion de lchelle des valeurs combiner. Cette autodualit soppose la dualit quon trouvera quand on tudiera les tnormes et t-conormes. Leur forme gnrale est donne par :
)y 1,x 1( g
o g est une fonction de [0,1] x[0,1] dans [0,1], croissante, positive et continue telle que g(0,0)=0. Typiquement, on peut prendre pour g une t-norme ou une t-conorme continue. Les oprateurs adaptatifs prennent en compte le conflit entre les diffrentes distributions de possibilit fusionner et peuvent se comporter comme un min si les distributions sont consonantes et comme un max si elles prsentent un fort conflit. Au del des distributions de possibilit considres (par exemple 1 et 2 dfinies sur D), ces oprateurs utiliseront une mesure h de conflit qui peut tre, par exemple, de la forme :
Pour une description plus en dtail de ces oprateurs, avec des rfrences des articles permettant dapprofondir sur chacun dentre eux, on renvoie le lecteur au chapitre 8 de [1].
) y ,x ( g
) y ,x ( g
) y ,x (
f(
=
1 0
)) f ( , (nim
pus
d f
)x (
24
Si les lments focaux sont les singletons de X, la fonction de plausibilit et la fonction de croyance sont identiques et ont les proprits dune mesure de probabilit : 4.2.5.2 Cas des possibilits Si, par contre des observateurs nattribuent pas de croyance des vnements incompatibles des vnements ne seront affects de masses de croyance non nulles que sils sont concordants. Le corps dvidence est cohrent et donc les lments focaux E1, E2 Ek sont embots, cest dire tels que E1 E2 Ek. Dans ce cas l, on peut dmontrer que la fonction de plausibilit a les proprits dune mesure de possibilit et la fonction de croyance celles dune mesure de ncessit. La figure ci-jointe, extraite de louvrage de Bouchon-Meunier cit au-dessus, montre une rcapitulation des conclusions quon vient dexpliquer :
Figure 9. Position de la thorie des possibilits et de la thorie des probabilits dans le cadre de la thorie de l'vidence [2]
)A (rP )A ( lP )A ( lB e
25
26
Classe Avion
Fonction dapparten.
Distribution de possibilit
Fonction dapparten.
Distribution de possibilit
Paramtre Taille
Valeurs instantanes de N y P
Valeurs instantanes de N y P
Valeurs instantanes de N y P
Paramtre Taille
Paramtre SER
Paramtre SER
CPAV_SER ,CNAV_SER
CPAV_TAI ,CNAV_TAI
Intgration spatiale Possibilit et Ncessit pour la classe Avion PAV ,NAV Dcision finale : identification / classification
Thales Air Defence JRS/RBPEF
elliaT
Classe Hlicoptre
Fonction dapparten. Distribution de possibilit Fonction dapparten. Distribution de possibilit
RES
Mesures
Mesures
Valeurs instantanes de N y P
CPHE_SER ,CNHE_SER
CPHE_TAI ,CNHE_TAI
27
La densit de possibilit D(x) est directement reli la notion derreur ou imprcision dans la mesure radar, est devra tre obtenue chaque instant partir des valeurs instantanes fournies par le capteur impliqu (xC(t)) et sa prcision (C). On parle, donc, dune fonction avec une forte dpendance des caractristiques techniques du radar utilis et qui varie chaque instant. De mme que pour la fonction dappartenance, on peut considrer des fonctions trapzodales pour la densit de possibilit. Un critre habituel est celui de considrer un modle gaussien de variance C et utiliser cette valeur pour dfinir les limites du trapze en question :
28
= =
]) t ,x (D
{ {
} }
) t( N
) t( P
29
CPB,C(t) CNB,C(t) . . .
NB,C(t)
Paramtre X PX,C(t)
Buffer taille M Intgration temporelle
CPX,C(t) CNX,C(t)
NX,C(t)
Le processus dintgration temporelle sera le sujet principale dune section future et donc, on se limitera ici signaler que, en principe, cette intgration sera faite sur les M dernires valeurs instantanes considres (typiquement M=10), qui seront stockes cet effet dans un buffer en mmoire. Comme on le verra plus tard, parfois il peut tre nanmoins intressant de considrer aussi dautres stratgies visant faire lintgration avec le rsultat cumul correspondant linstant prcdent.
30
31
Figure 15. Exemple des donnes relles utilises possibilit (bleu) et ncessit (vert) avant (gauche) et aprs (droite) intgration. La figure montre les mesures correspondant six classes pour un certain paramtre.
32
5.1.1
Fonction A
Cette premire fonction est la seule qui travaille directement sur les rsultats de lintgration temporelle et spatiale, sans intervention daucun type de processus de prise de dcision. Il sagit tout simplement de mesurer de manire objective le degr de similarit entre les rsultats obtenus pour une mthode dintgration temporelle dtermin et les rsultats de classification pour un cas idal. On va donner une bonne note quand on obtient des valeurs de possibilit et ncessite leves pour la bonne classe associe chaque cible et aussi quand on obtient des valeurs de possibilit et ncessit faibles pour les classes qui ne correspondent pas la cible en question. Cela traduit lide intuitive quun algorithme sera bon ds quil sera capable daffirmer lappartenance la bonne classe, mais aussi de rejeter lappartenance de la cible aux classes errones. Dun point de vue mathmatique, cela revient considrer comme des notes les valeurs de la possibilit et la ncessit finales elles-mmes pour la bonne classe et leurs complmentaires pour les classes errones. Puis, on fera une normalisation et une pondration afin davoir une valeur finale entre 0 et 1 dans laquelle la note apporte par la bonne classe ait le mme poids que la note apporte par lensemble des classes errones. Si lon considre Q classes possibles (et donc Q valeurs finales de Pi et Ni, avec i qui variant entre 1 et Q) et une cible de type C (1 C Q), la fonction dvaluation pour chaque instant sera de la forme :
) iN
1( )i P 1( 1 Q
Une note gale 1 veut dire que, aprs les processus dintgration, on a obtenu des valeurs de possibilit et ncessite gales 1 pour la bonne classe et la bonne cible et gales a 0 pour tout le reste de combinaisons errones classe - cible. Une note gale a 0 veut dire que lon est arriv a avoir des valeurs gales a 0 pour la bonne paire classe - cible et gales a 1 pour le reste.
5.1.2
Fonction B
Pour la deuxime fonction considre, on effectuera un processus de dcision par comparaison avec un double seuil au niveau de chaque classe et chaque paramtre, avec trois rsultats possibles : acceptation, rejet ou doute. Il y aura, donc, une dpendance des rsultats par rapport aux seuils utiliss. Dans le cadre de cette fonction, on considrera quil y a eu une russite : - Si lon accepte un paramtre pour la bonne paire classe - cible - Si lon rejette un paramtre pour une paire classe - cible errone On considrera quil y a eu une erreur : - Si lon rejette un paramtre pour la bonne paire classe - cible - Si lon accepte un paramtre pour une paire classe - cible errone Aprs lvaluation de tous les paramtres mesurs pour toutes les classes possibles pour une cible donne, on comptabilise le nombre de russites et derreurs et on calcule leurs pourcentages respectifs par rapport la quantit totale de dcisions prises. Le pourcentage de classifications neutres peut tre obtenu comme le complmentaire de lensemble des pourcentages derreur et de russite.
,1
C i i
=
CN
CP 1 2
) serget ni_sennod( A f 0
33
5.1.3 Fonction C
La troisime fonction dvaluation dveloppe dans le cadre de ce stage est un peu plus complexe que les prcdentes. Elle travaille sur les valeurs finales de possibilit et ncessit pour chaque classe (aprs intgration temporelle et spatiale). Elle sappuie sur la notion derreur employe Thales pour ses applications didentification NCTR radar, selon laquelle il y a une erreur : 1. Si lon rejette la bonne classe 2. Si lon naccepte pas la bonne classe et on accepte une autre classe (errone). Lobjectif de la fonction C est de fournir une note globale qui prenne en compte, avant tout, le fait de ne pas avoir derreurs, mais aussi qui soit capable de mettre en valeur la puissance discriminante de lalgorithme dintgration valu : si lon accepte toujours toutes les cibles, ou que lon les dclare toujours douteuses (ni accepts, ni rejets), on aura un algorithme avec un taux derreur nul, mais qui ne semble pas trop performant quand mme. Cest pourquoi la fonction C va noter les rsultats de lintgration en tenant compte, tout dabord du statut affect la bonne classe mais aussi du nombre de classes acceptes et rejetes dans le cadre de chaque identification. Voici un modle schmatique pour le calcul des rsultats :
Dans lensemble de mesures pour toutes les classes possibles pour une cible donne, on regarde la bonne classe (celle de la cible identifier) : accepte douteuse
ERREUR 1
non
oui ERREUR 2
=0
34
Lalgorithme dvaluation est le suivant : 1. On regarde la classification faite pour la bonne classe pour une cible donne. 2. Si la bonne classe est rejete, on donne une note 1 (ngative) et on finit. 3. Si la bonne classe est accepte, on donne une note qui dpend de la quantit de classes acceptes et rejetes en total (grce au systme de double seuil, une classe ne peut pas tre accepte et rejete au mme temps). 4. Si la bonne classe est douteuse, on regarde le reste de classes et a) si une autre classe est accepte, on donne une note 2 (ngative) et on finit. b) si aucune classe nest accepte, on donne une note qui dpend de la quantit de classes rejetes (et qui sera pondr par le paramtre de telle sorte que cela sera la note maximale). Certaines proprits de cette fonction peuvent tre contrles grce aux paramtres qui interviennent dans le processus dvaluation : Les paramtres nous permettent de contrler la pnalisation associe aux erreurs didentification. On considrera ici des valeurs ngatives (ex. = 1). Les paramtres et nous permettent dtablir limportance relative daccepter ou pas la bonne classe face limportance de rejeter les classes errones.
On va considrer des types diffrents de matrices de confusion et deux manires diffrentes de les construire pour chacun de ces types.
35
Dabord, on fera une distinction entre les matrices dacceptation et les matrices de rejet : Les matrices dacceptation expriment la probabilit avec laquelle on accepte les differentes classes pour une cible donne. Dans le cas idal, on acceptera seulement la bonne classe pour chaque cible considre et on obtiendra, donc, une matrice dans laquelle tous les lments qui ne se trouvent pas sur la diagonale son nuls (matrice identit).
Exemple : C1 T1 T2 T3 T4 T5 T6 C2 C3 C4 C5 C6
Les matrices de rejet expriment la probabilit avec laquelle une classe donne est rejette au cours du processus didentification pour une cible dun certain type. Dans le cas idal, tous les lments de la diagonale seront nuls et les autres gales 1 puisque on ne rejettera jamais la bonne classe pour la cible identifier et on rejettera toujours les autres.
Exemple :
On fera aussi une deuxime distinction par rapport la manire dont les matrices sont construites : On travaillera avec des matrices normalises, avec des valeurs entre 0 et 1, qui expriment le pourcentage de temps (~probabilit) pendant lequel chaque classe a t accepte ou rejete pour chaque type de cible. (voir exemple ci-dessus). On travaillera aussi avec des matrices non normalises, qui montreront la quantit totale de classifications effectue pour chaque paire classe - cible, chaque unit correspondant un instant dans un axe temporel discrtis.
Exemple :
Bien que la simple observation des matrices de confusion offre dj une ide gnrale de la qualit du processus de classification valu, on travaillera avec des mesures quantitatives plus rigoureuses, objectives et prcises.
36
5.2.2
Indicateurs de prcision
On calculera ces indicateurs sur les matrices non normalises dacceptation. On parlera de trois types de prcision : La prcision pour lutilisateur est le pourcentage de fois quune certaine classe a t bien affecte son type cible correspondant (une valeur par colonne).
jj
La prcision pour le ralisateur est le pourcentage de fois que, pour une cible dun certain type, on a affect la bonne classe (une valeur par ligne).
La prcision totale est la relation entre la quantit de bonnes identifications et la quantit totale didentifications effectues (une valeur par table).
Exemple.
ji
ji
ii
ji n , R
M dI seno
ji
M M
M M
M p M
kk
i , aer l
j , litu
j i
(((
M dI
j n i
((
tpecca , Q tejer , Q
E E
37
Cette expression est trs utile pour avoir une vision intuitive de la smantique du coefficient. En effet, on peut supposer des variables alatoires indpendantes qui reprsentent la classification dun mme objet (ou cible) par deux observateurs. La probabilit pour quun objet soit classifi par les deux dans la mme catgorie C est donne par + + . Si on tend ce raisonnement toutes les catgories
C C
attribuables au hasard exclusivement. Cet ainsi que la valeur kappa montre la relation entre lexcs
C
Au del de cette approche base sur lutilisation de probabilits, on peut obtenir une estimation de lindice kappa en remplaant celles-ci par des frquences dchantillonnage :
ou N est la somme de toutes les valeurs de la matrice de confusion non normalise (X).
Dans le cadre de notre tude, on utilisera toujours cette dernire expression. En ce qui concerne les possibles valeurs de kappa, on trouve que la concordance maximale possible correspond une valeur =1. On obtient =0 pour un degr de concordance qui concide avec celui que lon pourrait attendre cause du hasard seul. Si la concordance est plus grande que celle attribuable au hasard, kappa sera positif et vice-versa. La valeur minimum de kappa dpend des distributions marginales Xi+ et X+i.
ii
ii
X N
X N
ii
+ + + +
CC
possibles,
et lexcs maximum
ii
ou
ii
+ + + +
es
38
On peut aussi considrer lchelle numrique propose dans [12], rsume dans ce tableau : Valeur de < 0.20 0.21 0.40 0.41 0.60 0.61 0.80 0.81 1.00 Force de la concordance Pauvre Faible Modre Bonne Trs bonne
Un traitement plus rigoureux de ce coefficient impliquerait un travail avec des intervalles de confiance en fonction du nombre dchantillons considrs, mais au cours de nos simulations nous nous limiterons travailler avec des valeurs ponctuelles qui resteront valides, en tout cas, pour nous donner une ide gnrale de lvolution des performances pour la classification associes chacun des algorithmes tudis.
39
40
parle dans la section de la NCTR radar . On considrera trois paramtres de type A (que lon appellera A1, A2 et A3) et deux paramtres de type B (que lon appellera B1 et B2). Toutes les fonctions dvaluation utilises ont t conues pour donner comme rsultat les valeurs correspondantes aux paramtres type A et type B isols (aprs lintgration spatiale partielle A1+A2+A3 et B1+B2, mais avant lintgration spatiale globale A+B) et aussi la valeur finale aprs intgration spatiale entre les ensembles A et B (en total, trois valeurs par valuation).
Dans la suite de ce rapport, on utilisera le critre suivant pour toutes les figures reprsentant des rsultats des ces trois types : Couleur rouge, symbole toile (*) et trait point (.) pour les paramtres type A Couleur vert, symbole triangle () et trait tirets (--) pour les paramtres type B Couleur bleu, symbole croix (x), et trait continu (-) pour les rsultats de la fusion des paramtres A et B. Pour les figures prsentant des rsultats pour les mesures sur des matrices de confusion, on respectera toujours les critres suivants : Couleur bleu, symbole croix (x), et trait continu (-) pour la prcision et lerreur quadratique dacceptation. Couleur rouge, symbole toile (*), trait point (.) pour le coefficient kappa et lerreur quadratique de rejet.
=1 4150
Classes errones (Ti,Cj ij) : Valeur 0 0.1 0.2 Occurrences 6225 374 435
=1 11054
Figure 18. Distribution des valeurs de possibilit pour les donnes sans intgration temporelle
On observe que pour la bonne paire classe - cible les valeurs sont presque toujours gales 1. Par contre, pour les paires errones il y a de nombreuses valeurs au-dessous de 1 et une grande quantit de valeurs proches de 0.
41
Les fonctions dvaluation donnent ces rsultats : Fonction A FUSION FINALE 0.5809
PARAMETRES A 0.3483
PARAMETRES B 0.2326
Fonction B TAUX DE REUSSIT ELEMENTAIRE FUSION A B 0.7633 0.7187 0.6195 Fonction C FUSION FINALE 0.1547 Fonction D Russite Erreur FUSION FINALE 0.1430 0.0101
PARAMETRES A 0.1260
PARAMETRES B 0.1260
PARAMETRES A 0 0.0016
Voici la matrice de confusion normalise pour lacceptation : 0.9637 0.9969 0.0573 0.0789 0 0 0.7289 0.9969 0.1293 0.2341 0 0 0.9912 0.6114 0.9863 0.7875 0 0 0.9556 0.0748 0.7093 0.9924 0.2647 0.8776 0.8928 0.0305 1.0000 1.0000 1.0000 0.6327 0.0015 0 0.0020 0.2935 0.2114 1.0000
Erreur quadratique : 9.1751 Voici la matrice non normalise avec les mesures de prcision : 685 805 50 31 0 0 0.4360 596 805 89 92 0 0 0.5088 707 487 600 276 0 0 0.2899 680 52 433 326 161 43 0.1923 kappa = 665 20 612 329 652 31 0.2824 0.3016 1 0 1 59 128 49 0.2059 0.2055 0.3711 0.3361 0.2929 0.6929 0.3984 0.3293
Et voici finalement la matrice de confusion pour le rejet: 0.0140 0.0031 0.8751 0.8932 1.0000 1.0000 0.1255 0.0031 0.6029 0.5343 1.0000 1.0000 0.0074 0.0031 0.0137 0.0381 0.9846 0.9796 0.0282 0.3844 0.2674 0 0.7353 0.0612 0.0280 0.9038 0 0 0 0.1837 0.9985 1.0000 0.9980 0.6816 0.7853 0
Erreur quadratique : 11.6448 Ces rsultats que lon vient dobtenir seront trs intressants dans la suite puisquils nous serviront de rfrence, de point de dpart, pour avoir une ide plus prcise de la qualit des rsultats aprs intgration temporelle.
42
]1,0[
) ' y ,y , ' x ,x (
]1,0[
) y ,x (
, ( x x et y y )
m(x,y) m(x,y)
[1]
43
Figure 21. Fonction B russite (gauche) et erreur (droite) lmentaires - "K sur M"
Figure 22. Taux de russite (gauche) et derreur (droite) - "k sur M"
44
Voici un rsum des rsultats quantitatifs le plus importants qui accompagnent les graphiques daudessus : Fonction A k 1 3 10 Fonction B k 1 3 10 Fonction C k 1 3 10
TAUX DE REUSSIT ELEMENTAIRE TAUX DERREUR ELEMENTAIRE
Matrices de confusion: Erreur quadratique acceptation Erreur quadratique rejet Prcision gnrale Coefficient kappa k = 1 6.1555 8.0644 0.3826 0.3557 k = 3 8.7214 11.4002 0.3482 0.3208 K = 10 13.8264 15.8039 0.2660 0.2385
Intuitivement, ce comportement peut tre expliqu par le fait que prendre une valeur petite de k implique une stratgie plus risque pour le processus de classification, cest dire, plus discriminante, mais la fois plus susceptible de provoquer des erreurs didentification pour la bonne classe. Le fait de prendre une valeur plus grande, par contre, suppose une attitude plus conservatrice : on acceptera plus de classes pour chaque identification, on deviendra moins discriminant, mais on commettra moins derreurs.
45
moyennes classiques (arithmtique, gomtrique, harmonique, etc.) sur un chemin allant de loprateur min jusqu loprateur max :
Dans les figures suivantes, on observe les variations des performances pour une variation
2 x
01
2 1
) a( xam )A (
h:
)A ( 1h : 1
a1
1 i
)A ( 0h : 0
( )
n
ia 1 i 1 n
)A ( 1 h : 1
) a( nim )A (
h:
a ,..., 2 a , 1a h
n 1
)=
M. gomtrique
46
Figure 26. Fonction B russite (gauche) et erreur (droite) lmentaires - "Moyennes gen."
A cause du comportement monotone observ, il semble intressant de regarder les valeurs numriques correspondant aux valeurs extrmes du paramtre, mais puisque pour celles-ci on obtient un oprateur qui va vers le min et le max, on renvoie le lecteur aux rsultats obtenus dans la section prcdente pour les valeurs k = 1 (min) et k = 10 (max). En effet, les moyennes gnralises nous apportent une alternative lapproche k sur M qui parcourt le mme intervalle de performances traversant ce que lon pourrait considrer comme un chemin diffrent . Parmi les avantages introduits par les moyennes on peut nommer une prcision
47
plus grande grce la possibilit de faire varier le paramtre de manire continue et aussi la mthode de calcul employe (selon les circonstances et lenvironnement de calcul notre disposition, il peut tre ou non plus intressant de calculer une moyenne arithmtique, par exemple, que de ranger une vecteur par ordre croissant et choisir un lment dans une position dtermine).
Ceci dit, la fusion de donnes par un oprateur OWA est dfinie par la relation :
=
Une premire option pour travailler avec ce type doprateurs est celle de choisir quelques formes gomtriques plutt simples et intuitives pour la distribution de poids, comme par exemple une distribution triangulaire croissante, triangulaire dcroissante ou pyramidale. Il sagit dune approche assez nave, laquelle il manque la rigueur formelle de celles que lon considrera plus tard, mais qui peut apporter des informations dintrt propos du comportement des oprateurs OWA. 6.3.3.2 Distribution de poids triangulaire croissante
Ceci dit, on commence par considrer une distribution de poids de forme triangulaire croissante, selon la pondration (normalise) : [ 1 2 3 4 5 6 7 8 9 10 ]
On peut considrer des permutations circulaires successives afin dtudier les performances pour des positions diffrentes du poids maximal dans la distribution, toujours avec la forme relative ci-dessus.
)i(
a iw 1
1,
w1 i
et wi [0,1]
48
Les figures ci-jointes montrent les performances obtenues. Laxe des x indique la position du poids maximal :
Figure 31. Fonction B russite (gauche) et erreur (droite) lmentaires - "OWA - T. croissante"
49
Les performances observes pour les fonctions dvaluation (et exception de le taux derreur globale), toujours au-dessous de celles obtenues pour loprateur min, sont meilleures quand le poids maximal se trouve en dernire position (distribution triangulaire croissante pure ). Cela est logique, puisque cette distribution est la plus proche loprateur min, et les rsultats obtenus sont donc cohrents avec ceux de la section prcdente. En gnral, on observe que quand la distribution de poids est telle que les valeurs maximales obtiennent la plus part du poids, les performances gnrales deviennent pires (ce qui arrive pour des valeurs centrales pour le poids maximum) et vice-versa. 6.3.3.3 Triangulaire dcroissante
Si lon continue avec lesprit de lapproche nave, on peut considrer une distribution de poids complmentaire celle que lon vient dutiliser, une distribution triangulaire dcroissante :
[ 10 9 8 7 6 5 4 3 2 1 ]
Si lon applique un critre analogue au cas antrieur pour les rotations, on obtient des rsultats complmentaires ceux obtenus auparavant :
50
Figure 36. Fonction B russite (gauche) et erreur (droite) lmentaires - "OWA - T. dcroissante"
51
Maintenant les meilleurs rsultats, qui restent toujours assez au-dessous de ceux obtenus pour loprateur min pur, sobtiennent pour les positions de poids maximal qui offrent une proportion totale du poids plus grande aux valeurs les plus petites du vecteur ordonn, cest--dire, aux valeurs minimales de lensemble de valeurs intgrer. 6.3.3.4 Pyramidale
Une troisime ide dans le cadre de lapproche OWA avec des distributions naves est dutiliser une distribution de structure pyramidale avec des poids relatifs (normaliss) de la forme :
[ 1 2 3 4 5 5 4 3 2 1 ]
Si, nouveau, on fait varier la position du maximum, on trouve les performances suivantes :
52
Figure 41. Fonction B russite (gauche) et erreur (droite) lmentaires - "OWA - pyramidale"
A nouveau, on trouve les performances les plus attirantes (sauf taux derreur) pour les distributions qui montrent une tendance concentrer la plupart du poids dans la partie du vecteur des valeurs intgrer correspondant aux valeurs minimales. Les premires observations drives de lutilisation des oprateurs OWA semblent recommander donc de sapprocher des caractristiques de loprateur min pour amliorer les performances.
53
En tout cas, les rsultats obtenus correspondent un comportement assez conservateur , peu risque , avec un taux de russite (toujours infrieur au 16%) et un taux derreur (toujours infrieur au 1%), valeurs globales trs baisses pour tous les distributions et tous les rotations considres.
6.3.3.5 MEOWA
Au del de ces premires tentatives caractre plutt naf , les oprateurs OWA offrent une varit presque illimite de stratgies envisageables pour le choix du vecteur de poids et donc pour la fusion des donnes floues. Ici, on essaiera dtablir un critre plus rigoureux, plus systmatique, pour lvaluation de ce type doprateurs. On commencera, tout dabord, par dfinir quelques concepts dintrt dans le domaine des OWA: La mesure de orness est un indicateur de la similarit entre un oprateur OWA donne et loprateur OR (max). On aura toujours orness(W) [0,1].
i
1 i
La mesure de andness est une mesure complmentaire de lantrieur et indique la similarit entre loprateur OWA considr et loprateur AND (min). A nouveau, on aura toujours andness(W) [0,1].
i
1 i
Finalement, on peut dfinir un troisime indicateur, celui de la dispersion, qui montre le degr jusquau quel un oprateur OWA prend en compte toute linformation disponible dans le vecteur de donnes intgrer pour le processus de fusion. La notion de dispersion et proche de celle dentropie. Malgr lexistence de nombreux types dentropie (entropies de Rnyi, entropies dordre introduites par Darczy, entropies R-normes, etc.) on se placera ici prs de lapproche originelle propose par Shannon en 1948 et on considrera une mesure de dispersion normalise de la forme :
i
Dans la suite, on utilisera les rsultats prsents par Pter Majlender dans son article OWA operators with maximal entropy [15]. Cet article dcrit lapproche originalement propose par OHagan [16] pour obtenir un vecteur de poids OWA avec lentropie maximale Shannon pour une certaine valeur dorness. Cest ainsi que lon essaiera dvaluer les performances des oprateurs OWA en faisant varier la valeur dorness considre et en calculant en chaque cas le vecteur de poids associ (qui aura toujours lentropie maximale cause du procd choisi pour le calcul). Mathmatiquement, on devra rsoudre un problme de maximisation de la forme :
n ,...,1 i ,1
wi n
1 w 1 1 n nnod tnate
((
w nl i w
) )=
1 i
nl w(
w1 i
1 1n
)w(ssenro 1 )w (ssendna
nl
wi n
=
((
) )
n
) (
w noisrepsid
w ( ssenro
n
i n i
((
) )
resimixam
54
La solution gnrique pour un oprateur OWA de n composants propose par OHagan (dont la dmonstration et lexplication en dtail se trouvent dans larticle de Majlender) est base sur lutilisation de ces formules :
Si lon utilise ces expressions pour valuer les performances des oprateurs MEOWA en fonction des diffrentes valeurs de orness dans le cadre de notre tude sur lintgration temporelle de la variable possibilit, on obtient des rsultats de la forme :
[Laxe x des figures montre le degr dorness, pour 101 valeurs dans lintervalle [0,1] telles que orness=0.01x, 0x 100 ]
1 j
w j n1w 1 n
wn
1- n
1- n
1- n
1wn 1 1 1w n wn 1
1 1
n n
1- n
[(
) + ] (( ) ) = ( ) +
= ((
) ) [((
) )
55
Lobservation des rsultats obtenus nous permet dobtenir des conclusions similaires celles obtenues pour lapproche k sur M , o lon se dplaait aussi entre le min et le max, et les meilleures performances en termes de discrimination sobtenaient pour le min avec une pnalisation importante en terme de taux derreur. A nouveau, on trouve que les performances gnrales sauf le taux derreur amliorent quand lorness diminue, jusqu un maximum (pour lequel le taux gnral de russite se trouve proche de 25%) obtenu pour orness=0 (oprateur AND ou min). Par contre, le fait dadopter une approche plus risque comme celle de loprateur min cause une augmentation trs importante du taux derreur, qui monte au-dessus de 6%, valeur non tolrable dans le cadre dapplications militaires dans lequel lon travaille. En tout cas, lutilisation des ME-OWA nous apporte un outil trs intressant pour le futur, puisque lon obtient une variation avec un caractre beaucoup plus continu que celle associe aux oprateurs k sur M , parcourant le mme intervalle de performances, ainsi quune prcision thoriquement infinie pour le choix du point de lespace mtaphorique entre les oprateurs min et max o lon veut se placer (par opposition aux dix possibilits discrets de k sur M ).
56
Les chercheurs Filev et Yager ont propos dans leur article [13] une mthode pour lapprentissage du vecteur de poids associ un oprateur OWA partir des observations pralables que lon explique par la suite. Il sagit dune technique qui se rapproche de la thorie des rseaux de neurones et qui est aussi base sur la mthode de la descente du gradient. On considrera que lon a une collection de m ensembles de donnes (ak1, ak2, , akn) que lon ordonnera dans les ensembles (bk1, bk2, , bkn) et pour chacun desquels on connat la valeur agrge idale dk associ. On peut essayer de trouver une mthode itrative qui nous permette dapprendre la distribution de poids ideale WT=[w1, w2, , wn] telle que : pour k entre 1 et m + + + = En fait, on cherchera le vecteur de poids WT qui minimise lerreur quadratique instantane :
2
k
A nouveau, on trouve un problme doptimisation avec les contraintes imposes par la dfinition des OWA: 2.
Ce problme peut tre transform en un problme non linaire sans contraintes si lon reprsente chacun des poids OWA selon lexpression :
On remplace cette valeur dans lexpression de lerreur ek , et puis on applique une technique de descente de gradient, similaire celles utilises pour la rtro - propagation dans le domaine des rseaux de neurones, de telle sorte que lon obtienne une rgle pour lactualisation des valeurs de de la forme :
k
A partir des expressions prcdentes on obtient la rgle finale pour lactualisation de lambda :
Ceci dit, lalgorithme propos par Yager et Filev pour lapprentissage du vecteur de poids est le suivant : 1. On commence avec une estimation arbitraire des valeurs i (l) (par exemple, i (l)=0, qui correspond un vecteur de poids avec tous ses lments gaux 1/n) et une nouvelle observation de valeurs ordonnes (bk1, bk2, , bkn) avec leur valeur agrge correspondante dk.
ik
b iw
) l( i
)1
l( i
ik
b iw
=
k i
)(
)
)(
i=[1,n]
w nkb
...
w 2 kb
w 1kb
On dnotera par
) l( i
) l( i
)1
l(
1 j
iw
w1 i
1,
1.
et wi [0,1]
w nkb
...
w 2 kb
w 1kb
=(
w nkb
...
w 2 kb
e
n
w 1kb
57
3. On utilise les poids estims pour calculer une estimation de la valeur agrg partir du vecteur de valeurs intgrer : 4. Finalement, on actualise les valeurs des i estims :
5. On rpte le processus un certain nombre de fois ou jusqu ce que lon arrive avoir une erreur dapproximation infrieure un certain seuil. Dans notre cas, les valeurs intgrer sont des ensembles de valeurs de possibilits instantanes et la valeur agrge de rfrence pour chacun de ces ensembles sera 1 pour les bonnes paires classe cible et 0 pour les paires errones. Si lon choisit un taux dapprentissage =0.35, il suffit de trs peu ditrations pour observer une tendance vidente vers le vecteur de poids W T= [0 0 0 0 0 0 0 0 0 1], c'est--dire, le vecteur de poids qui minimise lerreur quadratique et qui semble tre celui qui correspond loprateur min. On constate avec plaisir que ce rsultat est cohrent avec ceux obtenus pour tous les autres oprateurs jusqu prsent : Itration 0 1 2 3 4 5 6 7 8 9 10 w1 0.1000 0.0006 0.0003 0.0002 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 w2 0.1000 0.0006 0.0003 0.0002 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 w3 0.1000 0.0006 0.0003 0.0002 0.0002 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 w4 0.1000 0.0006 0.0003 0.0002 0.0002 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001
w5 0.1000 0.0007 0.0003 0.0002 0.0002 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001
w6 0.1000 0.0007 0.0004 0.0002 0.0002 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001
w7 0.1000 0.0008 0.0004 0.0003 0.0002 0.0002 0.0001 0.0001 0.0001 0.0001 0.0001
ik
b ) l( i w
) l( i
)1
l( i
) l( n w nkb
...
) l( 2 w 2 kb
) l( 1w 1 kb
1 j
) l( j
) l( i
) l( i w
kd
)(
w8 0.1000 0.0009 0.0005 0.0003 0.0002 0.0002 0.0002 0.0001 0.0001 0.0001 0.0001
w9 0.1000 0.0012 0.0006 0.0004 0.0003 0.0003 0.0002 0.0002 0.0002 0.0001 0.0001
w10 0.1000 0.9933 0.9966 0.9977 0.9983 0.9986 0.9988 0.9990 0.9991 0.9992 0.9993
58
6.3.4
A partir de lapproche k sur M , on a commenc notre tude des diffrents oprateurs de fusion pour lintgration temporelle avec les oprateurs de moyenne. On a fait des simulations pour des moyennes gnralises et pour des oprateurs OWA. Les rsultats obtenus nous permettent de tirer quelques conclusions : Le pouvoir discriminant de lalgorithme augmente quand on sapproche de loprateur min. Cela signifie que lon adopte une approche plus risque , qui implique une augmentation des taux de russite et erreur globales. Cest ainsi que loprateur min est celui qui nous permet doptimiser les rsultats obtenus travers les diffrentes fonctions dvaluation, ainsi que les mesures sur les matrices de confusion et le taux gnral de russite. Par contre, le taux derreur obtenu avec cet oprateur est trop lev pour les requis des applications dans le cadre desquelles on travaille. Ceci dit, il semble souhaitable dapprofondir dans la direction de loprateur min et, ventuellement, dessayer de trouver une solution pour contrler et rduire le taux derreur associ. En tout cas, les oprateurs tudis dans cette section restent des outils avec des caractristiques trs intressantes dont la possible utilisation dans le cadre de la fusion floue NCTR ne doit pas tre rejete face lavenir.
Le min est la plus grande t-norme et donc on peut considrer que toute t-norme a un comportement conjonctif. En effet, on vrifie :
)y ,x (nim ) y ,x ( t , 1,0 )y ,x (
x ( t , 1,0
[ ]
) 'y
y , 'x
x( ,
1,0
) ' y ,y , ' x ,x (
) x ,1( t
)1,x ( t , 1,0
[ ]
) z ,y ( t ,x t
z ,) y ,x ( t t , 1,0
) z ,y ,x (
] [
]= [
59
A loppos, on peut considrer la t-norme dite drastique , qui est toujours plus petite que toutes les autres, et qui est dfinie par :
Par consquent, on peut affirmer que toutes les t-normes seront comprises entre le min et la t-norme drastique mais, en tout cas, il faut noter quil ny a pas dordre total sur lensemble des t-normes. A partir dune t-norme et dune complmentation c, un autre oprateur T appel t-conorme peut tre dfini par dualit :
)) y ( c ,)x (c( t
Les t-conormes gnralisent aux ensembles flous la notion de runion ou de ou logique, par opposition au caractre conjonctif des t-normes. Selon un raisonnement parallle celui utilis pour les t-normes, on peut dire que les t-conormes sont des fonctions T :[0,1] x [0,1] [0,1] telles que : - T est commutative, associative et croissante par rapport aux deux variables. - 0 est lment neutre : = = De plus, on trouve que T(0,1) = T( 1,1) = T( 1,0) = 1, T(0,0) = 0, et 1 est lment absorbant :
.1 )1,
Loprateur max est la t-conorme la plus petite, c'est--dire, tout t-conorme vrifie :
Et, nouveau, on peut dfinir une t-conorme plus grande que le reste, dite drastique, selon lexpression :
Quelques proprits dintrt pour les t-normes et t-conormes cits par I. Bloch dans son introduction [1] sont : Toute t-norme ou t-conorme est distributive par rapport au min et au max et lon a donc des galits du type : Les seules t-normes et t-conormes qui sont mutuellement distributives sont le min et le max . Les seules t-normes et t-conormes idempotentes sont le min et le max . A partir de toute t-norme t et de toute fonction continue strictement croissante h de [0,1] dans [0,1] telle que h(0) =0 et h(1) = 1, on peut construire une autre t-norme t par la formule : ce qui donne un moyen de gnrer des familles de t-normes partir dun exemple concret.
)) y (h ,)x (h( t
1
) y ,x ( ' t , 1,0
) y ,x (
) y ,x ( 0T , 1,0
] [
) y ,x (
]=
tnemertua 1 0 x is ,y y is ,x
)y ,x (xam )y ,x ( T, 1,0 )y ,x (
x ( t , 1,0
)x ,0( t
)0,x ( t , 1,0
[ ]
yxT
, (
, 1,0
) y ,x (
) y ,x ( 0 t , 1,0
) y ,x (
x
tnemertua 0 1 x is ,y y is ,x
=
60
Dans le cadre de notre tude pour la variable possibilit, aprs avoir constat que les rsultats les plus intressants pour les oprateurs de moyenne taient ceux proches du min, on utilisera exclusivement des t-normes dans le reste de cette section pour aller au del de cette frontire et essayer damliorer les performances dintgration.
Pour plus dinformations sur les t-normes et co-normes archimdiennes, on renvoie le lecteur au chapitre 8 de [1] . Lexpression concrte de loprateur est de la forme:
) yx
o est un paramtre positif. Parmi les cas particuliers pour cette t-norme on doit signaler que : - Pour = 1 on retrouve le produit (oprateur dit probabiliste ). - Pour on retrouve la t-norme drastique dcrite ci-dessus. Les rsultats obtenus par les simulations dvaluation de performances pour les t-normes de Hamacher sont de la forme :
[Dans toutes les figures de cette section, laxe des x montre la variation du paramtre caractristique associ chacune des diffrentes familles de t-normes considres, selon une relation de type paramtre = (-10 x 10). On a choisit cette chelle pour essayer dvaluer les diffrents comportements pour des valeurs des paramtres entre 0 et .]
01
x ()
+
1(
yx
) y ,x (
H t , 1,0
) y ,x (
) y ,x ( t
'
y,
1,0
) ' y ,y ,x (
) x ,x ( ' t , 1,0
[ ]
<
<
61
Malgr une monte importante de lerreur, on trouve une certaine amlioration du reste des performances gnrales par rapport loprateur min. Ce fait est plus vident pour des valeurs de qui tendent vers linfini.
62
o s est un paramtre strictement positif. A nouveau, on trouve quelques cas particuliers : - Si s 0, la t-norme tend vers le minimum. - Si s , la t-norme tend vers la t-norme dite de Luckasiewicz . - Si s = 1 on retrouve le produit nouvellement.
Les t-normes et t-conormes de Frank prsentent la proprit unique de vrifier lgalit suivante:
) y ,x ( T
) y ,x ( t , 1,0
) y ,x (
= +
s gol
) y ,x ( F t ,
10 ,
) y ,x (
)(
63
A nouveau, on observe des performances gnrales lgrement meilleures pour des valeurs leves du paramtre s, bien quici laugmentation relative de lerreur soit plus accentue et plus vidente partir dun certain seuil.
La classe Dombi de t-normes nous permet de parcourir tout le espace de t-normes entre le min et la tnorme drastique, de telle sorte que : - Pour 0, la t-norme tend vers la t-norme drastique. - Pour , la t-norme tend vers loprateur min
nonis
x is
y 1 1
x 1
0 ) y ,x ( D t
64
Les rsultats pour lintgration de la variable possibilit dans le cadre de notre systme NCTR sont de la forme :
yx
+
y
nonis
yx
y uo 0
x is
1D t
65
On constate nouveau la mme tendance dauparavant en ce qui concerne le compromis entre les performances gnrales et taux derreur associ une approche plus ou moins risque . Cest ainsi que lon obtient les meilleurs performances gnrales (avec un taux de russite suprieur 25%), mais aussi le taux derreur le pire (au-dessus du 6.5%) pour des valeurs de p qui tendent vers 0, ce qui correspond la t-norme drastique.
Et parmi les cas particuliers dintrt, on peut mentionner : - Pour p , la t-norme tend vers loprateur min - Pour p=1, on obtient nouveau la t-norme de Lukasiewicz Les rsultats obtenus pour les t-normes de Yager sont de la forme :
0,
p p
1 1 xam )y ,x (
((
+(
)x ( f *
) y ,x ( t , 1,0
) y ,x (
Yt
66
67
On observe un comportement assez similaire celui des t-normes de Dombi. En fait, on retrouve les rsultats les plus risqus, c'est--dire, les plus discriminants mais aussi les plus susceptibles de commettre des erreurs, nouveau, pour des valeurs du paramtre qui tendent vers 0 et qui correspondent donc la t-norme drastique. En gnral, il semble que le comportement des familles de Dombi et de Yager offre des performances similaires pour les donnes considres.
PARAMETRES A 0.3643
PARAMETRES B 0.2737
Fonction B TAUX DE REUSSIT ELEMENTAIRE FUSION A B 0.8479 0.7831 0.7562 Fonction C FUSION FINALE 0.1926
PARAMETRES A 0.1540
PARAMETRES B 0.1544
68
Fonction D Russite Erreur FUSION FINALE 0.2582 0.0654 PARAMETRES A 0 0.0021 PARAMETRES B 0.2433 0.0678
Voici la matrice de confusion normalise pour lacceptation : 0.7926 0.9047 0 0 0 0 0.1789 0.9687 0.0086 0 0 0 0.9912 0.1772 0.9221 0.4426 0 0 0.5905 0.0038 0.2154 0.9242 0.0936 0.4286 0.6808 0.0027 1.0000 0.9924 1.0000 0.1224 0 0 0.0020 0.0647 0.0820 1.0000
Erreur quadratique : 5.1779 Voici la matrice non normalise avec les mesures de prcision : 551.0000 733.0000 0 0 0 0 0.4291 172.0000 778.0000 6.0000 0 0 0 0.8138 707.0000 143.0000 544.0000 173.0000 0 0 0.3472 498.0000 3.0000 134.0000 299.0000 56.0000 21.0000 0.2957 kappa = 581.0000 2.0000 612.0000 326.0000 652.0000 6.0000 0.2992 0 0 1.0000 13.0000 50.0000 49.0000 0.4336 0.2196 0.4690 0.4194 0.3687 0.8602 0.6447 0.4041
0.3785
Et voici finalement la matrice de confusion pour le rejet: 0.1424 0.0953 1.0000 1.0000 1.0000 1.0000 0.7889 0.0313 0.9893 0.9975 1.0000 1.0000 0.0074 0.7984 0.0779 0.5574 1.0000 0.9796 0.3874 0.9962 0.7716 0.0076 0.9064 0.5714 0.3148 0.9962 0 0.0076 0 0.8776 1.0000 1.0000 0.9980 0.8756 0.9180 0
Erreur quadratique : 5.2243 La conclusion semble vidente: les t-normes nous permettent d'augmenter le niveau de risques pris pour l'intgration, nous permettent d'adopter des approches plus risques (avec des taux d'erreur et de russite plus leves au mme temps) que celles correspondants aux oprateurs de moyenne. Il sagit donc dun type doutils qui peut apporter des grands avantages, mais quil faudra utiliser avec prcaution.
69
ou w est un paramtre entre 0 et 1. Evidemment, pour w = 1, la contribution du pass est nulle et lon retrouve la stratgie que lon avait utilise dans tous les cas prcdents. Voici quelques exemples pour un paramtre quelconque et une intgration de base de type k sur M sur laquelle on a ralis une moyenne avec diffrentes valeurs de w :
)1
t( eelumuc P
70
Valeurs instantanes
w = 0.8
w = 0.5
w = 0.2
Figure 70. Exemples de moyenne exponentiel pour la double intgration temporelle (cas gnrique, avec la possibilit en bleu et la ncessite en vert)
71
Les rsultats obtenus pour cette nouvelle approche, applique la t-norme drastique (Yager, avec 0) sont prsents dans les figures ci-jointes, dans lesquelles laxe des x correspond aux diffrentes valeurs de w dans lexpression de la moyenne exponentielle ci-dessus, telles que w=0.1x :
erreur - "Yager+m.exp."
72
Ces rsultats montrent que les notes fournies par les fonctions dvaluation sont, en gnral, meilleures pour des valeurs proches de w=1, cest--dire, pour les cas o il ny a pas de double intgration. On observe, par contre, que les rsultats correspondant aux mesures sur les matrices de confusion et aussi au taux de russite gnral samliorent parfois grce la technique de la moyenne. Le taux derreur, par contre, augmente en gnral et dpasse le 7% pour quelques valeurs de w. On observe donc des performances qui ont expriment des modifications plutt complexes dans leur tendances (elles sont devenues parfois monotones avec le paramtre considr et parfois pas), mais en tout cas ce sont des modifications dune magnitude pas trop importante. La moyenne exponentielle napporte pas damlioration vidente sur les performances, et pour certaines valeurs du paramtre w celles ci deviennent pires que leurs quivalents pour lintgration simple. Il semble intressant, quand mme, de poursuivre notre enqute sur la double intgration la recherche de comportements plus adapts nos besoins en terme de taux derreur et de taux global de russite.
PARAMETRES A 0.3678
PARAMETRES B 0.2772
73
Fonction C FUSION FINALE 0.0804 Fonction D Russite Erreur FUSION FINALE 0.3014 0.2088
PARAMETRES A 0.1597
PARAMETRES B 0.0610
PARAMETRES A 0 0.0021
Matrices de confusion: Erreur quadratique acceptation Erreur quadratique rejet Prcision gnrale Coefficient kappa
On observe une augmentation simultane trs importante des taux de russite et derreur. En ralit, on trouve ici une approche notamment plus drastique, plus radicale, plus risque que dans les cas prcdents. Le comportement devient binaire : la possibilit cumule est gale 1 jusqu' ce que lon trouve une seule valeur instantane diffrente de 1 et partir de cet instant l elle restera toujours gale 0. Apparemment, cette stratgie est tellement risque que les avantages obtenus en terme dune plus grande puissance de discrimination sont annuls par les nouvelles erreurs provoques par les valeurs non idales pour la possibilit instantane fournies sporadiquement par les capteurs pour la bonne paire cible-classe. Idalement, on voudrait profiter de lamlioration des performances auprs du taux de russite, mais en contrlant le taux derreur. Cela sera notre objectif dans la suite.
PARAMETRES A 0.4597
PARAMETRES B 0.1898
74
Fonction C FUSION FINALE 0.2086 Fonction D Russite Erreur FUSION FINALE 0.3291 0.0021
PARAMETRES A 0.1597
PARAMETRES B 0.1270
PARAMETRES A 0 0.0021
PARAMETRES B 0.1815 0
Matrices de confusion: Erreur quadratique acceptation Erreur quadratique rejet Prcision gnrale Coefficient kappa
Voil un taux de russite de 32,91% avec un taux derreur associe de 0,21% - ce qui constitue les meilleurs rsultats que lon a obtenu jusqu' prsent. Les rsultats confirment par ailleurs nos suppositions initiales en ce qui concerne le paramtre B1 : on obtient des meilleures performances sans considrer le paramtre B1, avec la double intgration sur tnorme drastique, quen lutilisant. Quelques simulations faites avec et sans le paramtre B1 (que lon ne reproduira pas ici pour des raisons de place) montrent que, en gnral, le paramtre B1 amliore les performances didentification pour tout les oprateurs dintgration considrs dans les autres sections. Cest seulement quand on utilise une approche tellement drastique, tellement radicale , comme celle de la double t-norme drastique que la prise en compte de B1 apporte une contribution ngative. Comme on la dj dit, B1 prsente des valeurs de possibilit gales 1 la plupart du temps, mais il prsente aussi quelques fluctuations qui empchent la bonne identification selon lapproche double drastique . Comment pourrait-on donc profiter de linformation contenue dans B1 pour amliorer le processus didentification ? Une solution possible est de faire ce que lon pourrait considrer comme un prtraitement du paramtre B1 avec une intgration additionnelle utilisant la mthode k sur M , ce qui nous permet de raliser une espce de filtrage , de transformer en 1 les valeurs plus ou moins isoles (selon le choix de k) de possibilit au-dessous de 1, afin de corriger les fluctuations non dsires qui perturbent nos donnes floues pour la bonne paire classe-cible. Si on considre, par exemple, une valeur de k=4, on pourra tolrer 3 valeurs diffrentes de 1 sur chaque ensemble de M(M=10) chantillons correspondants la possibilit instantane pour le paramtre B1, valeurs qui seront mises 1 au cours de ce prtraitement. Sans doute, on augmentera aussi parfois les valeurs de possibilit pour des paires classe-cible errones, mais le rsultat global semble apporter des rsultats satisfaisants. Les figures ci-dessous montrent un exemple de ce filtrage avec la mthode k sur M sur une mesure du paramtre B1 et ses rpercussions sur le processus dintgration.
75
Valeurs instantanes
Les rsultats numriques obtenus pour cette stratgie que lon pourrait considrer comme hybride, consistant en un prtraitement k sur M avec k = 4 exclusivement pour le paramtre B1 et une double intgration avec t-norme drastique postrieure pour tous les paramtres sont : Fonction A FUSION FINALE 0.6511
PARAMETRES A 0.3678
PARAMETRES B 0.2833
Fonction B TAUX DE REUSSIT ELEMENTAIRE FUSION A B 0.8958 0.7928 0.7981 Fonction C FUSION FINALE 0.2148 Fonction D Russite Erreur FUSION FINALE 0.3540 0.0021
PARAMETRES A 0.1597
PARAMETRES B 0.1565
PARAMETRES A 0 0.0021
PARAMETRES B 0.2547 0
76
Matrices de confusion: Erreur quadratique acceptation Erreur quadratique rejet Prcision gnrale Coefficient kappa
On observe donc une amlioration relativement significative des performances (taux de russite 35,4% pour le mme taux derreur) par rapport la non utilisation du paramtre B1. En tout cas, on retrouve une nouvelle situation de compromis en ce qui concerne le choix de la valeur de k pour le paramtre B1 : K (B1) 1 2 3 4 5 6 7 8 9 10 Russite 0.3014 0.3612 0.3540 0.3540 0.3527 0.3291 0.3291 0.3291 0.3291 0.3291 Erreur 0.2088 0.0467 0.0245 0.0021 0.0021 0.0021 0.0021 0.0021 0.0021 0.0021 Prcision 0.4241 0.4600 0.4627 0.4620 0.4612 0.4567 0.4546 0.4490 0.4446 0.4446 Kappa 0.3975 0.4333 0.4356 0.4338 0.4330 0.4287 0.4265 0.4204 0.4157 0.4157
Si lon considre une valeur trs petite de k pour B1, on aura un meilleur taux de russite mais aussi un taux derreur plus grand (approche plus risque, plus discriminante), taux derreur qui diminuera avec des valeurs plus grandes de k (approche plus conservatrice).
On arrive donc, proposer un modle de traitement diffrenci pour chaque paramtre, en fonction de sa fiabilit, qui comporte la ralisation dune double intgration temporelle avec t-norme drastique prcde dun prtraitement de filtrage , avec un niveau de risque adapt au paramtre en question, dans les cas ou celui-ci est ncessaire.
77
Dans la section prcdente, on a parl du prtraitement k sur M qui prsentait un grand intrt car il permettait dimplmenter une certain tolrance face des suites de valeurs diffrentes de 1 pour la bonne paire classe-cible. Cette ide de tolrance face des suites ou rafales (dans le sens intuitive du mot, et appliqu aux donnes floues, rien avoir avec les rafales radar) de valeurs diffrentes de 1 (il faut pas oublier que lon considre toujours une fentre temporelle de M chantillons) nous rappelle le concept de tolrance aux retards relatifs entre paquets de donnes propre du domaine de la gestion et modlisation du trafic rseau. Dans ce domaine dtude des Telecoms, lapproche leaky bucket ou panier perc a t utilise depuis longtemps et il nest pas donc difficile de trouver une vaste littrature qui la dcrit en rigueur et profondeur. Pour une dfinition plutt basique et facile comprendre, on recommande le chapitre X de luvre Computer Networks [29]. Ici, on se limitera prsenter cette approche en tant quide originelle pour lintgration temporelle des donnes floues ne dans le cadre de ltude qui nous occupe. On peut donc essayer dappliquer cette approche pour lintgration temporelle des donnes floues dans le cadre de notre systme NCTR, afin dobtenir des performances similaires celles de la double intgration drastique avec prtraitement par oprateur de moyenne, mais avec une plus grande simplicit et en optimisant lutilisation de ressources. Il sagit tout simplement de considrer un seau ou un panier avec une certaine capacit et un trou au fond. Chaque fois que lon trouve une valeur de possibilit diffrente de 1, on ajoute une certaine quantit deau dans le seau. Si leau dborde, on active lalarme et considre que la possibilit sera toujours gale 0 partir de ce moment-l.
78
Cest ainsi que, pour chaque paramtre et pour chaque classe possible, on va considrer une variable bucket_level initialise zro. Dun cot, chaque fois que lon dtecte une valeur de possibilit diffrente de 1, on ajoute une quantit possibility_deficit cette variable. Dun autre cot, on diminue la valeur de la variable bucket_level une quantit empty_rate aprs larrive de chaque nouvelle valeur de possibilit. Si bucket_level devienne ngatif, on le remet zro (seau vide). Initialement, la valeur de la possibilit cumule est toujours 1. Si le seau dborde, la valeur de la possibilit cumule devient 0. Avantages de cette approche
6.6.1.1
Lapproche ainsi dfinie permet dobtenir les mmes performances que la double intgration avec norme drastique et prtraitement k sur M et prsente quelques avantages additionnels dintrt, notamment : Optimisation de ressources : On utilise une seule variable bucket_level en mmoire. On na plus besoin de stocker les dix dernires valeurs de possibilit pour chaque classe. Le Traitement trs simple du point de vue calcul : une somme, une reste et une comparaison avec un seuil. On na plus besoin dordonner un vecteur de M chantillons pour calculer chaque nouvelle valeur cumule ni deffectuer dautres types doprations arithmtiques (formules des t-normes et moyennes gnralises, produit pour les OWA, etc ). Cela peut tre un aspect critique dans certaines applications face au traitement temps rel . Les performances sont indpendantes du nombre dchantillons considrs. Le paramtre M se modlise travers les relations entre les nouveaux paramtres possibility_deficit , bucket_capacity et empty_rate , et donc les performances en termes du temps de calcul et utilisation de mmoire devraient tre les mmes pour M=10 et pour M=1.000.000, par exemple.
-
Plus de versatilit : Si lon considre une capacit de seau nulle, on obtient un simple dtecteur de valeurs diffrentes de 1 (similaire lapproche double t-norme drastique considre toute seule). En rglant les diffrents paramtres, on peut dfinir diffrentes sensibilits qui pourraient tre fixes en regardant la nature des diffrents paramtres et capteurs utiliss pour lidentification. Tout cela peut-tre fait avec un seul algorithme, ce qui nous garantit un traitement homogne et plus rapide des divers paramtres (pas plus besoin de faire un prtraitement et puis une double intgration). Nous pouvons imaginer, par exemple, une version continue de lalgorithme par opposition cette premire proposition discrte qui nous permette de considrer un seuil pour le dficit de possibilit cumul pendant une fentre temporelle dune longueur fixe. Cela revient transformer la quantit fixe possibility_deficit en une quantit variable et gale en chaque instant la diffrence : 1-PINSTANTANE , au lieu de considrer une pnalisation discrte comme dans lexemple propose. De cette manire, lon pourrait imaginer une situation o le seau ne dborde pas pour une possibilit moyenne au-dessus de 0.95 dans le cadre dune certaine fentre temporelle, mais il dborde pour une possibilit moyenne de 0.94.
79
6.6.1.2
Algorithme en pseudocode :
for class =1:Number_of_classes flag = 1; bucket_level = 0; for i=1:total_of_instants if (flag~=0) if (instant_P_matrix(i,class) < 1 ) bucket_level = bucket_level + possibility_deficit; end if bucket_level = bucket_level - empty_rate; if (bucket_level > bucket_capacity) flag = 0; elseif (bucket_level < 0) bucket_level = 0; end_if endif integrated_matrix(i,class) = flag; endfor endfor 6.6.1.3 Rsultats obtenus
Avec lapproche leaky bucket , on obtient des rsultats similaires ceux de la section antrieure, et on les amliore mme lgrement, de telle sorte que cette mthode dintgration apporte les meilleurs rsultats obtenus dans le cadre de notre tude : Fonction A FUSION FINALE 0.6542
PARAMETRES A 0.3681
PARAMETRES B 0.2862
Fonction B TAUX DE REUSSIT ELEMENTAIRE FUSION A B 0.8998 0.7941 0.8085 Fonction C FUSION FINALE 0.2180 Fonction D Russite Erreur FUSION FINALE 0.3566 0.0021
PARAMETRES A 0.1602
PARAMETRES B 0.1689
PARAMETRES A 0 0.0021
PARAMETRES B 0.2559 0
80
Erreur quadratique = 3.9049 Voici la matrice non normalise avec les mesures de prcision :
702.0000 430.0000 0 0 0 0 0.6201 194.0000 808.0000 11.0000 0 0 0 0.7976 707.0000 74.0000 612.0000 200.0000 0 0 0.3842 515.0000 0 45.0000 329.0000 50.0000 21.0000 0.3427 440.0000 0 612.0000 247.0000 652.0000 4.0000 0.3335 0 0 1.0000 13.0000 50.0000 49.0000 0.4336 0.2744 0.6159 0.4778 0.4170 0.8670 0.6622 0.4659
Erreur quadratique = 3.9049 Les rsultats ci-dessous ont t obtenus pour des paramtres dintgration de la forme : Paramtre B1 1.5 1 0.3 Autres paramtres 0.5 1 0
81
Figure 78. Fonction A - "k sur M" - utilisation conjointe de la possibilit et la ncessite
Sur la figure, les axes reprsentent des valeurs dandness pour les oprateurs OWA considrs. On trouve que, apparemment, les rsultats les plus proches du cas idal correspondent des valeurs grandes dandness pour la possibilit (oprateurs conjonctifs du type AND ou min , comme on avait dj vu) et des valeurs petites pour la ncessit (oprateurs disjonctifs du type OR ou max ).
82
Cela, veut-il dire que lon devra rpter notre parcours vers le max et au-del pour les valeurs de ncessit, de manire complmentaire ce que lon a fait pour la possibilit ? Peut-tre oui, mais pas ncessairement, puisque un simple coup dil aux rsultats de la fonction A appliqu la ncessit seule montre un comportement pas toujours monotone pour le paramtres de type A :
Figure 79. Fonction A - "k sur M" - Intgration des paramtres type A pour la ncessite isole
On trouve, donc, une complexit apparemment suprieure inhrente au travail avec la ncessit quil ne faudra pas ignorer. En plus, les valeurs que lon a vu jusquau prsent pour la ncessit semblent parfois tre contradictoires (on trouve des cas ou la bonne paire classe - cible reste toujours zro, tandis que des paires errones prennent des valeurs plus grandes) et donc il faudrait sassurer de la bonne qualit des valeurs de ncessit fournies par des niveaux plus bas avant de se lancer dans un tude rigoureuse. Finalement, on doit signaler que, en ce qui concerne lutilisation conjointe de possibilit et ncessite, il faudra tre prudent pour ne pas perdre le contenu smantique associ ces concepts dans le cadre de la thorie des possibilits. En effet, comme Isabelle Bloch la bien remarqu au cours dune conversation sur le sujet, le fait de raliser lintgration sur des valeurs de possibilit et ncessit calcules (et pas sur les mesures venant du radar ou sur les densits de possibilit associes) peut nous mener obtenir parfois des valeurs cumules de possibilit plus petites que les valeurs correspondantes de ncessit pour un mme instant, ce qui constitue une contradiction viter et que lon doit prendre en compte pendant la phase de conception du traitement.
83
8 Conclusion
Le cadre mathmatique de la logique floue et de la thorie des possibilits offre un grand potentiel pour le dveloppement dapplications pratiques complexes dont aujourdhui on commence seulement avoir les premiers exemples. Les techniques floues pour la reconnaissance de cibles ariennes non cooprative sont des bons exemples et montrent jusqu quel point ces outils formels de base sont puissants en termes de performances dans des situations relles. Tout au long de ces pages, on a montr les rsultats obtenus pour ltude de quelques approches diverses concernant lintgration temporelle des donnes floues pour la possibilit dans le cadre dun systme didentification NCTR rel. Ces conclusions peuvent tre rsums par les figures ci-dessous :
84
Sans "k sur M" "k sur M" "k sur M" t-norme integration (k=1) (k=3) (k=10) drastique 0,036 0,143 0,2454 0,1321 0,2582 0 0,0101 0,0615 0,0032 0,0654 0,3293 0,3826 0,3482 0,4041 0,266 0,3016 0,3557 0,3208 0,3785 0,2385
0,4376
Ces rsultats nous permettent darriver quelques conclusions pratiques concernant les diffrents oprateurs tudis: Lapproche k sur M nous impose un compromis qui ne convient pas toujours nos intrts : on doit choisir entre une bonne discrimination avec un taux derreur lev, ou un taux derreur satisfaisant au dtriment du reste des performances mesures. Lutilisation de la t-norme drastique par elle-mme offre des taux de russite et derreur assez similaires ceux de loprateur min , bien quelle apporte une certaine amlioration en termes de prcision et coefficient kappa. En tout cas, le taux derreur associ est trop lev pour le type dapplication dans le cadre duquel on travaille. On observe que les meilleures performances correspondent lapproche hybride double tnorme drastique avec prtraitement k sur M et lapproche leaky bucket , puisquelles prsentent les valeurs les plus levs pour le taux de russite, pour la prcision et pour le coefficient kappa, avec le taux derreur le plus petit.
-
Les oprateurs de moyenne (moyennes gnralises et OWA) napparaissent pas dans la figure de manire explicite, mais leurs performances peuvent tre compares celles de lapproche k sur M , du fait quils permettent de parcourir par des chemins divers, et avec des pas plus ou moins longs (en utilisant la mme mtaphore, rappelons la prcision infinie pour le choix de la valeur dorness associe aux OWA), lintervalle des performances comprises entre celles associes loprateur min et loprateur max . Finalement, la plus grande simplicit de lalgorithme leaky bucket , ainsi que ses avantages dj expliqus en termes de versatilit et optimisation de ressources nous mnent le proposer comme mthode prfrable pour lintgration temporelle des donnes floues dans notre systme. En tout cas, il ne faut pas oublier que les simulations que lon a effectues ont t faites sur une base dexemples rels limite, et il serait donc souhaitable dtendre cette base avec des nouvelles mesures radar dans des conditions diverses en termes de distance de la cible au radar, prsentation de la cible (en rapprochement, en loignement, en manuvres, etc.), caractristiques techniques du radar et dautres. Cest pourquoi, bien quil faille rester toujours prudent face aux fortes amliorations en termes de performances apportes par les deux dernires approches par rapport a la premire (on passe dun taux de russite de 13,21% et un taux derreur associ de 0,32% pour lapproche k sur M avec k=3 un taux de russite de 35,66% et un taux derreur de 0,21% pour lalgorithme leaky bucket ), on peut considrer que les traitements dintgration proposs au cours du stage offrent des perspectives intressants. Sur un plan personnel, jespre que le travail ici prsent sera dutilit pour dautres tudes futures et quil contribuera enrichir notre comprhension dun domaine passionnant dans le cadre de la fusion de donnes qui se trouve actuellement en plein dveloppement.
85
9 Rfrences bibliographiques
Livres
[1] Fusion dinformations en traitement du signal et des images sous la direction dIsabelle Bloch. Srie IC2 Traitement du Signal et de lImage. Hermes science Lavoisier. 2003 Bernadette Bouchon-Meunier. La logique floue et ses applications . Collection vie artificielle. Add ison-Wesley , France, 1990.
[2]
Articles
[3] I. Bloch, Information Combination Operators for Data Fusion : A Comparative Review with Classification . IEEE Transactions on Systems, Man and Cybernetics Part A: Systems and Humans, vol. 26, no. 1. Janvier 1996 N. Colin, M. Moruzzis. Radar target recognition by fuzzy logic C. Delhotte, M. Moruzzis. MILORD : a Technical Demonstrator for Long Range Radar Identification NATO RTO Meeting Proceedings 6, April 1998 M. Moruzzis, N. Colin, G. Milhem. Applications of Multisensor Data Fusion to Target Recognition rd AGARD Mission Systems Panels 3 Symposium, May 1995 Z. Chair, P.K. Varshney. Optimal Data Fusion in Multiple Sensor Detection Systems . IEEE Transactions on Aerospace and Electronic Systems. Vol. AES-22, no 1. Janvier 1986 V. Nimier. Application de la thorie de Dempster Shafer a la fusion de classifieurs ONERA Rapport technique 6 janvier 1995 J. Portegies. Aircraft Recognition from Features Extracted from Measured and Simulated Radar Range Profiles ASCI dissertation series number 92, Amsterdam, october 2003
[4] [5]
[6]
[7]
[8]
[9]
[10] L. Hong, A. Lynch. Recursive Temporal-Spatial Information Fusion with Applications to Target Identification IEEE Transactions on Aerospace and Electronic Systems, vol. 29, no. 2. Avril 1993. [11] D. Dubois, H. Prade, C. Testemale. Weighted Fuzzy Patern Matching Fuzzy Sets and Systems 28 (1998) , 313-331 [12] I. Ullibarri, S. Pita. Medidas de concordancia : el indice de Kappa Unidad de Epidemoilogia Clinica y Bioestadistica. Hospital Universitario Juan Canalejo Cad Aten Primaria 1999 ; 6 : 169-171 [13] R. Yager, D. Filev. Induced Ordered Weighted Averaging Operators IEEE Transactions on systems, man and cybernetics Part B: Cybernetics, vol. 29, no.2, Avril 1999
86
[14] R. Yager, On Ordered Weighted Averaging Aggregation Operators in Multicriteria Decision Making IEEE Transactions on systems, man and cybernetics Part B: Cybernetics, vol. 18, no.1, p.183190, 1988 [15] Peter Majlender. OWA operators with maximal entropy . [16] M. OHagan. Aggregating template or rule antecedents in real-time expert systems with fuzzy set logic . Proc. 22nd Annu. IEEE Asilomar Conf. Signals, Systems, Computers, Pacific Grove CA 1988, pp. 681-689 [17] L. Zadeh. Fuzzy Sets Information and Control, vol. 8, p. 338-353, 1965. [18] L. Zadeh. Fuzzy Sets as a Basis for a Theory of Possibility Fuzzy Sets and Systems, vol. 1, p. 3-28, 1978. [19] H. Hamacher. Uber logische Verknupfungen Aussagen und deren zugehorige Bewertungsfunktionen Working Paper, 75/14, 1975, RWTH, Aachen. [20] M. Frank. On the Simultaneous Associativity of F(x,y) and x+y-F(x,y) Aequationes Mathematicae, vol. 19, p. 194-226, 1979. [21] J. Dombi. A general class of fuzzy operators Fuzzy Sets and Systems, 8(2): 149-163. [22] Yager, R. R., On a general class of fuzzy connectives Fuzzy Sets and Systems 4, 235-242, 1980.
Autres
[23] Corporate Brochure du groupe Thales 2004 [24] Rapport Annuel des rsultats du groupe Thales pour lanne 2003 [25] Notes du cours de Henrik Legind Larsen sur la logique floue et la thorie des ensembles flous. Aalborg University Esbjerg [26] Site web sur la recherche NCTR du laboratoire de Traitement du signal (TSD) de POSTECH et Yeungnam University (Korea). http://yu.ac.kr/~kkt/ [27] Plusieurs sources non officielles : - Situation Awareness in Air Combat article en ligne de Peter Grining, 2000 (source non contraste). - The Bombcatss impending war on terrorism , article en ligne de Tony Holmes chez . www.global-defence.com - Air Combat Information Group Forum (www.acig.org) [28] J. Kurose et K. Ross. Computer Networking: A Top-Down Approach Featuring the Internet Pearson - Addison Wesley. Second Edition (juillet 2002) [29] A. Tanenbaum. Computer Networks Pearson Prentice hall (octobre 2002)
87
Finalement, voici quelques ouvrages consultes ponctuellement afin davoir une certaine culture de base sur des gnralits radar: - Les RADARS : Principes de base C. Delhotte Formation interne THALES - 24 Juin 2003, Bagneux - Bases physiques du radar F . Le Chevalier Revue technique THOMSON-CSF vol. 25 N Decembre 1993 4 - Cibles et environnement et chaines fonctionnelles TS/TD Guy Desodt Suite communication AIRSYS / RD / RAN 250/98 - Que sais-je ? Le radar Michel-Henri Carpentier Presses Universitaires de France - Le Radar : 1904-2004 Yves BLANCHARD Ellipses THALES - Introduction to Radar Systems 3rd Ed M.I. Skolnik McGraw-Hill, 2002 - Traitement des images de radar synthse d'ouverture Sous la direction de Henri Matre Srie IC2 Traitement du Signal et de lImage. Hermes science Lavoisier
88