Vous êtes sur la page 1sur 165

ECOLE DES HAUTES ETUDES EN SCIENCES SOCIALES Mmoire de Master II : Histoire visuelle

Indexation visuelle et recherche dimages sur le Web : Enjeux et problmes

Amlie Segonds Directeur de recherche Andr Gunthert

2009

Sommaire
Introduction

Chapitre 1 Lindexation sur les moteurs de recherche du Web.p. 9


I.Internet : un nouvel espace documentaire II. Lindexation des documents visuels par les moteurs de recherche

Chapitre 2 Lindexation smantique et la Folksonomie.....p. 34


I.Lapparition dune indexation sociale II. III. Vers les nouveaux usages de la folksonomie Les limites de la folksonomie

Chapitre 3 Le gotagging comme nouveau systme dindexation......p. 74


I.Les prsupposs dune indexation par coordonnes gographiques II. III. Les mises en application sur le Web Vers un dplacement de la sphre documentaire

Chapitre 4 Lindexation et la recherche par le contenu ..p. 108


I.La recherche de limage par limage II. III. Une observation des sites en ligne Les enjeux de la recherche par le contenu

Conclusion gnralep.147 Bibliographie.............................................................................................................p.151

Introduction
Lune des volutions majeures du Web aujourdhui concerne le changement de nature du document lchelle de son dploiement sur les rseaux. Comme le souligne le collectif de chercheurs RTP-DOC Le Web savant initial tait un Web de documents rdigs. Il ne reprsente quune faible minorit du trafic dInternet dsormais. Ce sont des documents multimdia qui schangent massivement (musique, image, vido). Plus largement, cest la place de limage qui change le niveau de participation aux rseaux et la production documentaire.1 . Une rengociation documentaire est luvre sur le Web, signant la fin de la suprmatie du texte et ratifiant limportance croissante porte au partage et la circulation des documents visuels. De cette transformation de nature des documents du Web dcoulent ncessairement de nouvelles interrogations dune part quant au traitement des masses documentaires indites dans leur forme. Elle repose dautre part la question de la recherche et de laccs pertinent ces mmes documents. Et lon suivra volontiers RTP-DOC quand ils considrent que cette transformation des proprits smiotiques des documents les plus changs constitue une rvolution dont on na sans doute pas encore peru tous les effets [] Lanalyse du document, de ses enjeux en termes dindexation ne peut ignorer la concomitance de ce dveloppement des machines produire des images numriques peu coteuses et de la participation tendue des milieux sociaux beaucoup plus divers que les premires poques dinternet.2. La gnralisation des supports numriques, l'apparition de formats vido et photo compacts, lmergence du Web 2.0, de ses espaces de partage de donnes multimdias et sites collaboratifs ont engendr une augmentation vertigineuse de la quantit de documents visuels sur le Web. Les chiffres rcents du nombre dimages circulant sur Internet recensent des milliards ditems au moment mme o plus dun million de photographies numriques sont mises en ligne par jour. La question nest plus aujourdhui de produire de nouvelles images mais de trouver limage dj existante dans le stock disponible. Le problme crucial prendre en compte face ce flux ininterrompu de production dimages est celui de leur indexation. Les techniques dites d'indexation, dans le champ du visuel comme du textuel, se proposent d'attacher une image ou une vido ou tout type de
Pdauque, Roger T. Documents et modernit [en ligne].Paris : CNRS, 2006 (consult le 25/03/09). Disponible sur : http://rtp-doc.enssib.fr/IMG/pdf/Pedauque3-V4.pdf 2 Ibid.
1

document, un ensemble de descripteurs de leur contenu, dans le but de mesurer la ressemblance avec les descripteurs correspondant la requte. Or comme le souligne Bruno Bachimont si le texte est sa propre indexation, la mmoire audiovisuelle reste muette sans traitement documentaire3 . Il sagit donc pour nous de comprendre ces traitements documentaires ncessaires sans lesquels aucune indexation de ressources visuelles nest possible.

L'indexation est un besoin ancien mais une pratique rcente thmatise par des disciplines jeunes, la documentation et la bibliothconomie. labore ces deux derniers sicles (au XXe sicle en ce qui concerne la documentation), l'indexation a concern de manire privilgie les contenus textuels partir desquels ont t mis au point ses

procds et mthodes. En tant que notion de classification, lindexation est un terme rcurrent en science de linformation et appartient au domaine de la gestion documentaire, l'indexation relve avant tout d'un travail sur le contenu, o l'interprtation et le discernement sont la cl pour reprsenter un document de manire pouvoir le retrouver. Il nous semble utile, ce stade, de prciser la diffrence entre les notions de catalogage, de classification et dindexation. Le catalogage consiste dcrire physiquement un document, quel que soit son format, permettant d'une part de l'identifier de faon unique et d'autre part de le reprer par le biais d'une caractristique qui n'a pas rapport son contenu (numro ISBN, nom de l'auteur, etc.). La classification permet de rattacher un document, aprs en avoir analys le contenu de faon gnrale, une catgorie, un ensemble de documents qui traitent du mme sujet. Le document est ici considr comme une entit. Quant l'indexation, on ne considre plus le document comme une entit distincte mais on considre plutt les lments d'information qui s'y trouvent. Si le but de l'indexation est toujours de crer des regroupements de documents sur un mme sujet, la description se fait plus prcise. L'indexation nous permettra donc d'accder par exemple tous les documents qui fournissent de l'information sur un mme sujet, peu importe que le document qui contient cette information ait t class dans telle ou telle catgorie. En effet, l'indexation est cette technique consistant caractriser le contenu d'un document et l'information qu'il dtient de manire le retrouver quand on effectue des recherches sur l'un des sujets dont il traite. La difficult est donc de savoir caractriser et
Bachimont, Bruno. Bibliothques numriques audiovisuelles : des enjeux scientifiques et techniques. Document numrique, 1998, vol. 2, n 3-4, p. 219-242
3

reprsenter l'information documentaire pour qu'il soit ais de la mettre en rapport avec des sujets d'investigation. Mise en rapport d'une requte et d'un contenu reprsent et synthtis, l'indexation permet de s'orienter dans la masse des documents et d'organiser ses connaissances. Si lindexation permet une recherche efficace dun document, demeure la cl du fonctionnement des moteurs de recherche, cette tape constitue un problme majeur sur le web, en raison de la croissance constante du nombre de documents numriques bruts, non renseigns, qui y circulent.

Ds lapparition de la technologie numrique de nombreux projets ont vu le jour en recherche dinformation visant plus defficacit et de simplicit dans le classement, lindexation et laccs aux donnes. Ces projets aboutissent la cration de logiciels de recherche plein texte ou de reconnaissance des signes performants, aujourdhui employs sur Internet. Selon lenqute de Kobayashi and Takeda4, 80% des usagers du Web utilisent des moteurs de recherche, de type Google ou Yahoo!, pour trouver une information. Crs une poque o le Web est principalement un outil de recherche de document textuel fonctionnant selon le principe de double articulation du langage, ces moteurs ont hrit des diffrentes avances dans le domaine de lautomatisation du traitement documentaire. Au regard du succs des moteurs de recherche dvelopps pour le texte, les moteurs de recherche d'image sont comparativement encore rares et peu puissants du fait mme de la difficult indexer ces documents. Une photographie ne peut en effet se dcomposer en units facilement reprables comme des chanes de caractres spares par des blancs permettant la recherche plein texte. Sur le Web, la recherche de documents visuels demeure encore trs largement domine par lanalyse du texte entourant une image et la requte par mots-cls. Si ces dernires connaissent des limites au niveau de la pertinence des rsultats, elles sont aussi critiques pour ne prendre en compte que les lments textuels et non les caractristiques propres aux images. Ds les annes 1990, de nombreux laboratoires de recherche en France comme ltranger ont conduit des projets qui visent une automatisation de lindexation des documents iconographiques partir de descripteurs visuels. Deux approches coexistent donc aujourdhui quant lindexation des documents visuels, une mthode smantique qui, pour linstant et comme le rappelle Antoine Manzarena est manuelle. Une tape selon laquelle, l'oprateur d'indexation attache au document des
Kobayashi, M. and Takeda, K, Information Retrieval on the Web, ACM Computing Surveys, 2000, Vol.32, No.2, 144-173.
4

donnes de haut niveau relatives la signification du contenu de l'objet. Les requtes associes sont en gnral des mots, dsignant un objet, une action, le nom d'un personnage ou d'un vnement.5. Par opposition, des projets tendent une indexation automatique comprise comme essentiellement descriptive ou visuelle. L'algorithme d'indexation attache des donnes de bas niveau smantique, relatifs aux contenus gomtrique, spectral, de l'image, un niveau local ou global. Les requtes associes se font en gnral par l'exemple, ou par modle. 6 . ces deux mthodes largement commentes par divers travaux de recherche nous rajoutons celle du gotagging autre systme dindexation, de classement et de navigation qui connat sur le Web un succs croissant. Les premires motivations des divers laboratoires de recherche pouvaient en creux faire apparatre le dsir dmanciper limage de sa dpendance au mot avec pour toile de fond lide dune navigation uniquement visuelle ou pour le dire autrement comment rechercher limage par limage. Il fallait y voir une dfiance quant la subjectivit prsidant au choix des termes indexeurs une poque o tous les espoirs se tournaient vers lintelligence artificielle et linformatisation du savoir. Cependant, bon nombre de ces projets de recherche dimages sont demeurs dans lintimit des laboratoires de recherche. On constate depuis quelques annes une recrudescence de ces questions dautomatisation de lindexation dont les rsultats ont pour linstant abouti quelques fonctionnalits encore souvent ltat de test tel que la reconnaissance faciale, ou la cration de sites en version beta pour la plupart. Si laccs la connaissance et aux savoirs est videmment un enjeu motivant les diverses recherches dans le champ de lindexation visuelle, lenjeu conomique est galement un facteur dcisif dans cette recherche dautomatisation dindexation et de prcision dans les descriptions de contenus visuels. Les moteurs de rfrencement et de recherche de documents tels Google trouvent leur viabilit et rentabilit par lapport de revenus en particulier gnrs par la publicit contextuelle, des annonces cibles en fonction dune slection de mots-cls. Si les systmes de rgie publicitaire sont des plus performants en ce qui concerne les documents textuels, ces applications connaissent de vraies lacunes quant la liaison des publicits avec des documents visuels. Dune part parce que peu dimages sont renseignes par mots-cls et dautres part parce quil est pour linstant impossible danalyser automatiquement le contenu dune image fixe ou anime. Il

Antoine Manzarena, lindexation dimages, [en ligne], disponible sur : http://www.abhatoo.net.ma/index.php/fre/content/download/2563/28254/file/Indexation%20d'images.pdf 6 Ibid.

va sen dire quau vu du nombre de nouvelles images circulant sur le web chaque jour cette opration ne peut se faire manuellement. Les technologies dindexation et de descriptions des images par leur contenu apparaissent donc pour Google et les autres moteurs comme une voie salutaire dans la rentabilit de leurs services une poque o le site Youtube, par exemple, et pour les raisons prcdemment invoques, savre dficitaire. Le Web a depuis sa cration connu de nombreuses volutions et est devenu aujourdhui un espace dchange de documents polymorphes. Si le texte reste trs prsent sur le rseau, de nouvelles formes de documents ont fait leur apparition, des documents multimdias, photos, vidos et sons, qui en plus de la varit du medium ont en commun la diversit de leur origine de production. Une dichotomie sinstalle peu peu entre le mode de fonctionnement originel du web, comme lieu de circulation de documents textuels et la place de plus en plus importante quoccupent des objets visuels souvent peu lgends, documents, sources brutes dans leur medium. Comment ces objets pour beaucoup issus de pratiques non officielles, documents privs (dans leur mode de cration) mais publis (rendus publics), peuvent ils tre cherchs, retrouvs sur la toile dont le systme dindexation, dorganisation des documents, est vou au texte ? De cette

documentarisation nouvelle de sources issues dusages domestiques et privs, de nouvelles problmatiques mergent, tenant lindexation et donc lutilisation mme de ces sources. L'objet de ce travail est de rendre compte de ce que devient l'indexation quand on considre des contenus numriques non textuels comme les images fixes. Si l'indexation des documents non textuels sur des supports analogiques comme les photographies, les films, les dessins et autres schmas est pratique de longue date, l'introduction des techniques numriques a profondment modifi l'indexation qui est ainsi devenue recherche d'information et a permis d'laborer un nouveau paradigme, l'indexation fine des contenus ou l'indexation par le contenu . Si la pratique de lindexation est un systme de classification ancien, il connat aujourdhui un renouveau en rapport avec lintroduction du numrique au sein de la sphre documentaire. La fonction documentaire de limage au sein du web doit alors tre comprise selon lhorizon de sa nature numrique en interrogeant lapport de cette technologie aussi bien la notion de document quaux mthodes de gestion documentaires. La question transversale tout ce travail est donc comment indexer des documents visuels, quest ce qui est indexable au sein dune image ? Au-del dune approche purement descriptive il sagira de montrer comment la problmatique de la structuration de la sphre documentaire est devenue lenjeu de 7

pratiques sociales nouvelles, entrainant elles mmes la cration de nouveaux outils de gestion et de structuration des collections dimages sur Internet. Pour ce faire nous avons pris comme objets dtude le Web, ses moteurs de recherche et sites de partage dimages. Pour chaque chapitre de ce travail une slection de sites et plateformes sera effectue afin de conserver les plus spcifiques, mettant en jeu des problmatiques cruciales en termes de technique dindexation ou dusages.

Nous divisons ce mmoire en quatre parties. La premire est consacre une analyse du fonctionnement des moteurs de recherche du Web, de leur gestion des ressources visuelles, nous avons privilgi Google comme tude de cas. ct des moteurs possdant des fonctions de recherche dimages classiques comme Google Image, se sont dvelopps, en parallle de lmergence du web dit 2.0, des plateformes de stockage et de partages dimages type de Flickr ou encore Panoramio dont les bases peuvent compter des milliards de photographies. Nous considrons donc la faon dont ces sites ont gr lindexation des collections, les systmes quils ont adopts pour faciliter le classement et la recherche de photographies dans des bases de donnes toujours croissantes et rassemblant des documents souvent non renseigns, destination dun public dusagers pour la plupart non spcialistes de la recherche documentaire. En ce sens notre deuxime chapitre se concentre sur les principes de lindexation textuelle applique aux images et plus particulirement sur la folksonomie dans ses avantages, les types dappropriations quelle engendre mais aussi ses limites. Flickr constitue ici le corpus principal. Le troisime moment est quant lui dvolu une dfinition et une observation du fonctionnement du gotagging comme nouvelle forme dindexation, de gestion documentaire et de navigation au sein des collections. Enfin dans le quatrime et dernier chapitre nous revenons sur les prsupposs techniques des systmes dindexation et de recherche dimages par le contenu. Par lanalyse des diffrents sites proposant cette fonctionnalit nous nous efforcerons de cerner les enjeux documentaires, conomiques et sociaux du procd. Nous envisageons sa compatibilit avec les attentes du grand public pour que demain limage, vecteur dsormais majeur du contenu du Web trouve sa relle mancipation vis--vis du texte sur lequel repose encore aujourdhui pour lessentiel lindexation des documents visuels.

Chapitre 1

Lindexation par les moteurs de recherche du Web

Sommaire du chapitre I. Internet : un nouvel espace documentaire................................................. 11


. Moteur de recherche et volution des contenus du Web .......................................... 11 1. 2. Du Web aux moteurs de recherche ....................................................................... 11 Extension des espaces documentaires indexables ................................................ 14

B. Indexation des contenus et publicits contextualises .............................................. 16 1. 2. Double articulation et indexation textuelle ........................................................... 16 Une indexation vise conomique ..................................................................... 18

II. Lindexation des documents visuels par les moteurs de recherche .......... 21
. Accroissement des contenus visuels par le Web 2.0 ................................................ 21 1. 2. Nouvelle approche du document .......................................................................... 21 Lexplosion visuelle du Web ................................................................................ 23

B. Les systmes dindexation de la firme Google......................................................... 26 1. 2. 3. Chercher le texte avant limage ............................................................................ 26 Google Image et Google Image Labeler ............................................................... 28 Les solutions pour la vido ................................................................................... 31

10

I. Internet : un nouvel espace documentaire


A. Moteur de recherche et volution des contenus du Web

Au dbut des annes quatre-vingt-dix apparat linternet tel que nous le connaissons aujourdhui, un systme informatique en rseau o le Web devient lapplication phare. Depuis sa cration, le World Wide Web na cess de connaitre des volutions dans ses programmes, fonctionnements et contenus. Rcemment encore, la Toile a subi une transformation touchant ses appellations mmes. Il est ainsi question de lhypernet, du Web social, autant de termes qui tmoignent dune transformation progressive du Web, touchant aussi bien la technique que les contenus, les deux tant irrmdiablement lis. 1. Du Web aux moteurs de recherche Dans le vocabulaire courant, il est commun que lInternet et le World Wide Web soient confondus. Internet est un rseau informatique mondial qui rend accessible certains services de communication et dinformations tels que les courriers lectroniques, le Web, les messageries instantanes, etc. Le Web quant lui nat officiellement en 1989 avec la publication dun article de Tim Berners Lee Lhypertexte et le CERN 7. Il sagit dun systme dhypertexte public dsignant un service, une application spcifique de lInternet. Il fonctionne selon plusieurs protocoles dchanges et de localisation de linformation dont Lhttp, protocole de communication qui permet le transfert de donnes entre le rseau et un ordinateur particulier. Mais pour que le Web existe comme espace documentaire, il faut la conjonction de trois lments supplmentaires : des adresses URL grce auxquelles les informations peuvent tre localises, des navigateurs permettant dy accder et un format dencodage lHTML, langage informatique par lequel les donnes rcupres peuvent tre affiches et qui permet linsertion dhyperliens au sein des pages du Web. Ces divers protocoles sont les lments constitutifs du Web. Ce dernier apparat alors comme une vaste base de donnes navigable par le biais des systmes de transmission dinformations, des navigateurs, et des hyperliens. Si le Web peut donc tre envisag comme un espace documentaire, sa ralit sociale et informationnelle nous incite plus le considrer comme un continent
7

Cf. le texte original de Tim Berners Lee http://www.w3.org/History/1989/proposal.html

11

documentaire. Les dernires enqutes de la socit Netcraft8, recensent en avril 2009 plus dun milliard dinternautes. Au niveau des sites Web, les derniers chiffres font mention de lexistence de plus de 900 millions de noms de domaines pour environ 230 millions de sites actifs, cest dire ayant du contenu pouvant tre index par les moteurs. Nous suivons dans leur raisonnement Olivier Ertzscheid, Gabriel Gallezot et ric Boutin quand ils affirment Au vu de ces chiffres qui confinent lincommensurable, on comprend mieux la ncessit de lexistence doutils de reprage, de classification et daccs.9 . Selon eux toujours, si les premiers systmes de navigation au sein des pages de Web reposaient sur de simples signets ou listes dadresses, il fallut mettre au point, mesure que le nombre de sites et de pages croissaient de faon exponentielle, de nouveaux modes de recherche et de consultation des donnes. Cest dans cette perspective que les moteurs de recherche se sont crs, afin damliorer la recherche dinformations et rendre la masse de documents toujours plus accessible, au travers doutils simples dutilisation et globaux. En ce sens le Web sinscrit plus que jamais dans une problmatique documentaire et la pousse son paroxysme en cristallisant ses interrogations aussi bien en termes de conservation quen termes daccs aux documents. Les principaux moteurs de recherche existant aujourdhui sont Google, Yahoo, ou encore Live search (le moteur de Microsoft) ; ils fonctionnent selon trois tapes fondamentales : L'exploration ou crawl : Un moteur de recherche est d'abord un outil d'indexation,

c'est--dire qu'il dispose d'une technologie de collecte de documents distance sur les sites Web, via un outil que l'on appelle robot. Le Web est alors explor par ce robot d'indexation suivant tous les hyperliens qu'il rencontre et rcuprant les ressources juges intressantes. L'indexation des ressources rcupres consiste extraire les mots considrs

comme significatifs du corpus explor. Les mots extraits sont alors conservs dans une base de donnes organise selon la forme dun index terminologique. Les termes significatifs sont associs une valeur dit poids qui correspond une probabilit d'apparition, la frquence du mot dans un document. La recherche correspond la partie requtes du moteur, qui restitue les rsultats. Un

algorithme est appliqu pour identifier dans le corpus documentaire, et selon l'index, les

http://news.netcraft.com/archives/2009/04/06/april_2009_Web_server_survey.html Olivier Ertzscheid, Gabriel Gallezot et ric Boutin, Perspectives documentaires sur les moteurs de recherche : entre srendipit et logiques marchandes, 2007, en ligne : http://hal.archivesouvertes.fr/docs/00/17/21/69/PDF/ertzsgallbout.pdf
9

12

documents qui correspondent le mieux aux mots contenus dans la requte. Les rsultats sont prsents par ordre de pertinence suppose. Les moteurs de recherche ont connu des volutions dans leur mode de fonctionnement, ceux dits de premire gnration, reposent sur l'analyse du contenu des pages indexes et se basent exclusivement sur le croisement entre les mots-cls de la requte et ceux rcuprs sur les pages indexes. Les moteurs de deuxime gnration tentent de prendre mieux en compte la structuration du Web o la notion dhyperliens et dhypertexte est dterminante. Cette tape permet daboutir la cration du fameux algorithme du Page Rank, rendant possible une recherche dinformation augmente , que nous dtaillerons plus loin. Toutefois, les principaux moteurs de recherche continuent doffrir une vision limite de lorganisation informationnelle du Web, ne retenant pour laffichage des rsultats que la forme de la liste et non leur catgorisation ou ordonnancement raisonn . Les moteurs de dernire gnration reposent sur lide que lexpression du besoin dinformations peut tre affine par linternaute travers lexpression de dimensions complmentaires au sujet de la recherche. Ainsi une page Web peut tre dcrite par son thme mais aussi selon son niveau plus ou moins commercial, sa fonction de page de contenu ou de pages de liens. De nouveaux projets de moteurs de recherche dits moteurs sociaux de type Rollyo10, Eurekster11, Criteo 12, etc., apparaissent. Leur principe est dajouter un filtrage en amont des sources comme un modle de pertinence diffrent, issu des usagers eux mmes. Selon une logique similaire dautres offres se dveloppent aujourdhui et proposent des types de recherche plus cibls bases par exemple sur la recommandation dont Amazon fut le premier exemple en ligne, ou de catgorisation comme Exalead13, permettant une recherche gnrale sur le Web, ou directement sur Wikipedia. Google a depuis sa cration dj largement fait voluer lergonomie de sa page de rsultats, notamment avec le dveloppement de la recherche universelle. Celle-ci offre une prsentation verticale et permet de runir des rsultats de Google Images, Youtube, Google Actu, etc. et de les prsenter au sein des pages de recherche gnrales du moteur. Linternaute est ainsi confront sur une mme page aux rsultats disponibles dans les diffrents outils Google, ce nest plus seulement le rendu des correspondances crites qui
10 11

http://rollyo.com/ http://www.eurekster.com/ 12 http://www.criteo.com/ 13 http://www.exalead.fr/search/

13

est privilgi, mais lensemble des contenus multimdias qui est interrog, dans la mesure o lindexation le permet. Dans ce contexte de renouveau de la recherche, il est important pour ce moteur doptimiser lindexation des contenus multimdia des sites Internet, car la recherche universelle ouvre de nouvelles perspectives stratgiques en termes de visibilit notamment et par consquent de nouvelles perspectives conomiques pour la socit.

2. Extension des espaces documentaires indexables Vers la fin des annes 90, le Web est un espace de programmation statique et complexe, le lieu de prdilection des Webmasters. Le Web dit public, index par les moteurs, connat alors une varit assez large des contenus et rassemble diffrentes formes documentaires o les articles scientifiques ctoient les pages commerciales, les sites de presse et dautres documents factuels. Une premire volution du Web est notable avec lapparition de pages pouvant tre gnres dynamiquement, c'est--dire la demande, contrairement au site Web statique. Si ce systme offre une plus grande souplesse dans lintgration des contenus il se confronte dans un premier temps des soucis dindexation de ces pages dynamiques. Se dveloppe alors peu peu un Web dit opaque , invisible aux moteurs et donc non index. Ces premires pages dynamiques sont pour la plupart bases sur des informations issues dorganismes privs, qui dploient, partir de bases de donnes antrieurement constitues, des pages Web dynamiques (). Il sagit dans ce dernier cas de documents gnrs la vole, dynamiquement, partir de requtes dposes sur les sites par les utilisateurs 14. Ces contenus sont donc purement virtuels et nont pas dinscription physique stable puisquils sont pour la plupart des hyperliens de navigation gnrs la demande, et pouvant diffrer d'une visite l'autre. Si les problmes de lindexation des pages dynamiques se rsolvent, de nouvelles limites lindexation des contenus se rvlent peu peu sur le Web. Les documents en format PDF par exemple ont chapp pendant longtemps toute indexation par les moteurs puis le problme se posa nouveau pour les pages en Flash notamment. Ainsi semble-t-il que lvolution technologique du Web intervient et interfre toujours avec laccessibilit des documents engendrant une scission entre un Web visible et un Web opaque.
Olivier Ertzscheid et Gabriel Gallezot, Etude exploratoire des pratiques dindexation sociale comme une rengociation des espaces documentaires. Vers un nouveau big bang documentaire ? , Document numrique et socit, ADBS ditions, 2006, p 3, en ligne : http://affordance.typepad.com/mon_Weblog/files/sdndocsoc.pdf.
14

14

Une autre rupture est prendre en compte en lien avec le statut mme des documents sur le Web. Nous sommes confronts lexistence dun Web public dun ct, indexant des documents librement consultables via les index des moteurs de recherche, et un Web dit priv de lautre. Cette privatisation et donc restriction daccessibilit dune partie du Web, est due la nature mme des documents en jeu ou aux politiques de confidentialit qui y sont dployes. Les pratiques informationnelles consistant changer des courriers lectroniques ou stocker des documents de travail sur son disque dur personnel chappent notamment la problmatique dindexation des contenus du Web. Pour Gallezot et Ertzscheid La question qui permet alors de scinder la masse documentaire en visible / invisible, indexe / non indexe est alors encore celle de la nature des contenus informationnels : Quoi indexer ? 15. Toutefois et depuis peu les divers moteurs de recherche proposent des outils de plus en plus prcis et axs sur le dveloppement de lindexabilit de tout type de documents y compris de nos donnes personnelles. Ainsi les informations contenues dans lensemble de nos courriers lectroniques personnels ainsi que les fichiers et documents stocks sur nos ordinateurs, sont dsormais accessibles aux moteurs, lesquels les indexent aussitt par le biais de ces outils ddis que sont Google Mail, ou encore Google Desktop. Et les auteurs de nous mettre en garde contre les drives possibles de cette multiplication doffres, Un seul et mme outil ce qui constitue un gain mais surtout, une seule et mme socit commerciale ce qui constitue un risque - garantit lindexation et laccs cet ensemble. () en termes daccs et de droit linformation, lextrme mouvement de concentration qui touche ici la mdiasphre est tout le moins problmatique.16 . Cest une concentration de tous les outils et donnes documentaires entre les mains dun nombre restreint de socits laquelle nous assistons, nouvel tat de fait pouvant remettre en cause la notion dterminante de libre circulation des informations sur le Web. Au-del de laspect conomique, un autre changement notable intervient et touche la notion mme de document. En effet ce ne sont plus seulement des contenus valids par un processus ditorial (scientifique ou commercial) qui sont indexs et accessibles sur le Web, mais lensemble des entits mises dans un format numrique qui peut se trouver sur la toile. Ces nouveaux documents se dfinissent stricto sensu par leur capacit tre indexs, une capacit qui les constitue alors comme autant dunits documentaires.

15 16

Ibid.loc cit. Ibid. p 4.

15

De manire gnrale de nouveaux usages informationnels apparaissent sur le Web, si lextension des techniques dindexation modifie la teneur des documents du Web, la large ouverture de celui-ci sur les contenus directement engendrs par les internautes entrine le changement de paradigme documentaire. Aprs le Web statique, le Web dynamique, apparat le Web 2.0, o se sont, travers le phnomne des blogs dans un premier temps, les internautes eux-mmes qui gnrent le contenu du Net. Ainsi Avec cette nouvelle configuration de nos espaces informationnels, merge une nouvelle cologie cognitive, un nouvel habitus, qui fixe linterpntration de deux sphres : celle de la recherche dinformation publique (Web) et celle de la recherche dinformation sur des donnes personnelles (Web priv et Web intime).17 . Le Web 2.0 engendre un nouveau paradigme dans la recherche dinformations, une recherche qui concerne laccs des contenus fondamentalement diffrents dans leur conception, dans leur usage, dans leur nature et de fait dans leur possibilits dindexation.

B.

Indexation des contenus et publicits contextualises

En France, le moteur Google reprsente lui seul prs de 85%18 de lensemble des recherches effectues et 60%19 lchelle mondiale, les diffrentes tudes rvlent une claire domination du moteur. Ce monopole est non seulement conomique mais galement culturel, et se reflte largement au travers de ladoption gnralise de lexpression Googler quelque chose ou quelquun , de son passage dans le langage courant pour dsigner lensemble du processus de recherche sur Internet. La question est alors de comprendre comment Google a russi asseoir sa suprmatie, sur quels principes se distingue-t-il ? 1. Double articulation et indexation textuelle Le fonctionnement de la majorit des moteurs de recherche grand public se base sur le principe dindexation textuelle et de recherche plein texte. Lefficacit des technologies textuelles les plus lmentaires mises en uvre par les moteurs de recherche, comme par exemple la recherche en texte intgral, est due la double articulation du texte, qui est
Olivier Ertzscheid, Gabriel Gallezot et ric Boutin, Perspectives documentaires sur les moteurs de recherche : entre srendipit et logiques marchandes, 2007, en ligne http://hal.archivesouvertes.fr/docs/00/17/21/69/PDF/ertzsgallbout.pdf 18 Sources : http://www.comscore.com/Press_Events/Press_Releases/2008/07/Top_French_Search_Engines/(l anguage)/eng-US 19 Sources :http://www.comscore.com/Press_Events/Press_Releases/2007/07/Top_Worldwide_Web_Properti es .
17

16

envisager en cho de la double articulation de la langue dj souligne par les linguistes. Pour Bruno Bachimont lefficience aujourdhui observable de la recherche textuelle sur la plupart des moteurs est due la forme mme du texte qui sert de structure matricielle lalgorithme des moteurs. Ainsi il souligne comment le texte, sous la forme que nous lui connaissons dans les langues occidentales, rsulte dune criture alphabtique, constitue dun rpertoire fini de symboles permettant, par leur combinaison, dexprimer tous les contenus de la langue. Par ailleurs, certains assemblages de ces symboles sont particulirement stables et constituent ce quon peut appeler en premire approximation des mots. 20 Le texte obit donc une double articulation, alphabtique dun ct et lexicale de lautre. Le rpertoire fini de symboles, que constitue lalphabet, assure que tout contenu textuel sexprime selon une combinaison de ces symboles. Une requte visant un contenu textuel sera par consquent exprime par lintermdiaire de ce mme rpertoire, de plus le rfrentiel stabilis permet de surmonter linfinit des combinaisons possibles de ces symboles dans la mesure o ce rpertoire est plus ou moins commun au producteur du document et son lecteur, ou bien lutilisateur dun moteur de recherche. Cette continuit entre lauteur et le rcepteur, fonde sur le partage dun mme rfrentiel, permet dexprimer des requtes possdant un cho dans les documents que lon recherche. 21. Les algorithmes des moteurs de recherche se basent donc sur les termes de la requte pour trouver leurs correspondances au sein de la base de donnes. Selon la combinaison de ces symboles est rpertorie la position exacte de chaque occurrence dans la base de donnes de documents. Si la technique est au point, permettant partir de quelques mots cls basiques daccder une grande collection de documents, le problme principal des requtes effectues sur des moteurs de recherche textuels sont les retours non pertinents. lorigine du problme se trouve lambigit lexicale, comme la synonymie, qui peut entraner des rsultats non utilisables par lusager. Des amliorations ont donc t ajoutes la fonctionnalit de fouille intgrale de texte sur laquelle se base les moteurs. Parmi ces amliorations lon trouve lutilisation des mots cls. Il fut ainsi prconis aux crateurs de documents ou aux indexeurs de fournir une liste de mots dcrivant le sujet du texte, incluant des synonymes des mots qui dfinissent le sujet. Ce systme amliorent le retour

Bruno Bachimont, Image et audiovisuel : la documentation entre technique et interpretation. Critique et perspectives , Documentaliste-Sciences de linformation, 2005/6, Volume 42, p. 348-353. 21 Ibid.

20

17

des rsultats, notamment lorsque la liste de mots cls inclut un mot de recherche qui n'est pas dans le document textuel mais qui permet nanmoins de catgoriser le contenu. Les moteurs de recherche furent encore perfectionns par la mise au point de requtes boolennes. Les recherches se basent alors sur des oprateurs boolens (et, sauf, ou, etc.) qui permettent daccrotre considrablement la prcision d'une recherche plein texte. Parmi ces termes descripteurs loprateur et permet dassocier les termes,

l'oprateur sauf est un outil dexclusion lexicale. Si les rsultats se rfrent trop peu de documents, l'oprateur ou peut tre utilis pour accrotre les retours en largissant le sujet ou les thmes possibles. Mais cette mthode, largement utilise par les moteurs de premire gnration, et toujours oprante, atteint vite ses limites sur des corpus volumineux. Les moteurs plus volues utilisent la formule TF-IDF22 (Term Frequency-Inverse Document Frequency), pour mettre en perspective le poids des mots dans une requte avec ceux contenus dans les documents. Il sagit donc dune formule de pondration qui calcule la frquence des termes au sein du document, une variante ce systme s'appuie sur la frquence maximale des termes afin de concilier l'aspect multi-thmatiques d'un document avec des documents mono thmatiques Les moteurs de seconde gnration comme Google, s'appuient non seulement sur la frquence des termes pour indexer les pages Web mais aussi sur la popularit des sources en calculant un indice de notorit des pages, le Page Rank. En naviguant de lien en lien, les robots indexent les termes utiliss par une page Web pour dcrire une autre page Web. chaque fois qu'un utilisateur suit ce lien, il "vote" la pertinence des descripteurs utiliss. Par exemple, l'algorithme PageRank de Google, qui grce son efficience fait le succs du moteur, fournit plus d'importance aux documents qui renvoient, au travers de liens hypertextes, d'autres pages Web. 2. Une indexation vise conomique Si laccs la connaissance et aux savoirs est videmment un enjeu motivant les diverses recherches dans le champ de lindexation, lenjeu conomique est un facteur dcisif dans la recherche dautomatisation de lindexation. Les moteurs de rfrencement et de recherche de documents tels Google trouvent leur viabilit et rentabilit par lapport des revenus gnrs par la vente de technologie mais surtout par la publicit, une publicit dsormais de plus en plus contextuelle. Le dveloppement de cette dernire est lun des
22

Pour plus dinformations consulter http://fr.wikipedia.org/wiki/TF-IDF

18

fers de lance de Google, la socit a en effet mis au point divers systmes permettant la fois lannonceur et au grant de site de placer des publicits le plus en lien possible avec les contenus des pages. AdWords23 est le nom du systme publicitaire du moteur de recherche Google qui permet aux annonceurs de placer leurs publicits de faon cible. AdWords provient de Ad pour Advertising (Publicit) et Words (mots), le principe repose sur lachat de mots cls par l'annonceur en rapport avec son activit. Prenons en exemple une agence de voyage, celle-ci peut acheter des mots-cls comme vacances , htel et plage ou des noms de villes ou de pays dont elle est spcialiste. Cet achat permet d'obtenir un rfrencement dit "rfrencement payant" distinguer du rfrencement dit "rfrencement naturel" engendr notamment par le page ranking. Lorsque les internautes effectuent des recherches sur Google l'aide de l'un des mots cls utilis par le publicitaire, son annonce est alors susceptible dapparatre ct des rsultats de recherche. Google met galement disposition des annonceurs un gnrateur de mots cls. Cet outil recense de faon automatique une liste de requtes courantes effectues sur le moteur de recherche de Google, en rapport avec le mot cl saisi par le publicitaire. En parallle de AdWords, Google a galement dvelopp un systme cette fois tourn vers le gestionnaire de site Web, AdSense24, autre rgie publicitaire de Google qui utilise donc les sites Web comme support pour les annonces. AdSense propose aux entreprises ou aux particuliers possdant un site Web dexplorer automatiquement le contenu des pages et de proposer par la suite des annonces (textuelles et/ou illustres) correspondant au public et au contenu du site. Pour accrotre la pertinence des annonces, AdSense ne se base pas sur un seul mot, mais sur plusieurs et cherche trouver le point commun entre eux pour dterminer le sens du contenu d'un texte. Le moteur de recherche peut afficher la publicit de deux manires : en encart spar ou en l'intgrant aux rsultats de la recherche. Pour le visiteur, l'encart spar se prsente comme une publicit classique. L'intgration aux rsultats se fait en revanche au dtriment de leur pertinence et peut avoir des retombes ngatives sur la qualit perue du moteur. De ce fait, tous les moteurs ne vendent pas de placement dans les rsultats.

23

https://www.google.com/accounts/ServiceLogin?service=adwords&cd=FR&hl=frFR&ltmpl=adwords&passive=true&ifr=false&alwf=true&continue=https%3A%2F%2Fadwords.google.fr%2 Fselect%2Fgaiaauth%3Fapt%3DNone%26ugl%3Dtrue 24 https://www.google.com/adsense/login/fr/?sourceid=aso&subid=ww-fr_FR-etawhome&medium=link&hl=fr_FR&gsessionid=sEQjZFR5RAoxfzoKTroK8Q

19

Pour Tim OReilly, la vente despace publicitaire est le cur du systme conomique de Google. Le trait de gnie de Google, qui permet la firme de largement dpasser les autres moteurs de recherche sur le march en matire de montisation dencarts, a t de comprendre que vendre les meilleurs espaces publicitaires aux plus gros enchrisseurs tait en ralit une perte dargent. Et Tim OReilly de prciser, tant donn que les annonceurs ne paient quen fonction des clics, Google se rendit compte que sils pouvaient dterminer le nombre probable de clics sur une publicit, ils pourraient vendre lespace le plus en vue la meilleure combinaison de prix et de clics. Par linstrumentalisation, la mesure et ladaptation au taux de clics, Google rendit la vente de publicit plus intelligente, le tout grce limplication implicite des internautes. 25. Parce que Google a su prendre en compte limportance de la position dune annonce sur une page Web, les usages et habitudes des usagers, parce quils russirent traduire leurs intuitions en outils rentables, la firme se place aujourdhui comme leader conomique et technologique. Les systmes Adwords et Adsense, crs par Google, reposent pour le premier sur lachat par les entreprises de mots-cls permettant lapparition de leurs annonces sur la page de rsultats Google et pour Adsense sur lanalyse du contenu des pages de sites permettant dy loger les publicits les plus en lien. On comprend donc que si ce systme est des plus performants en ce qui concerne les documents textuels, puisquils se basent tous deux sur une analyse plein texte et sur la forme du mot cl, ces applications connaissent de vraies lacunes quant leur application sur des documents visuels. Dune part parce que peu dimages sont renseignes par mots-cls et dautres part parce quil est pour linstant impossible danalyser automatiquement le contenu dune image fixe ou anime, il va sen dire quau vu du nombre de nouvelles images circulant sur le Web chaque jour cette opration ne peut se faire manuellement. Les technologies dindexation et de descriptions des images par leur contenu apparaissent donc pour Google comme une voie salutaire dans la rentabilit de leurs services une poque o par exemple le site Youtube, pour les raisons prcdemment invoques, savre dficitaire. Depuis 2008, Youtube a dcid dutiliser AdSense pour montiser ses contenus, en faisant safficher des publicits en bas des fentres vido, toutefois rien nindique encore que la solution sera suffisante pour rentabiliser le trafic. Ce choix de rgie publicitaire est loin dtre neutre, comme lexplique Rmi Douine la valeur publicitaire dun contenu sur Internet, mme quand il sagit dune vido, ne peut tre ralise par lexploitation de
Tim OReilly, Why Dell.com (was) more enterprise 2.0 than Dell Ideastorm, OReilly Radar, 29/09/2008, en ligne http://radar.oreilly.com/2008/09/why-dell-dot-com-is-more-enterprise.html
25

20

linformation descendante du contenu (meta-tags des vidos choisis par les internautes ou description du contenu ou slection dun contenu par un publicitaire) mais bien par lexploitation et la mise en avant de linformation remontante des internautes (mots-cls que les internautes recherchent un instant T) 26. Il faut donc prendre en compte, les utilisateurs, le contenu, mais aussi les pratiques dveloppes par les usagers sur ce contenu et leur apprciation. Les possibilits de rentabilit des espaces documentaires visuels de Google semblent donc dpendre non seulement dune possible contextualisation des annonces, et donc dune analyse du contenu visuel, mais aussi et de faon dterminante de lestimation de lintrt des internautes de ce mme contenu.

II. Lindexation des documents visuels par les moteurs de recherche


A. Accroissement des contenus visuels par le Web 2.0

Lune des dernires volutions majeures du Web est son ouverture lindexation de contenus divers issus des multiples sphres, publique, prive/professionnelle ou encore intime qui nous caractrisent. la varit des sources de ces documents en constante circulation vient sajouter la diversit de leur nature dont la prsence toujours accrue de limage sur le Web constitue un des changements de rgime documentaire les plus observables. 1. Nouvelle approche du document Le Web opre un changement de la notion de document, lindexabilit largie des contenus semble favoriser une transgression de lordre documentaire ordinaire. Le Web documentarise des expressions qui relevaient autrefois de lintime et de lphmre en les enregistrant, les traant, les indexant, et la frontire se brouille alors entre priv et public, document et donne factuelle. Toutefois le chamboulement dans la perception du documentaire trouve son origine avant lessor du Web, medium ne faisant quacclrer le processus. En effet lapparition du numrique ne fut pas sans apporter de changement vis-vis de la notion mme de document et par consquent au niveau galement des mthodes de gestion et de traitement de linformation. Lune des premires transformations apporte par le numrique la notion de document, se distingue au niveau de sa forme tout dabord, ce que le collectif RTP DOC
Rmi Douine, Extension du domaine de la recherche vido , ARHV,8/12/2008, en ligne http://www.arhv.lhivic.org/index.php/2008/12/08/885-extension-du-domaine-de-la-recherche-video
26

21

nomme la matrialit du document. considrer le document lchelle des sciences de linformation, de la bibliothconomie et de larchivistique, il se dfinit comme une ressource matrielle manipulable, vecteur dinformations ou faisant office de preuves. Son aspect dominant est le support papier lui permettant une transmission dinfo le plus souvent textuelle, Le document a t construit comme un objet dont la concrtisation la plus banale est la feuille de papier, au cours dun processus sculaire o se sont entrelacs outils, savoirs et statuts. Depuis quelques dizaines dannes avec le numrique, nous sommes passs dans une nouvelle priode dont certaines caractristiques sont en filiation directe avec la phase prcdente tandis que dautres marquent au contraire un changement radical et peut-tre lmergence dune notion diffrente reprenant tout ou partie de lutilit sociale de ce que nous appelions document. 27 . Jusqu larrive du numrique nous pouvons ainsi stipuler une emprise du texte et du document papier sur la sphre documentaire. Or le document numrique qui dferle dsormais au sein des rseaux ne saurait se caractriser par une quelconque matrialit mais implique au contraire, dans le cas dune numrisation, une rupture du document avec son support originel. Le document devient une reprsentation dinformations, un enregistrement en langage binaire. Lun des premiers changements apport par le numrique est donc dordre matriel, touchant lintgrit mme de ce qui constituait, depuis lapparition de lcriture, lapanage de la science documentaire. Aujourdhui le document dpasse de bien loin la seule considration du texte sur support papier pour couvrir ce que lon nomme dj le multimdia. En considrant que, dsormais, tout document existant est vou la numrisation, que toute production matriellement tangible dun document est forcment accompagne de son double numrique, et enfin que certains documents ne connaissent quune existence digitale, le document ne doit plus tre uniquement considr du point de vue de sa matrialit. On assiste un largissement de la notion, le numrique dans labandon du support natif quil inflige au document, pour sa transcription en reprsentation binaire et unique, oblige le considrer dsormais en dehors de son lien au support originel. De plus par la mixit des mdias quil permet, le document prend aussi bien en compte les dimensions iconiques quauditives ou textuelles de la ressource, le texte ntant plus le seul langage vecteur dinformations. Limage devient par consquent dans sa forme numrique une unit documentaire au mme titre quune source numrise textuelle
27

Roger T Pedauque, Document : forme, signe et medium, les re-formulations du numrique, Paris, ENSSIB, 2003, en ligne http://archivesic.ccsd.cnrs.fr/docs/00/06/21/99/PDF/sic_00000511.pdf

22

puisquils partagent tous deux le mme encodage binaire. De par sa nature numrique et sa fonction de document limage fixe se trouve donc soumise au principe de la recherche et rpond par consquent des ncessits de classification, dindexation : seul systme pouvant assurer son utilisabilit au sein de collections enrichies en permanence. La fragmentation de la notion de document ouvre la possibilit dune redocumentarisation massive28 , laquelle mixe de manire indite et avec une permabilit nouvelle des espaces et des marqueurs sociaux jusque-l bien distincts. Toute trace, inscription, support, flux ou change numrique est aujourdhui mme de devenir document, la condition tant son apparition mme fugitive ou volontairement phmre sur le rseau. Une image, un texte, un extrait de page, un courrier lectronique, quelques lignes de conversations sur messagerie instantane, une vido, etc. sont aujourdhui des entits documentaires par leur inscription au sein du Web. Aujourdhui le Web se comprend plus que jamais comme lespace du multimdia, o les images, les vidos et les sons ont une place privilgie pouvant permettre un enrichissement des documents textuels. Il suffit pour sen convaincre de considrer les formules en ligne des principaux quotidiens dinformations qui usent de ces mediums comme complments essentiel aux articles. Les images ont envahi le Web dans leur forme anime comme mouvante, en support dinformation ou de mdiation. Elles accompagnent la plupart des sites officiels, comme forme dexpression personnelle et de communication globale. Leur nombre explose littralement sur les blogs personnels et autres plateformes de partage grand public. 2. Lexplosion visuelle du Web Une transformation profonde du Web se dessine depuis peu avec lintroduction massive des documents visuels et multimdias issus des productions personnelles des internautes. Ce renouveau du paysage de la toile dpend majoritairement de deux facteurs, la dmocratisation des Appareils Photos Numriques29, dont les cots proportionnellement leurs capacits ne cessent de baisser ; et dautre part laccessibilit accrue des foyers au rseau Internet et au haut dbit. Ces changements dordre sociaux-conomiques influent non seulement sur le contenu du Web mais galement sur lessence mme de la pratique photographique voire dans une perspective plus ontologique sur la notion dimage mme.
28

Jean-Michel Salan, Le dfi du numrique : redonner sa place la fonction documentaire, ADBS, 2008, en ligne https://papyrus.bib.umontreal.ca/jspui/bitstream/1866/2225/1/salaun-jm-defi-documentalistemktg.pdf 29 Cf. les chiffres de vente des appareils anne par anne sur le site du SIPEC : http://www.sipec.org/ .

23

Aujourdhui limage non seulement se partage mais semble plus que jamais tre faite pour tre partage, et ainsi est-il permis dobserver un changement de paradigme au niveau de la production des images. Les photos numriques ne sont plus seulement voues paratre sur papier mais se regardent directement sur lcran (que se soit celui de lappareil ou de lordinateur), il rsulte de ce changement une baisse des cots de la pratique photographique (dans lhypothse o le foyer est dj quip dun ordinateur) et par consquent une augmentation significative des prises de vues par famille alors stockes, classes sur le disque dur ou de faon plus rcente mises en ligne sur des plateformes de partage. Une autre mutation radicale des pratiques touche la circulation, le partage de ces images. Jusqu lavnement du numrique la photographie issue des pratiques amateurs tait voue, dans le cas dune pratique prive rester dans le cadre familial, les photos ranges dans des albums se regardaient lors de runions, de rituels familiaux. Objet de remmoration des vnements passs, illustration de la gnalogie familiale, supports de souvenirs des tres chers et des lieux de son histoire personnelle, la photographie prive, navait pas vocation transmettre un savoir visuel en dehors de lunivers familial30. En outre, si lon considre les pratiques claires du medium, les images circulaient alors au sein des photoclubs, lors de rencontres rgionales, nationales des socits photographiques mais trouvaient difficilement une visibilit publique. Seules les meilleures dentre elles pouvaient prtendre une publication dans certaines revues spcialises au public trs restreint31. Quelle que soit la pratique envisage la photographie amateur navait pas de reconnaissance publique. Limage produite par un photographe amateur fait aujourdhui pleinement partie du paysage dInternet, la mise en ligne des photos offre aux particuliers ce quils navaient jamais eu jusque l : un public et une visibilit. Si la cration amateur se dfinissait jusqu prsent par une pratique de loisir, ayant pour seule fin une diffusion de ces productions dans la sphre prive, ou dans un cercle restreint de connaisseurs, il faut donc convenir quune transformation du statut mme de lamateur est en train de soprer, au travers des pratiques de diffusion de ses travaux. Regarder les images des autres est peru dsormais comme une forme de plaisir et dactivit sociale. Limage partage devient le lieu de sociabilit mais aussi de crations. En recherchant la visibilit pour ses propres travaux un
Sur ce sujet voir notamment : Irene Jonas, la photographie de famille au temps du numrique , Enfances, familles, Gnrations, n7, automne 2007. 31 Sur ce sujet voir notamment Christian Joschke, Aux origines des usages sociaux de la photographie , Actes de la recherche en sciences sociales, n154, avril 2004, p 53-65.
30

24

amateur est souvent amen nouer des liens avec dautres internautes, la circulation dimages au sein des rseaux du Web entrane ainsi souvent des pratiques nouvelles de recyclage ou remix, des participations nouvelles de la part des amateurs se constatent galement au niveau des discussions, commentaires, annotations encadrant les images. Loin de ne demeurer quun utilisateur passif des techniques, lamateur lre du numrique est en instance de devenir lun des acteurs majeur de la culture populaire sexprimant sur Internet. Sinscrivant dans une perspective participative, la pratique vernaculaire de la photographie se rvle tre un espace de cration, dont le vecteur principal est lchange, la circulation des images32. Ce renouveau des pratiques, qui prend dsormais en compte un travail de post production inhrent la diffusion des images (transfert sur lordinateur, classement, gestion des dossiers, des comptes dutilisateurs sur les plateformes, les photoblogs, rseaux sociaux, etc.), est d non seulement la technologie du numrique, mais galement au dveloppement dInternet. La premire voie de partage des images numriques a t le mail, dans un premier temps, la taille importante des fichiers images et les connections bas dbit rendaient la tche longue et fastidieuse. Cest finalement larrive de linternet rapide, les capacits de stockage et denvoi accrues des botes mails, qui ont provoqu un premier renversement au sein des pratiques photographiques, que se soit au niveau du visionnage ou de lchange autour de limage. Mais cest vritablement lapparition des plateformes de partage, des logiciels de gestion des images en ligne et du phnomne des blogs qui provoquent une dferlante images sur le Web. Les diffrents sites existants aujourdhui proposent aux internautes non seulement des espaces de stockage des images mais aussi des outils dorganisation des corpus voire de retouche et enfin des technologies de transfert des images gratuits et performants. Lmergence de ces plateformes et autres photoblogs est concomitante la phase de transformation du Web qui, ds 200533, se mue du Web classique en Web 2.0. Reposant sur une interactivit entre les sites et sur la participation des internautes la formation de leurs contenus, ce nouveau Web a engendr et rendu possible ces nouvelles pratiques photographiques des amateurs. Larrive du numrique, la possibilit denvoyer des fichiers images par le Web, lmergence de plateformes de stockage des photographies sur

Sur le renouveau de lamateur voir Jean-louis Weissberg lamateur : mergence dune figure politique en milieu numrique , Multitudes, n5, mai 2001. 33 Nous nous rfrons pour la date larticle de Tim O Reilly, What is Web 2.0 , en ligne http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-Web-20.html .

32

25

Internet comme Flickr34, ont profondment modifi le rapport des familles, des particuliers limage. Nous sommes passs dun rgime de production de limage, un rgime de diffusion.

B.

Les systmes dindexation de la firme Google

Louverture toujours croissante du Web aux documents non plus seulement textuels mais visuels, induit par le changement et surtout llargissement de la notion mme de document de nouvelles problmatiques en matire dindexation. Comment appliquer les technologies des moteurs jusque l dvous au texte sur des contenus iconographiques ? 1. Chercher le texte avant limage La plupart des moteurs de recherche gnralistes proposent aujourdhui des solutions de recherche dimages sur le Web. Toutefois, et en conformit avec leur propre systme de fonctionnement, lindexation et la recherche de ces images seffectuent en se basant majoritairement sur des annotations textuelles ou des lments de texte pouvant tre rattachs aux images. La principale particularit de la recherche d'images est qu'il n'est pas possible d'effectuer une recherche plein texte avec des mots-cls sur les donnes des images prsentes dans une base de donnes d'images. Pour pallier cet inconvnient, deux solutions existent. En premier lieu, la recherche peut s'effectuer daprs les donnes textuelles associes limage, par exemple les donnes de la page Web o est prsente l'image. La solution oppose, que nous examinerons dans le dernier chapitre de ce mmoire, repose sur un principe dindexation et de recherche effectu partir du "contenu" des images, par une analyse des donnes des images. Dans le cas de la recherche d'images partir de texte associ aux images, principe le plus rpandu au sein des moteurs de recherche basiques, les mthodes d'indexation et de recherche s'apparentent celles utilises classiquement dans une base de donnes textuelle. Simplement, dans le cas de la recherche d'images, les donnes indexes par les outils de recherche servant "retrouver" les images, sont les informations textuelles se rapportant aux images. Ces informations textuelles collectes et indexes par les outils de recherche d'images sur internet peuvent se situer deux emplacements. Tout dabord ces lments peuvent tre extraits du code HTML des balises et des attributs spcifiques aux images. Ainsi la balise <IMG SRC="..."> sert indiquer l'insertion d'une image dans une page

34

http://www.flickr.com/, pour un aperu des principes dutilisation du site et de ses fonctionnalits on peut galement se rfrer linterview dAndr Gunthert sur le site Internet Actu, Flickr une des choses les plus importantes qui soit arrive la photographie ,en ligne http://www.internetactu.net/ .

26

HTML, la balise < HREF="..."> mentionne quant elle la prsence dun lien hypertexte vers une image. Enfin lattribut ALT="..." reprsente le texte alternatif d'une image, il prsente l'inconvnient de ne pas toujours tre renseign par les crateurs de pages HTML. Enfin les informations pouvant servir lindexation des images peuvent se trouver dans le texte de la page associe ou dans le titre de la page support , ce sont alors des lments lexicaux, mots entourant limage. Les moteurs de recherche du type Google ont un systme dindexation bas sur la forme du texte, en ce qui concerne lindexation des images fixes cest le texte entourant limage qui sert de critre, que ce soit celui contenu dans les mtadonnes, ou ladresse, le titre et le texte de la page. Il convient galement de noter que ce qui permet de reprer des images prsentes sur les rseaux par les diffrents outils disponibles et de les diffrencier des autres donnes passe par la recherche des extensions de fichiers qui correspondent celles des images comme les fichiers Gif, Jpeg, etc. Il apparat avec ces mthodes dindexation que limage demeure toujours dpendante du texte qui lentoure, la recherche ne peut seffectuer que selon des critres qui lui sont extrinsques. Cest un lieu commun que de penser nos socits industrialises, o le cinma, la tlvision, la photographie sinscrivent en pratiques culturelles de masse, comme tant exclusivement visuelles. Ce quil ressort dune observation simple dInternet et du Web est que le texte domine encore largement limage malgr sa prsence croissante sur la toile. Pour exister physiquement sur un support numrique, chaque image porte un nom seul critre de son indexation, les moteurs de recherche, qui sont le moyen daccs aux donnes numriques, tant essentiellement textuels. Et lorsquon cherche une image cest par son titre que lon y parvient. Cette domination interroge la relation complexe et historiquement stratifie entre ces deux rgimes de pense. Il y a toujours eu un entrelacs, ou si vous voulez un problme, une question, un no mans land entre lalphanumrique et liconographique 35. L o le numrique a permis dlaborer des outils automatiss de gestion des collections documentaires, daboutir des moteurs de recherche performants pour des volumes de documents toujours croissants, son application limage, bien quayant transform les pratiques photographiques et vidos, ne semblent pas pour linstant avoir engendr un renouveau au niveau de la gestion des corpus iconographiques.

35

Gregory Chatonsky, La rvolution a lieu New-york , Incident.net, 03/07/2003, en ligne : http://incident.net/users/gregory/wordpress/03-la-revolution-a-eu-lieu-a-new-york/

27

Il perdure dans plusieurs cas, chanes de tlvision, journaux, Web un archivage et un traage des images et des squences vidos ne pouvant se faire quau prix dune tape dannotation manuelle laide de mots-cls. Cette indexation reprsente une tche longue et rptitive pour lhumain, surtout avec les bases dimages qui deviennent aujourdhui de plus en plus massives. En prenant en compte laspect fastidieux de ce type dindexation, sa quasi incompatibilit avec les donnes visuelles du Web, mais aussi la subjectivit de cette tche, dpendant de la culture, connaissance, et des sentiments de chaque personne, le besoin de mthodes dindexation et de recherche automatique, directement bases sur le contenu de limage nest donc plus dmontrer. 2. Google Image et Google Image Labeler Loutil de recherche dimages fixes de Google est aujourdhui lun des moteurs les plus utiliss. Google a choisi de ddier une page de son interface cette fonctionnalit qui hrite donc de lergonomie simple et lisible du moteur. La recherche dbute par une saisie de mots cls dans le champ imparti, les rsultats sont retourns sous la forme dune mosaque de dix-huit miniatures, le nombre total dimages trouves est quant lui mentionn au dessus des rsultats. Sous chaque image sont mentionns le titre, la taille de limage, le type de fichier et le nom du site hbergeur.

Ill. 1 Capture dcran dune recherche effectue sur Google Image partir du motcl LHIVIC.

28

La requte peut tre affine par la slection de la taille des images (trs grande taille, grande, moyenne, petite taille), par le type de contenu tel que contenu dactualits, portrait, images clipart, dessin au trait, contenu photo. Depuis peu, le moteur permet galement de slectionner les images en fonction de la couleur souhaite. En cliquant sur une miniature, une nouvelle fentre souvre directement sur la page Web o se trouve limage. Un cadre surplombe la page Web, o lon retrouve la miniature et un rsum de ses proprits, lusager peut alors suivre un lien conduisant une nouvelle page o limage est extraite de son contexte Web et prsente dans sa taille relle. Il est possible deffectuer une recherche avance, plusieurs champs sont alors remplir par linternaute, dont des cadres ddis une requte boolenne. Il est aussi possible ce stade de slectionner le type de fichier dsir (JPG, GIF, PNG), ou de restreindre la recherche un seul site en rentrant son adresse URL.

Ill. 2 Capture dcran des options de recherche avance sur Google Image

Si le site moteur propose une interface simple dutilisation et efficace, il connat toutefois quelques limites, notamment de pertinence, problme imparti au systme dindexation bas uniquement sur la recherche de termes associs aux images. Le principal manque de pertinence visible est celui d au synonyme ou homonyme, des images reprsentant des objets diffrents mais rfrant au mme mot seront prsentes ensemble. Lexprience est simple faire avec le terme avocat , rassemblant alors des images aussi bien du fruit que de la profession. Cette limite nest pas une faille spcifique au moteur mais se retrouve dans tous les systmes utilisant une indexation en smantique libre 29

et non hirarchise comme nous le verrons plus loin, de plus il est possible, en utilisant la recherche avance de limiter sur cette interface ce genre de problme. Un autre type de retour non pertinent est quant lui incomber au fonctionnement du moteur. En se basant sur les termes de la requte croiss ceux des pages Web avec images les comportant, il peut arriver que limage retourne nait aucun rapport avec les termes soumis. Les mots se trouvaient bien sur la page mais ne se rapportaient pas directement limage, il convient ici aussi davoir recours aux outils de recherche experte pour amoindrir ces cueils. Conscient des manques et limites de son systme en termes dindexation visuelle et dans une vise damlioration des services et de rentabilit accrue, Google Image se tourne en 2006 vers la pratique du taggage collaboratif. Ainsi est lanc Google Image Labeler36, une application dapparence ludique savrant mme addictive, et qui suit le mot dordre de la firme Many hands make light work. Le but est donc de faire participer les gens au (re)taggage des images, denrichir lindexation visuelle de sa base de donnes par lajout de mots-cls choisis par les internautes et ce par lintermdiaire dun jeu. Le principe est simple, le logiciel nous attribue un adversaire prsent sur linterface au mme moment mais dont nous ne savons rien. Viennent ensuite les images, des photographies dfilent de faon alatoire sur lcran, le jeu est de rentrer un maximum de mots cls pour dfinir chaque image. Si lon entre le mme mot-cl que son partenaire, celui-ci est donn " gagnant " et donc pris en compte par Google pour indexer l'avenir cette image. De plus il sera dsormais considr comme mot tabou, les futurs joueurs tombant nouveau sur limage ne pourront pas lemployer. la fin du jeu, qui dure 1 minute 30, un score correspondant au nombre d'images ainsi identifies par les joueurs, et les meilleurs scores sont affichs en page d'accueil de ce "service". La folksonomie se met en place au sein de GI et permet une prcision renforce, une plus grande varit des motscls.

36

http://images.google.com/imagelabeler/

30

Ill. 3 Capture dcran dune session de Google Image Labeler

3. Les solutions pour la vido Si des solutions sont dveloppes pour lindexation et la recherche dimages fixes, le problme est tout aussi important du ct des contenus vidos. Si bien sr des vidos aux fichiers bien documents peuvent tre retrouves par leur titre, annotations, etc., la difficult technique encore rsoudre concerne lindexation des propos contenus dans ces vidos. Pour linstant les moteurs ne prennent pas en charge les contenus des vidos, ce qui rend impossible de retrouver un passage particulier alors perdu au sein de la masse visuelle chaque jour mise sur le Web. Depuis peu ont t mis au point les premiers outils permettant dextraire les bandes sonores des vidos, de dchiffrer les propos et dindexer les vidos daprs cette analyse. Le but est de permettre aux usagers de chercher de linformation dans les propos tenus dans les vidos, de slectionner les commentaires vidos selon des mots cls ou des termes de recherche. Les premiers logiciels prenant en charge ce type dindexation sont Blinkx37 ou EveryZing38, mais Google a depuis peu lanc son propre outil dindexation audio. Google Audio Indexing39, est le nom de la technologie mise au point par la firme pour permettre aux usagers deffectuer une recherche par mots-cls directement partir du

37 38

http://www.blinkx.com/ http://search.everyzing.com/ 39 http://labs.google.com/gaudi

31

contenu audio des vidos. Pour linstant encore en stade dexprimentation, seules celles issues de YouTube Political channels ont t indexes. Le principe repose sur la dtection puis lindexation de mots parls lintrieur des images et leur transformation en texte indexable. Lutilisateur dispose dune interface entirement ddie cet outil pour effectuer ses recherches. Comme pour toute option de recherche Google, une barre de recherche est disponible dans laquelle lusager peut taper ses mots-cls. Une liste de miniatures correspondant aux vidos comportant ces termes est alors affiche sur la gauche. Une fois une vido choisie, apparat sur la droite un encart comportant un lecteur avec une vido charge sous laquelle apparaissent sous forme textuelle, les passages o les termes sont mentionns. Il est alors possible en cliquant sur le lien de visionner directement le passage dsir. La mme opration peut aussi tre effectue en cliquant directement sur la ligne de dfilement de la vido o les passages sont marqus en jaune.

Ill. 4 Capture dcran de loutil Google Audio Indexing

Si selon les propos mme de Google leur mission est "to organize the world's information and make it universally accessible and useful"40, le but de cette course la technologie dindexation est bien aussi certainement conomique. Comme nous lavons abord prcdemment, la plateforme Youtube connat de vrais problmes de rentabilit dus aux possibilits limites dindexation des vidos et par consquent au peu de retour publicitaire que les contenus suscitent. En accroissant les chances dindexation et surtout

40

http://labs.google.com/gaudi/static/faq.html#how-it-works

32

en effectuant cette tape directement partir du contenu des vidos, la firme pourrait enfin parvenir lier pour chaque vido une annonce contextuelle pertinente.

33

Chapitre 2

Lindexation smantique et la folksonomie

34

Sommaire du chapitre I. Lapparition dune indexation sociale ...................................................... 36


. Lindexation des collections iconographiques ......................................................... 36 1. 2. 3. Une indexation smantique surajoute ................................................................. 36 Indexation, classification et thsaurus .................................................................. 38 Indexation et mtadonnes.................................................................................... 40

B. La folksonomie ......................................................................................................... 43 1. 2. 3. LApparition de la folksonomie sur le Web ......................................................... 43 Les principes de la folksonomie ........................................................................... 46 Une tude de cas : Flickr....................................................................................... 48

II. Vers les nouveaux usages de la folksonomie ........................................... 50


. Les pratiques sociales et communautaires ................................................................ 51 1. 2. 3. Des tags aux groupes ............................................................................................ 51 Commenter par les tags ......................................................................................... 53 Tags et jugement de got ...................................................................................... 55

B. Les dtournements cratifs de lindexation .............................................................. 57 1. 2. 3. Dfinition dun mashup ........................................................................................ 57 Mashups et jeux de mots ....................................................................................... 58 Mashups artistiques............................................................................................... 60

C. Flickr Commons et les nouvelles pratique documentaires ....................................... 61 1. 2. The Commons sur Flickr ....................................................................................... 62 Flickr comme moteur de recherche ...................................................................... 66

III. Les limites de la folksonomie ................................................................... 68


. Polysmie, synonymie et subjectivit....................................................................... 68 1. 2. Problmes de lindexation smantique des images ............................................... 68 Polysmies des tags .............................................................................................. 69

B. Problme des multilinguismes et Restriction du champ smantique ....................... 70 1. 2. Rgulation par les foules ....................................................................................... 70 Un vocabulaire limit, Folksonomie et multilinguisme........................................ 72

35

I. Lapparition dune indexation sociale


Avec lmergence du Web 2.0 se sont dvelopps depuis moins de 10 ans de nombreux sites de partage de photographies ouverts au grand public. Ces sites dhbergement de photographies ont connu un succs fulgurant et comprennent pour les plus importants des bases de donnes comptant souvent plusieurs centaines de millions dimages. Face ce flux dimages quotidiennement tlcharges ces sites ont d intgrer des systmes dindexation fiables et performants pour faciliter le classement et la recherche de photographies auprs dun public souvent non spcialiste de recherche documentaire.

A.

Lindexation des collections iconographiques

Nous considrons les sites de partage dimages au sein du Web partir du modle des collections de photographies, pour autant quune collection soit comprise comme une
runion artificielle de documents en fonction de critres communs lis leur contenu ou leur support et dont la juxtaposition est le fruit de la volont ou du hasard 41. Nous nous efforons dans un premier temps de revenir sur les systmes dindexation dimages traditionnels, employs par les professionnels de la documentation, tout en nous interrogeant sur leur oprabilit dans le cas dune application sur les corpus des sites Internet.

1.

Une indexation smantique surajoute

Dans une perspective de rationalisation dune collection, dune base de donnes iconographique, la question essentielle est de savoir ce qui est indexable dans une photographie. De prime abord nous avons seulement les mots pour tablir des passerelles entre les images et les utilisateurs de cette mme banque dimages. L'image reste muette sans les mots qui non seulement lui donnent un sens mais permettent de la retrouver. Ainsi: Nous parlons dans un monde, nous voyons dans l'autre. mais nous sommes contraints de les relier car ce qui fait d'un fonds une mmoire repose sur son indexation. 42. Bruno Bachimont le confirme : Les images se caractrisent principalement par un aspect morphologique analogue la ralit mondaine... Le signe qu'est l'image est un signe qui montre mais non un signe qui dit. Or, l'instar de la ralit qu'elle prtend reprsenter,
Association des archivistes franais, Abrg darchivistique : principes et pratiques du mtier darchiviste , Association des archivistes franais, Paris, 2004, p. 259-263. 42 Debray, Rgis. Vie et mort de l'image, Paris, Gallimard, 1994. 526 p.
41

36

l'image ne peut dire par elle-mme ce qu'elle signifie et doit reposer sur une paraphrase langagire pour gagner l'intelligibilit qui lui manque. C'est pourquoi tout contenu visuel doit comporter un commentaire ou une lgende. 43. Il convient de distinguer comme laffirme lauteur les signes qui disent , signes renvoyant une double articulation et qui forment un systme fonctionnel, des signes qui montrent , ceux qui ne font pas systme. Le langage opre une transformation symbolique du rel, par lintermdiaire du signe linguistique. cette codification rpond le signe qui montre qui tend seffacer devant ce quil montre dans la mesure o, ressemblant son objet, il lui est homogne. Cest en effet lambigut inhrente de limage qui se confond avec la ralit quelle montre, alors quune reprsentation nest pas violente, mais seulement la ralit quelle montre, limage, elle, pourrait ltre. Relevant davantage de la ralit perceptive que de la codification symbolique, les images et les sons possdent une texture smiotique diffrente et irrductible. La prvalence dun systme dindexation smantique nest pas trangre au caractre indiciel dfinissant depuis plus de vingt ans aussi bien la photographie que le cinma. Puisque les images selon cette conception renvoient de faon ontologique au rel, puisquelles ne sont souvent considres que daprs la notion de signe alors leur catgorisation, leur classification au sein des systmes bibliothconomiques comme au sein des bases de donnes, sopre daprs cet ordre smiotique qui les place sous le joug du mot. En prnant que toute photographie est le rsultat dune empreinte physique qui a t transfre sur une surface sensible par les rflexions de la lumire et que la photographie est donc le type dicne ou de reprsentation visuelle qui a avec son objet une relation indicielle44, Rosalind Krauss est lune des premires thoriser cet attachement ontologique de limage photographique son rfrent. Seulement, l o les moteurs de recherche sur le Web fonctionnent selon une indexation des mots entourant limage, le principe dindexation au sein de collections iconographiques se rvle diffrent de par la nature mme des documents en jeu. En effet le moteur Google comprend les images comme un lment constitutif dun plus vaste document quest la page Web. Limage est retrouve par les balises html qui la signalent au sein du code de la page et par une analyse du texte qui laccompagne. Au sein dune banque dimage la photographie est le document mme, celui devant tre index, si dans le
Bruno Bachimont. Bibliothques numriques audiovisuelles : des enjeux scientifiques et techniques. , Document numrique, 1998, vol. 2, n 3-4, p. 219-242 44 Rosalind Krauss, Notes sur l'index , L'Originalit de l'avant-garde et autres mythes modernistes, Paris, Macula, 1993, p. 69.
43

37

flux de documents multimdias qui composent le Web une image est rarement isole, dans une base iconographique la photographie peut se retrouver orpheline. Lutilisation des moteurs dindexation textuelle est par consquent inutilisable, lindexation smantique doit alors soprer un autre niveau. Si linscription crite est donc sa propre indexation 45, il en va autrement pour les images pour lesquelles lindexation nest pas donne avec le contenu et doit par consquent tre surajoute. 2. Indexation, classification et thsaurus

Avec la masse croissante de documents circulant sur le Web, les domaines de la gestion documentaire, de lorganisation et de la classification des donnes au sein de bases iconographiques suscitent de nouvelles proccupations, il ne sagit pas toutefois de problmatiques rcentes. En labsence de tout systme permettant une automatisation efficiente de lindexation des documents visuels, les annotations dimages sont effectues manuellement, ce qui permet dobtenir le niveau dabstraction dsir. Ces mthodes remontent aux annes 1970 et font appel des documentalistes experts en annotation manuelle dimages, qui vont traiter ces fonds selon des pratiques documentaires traditionnelles, leur appliquant les mthodes bibliothconomiques dveloppes pour le texte mais adaptes limage. En pratique, et pour de nombreux domaines, les documentalistes ont lhabitude de produire des descriptions textuelles des images en sappuyant sur des ressources terminologiques : schmas de classifications, listes dautorit, dictionnaires de noms propres, thsaurus gnraux ou spcialiss, etc. Le but de ces ressources est de contrler les descriptions en attnuant leur variabilit et de remdier la subjectivit du choix dun terme descripteur quand la tche incombe une seule personne. Indexer consiste donc analyser le contenu dun document et de le transcrire dans un langage documentaire. La double finalit du processus d'indexation est de normaliser la codification du contenu des documents et pour l'utilisateur de faciliter la recherche du document. Un langage documentaire est constitu par des termes choisis pouvant appartenir au langage naturel et par un systme de relations entre ces termes, il se caractrise galement par une syntaxe en reprenant les rgles de construction du langage. Il existe plusieurs types de langage documentaire,

45

Bruno Bachimont, Image et audiovisuel : la documentation entre technique et interprtation. Critique et perspectives , Documentaliste-Sciences de linformation, Volume 42, juin 2005, p. 348-353.

38

les classifications apparues la charnire du 19e et du 20e sicle comme la Classification Dcimale de Dewey, et qui ont essentiellement pour fonction de permettre le rangement physique des documents,

les langages analytiques dont lapparition est concomitante avec la monte en puissance des outils informatiques et leur capacit danalyse.

Parmi ces langages analytiques on peut diffrencier : le thsaurus qui liste les descripteurs comportant des relations d'exclusion (limination de la synonymie) et prcise leurs relations smantiques et hirarchiques, il est gnralement spcialis. la liste dautorits qui recense les termes dcrivant un sujet de faon normalise, appels vedettes-matires, retenus pour l'indexation et ceux exclus relis entre eux par des relations smantiques labores et dveloppes au fur et mesure des besoins des bibliothques qui l'utilisent. Elle est gnralement encyclopdique, le systme RAMEAU constitue l'exemple-type de la liste d'autorit. En ce qui concerne les collections iconographiques des adaptations de ces systmes documentaires sont cres. Comme le souligne Ccile Kattnig: Les classifications ou les thesauri existent toujours et saccompagnent souvent de listes complmentaires qui vont porter sur la forme, le genre ou la connotation qui recouvrent le niveau de lecture de limage., de mme pour les listes dautorits des listes complmentaires les accompagnent ainsi existe-t-il Une autre liste dautorit Genre de lImage utilise aux archives photographiques du Ministre de la Culture. Elle comprend 7 catgories, avec parfois un niveau hirarchique : photographie de nuit , photographie dvnementiel (avec un niveau qui est interview), portrait (avec un niveau qui est portrait collectif), etc. 46. Par lintermdiaire de ces index la recherche aboutit la prsentation des notices descriptives correspondantes. Le principe de lindexation consiste donc extraire des mots-cls en langage naturel et de les transposer dans le langage documentaire choisi. Les termes alors la disposition des usagers sont issus dun vocabulaire contrl, et donc restreint, dont le but est llimination des synonymes et le traitement de la polysmie afin de permettre une recherche des plus pertinentes. Toutefois lindexation par vocabulaire contrl demeure problmatique en ce qui concerne les documents iconographiques, comme lexplique
46

Ccile kattnig, En quoi les nouvelles technologies renouvellent-elles le traitement intellectuel de limage ?, Actes de colloques tenu les 23 et 24 octobre 2003 Lyon dans le cadre des rencontres nationales cdidoc-fr, 2003, (en ligne http://www2.acrennes.fr/testscdi/rencontrelyon/kattnig/kattnig.pdf )

39

Marie Didier la diffrence du texte, ou du moins bien plus que lui, limage pose un problme de pertinence de lindexation matire, car elle ne saurait tre circonscrite, cest-dire dcrite de faon exhaustive et objective. Au-del de sa description, une image est susceptible de renvoyer dautres images, dvoquer dautres lectures et interprtations, de provoquer dautres motions 47. Dun point de vue technique lindexation peut porter soit sur du texte intgral, et se fait alors automatiquement par lintermdiaire de moteur dindexation plein texte, soit sur des termes ou expressions contrls qui constituent autant de points daccs aux collections, mais suppose leur dfinition manuelle au sein des notices. Si des systmes de traitement automatique de textes permettent l'extraction des termes les plus frquents d'un corpus et dans une certaine mesure facilitent l'mergence de leurs relations smantiques, ces outils sont inoprants dans le cas dune indexation matire, et dautre part quand le document indexer est iconique. Une opration supplmentaire par rapport au texte est ncessaire et soumet bien plus lindexation la subjectivit de lindexeur : linterprtation du contenu visuel dune image et sa transcription en mot-cl, puis vedettes-matires. Ainsi la construction du thsaurus et de lindex en ce qui concerne limage nest possible que manuellement, lautomatisation des systmes documentaires interviendra seulement dans le contexte de la recherche, par lintgration et le traitement informatique des bases de donnes dindexation et des notices descriptives. 3. Indexation et mtadonnes

Lapparition du numrique, par la numrisation des documents et la constitution de bases aux sources nativement digitales, engendre un renouveau des pratiques dindexation. On assiste au glissement dune indexation par notices extrieurs au document un renseignement compris dans le document par lintermdiaire des mtadonnes. Dans la plupart des systmes informatiss, les informations relatives un document et son classement sont stockes dans une base de donnes spcifique. Cette sparation entre les documents et leurs mtadonnes (au sens dinformation sur les donnes) induit une opration de va et vient pendant le processus de consultation des documents, les mtadonnes demeurant dans la base et devant tre exporter sparment puis associer

47

Marie Didier, Indexation, structuration et encodage des fonds iconographiques : le fonds Lon Lefebvre de la Bibliothque Municipale de Lille , mmoire dtude, Ecole Nationale Suprieure des Sciences de lInformation et des Bibliothques, Paris, 2005, (en ligne : http://www.enssib.fr/bibliothequenumerique/document-809 )

40

nouveau avec la ressource. De plus un risque existe alors de perdre les informations associes aux images en cas de transfert ou de conversion de fichiers. Dans le cas dun document numrique consultable sur une base de donnes ou sur un rseau en ligne, les notices descriptives peuvent galement tre intgres directement au document numrique en tant que mtadonnes informatiques. Avec ces mtadonnes, le travail des moteurs d'indexation et de recherche est grandement facilit car ils peuvent extraire automatiquement de nombreuses informations sur le document, ainsi que reconstituer les relations qui existent entre eux. La question du classement, de la prservation et de larchivage des documents du Web nappartient pas aux seuls moteurs de recherche. Le monde des bibliothques et de la documentation a mis au point des mthodologies, des normes permettant dappliquer ces contenus un ensemble de principes de classement de nature bibliothconomiques au travers de la mise au point de mtadonnes mtiers, internes aux documents et permettant de renseigner les informations indispensables la connaissance et comprhension du document. Pour que ces champs informationnels soient efficients, il est nanmoins ncessaire que tous les acteurs (publicateurs, diteurs de logiciels clients, etc.) partagent une dfinition et une nomenclature communes des mtadonnes, quil en existe une normalisation. Partant de ce constat, un certain nombre d'quipes impliques dans la smantique sur le Web organisrent un atelier Dublin (Ohio) en 1995. Ils dfinirent une liste prcise de quelques mtadonnes lies aux pages Web. Ce jeu de mtadonnes fut surnomm Dublin Core metadata . Le Dublin Core dfinit une quinzaine de champs de mtadonnes utilisables pour les pages Web et les documents numriques de faon gnrale. Ceux-ci concernent : Le contenu (mtadonnes de contenu) : Title, Description, Subject, Source, Coverage, Type, Relation ; la Proprit intellectuelle (mtadonnes de gestion) : Creator, Contributor, Publisher, Rights ; la Version (mtadonnes de structure) : Date, Format, Identifier, Language.

Les lments Dublin Core constituent ainsi des mtadonnes internes, qui peuvent notamment tre encodes dans des balises <meta> dune page HTML, ils constituent ainsi des lments pouvant tre retrouvs par les moteurs de recherche grand public. Pour ce qui est des images on peut considrer que les aspects techniques concernant les fichiers numriques sont insuffisamment transcriptibles en Dublin Core. Cette limitation dapplication a engendr lapparition de formats de mtadonnes spcifiques la 41

photographie dont le plus connu est le modle IPTC (International Press and Telecommunications Council), dvelopp par les organes de presse, il est constitu de 33 mtadonnes de type interne, cest--dire stockes lintrieur des fichiers images JPEG. Appliqus la sphre du Web ces systmes dindexation des documents en ligne ncessitent un savoir faire, une maitrise des outils informatiques, ils demeurent par consquent peu connus du grand public confin une pratique documentaire

professionnelle, et comme le remarquent Olivier Ertzscheid et Gabriel Gallezot ils ne sappliquent, pour une trs grande majorit, qu des contenus institutionnels ou scientifiques valids et ne concernent donc pas lensemble des documents constituant le Web 48. Si les mthodes dindexation professionnelles sont valables pour des contenus norms, elles savrent inoprantes dans le contexte qui nous intresse. En effet comment les appliquer des collections dimages formes partir de la mise en ligne de corpus photographiques dusagers non spcialistes, corpus eux-mmes htrognes issus dune culture non officielle pouvant motiver des classifications vernaculaires. De plus face au nombre massif et croissant de documents en gnral et de photographies en particulier circulant sur la toile, des mthodes dindexation sappuyant sur une saisie manuelle des descripteurs est inenvisageable. Une premire solution apparat par le biais de lusage des mtadonnes publiques. Il sagit alors de mettre les oprations dindexation entre les mains des utilisateurs des sites de partage de signets, dimages ; dusage simplifi ces modles de mtadonnes ne renvoient pas, linverse de celles du Dublin Core, un mode dorganisation bibliothconomique. Elles permettent ainsi chacun dinsrer dans le code HTML des documents publis un certain nombre dinformations annexes (titre, description, motscls). Comme lexplique toujours Olivier Ertzscheid et Gabriel Gallezot cette premire tentative se solda pourtant par un chec ils invoquent ainsi deux raisons principales, comme pour toute utilisation de champs de mtadonnes les pr-requis techniques taient bien trop lourds pour des utilisateurs nayant aucune connaissance du balisage HTML , de plus, des professionnels du rfrencement semparrent de ces balises et les utilisrent des fins stratgiques damlioration du positionnement de leur site au sein des moteurs de recherche. Ces techniques aboutirent pour certains lutilisation de faux mots-cls pour

Olivier Ertzscheid et Gabriel Gallezot, Etude exploratoire des pratiques dindexation sociale comme une rengociation des espaces documentaires. Vers un nouveau big bang documentaire ? , Document numrique et socit, ADBS ditions, 2006, en ligne : http://affordance.typepad.com/mon_Weblog/files/sdndocsoc.pdf.

48

42

indexer le site faussant du mme coup les techniques de classement statistiques des moteurs qui en contre partie ne prirent plus en compte ces mtadonnes ou de faon bien moindre.

B.

La folksonomie

Les problmes de ces systmes de classification et dindexation mtiers sont la complexit des oprations de traduction du document en entit indexe norme. Cette opration ne peut tre ralise que par des professionnels de la documentation, matrisant les langages documentaires et leur syntaxe. Si les sites de partage dimages ont une structure proche du modle de la collection de photographies en ligne, leurs systmes dindexation ne sauraient correspondre ceux envisags jusqu prsent. Celui-ci, selon des principes de simplicit, de non spcialisation dvelopp par le Web 2.0 et surtout defficacit grer dimportants corpus, doit pouvoir tre gr en partie du moins par les usagers, il doit sinscrire dans un horizon social ou en tout cas ne pas freiner circulation et changes. Lobjectif est de proposer un modle dindexation des informations non plus fond sur des langages documentaires au vocabulaire contrl et produits par des spcialistes, mais sur des modes de catgorisation pragmatiques fonds sur des mtadonnes indexes par les utilisateurs 49. Cest dans ce contexte que sont apparus les systmes de tagging collaboratifs ou folksonomies, proposs par les sites de partage dinformations sur le Web, ces outils daide la navigation apparaissent aujourdhui comme un mode de catgorisation de linformation typique des sites du Web 2.0. 1. LApparition de la folksonomie sur le Web

Les folksonomies, qui dsignent un processus de classification collaborative par des mots-cls librement choisis, ou le rsultat de cette classification 50, mergent dans un contexte o la structuration des donnes du Web et leur accessibilit la fois par un public et des moteurs de recherche reprsentent des enjeux centraux de son dveloppement. Cette mthode dindexation est caractristique du courant du Web 2.0 qui sefforce de placer lutilisateur au centre de la production des contenus (usergenerated- content) mais aussi de la production des mtadonnes relatives ces contenus. La structuration des donnes
49

Maxime Crepel, Les folksonomies comme support mergent de navigation sociale et de structuration de linformation sur le Web , Rseaux, n 152, juin 2008, p. 169-204, (en ligne : http://www.cairn.info/revuereseaux-2008-6-p-169.htm ). 50 Dfinition extraite du site Wikipedia ( http://www.wikipedia.org ).

43

partir des folksonomies sopre par une mise en partage des diffrentes classifications personnelles produites par les utilisateurs dans des logiques doptimisation de recherche et de partage dinformations. Cette approche est lie lmergence doutils techniques mis la disposition des utilisateurs sur les sites Web 2.0. Les folksonomies puisent leur origine dans llaboration de techniques efficientes sur Internet et concernant la fois des problmatiques de recherche et de partage de documents. Selon Olivier Ertzscheid et Gabriel Gallezot (2006, p.5) lmergence des folksonomies sur la scne des systmes dindexation est relier deux tendances de fond lorigine dune rengociation documentaire sans prcdent : la mise en ligne de documents appartenant jusque l la sphre personnelle et lexplosion documentaire qui en dcoule ncessairement. On assiste ainsi en premier lieu un processus de re-documentarisation luvre sur le Web avec la mise en ligne des donnes et systmes de classement personnels. Parce que lutilisation des outils informatiques se nomadise, le recours au rseau comme interface de centralisation et de partage des donnes devient indispensable, cest ainsi quy bascule une masse considrable dinformations. Selon les deux auteurs ce processus qui marque un changement dchelle documentaire engendre un changement de statut du document qui, en passant en ligne, sautonomise, il en va donc de mme pour les listes de signets cres par les internautes. Si ces dernires se caractrisent dabord par des fonctionnalits documentaires de nature technique , une fois sur le rseau, elles deviennent autant dunits documentaires stables
51

, cest dire pouvant tre

recherches et accdes sur les sites de partage ou directement par les moteurs de recherche. Cest en ce sens que la premire forme de taggage reprable dans lhistoire du net fut mise au point en 2003 sur le site Delicious52, une nouvelle plateforme dchange de signets (social bookmarking). Delicious offre lpoque un service novateur de partage de documents en ligne, lutilisateur ouvre un compte sur lequel lui est permis de stocker et classer des marques pages renvoyant autant darticles, de pages Web ou tout type de documents en ligne dont il dsire garder la trace. Dans lesprit du Web 2.0, le site noffre pas seulement des outils de classement personnel des donnes mais permet aux utilisateurs de partager le contenu de leur compte. Ainsi les informations sont classes et assorties de mots-cls librement choisis par le titulaire du compte, ce sont ces mmes mots cls qui

51 52

Olivier Ertzscheid et Gabriel Gallezot, op.cit., p.6. http://delicious.com/

44

permettront de rendre les donnes visibles et accessibles. Le principe du taggage merge dans un contexte de social bookmarking, o lacte de tagguer une ressource procde de la mme intention que de crer un marque page personnel. Selon ce schma les tags permettent lusager de lister et classer des documents mais aussi de les retrouver en utilisant les mots-cls ddis. Lautre tendance souligne par les auteurs est celle de la communautarisation des informations, de lexplosion documentaire qui marque chaque volution du Web et dont dcoulent le dveloppement et la diffusion du modle folksonomique. La popularit constante de ces outils dindexation sexplique alors par leur interaction avec des applications communautaires, par la liaison cre entre des activits de signalisation individuelle avec la trame dense des rseaux sociaux et du partage de ressources. Avec lmergence du Web 2.0 on assiste la cration des communauts dexpertise se constituant pour faciliter laccs des contenus documentaires bien cibls alors que sur le Web se multiplient des outils de recherche souvent experts, bien trop complexes pour la majorit des utilisateurs . Mais la rvolution se rvle surtout dans la formation de communauts dintrt dont lobjectif est la production et le partage de liens, communauts qui permettent leur tour la multiplication dunits documentaires en ligne . Flickr53 est ainsi un exemple de cette formation de communauts dinternautes se regroupant autour dintrts communs et mettant en uvre des systmes de classement spcifiques, des folksonomies adaptes aux usages. Les tags sont donc choisis, parce que permettant de catgoriser ses propres ressources sans ncessiter de savoir faire techniciste particulier. Comme le souligne les auteurs Au regard de la difficult de mise en uvre de normes idoines sur des contenus et des corpus documentaires pourtant dj homognes, au regard ensuite de lusage perverti des mtadonnes grand public, une analyse sommaire pourrait porter croire quun tel systme non contraint et appliqu des corpus documentaires totalement htrognes (dans leurs formats comme dans leurs finalits) savrerait rapidement tre un chec.
54

. Aujourdhui et contre toute attente les folksonomies

demeurent le systme dindexation le plus vident pour les sites de partage de documents vise sociale sur Internet.

53 54

http://www.flickr.com/ Olivier Ertzscheid et Gabriel Gallezot, loc.cit.

45

2.

Les principes de la folksonomie

Face la profusion des contenus multimdias sur le Web, les systmes classificatoires traditionnels bass sur des systmes hirarchiss dontologie et autres vocabulaires norms produits par des professionnels savrent inoprants, incapables de grer le flux constant de documents indexer sur Internet. Il est dsormais ncessaire denvisager lindexation des documents du Web sous langle dune pratique pouvant tre ouverte au non spcialiste. Cest ainsi que les principaux modles dindexation des informations sont fonds sur des modes de catgorisation pragmatiques bass sur des mtadonnes indexes par les utilisateurs eux-mmes, seule voie possible une indexation efficace des masses documentaires circulant sur la toile. Les folksonomies, au contraire des systmes classificatoires classiques, ne reposent sur aucun thsaurus, liste dautorit, sur aucun vocabulaire contrl mais est bas sur le langage naturel. Les folksonomies sont entirement centres et tributaires de lintervention de lusager et leur confre une totale libert pour produire leur propre classification des informations en y associant des mots-cls, appels tags qui vont permettre de dcrire et de catgoriser les documents. Le mot tag signifiant en anglais tiquette de balisage, tiquetage, flchage, marquage, voire traage, il est possible de rencontrer des traductions comme taggage collaboratif. Voici la dfinition quen donnent Guy Marieke et Emma Tonkin: Que sont vraiment les tags ? Une dfinition simple serait de dire que les tags sont des mots-cls, des catgories de noms, ou des mtadonnes. Essentiellement, un tag est simplement un jeu de mots-cls librement choisi. Cependant, du fait que les tags ne sont pas crs par des spcialistes de linformation, ils ne suivent aucune indication formelle. Cela signifie que ces items peuvent tre catgoriss avec nimporte quel mot dfinissant une relation entre la ressource en ligne et un concept issu de lesprit de lusager. Un nombre infini de mots peut tre choisi, dont quelques-uns sont issus de reprsentations videntes tandis que dautres ont peu de signification en dehors du contexte de lauteur du tag. 55 . Lusager utilise les tags dans un but personnel, afin dorganiser son propre systme dinformation et de produire des classifications personnalises de ses collections personnelles. Il sorganise en fonction de ses besoins propres dinformation et sans tre
55

Guy Marieke, Emma Tonkin , Folk-sonomies. Tidying up Tags? , Dlib Magazine , N 1, Volume 12, 2004, (en ligne : http://www.dlib.org/dlib/january06/guy/01guy.html ), traduit par nos soins.

46

aucun moment soumis une organisation restrictive tablie par des professionnels. Tout peut se trouver index par lusager, depuis ses favoris jusqu ses photos, en passant par ses messages sur son blog. Selon un esprit collaboratif qui dfinit les sites de partage de signets ou de documents visuels, les tags permettent galement dindexer les documents produits par les autres toujours selon ses besoins. partir de cette activit individuelle de tagging, les sites vont agrger lensemble de ces mtadonnes pour proposer tous les utilisateurs un systme de classification des ressources du site, ainsi lusager choisit dattribuer un ou plusieurs tags un document et en contre partie le site Web regroupe les mots-cls semblables en une liste ou nuage de tags duquel vont ressortir les thmes les plus populaires. Les tags offrent ainsi la possibilit de rendre explicite les univers smantiques relatifs linformation et renouvellent les formes daccs et de mise en valeur des ressources Web. Les folksonomies loin dtre des systmes fixes doivent tre considres comme des classifications dynamiques, parce que dune part elles voluent travers le temps et dautre part parce quelles sont le fruit dune agrgation des classifications personnelles dutilisateurs, dont les pratiques voluent sans cesse selon leurs intrts, leurs comptences et le dveloppement de leur rseau de connaissances. Les folksonomies sappuyant sur des rseaux sociaux ne font pas que classer de linformation et la partager, elles mettent en relation des usagers qui partagent les mmes centres dintrts, se nourrissant de la diversit des reprsentations du monde et des catgories auxquelles les objets renvoient ; elles permettent de relier entre eux des individus ou des groupes sociaux distincts. Les tags posts par les utilisateurs sont produits de faon individuelle mais renvoient systmatiquement des concepts utiliss par des collectifs (plus ou moins tendus) qui partagent des expriences, des valeurs, des centres dintrt communs et pour lesquels stablit un accord sur la manire de dsigner les choses. Sans ncessairement prendre conscience de la dimension collective de cette activit, certains utilisateurs produisent une classification des ressources qui leur est propre partir de catgories socialement marques qui font sens pour dautres. Ainsi en fonction de la diversit des groupes les sites vont offrir une diversit de tags pour dfinir un mme objet. Toutefois cette mme diversit, qui pourrait vite savrer crer un frein au partage en diffusant de trop nombreux items isols, va se trouver rgule par les pratiques des usagers eux-mmes. Cette activit de tagging, la diffrence dune activit de catgorisation ou dindexation dans un contexte documentaire professionnel, ne ncessite 47

quun trs faible cot cognitif, cest ainsi que Rashmi Sinha tend expliquer lengouement que suscite cette pratique : le marquage ("tagging") limine la phase de dcision (choisir la bonne catgorie) et dissipe la phase de paralysie d'analyse ("the analysis-paralysis stage") pour la plupart des gens. () Il offre un retour social et sur soi-mme immdiat. Chaque "tag" traduit un peu de vos centres d'intrts et les ancre dans un contexte social immdiat. () La beaut du taggage est qu'il est inscrit dans un processus cognitif dj existant sans lui ajouter de cot cognitif supplmentaire. 56 . 3. Une tude de cas : Flickr

Si Flickr constitue dsormais un exemple de site Web 2.0, il ne fut pas cr lorigine dans la perspective den faire un outil de publication de photographies. Lanc en 2004 par Stewart Butterfield et Caterina Fake57 le site tait initialement destin devenir un jeu en rseau, une plateforme o les joueurs schangeaient des objets matrialiss sous la forme de photographies. Ce sont finalement les tlchargements de photographies prives qui prirent le dessus et devinrent ainsi la fonction principale du site. Rachet par Yahoo en 2005, des comptes dutilisateurs sont alors crs permettant lutilisateur de grer et classer ses images, les photographies peuvent alors tre dotes de lgendes, titres et descriptions partir de linterface Organizr. Le site permet aux usagers de tlcharger leurs photos personnelles et de les hberger en ligne, mais la diffrence des autres sites de stockage dimages existant avant lui, les photos mises sur Flickr sont par dfaut publiques et visibles par les autres membres. Il existe plusieurs manires complmentaires de classer ses productions sur Flickr. Par dfaut, le site classe les photos de faon chronologique suivant leur date de publication sur le compte de lutilisateur. Lutilisateur peut galement choisir de les classer dans des albums thmatiques lintrieur desquels une photo peut tre indexe, relie diffrents albums simultanment. Flickr est aujourdhui lun des plus fameux sites de partage de photographies en ligne, dont les tags constituent les lments essentiels au systme dchange et de communautarisation des images. Sils reprsentent le troisime mode de classement des contenus, les tags permettent galement de rendre ses images visibles et accessibles aux autres usagers alors mme de filtrer les innombrables items du site en effectuant une requte par mots-cls ou par linterrogation du nuage de tags. Le succs de Flickr est en
56

Rashmi Sinha, cognitive analysis of tagging. , Rashmis blog, 27 Septembre 2005, (En ligne http://rashmisinha.com/2005/09/27/a-cognitive-analysis-of-tagging/ ), traduit par nos soins. 57 Cf un rsum de lhistoire de la cration de Flickr sur Wikipedia http://en.wikipedia.org/wiki/Flickr

48

partie d aux importantes interactions sociales quil permet, en plus de tlcharger des photographies les membres peuvent se crer des rseaux de contacts, rejoindre des groupes selon leurs centres dintrts, envoyer des messages, commenter, tagguer les images des autres, ou encore marquer leurs favorites. Cette abondance de moyens de communication place le site du ct des rseaux sociaux au sein duquel les tags jouent un rle dterminant.

Ill. 5 Capture dcran du nuage de tags de Flickr

Devant le flux massif dimages tlcharges chaque minute, le taggage des images apparat comme une solution efficace pour prvenir de leur disparition, de lincapacit dans laquelle nous serions de les retrouver au sein dune collection sans cesse croissante. Le site Flickr compte ainsi plus de quatre millions de tags diffrents posts par les utilisateurs et sil est possible dutiliser jusqu 75 tags pour marquer sa photographie, il apparat selon larticle de maxime Crepel que 60 % des photos postes sur le site possdent au moins un tag, pour une moyenne de 4 tags par photo. Sur lensemble des tags indexs par les utilisateurs 45 % des tags ne sont utiliss quune fois58. Le fait dattribuer plusieurs tags sa photographie permet non seulement de circonscrire au plus prs le sujet de limage mais aussi de relier son image autant de catgories et par consquent de groupes dutilisateurs utilisant ces mmes mots-cls. Sur la page ddie la recherche par tags, Flickr met systmatiquement en avant les tags les plus populaires ou ceux, parmi les plus rcents, qui enregistrent une forte activit, ce sont les
58

Maxime Crepel, op.cit., p.179.

49

hots tags , des termes alors favoris et qui vont permettre de faire ressortir des groupements thmatiques, des sujets communs ou dactualits partir de la masse dimages disponibles sur le site. Flickr offre galement la possibilit de sabonner au flux RSS dun tag particulier. Par les tags, les utilisateurs crent de la valeur pour les autres, et ce de faon le plus souvent inconsciente. Comme le dit Tim OReilly : Le tagging se prte des associations multiples et redondantes, plus semblables celles que notre cerveau ralise que des catgories rigides. Exemple typique : la photo dun chiot dans Flickr peut tre tague par les termes chiot et mignon - permettant donc de retrouver la photo suivant un cheminement naturel grce, une fois de plus, lactivit des utilisateurs. [] Lattention nest rciproque que de manire accidentelle59 . Toutefois comme le remarque Maxime Crepel toujours, le systme de tags relve le plus souvent des classifications personnelles qui mobilisent des catgories qui nont de sens que pour un utilisateur ou des collectifs trs restreints dutilisateurs qui partagent un ensemble de reprsentations et de catgories communes . Dans un contexte dutilisation individuelle des tags, ceux-ci peuvent galement jouer un rle au niveau de la popularit et de la visibilit des images. Les images apparaissant les premires sur la page de rsultat dune recherche sont souvent celles possdant le plus de tags, tags grce auxquels elles ont rcolt de nombreux commentaires et vues. Les utilisateurs les plus avancs rflchissent leurs tags et aux manires dont ils peuvent les aider sortir du lot ou se relier certaines communauts ; sils identifient un tag qui leur semble intressant, ils cherchent lemployer en prenant des photos qui pourraient entrer dans cette catgorie ou en associant ce mot-clef leurs anciennes photos. Les tags peuvent ainsi devenir le moyen de se dpartir de lanonymat, des outils pour une stratgie de promotion de son compte et de visibilit accrue de ses productions.

II. Vers les nouveaux usages de la folksonomie


La flexibilit de lusage des tags donne lieu de nombreuses et intressantes formes dinteraction, pouvant se rvler, ludiques, cratives ou plus simplement pragmatiques, o le taggage loin dtre une simple pratique individuelle de

59

Tim O Reilly, What is Web 2.0 ? , OReilly, 09 septembre http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-Web-20.html ).

2005,

(en

ligne

50

catgorisation, amne les utilisateurs entrer dans des formes multiples de coopration 60. Nous prenons ici Flickr comme site de rfrence nous permettant de mener une analyse quant aux diffrents usages qui peuvent tre faits de lindexation par tags en dehors de ces applications basiques que sont notamment le classement pour soi et une aide la valorisation de ses contenus.

A.

Les pratiques sociales et communautaires

Si certains usagers inscrivent leurs pratiques des tags dans des logiques individuelles de classement ou de valorisation des contenus, dautres obissent des usages plus sociaux, parfois conventionnels et pouvant prendre part une politique spcifique de certains collectifs que sont les groupes thmatiques de Flickr. Comme le prcise Maxime Crpel, Ces usages relvent des stratgies diffrentes dvaluation et de classement des contenus, mobilisant des catgories smantiques htrognes qui permettent par anticipation de produire des marqueurs de linformation pour soi ou pour les autres membres du site 61. 1. Des tags aux groupes

Nous lavons prcdemment signal, Flickr permet aux utilisateurs de se regrouper en communauts de toutes sortes, les fameux groupes Flickr, dont le but est de rassembler les utilisateurs selon des points communs partags. Le plus souvent se forment ainsi des communauts de got, ou dintrt qui peuvent aller des marques de lappareil photo utilis pour prendre ses images, des regroupements par sujet, par style ou esthtique. Ainsi existe-t-il des groupes centrs sur les photographies de coucher de soleil, sur le street art ou encore sur un lieu gographique dtermin. Les tags, sils peuvent dterminer le sujet dun groupe, permettent galement le rattachement de son image une communaut, les administrateurs de groupes faisant rgulirement des recherches par mots-cls pour trouver de nouvelles photos pouvant venir complter le pool de la communaut. Tagger ses images cest donc, par elles, avoir la possibilit dentrer en relation avec un groupe de membres partageant un intrt ou un regard semblable. Limportance de bien tagger ses images, quand on est dans une optique de rencontre et dchange social, est primordial, on ne rentre pas en contact avec les mmes communauts si lon marque ses images du tag B&W autour duquel se

60 61

Maxime Crepel, op.cit., p.171. Ibid., p.188.

51

concentre une communaut damateurs clairs de la pratique du noir et blanc et qui propose le plus souvent des images travailles et esthtiques, ou si lon utilise un terme plus gnrique, comme fleur ou coucher de soleil , ne se rfrant aucune communaut particulire sinon des dizaines.

Ill. 6 Capture dcran du Pool du groupe Flickr BlackandWhite

Un tag peut ainsi se rfrer une communaut et peu de tags en lien avec un sujet, un thme prcis nont pas de groupes attachs. Si les groupes peuvent constituer un espace supplmentaire de visibilit de ses images, il est aussi et essentiellement un espace de sociabilit o les membres se retrouvent, discutent et changent. Des pratiques collectives naissent ainsi sur ces groupes, pratiques que Caterina Fake, co-fondatrice de Flickr, dsigne sous le terme de culture de la gnrosit62 et dsignant les attentions et gards rciproques que les gens schangent via ces groupes. Il est aussi noter que si les changes communicationnels entre les membres dun groupe passent bien sr par des commentaires laisss sous la photographie, limage elle-mme peut devenir vectrice de communication. Ainsi une image poste sur la page du groupe rpondent dautres images, un discours implicite sous-tendant alors les publications de photos sur les murs des groupes et la base des changes discursifs de ces groupes passent par limage.

62

Cf lentretien avec Catherine Fake sur http://ouatedephoque.blogspirit.com/archive/2005/12/16/entrevueavec-caterina-fake.html

52

2.

Commenter par les tags

Ce caractre discursif de limage se retrouve largement sur les comptes personnels des utilisateurs et pages de prsentation des photos, o nombre dentres elles sont accompagnes de commentaires et ractions laisss par ses contacts voire par des inconnus. Certains mme nhsitant pas recourir aux annotations appliques directement limage, il sagit l dune application spcifique Flickr, permettant de former un encadr sur limage et dy adjoindre un mot ou une remarque en liaison avec llment point. Cette abondance de moyens de communication entourant limage et surtout le nombre croissant de personnes y ayant recours, tmoigne du nouvel engouement que suscite lexploration des collections des sites de photographies sur Internet. Les sites de partages dimages semblent avoir peu peu suscit lmergence dun nouvel intrt du public envers la photographie mme amateur, intrt transformant lpreuve du visionnage des images dautres usagers en activit sociale voire en vritable loisir. Regarder les photographies de famille, de vacances ou les uvres plus artistiques dun parfait tranger se conoit dsormais de faon ludique, pouvant aboutir des pratiques de lgendages et de commentaires voire de remix des images. Au sein de cette conception de lannotation des images comme pratique sociale, le tag est lui aussi amen jouer un rle et apparait alors comme un moyen dexpression et un support dinventivit. Selon la logique consistant commenter et communiquer autour dun contenu visuel et partir de la possibilit offerte aux usagers du site de marquer les photos dautrui de ses propres mots-cls, certains utilisateurs vont dtourner et se servir de la forme du tag pour laisser des commentaires aux images. Les contenus ne sont alors plus indexs par de simples mots-cls mais par des groupes nominaux voire de vritables phrases. La liste de tag dune image se retrouve ainsi affuble de phrases ayant permis aux auteurs, au-del dune fonction descriptive, dexprimer une motion, un avis ou une opinion en lien avec le contenu de la photo ou avec le moment, la date, le contexte de prise de vue.

53

Ill. 7 Capture dcran de la liste de tags de la photo Fofie aux fourneaux 63

Comme le remarque Maxime Crepel Une des spcificits du systme de tagging par rapport aux systmes de commentaires est quil ne permet pas didentifier les auteurs des tags ajouts sur une photo ( lexception de celui qui a post la photo et en a autoris le tagging). Cest donc un espace qui peut servir pour commenter une photo, le plus souvent dans le cadre de jeux amicaux entre contacts. 64. En effet sans mention de lorigine du tag, les moyens dentrer en relation avec lauteur sont limits, si cette pratique ne se pose pas en crateur de lien social elle illustre toutefois les formes inventives et ludiques que peuvent prendre les communications amicales sur Flickr. Sur une image soumise ce dtournement des outils de taggage, les premiers tags de la liste conservent un usage classique doutil dindexation, par la suite apparaissent des tags-phrases pouvant ne plus avoir aucun rapport thmatique avec limage mais formant entre eux une sorte de dialogue dont le sens nest alors souvent accessible quaux acteurs du jeu le plus souvent membres du rseau damis.

63 64

http://www.flickr.com/search/?q=fofie%20aux%20fourneaux&w=all Ibid, p.198.

54

3.

Tags et jugement de got utilisation comme

Un autre dtournement de lusage des tags se constate dans leur

indicateur de qualit. Cette pratique est souvent lapanage de groupes ayant centr leur activit sur llaboration dun mode dvaluation collectif des contenus partir du tag comme lment discriminant. Flickr recense diffrents groupes de ce genre, les plus clbres tant certainement la communaut anglo-saxonne de DeleteMe65 et son contraire SaveMe, groupes ayant entrain la formation de leur homologue franais Vire-moi ! Ces groupes fonctionnent gnralement selon un principe similaire, pour chaque publication dune image sur le pool du groupe les membres sont tenus de juger ou commenter une ou plusieurs photos du groupe, certains administrateurs de site nhsitant pas effacer les photos des usagers ne respectant pas les rgles. Les critiques et apprciations dune image se font par lutilisation de tags spcifiques venant marquer limage. Ainsi sur le groupe DeleteMe les membres sont invits tagguer les photographies avec soit deleteme ou saveme . Aprs dix tags deleteme ajouts une image celle-ci est supprime du groupe, inversement une photo recevant dix saveme est invite rejoindre le groupe Thesafe o elle retrouve les autres images slectionnes durant la semaine, images alors soumises une nouvelle preuve de jugement. On notera lexistence de groupes quivalents dans la sphre francophone avec la communaut Viremoi 66 notamment. Les tags employs par ces groupes ne fonctionnent pas selon les principes traditionnels dindexation, ils ne dcrivent pas plus quils ne caractrisent le sujet dune image, leur fonction nest pas de permettre celle-ci dtre classe ou plus aisment reprable mais de lui accoler la trace dun jugement oprant dans le temps du jeu, comme lexplique Maxime Crepel Il sagit donc de catgories grgaires nayant de pertinence que pour les membres qui participent ce type de groupe. La coopration entre les membres est plus formelle, car elle repose sur le dispositif de tagging qui sert de support lvaluation des contenus par le collectif partir dune convention bien tablie sur le type et le nombre de tags mobiliser pour effectuer le filtrage, ainsi que lapplication de rgles de tagging formellement explicites par les administrateurs qui en assurent galement le contrle. 67 .

65 66

http://www.flickr.com/groups/deleteme/ http://www.flickr.com/groups/viremoi/ 67 Maxime Crepel, loc.cit.

55

Ill. 8 Capture dcran dune photographie ayant ayant t taggue par le groupe Viremoi

Pour les membres de ces groupes le but est de permettre une slection qualitative des images base sur le vote des membres, ainsi est-il permis de lire sur la page daccueil du groupe Vire-moi ! : Donc le jeu, son essence, c'est quoi dj ? Et bien ne slectionner, ne garder, que les photos les plus blouissantes, inoues, fantastiques, celles qui tent les mots de la bouche et qui coupent les jambes. Vous n'avez juste qu' oser poster une photo dans le groupe, voir comment ragiront les autres membres, et quelle vitesse la photo se fera jeter du groupe . Le groupe se veut ainsi un espace de libre expression au sein duquel les tags virela ou gardela font office de sentences mais apparaissent aussi comme autant davis donns sur la valeur esthtique de limage. Devenir membre de ces groupes cest forcment en accepter les rgles et se placer aussi bien dans la position de juge que de jug, cest accepter voire rechercher un avis tranch sur ces images. Dans un article68 Dominique Cardon et son quipe de chercheurs remarquent au sujet de ces groupes dapprciation des images que leur fonctionnement redouble le fameux interestingness, application phare de Flickr. Cet algorithme est cens prendre en compte les diffrents critres de popularit dune image et permet ainsi dextraire et de mettre en avant les plus intressantes, originales, celles offrant des qualits esthtiques indniables. Pour les
Cf . Dominique Cardon et alt., The Stength of Weak cooperation: Case Study on Flickr, 2008, en ligne http://hal.archives-ouvertes.fr/docs/00/25/66/49/PDF/weak-coop-flickr-v1.1.pdf
68

56

auteurs cette redondance de fonction tmoigne du dsir de la part des usagers du site, ou de certains dentre eux du moins, de dfinir eux-mmes les critres dune photo russie, et de soumettre le jugement une assemble de personnes participant elles-mmes lenrichissement visuel du site.

B.

Les dtournements cratifs de lindexation

.Au-del dune simple tape de documentation de ses propres photos, de celles dautrui et dune mthode dannotation collaborative, les tags se trouvent au centre dusages dtourns, souvent ludiques et cratifs parmi lesquels ont surgi une srie de Mashups. Nous considrons lanalyse de certains dentre eux comme pouvant ouvrir sur des questionnements plus profonds en lien avec les principes fondamentaux du Web 2.0, comme lutilisation des tags et le fonctionnement de la folksonomie, ou encore sur le passage du caractre personnel des donnes celui de document rutilisable. 1. Dfinition dun mashup

Si nous nous rfrons la dfinition de Wikipedia, un mashup est une application composite qui combine du contenu provenant de plusieurs applications plus ou moins htrognes. On parle de mashup artistique ou de mashup technologiques (). On parle de mashup dans le cadre d'une superposition de deux images provenant de sources diffrentes, superposition de donnes visuelles et sonores diffrentes par exemple dans le but de crer une exprience nouvelle. 69. Au niveau du Web les mashups reposent sur des interfaces de programmation (API, Application Program Interface) ouvertes qui permettent de crer de nouveaux services composites en exploitant et en agenant de manire originale des programmes, des services et des contenus crs par dautres. Lune des plus clbres socits au sein de lunivers des Webs-mashups est sans conteste Flickr. Ce site de partage de photographies amateurs a ouvert son API au public presque depuis sa cration, permettant ainsi de dvelopper des applications bases la fois sur une recherche par tags, par nom dutilisateurs, par groupes ou mme par leur clbre systme de promotion des images les plus populaires interestingness . LAPI Flickr fut galement un centre dintrt pour de nombreux dveloppeurs Web layant peu peu rendue utilisable avec dautres programmes tels que Flash, PHP, Java, etc. ce qui contribue

69

http://fr.wikipedia.org/wiki/Application_composite

57

enrichir dautant plus les possibilits usuelles et esthtiques des mashups. Flickr en proposant une base de donne bien organise sur laquelle des millions dutilisateurs mettent chaque jour en ligne de nouvelles images, offre des possibilits infinies et toujours renouveles de mixage du contenu, apparaissant comme autant de propositions indites de navigation dans ce flux ininterrompu dimages. Un nombre toujours croissant de mashups sest ainsi dvelopp autour de Flickr, si beaucoup dentre eux sont des jeux ( limage de Flickr sudoku)70, bass sur une approche ludique du Web et de ses potentialits, certains offrent des propositions intressantes, originales permettant un rapprochement thorique avec des formes plus anciennes de jeu, montage, dtournement dimages. Toutes ces applications fonctionnent comme autant de services renvoyant au contenu et visant favoriser lchange et la dcouverte. Leur succs est moindre que celui du site lui-mme, mais ils contribuent la visibilit du service en multipliant les chemins daccs au catalogue. 2. Mashups et jeux de mots

Cr par Scott Michael Reynen, Web designer et programmateur de profession, Fastr71 est un mashup dont le principe consiste retrouver, partir dune image prise sur Flickr, lun des tags qui lui est associ. Plus prcisment, deux systmes sont disponibles, la recherche du mot-cl correspondant une seule image, le Mini Game , ou celui correspondant une srie de dix images pour la version chronomtre et dite officielle. Une pratique du site rvle rapidement la difficult de trouver le bon tag partir dune seule image. Lexercice se trouve en revanche simplifi par lapparition de plusieurs photographies ayant en commun le mot-cl ; la recherche seffectue alors par une analyse dductive du point commun liant les images entre elles. Il est tout fait hasardeux de russir du premier coup le jeu de la photo unique, celle-ci pouvant tre rattache de nombreux tags ayant un lien logique avec elle, soit au niveau des formes et objets reprsents, de la couleur, de latmosphre, etc. Ce jeu, aussi simple soit-il, met en lumire le fonctionnement mme du taggage dimages, de la folksonomie. Si cet outil offre lavantage de crer un systme dindexation communautaire, souple et infini cest aussi cette infinit qui en fait sa limite, tout terme

Cf. la slection effectue des dix meilleurs mashups http://www.Webmonkey.com/Webmonkey/06/08/index4a.html?tw=commentary 71 http://randomchaos.com/games/fastr/

70

de

Flickr

sur

58

pouvant tre employ la caractrisation dune image, retrouver selon le principe de Fastr un tag spcifique mais contingent est un exercice hasardeux.

Ill. 9 Capture dcran dune partie du Mini Game Fastr

Les mots cls utiliss et choisis par les internautes se veulent la plupart du temps transparents, cherchant une adquation parfaite entre le mot et limage et ressortent de catgories largement usites par les internautes. Mais comment rduire une image un mot ? Si lassociation tag/image se rvle efficace dans le cadre dune recherche au sein mme du site, le mashup Fastr rvle la complexit de cette pratique et surtout la quasi impossibilit dune correspondance objective et absolue entre une photo et un mot. Les tags relvent dun choix avant tout subjectif, dune interprtation, lecture personnelle de limage. Ce que je vois dans la photographie et qui me semble essentiel ne sera pas forcment partag par tous, do les listes de tags accompagnant bien souvent la mise en ligne dune image. la diffrence dune lgende qui offre une recontextualisation limage, le tag se base sur des critres descriptifs, sur un choix de lecture lui mme inhrent au caractre polysmique des images. Dans la srie des mashups ludiques il serait galement possible de citer lapplication Spell with Flickr72. Ce jeu permet de crer des phrases o chaque lettre est une photographie du

72

http://metaatem.net/words/

59

signe. Pour ce faire il utilise la collection du groupe One Letter73 prsent sur Flickr, groupe centr sur la photographie de lettre isole et taggue par cette mme lettre. Au fil du temps sest constitu un vritable alphabet polymorphe et photographique, sorte dencyclopdie visuelle des polices et lettrines existant dans lespace publique, sur les objets du quotidien. partir de luvre de cette communaut passionne par les lettres et leurs esthtiques varies, a t dvelopp un logiciel permettant dassocier chaque signe son quivalent photographi et ce grce lindexation des images dont se sert lalgorithme du site. Les mots, phrases entres dans le moteur de recherche du mashup, se transforment en assemblages de styles graphiques, partir de la base de donnes du groupe devenant police des polices.

Ill. 10 Capture dcran de la galerie du groupe One Letter

3.

Mashups artistiques

Le principe mme du mashup se trouve galement rinvesti dans les travaux de quelques artistes. On se rfre ici aux deux uvres du flasheur Mario Kligenmann, Flickeur74 et sa variante Island of consciousness75. Associant un logiciel flash et lAPI de Flickr, Flickeur extrait de faon alatoire des images du site de partage pour crer un film infini aux frontires de lesthtique documentaire, du clip vido, et de la vision surraliste. De la mme faon que la slection des images, tous les fondus, mouvements, rptitions, effets de zooms ou dacclrations visibles sur limage sont grs par un algorithme bas
73 74

http://www.flickr.com/groups/oneletter/ http://incubator.quasimondo.com/flash/flickeur.php 75 http://incubator.quasimondo.com/flash/islands_of_consciousness.php

60

sur le hasard. Dans

Island of consciousness une bande son de Oleg Marakov est

incorpore selon ces mmes principes, des boucles musicales sans structures tablies rpondent alors au flux des images. Si Flickeur fonctionne sur le principe de la boucle vido virtuelle, sans fin et en perptuel changement, Island of consciousness comporte pour sa part un algorithme modifi influant sur la slection des images qui napparaissent plus de faon totalement alatoire mais selon an associative stream-of-consciousness rule - each new image shares at least one tag with the previous one 76. Ce sont donc les tags des images de Flickr qui permettent lapplication de fonctionner, si Flickeur proposait un film comme une simple juxtaposition dimages, un enchevtrement de photographies sans trame narrative, Island of Consciousness par le recours aux catgories des tags introduit une forme de suivi thmatique dans le dfilement des images. Le rsultat apparat toujours comme un diaporama dynamique et anarchique mais la contigit smantique entre deux images qui se laisse parfois saisir nous entrane souvent reconstituer un sens, une narrativit ce flux ininterrompu dimages. Ces deux uvres offrent une approche indite des photographies de Flickr, une nouvelle voie dexploration de cette base de donnes aussi large et infinie que le film qui en est constitu. Nous assistons la reconversion en matriaux artistique dimages personnelles, le potentiel de publicisation de ces images induit par leur mise en ligne et leur propension au libre partage est ici pouss son paroxysme, ces images prennent part un projet conceptuel qui les dpasse, elles feront partie un moment donn, moment parfaitement imprvisible, peut-tre unique, peut-tre ritr, de cet espace cratif vou lexposition publique. Et les scnes photographies que nous voyons loin de demeurer des instants figs de la sphre prive, se transforment par cette entreprise artistique de dcontextualisation de limage en informations visuelles dcrypter. Les images amateurs deviennent moments de luvre, matire filmique, et Island of consciousness leur restitue une autonomie en les faisant circuler, en parallle de leur diffusion, dans un volet indpendant. En permettant de retrouver les sources originales de ces images sur Flickr, lartiste joue dautant plus sur lubiquit, la dualit de ces photographies la fois documents personnels et documents mis en ligne, offerts au regard de tous.

C.

Flickr Commons et les nouvelles pratique documentaires

Ainsi les photos amateurs deviennent par leur mise en ligne sur Flickr des documents visuels appartenant une base de donnes exhaustive, et non plus seulement
76

Citation extraite de la page daccueil de Island of consciousness

61

un photographe. Leur rattachement des catgories via les tags participe de cette ouverture de limage dans lespace public, dissocie de son origine, identifie seulement par des tags smantiques et place dans des groupes avec dautres images qui partagent alors des mtadonnes similaires, lapprhension dune image est dpendante de linterface qui en mdiate sa diffusion77 . Les images, par le site internet, se dfont de leur privaut pour soffrir comme document accessible tous. Selon un effet miroir, est apparue une logique de mise disposition des collections de photos dinstitutions publiques sur les plateformes ouvertes engendrant leur appropriation par les usagers du site au travers, notamment, des oprations dindexation et dannotation de ces images. Cest vritablement une opration de documentarisation des images en ligne laquelle Flickr se livre alors grce aux outils de taggage ordinaires et la force de la collaboration sociale. Selon Michel Salan, documentariser cest ni plus ni moins "traiter un document" comme le font, ou le faisaient, traditionnellement les professionnels de la documentation (bibliothcaires, archivistes, documentalistes) : le cataloguer, l'indexer, le rsumer, le dcouper, ventuellement le renforcer, etc. On prfre "documentariser" "documenter", qui renvoie plutt la cration d'un ou de plusieurs documents pour expliquer un objet ou une action, mais dans nombre de cas les deux activits se recoupent. L'objectif de la documentarisation est d'optimiser l'usage du document en permettant un meilleur accs son contenu et une meilleure mise en contexte. 78. Une pratique qui, aujourdhui, est rendue accessible aux usagers du net et qui dpasse la seule sphre de leurs documents privs pour stendre aux collections publiques, corpus que se rapproprient le public dans une logique daccroissement des bases de donnes et de rationalisation de laccs aux images. 1. The Commons sur Flickr

En Janvier 2008 The Library of Congress79 met en ligne sur Flickr une partie de ses collections de photographies, dans un premier temps et de faon tester cette opration ce sont deux corpus historiques qui sont accessibles via Flickr80, un ensemble de photos sur
Daniel Rubinstein et Katrina Sluis, life more photographic, Photographies, Vol n1, septembre 2008, traduit par nos soins. 78 Jean-Michel Salan, La redocumentarisation, un dfi pour les sciences de linformation tudes de Communication n 30, Entre information et communication, Les nouveaux espaces du document, Universit de Lille3, dcembre 2007. 79 http://www.loc.gov/index.html 80 http://www.flickr.com/photos/library_of_congress/
77

62

lactualit des annes 1910 d'une part, et des photos en couleur prises dans les annes 1930-1950 dautre part. Le but nest pas simplement doffrir une vitrine ces images mais bien de profiter des aspects sociaux du site et ainsi faire participer les usagers de Flickr lindexation et la documentarisation des fonds de linstitution : La librairie vous invite explorer lhistoire de faon visuelle en venant explorer les importantes photos de nos collections. Sentez-vous libre dajouter des tags et des commentaires galement ! Nous avons besoin de toujours plus de mots pour aider le plus grand nombre accder et user de ces images. 81 . la question : "pourquoi la Library of Congress met-elle ses photos sur Flickr ?", la rponse de la FAQ du projet est limpide : "Pour partager ces collections photographiques avec ceux qui ne visitent pas notre site" "Pour mieux comprendre en quoi l'indexation sociale peut nous apporter des ides d'amlioration de nos services et de nos fonds" "Pour accrotre notre exprience et notre implication dans des communauts Web partageant des centres d'intrts communs avec les collections de bibliothques.82" La Bibliothque conclu un partenariat avec Flickr appel The Commons, ce programme s'est fix deux objectifs principaux, augmenter l'accs aux classeurs tenus par un tablissement public et permettre au grand public d'apporter des informations et des connaissances. Le succs de cette initiative convainc la Library of Congress de rendre accessible de nouveaux corpus de ses collections, de nouvelles Institutions vont galement prendre part lexprience. On compte aujourdhui pas moins de vingt-trois organismes partenaires, rassemblant aussi bien des bibliothques que des muses, escomptant tous de cette collaboration avec Flickr quelle aboutisse une documentarisation des corpus en ligne, mais aussi la dcouverte par un public non habitu des fonds institutionnels de leurs collections. Selon Olivier Ertzscheid, Mettre disposition des fonds documentaires professionnellement construits et administrs, sur des services privs mais publiquement accessibles et massivement accds, autoriser les publics, TOUS les publics, indexer leur tour ces fonds documentaires quelle que soit leur nature, laisser les publics se les approprier (l'un des objectifs du projet est de permettre aux usagers d'indexer, de tagguer ces images), c'est probablement le meilleur moyen de recrer le dsir ... d'aller en

81 82

http://www.loc.gov/rr/print/flickr_pilot.html , traduit par nos soins. http://www.loc.gov/rr/print/flickr_pilot_faq.html

63

bibliothque. 83. Mme sans aboutir lmergence dun tel dsir, ce genre de projets engendre ncessairement pour ceux qui y participent une prise de connaissance des images disponibles et des institutions. Mais surtout, et cest l le premier constat effectu par la Library of Congress, cette collaboration est fructueuse en ce qui concerne les bnfices documentaires, puisque en octobre 2008 on pouvait compter 4929 photos mises en ligne, 7166 commentaires et plus de 70000 tags ont t dposs84.

Ill. 11 Capture dcran de la galerie de photographies de la Bibliothque du Congrs sur Flickr

Ces rsultats positifs sexpliquent, du ct des participants, par lintrt suscit de faire partie dune opration de grande envergure dindexation dune collection, cette pratique ressort de la mme logique que celle visant documenter de faon systmatique et srieuse ses propres images avec pour toile de fond lenvie de favoriser laccs des contenus au plus grand nombre. Comme le note Maxime Crepel, ces usages dindexation sont associs un discours altruiste, faisant rfrence au bien commun et la notion de partage et qui semble assez proche des motivations des membres actifs de Wikipedia qui justifient leur investissement au sein de lencyclopdie en ligne par une volont de participer un projet qui rend la connaissance accessible pour tous et endossent la responsabilit dassurer la

Olivier Ertzscheid, La bibliothque du congrs et FlickR : des accs desaxs , Affordance.info, janvier 2008, ( en ligne http://affordance.typepad.com/mon_Weblog/2008/01/la-bibliothque.html ). 84 Cf. le rsum du rapport, http://www.loc.gov/rr/print/flickr_report_final_summary.pdf

83

64

qualit et lintgrit des connaissances qui y sont disponibles. 85 . Toutefois, il convient galement de voir en ces pratiques documentaires une volont daffirmation de son identit et dintgration, de reconnaissance par la communaut des internautes. Une reconnaissance pouvant en loccurrence se baser sur lchange de savoirs sur lhistoire de la photographie ou de ses techniques, il sagit donc de mettre partie ses connaissances pour se retrouver entre amateurs, des communauts dexperts se tissent alors tous anims par un got commun de limage et de sa documentarisation.

Ill. 12 Capture dcran de la galerie dexemples de photographies fournies par les Institutions participant The Commons sur Flickr

En citant Manuel Zacklad, il serait ici plus juste de parler de re-documentarisation. Selon lauteur, redocumentariser, cest documentariser nouveau un document ou une collection en permettant un bnficiaire de rarticuler les contenus smiotiques selon son interprtation et ses usages la fois selon la dimension interne (extraction de morceaux musicaux pour les r-agencer avec dautres, ou annotations en marge dun livre suggrant des parcours de lecture diffrents) ; ou externe (organisation dune collection, dune

85

Maxime Crepel, Les folksonomies comme support mergent de navigation sociale et de structuration de linformation sur le Web , Rseaux, n 152, juin 2008, p. 169-204, (en ligne : http://www.cairn.info/revuereseaux-2008-6-p-169.htm ).

65

archive, dun catalogue priv croisant les ressources de diffrents diteurs selon une nouvelle logique dassociation) 86. 2. Flickr comme moteur de recherche

Une des consquences de lapparition des Commons sur Flickr, au-del des nouvelles collaborations sociales que le projet introduit et formations de nouvelles communauts expertes, sentend dans laugmentation considrable de la base de donnes du site. Si dj cette plateforme est connue pour diffuser un nombre formidable dimages, pour la qualit de nombres dentre elles, qualit nous lavons vu favorise par les changes entre membres, Flickr se dote dsormais de photographies historiques, pour certaines professionnelles, et toutes teneur patrimoniale. Des collections qui de plus bnficient des outils performants dindexation du site, leur offrant une visibilit en constante augmentation. ct de ces images anciennes connaissant une seconde vie sur le site et offrant par la mme un choix accru dimages aux internautes, la politique de libre partage et circulation des images trouve un cho au niveau amateur avec les licences Creative Commons qui peuvent tre appliques aux images de tout un chacun sur Flickr. Cres en 2002 par un collectif pour qui la proprit intellectuelle ne saurait se rsumer la proprit physique sans engendrer un frein dans la diffusion de la culture, ces autorisations non exclusives, et pouvant sappliquer sur tout type de contenu, permettent aux titulaires de droits d'autoriser le public effectuer certaines utilisations, tout en ayant la possibilit de rserver les exploitations commerciales, les uvres drives et de mentionner la paternit de luvre. Flickr a dpass le cap des 100 millions de photos sous licences Creative Commons quelque part pendant la journe du samedi 21 mars 2009. la date de lundi 23 mars 2009, 100 191 085 photos sous licence CC taient recenses. Lintgration des licences CC dans Flickr est la fois lune des premires existant cette chelle et lune des meilleures, non seulement elle permet aux utilisateurs dassocier chaque photo une licence diffrente, mais Flickr propose une page de dcouverte des images classes par type et association de licence CC. Il est par exemple possible de visualiser toutes les photos de New York sous licence CC Paternit, ou sans utilisation commerciale disponibles et tries par niveau dintrt.
86

Manuel Zacklad, Rseaux et communauts dimaginaire documdiatises , in Skare, R., Lund, W. L., Varheim, ., Document (Re)turn, Frankfurt, Peter Lang, 2007, 279-297, (en ligne http://hal.archivesouvertes.fr/docs/00/18/01/85/PDF/imaginaire_document_Skare_Lund_Varheim.pdf )

66

Ill. 13 Capture dcran de la page Creative Commons de Flickr

Ces photos ont t utilises dans des centaines de milliers darticles de Wikipdia, de messages posts sur des blogs, et mme dans des articles de presse traditionnelle ; autant dexemples de crations nouvelles qui nauraient autrement pas vu le jour sans ces licences publiques standardises. Cette possibilit non seulement dutiliser mais pour certaine de remixer les images, le choix de photographies disponibles sur le site font de Flickr une nouvelle base de donnes dimages dont les recherches documentaires peuvent savrer plus pertinente que GI. En effet en alliant ses collections basiques, celles plus spcifiques Creatives Commons et les ensembles the Commons avec les systmes dindexation du site les requtes et autres dsirs de documentation visuelle sont largement fournies et permettent des rsultats pertinents. Toutefois en ce qui concerne lutilisation, la copie ou le remix dimages des institutions publiques disponibles sur Flickr : les images mises en ligne au sein des Commons sont alors soumises un copyright spcifique et doivent comporter la mention Aucune restriction de copyright connue , les institutions culturelles stipulent ainsi qu'il n'existe pas de restriction de copyright pour une photo, celles-ci peuvent tre lgalement diffuses dans le cadre Flickr, mais cela ne garantit pas la possibilit pour linternaute de pouvoir utiliser cette image en dehors du site. Si linternaute peut avoir accs aux images pour participer lindexation collaborative, ou pour simplement prendre connaissance des collections dun muse ou bibliothque prsent 67

sur le site, toutes les images ne sont pas libres de droits et ne peuvent tre librement diffuses. Ce statut des Commons complique lutilisation des images puisquil sagit de se renseigner au cas par cas de ltat juridique dune image.

III.

Les limites de la folksonomie

La folksonomie est devenue un formidable outil dont les possibilits semblent, d'ailleurs, encore largement sous-exploites, toutefois elle connat depuis son apparition de nombreuses critiques, un nombre constant de voix slevant pour dnigrer ce systme dindexation collaboratif en comparaison avec les indexations professionnelles juges bien plus srieuses, ou pour pointer ses manques et limites.

A.
1.

Polysmie, synonymie et subjectivit


Problmes de lindexation smantique des images

Lindexation des images par des mots, bien qu'incontournable, reste une gageure tout dabord en raison de la multiplicit des entits prsentes l'image. Ds les premires tentatives de description dune photographie, nous nous trouvons confronts l'infinit des lments qui la composent. Il semble que la charge smantique d'un mot et la charge smantique dune photographie soient incomparables. Do la multiplication du nombre de tags ncessaire pour circonscrire au plus prs la signification, les rseaux de thmes dont une image est vectrice. Comme nous lavons vu avec le mashup Fastr, dfinir une image partir dun seul terme sapparente une vritable rduction de limage. Dautant plus que le terme qui fait sens pour moi, ne sera pas forcment celui partag par la majorit, une image est en effet le support dune multitude dinterprtation possible. Nous sommes tous ports faire des images diffrentes lectures travers nos propres schmas culturels, cognitifs, les motions qu'elle suscite ou non en nous. Cette polysmie de l'image est magistralement affirme par Rgis Debray : Une image est jamais et dfinitivement nigmatique, sans bonne leon possible. Elle a cinq milliards de versions potentielles (autant que d'tres humains), dont aucune ne peut faire autorit (pas plus celle de l'auteur qu'une autre). Polysmie inpuisable. On ne peut faire dire un texte

68

tout ce qu'on veut - une image, oui. () Non, il n'y a pas de perception sans interprtation. Pas de degr zro du regard87. Michel Foucault souligne galement l'irrductibilit des images et des mots, parlant de la peinture, lauteur remarque que : le rapport du langage la peinture est un rapport infini. Non pas que la parole soit imparfaite et en face du visible dans un dficit qu'elle s'efforcerait en vain de rattraper. Ils sont irrductibles l'un l'autre : on a beau dire ce qu'on voit, ce qu'on voit ne loge jamais dans ce qu'on dit, et on a beau faire voir, par des images, des mtaphores, des comparaisons, ce qu'on est en train de dire, le lieu o elles resplendissent n'est pas celui que dploient les yeux, mais celui que dfinissent les successions de la syntaxe88.. Barthes dj dans son article Rhtorique de limage observait () toute image est polysmique, elle implique, sous-jacente ses signifiants, une chane flottante de signifis, dont le lecteur peut choisir certains et ignorer dautres. 89 Et ce quelqu'un n'est pas qu'un sujet psychologique, il est aussi sujet biologique, historique et social, autant de contexte influant sur la perception et linterprtation qui est faite de limage. Ce sont ces dbordements mmes de signifis, ces rseaux de significations qui rendent impossible le fonctionnement monosmique de l'image. La polysmie , dit encore Barthes, produit une interrogation sur le sens ; or cette interrogation apparat toujours comme une dysfonction () Aussi, se dveloppent dans toutes les socits des techniques diverses destines fixer la chane flottante des signifis de faon combattre les signes incertains : le message linguistique est lune de ces techniques. . Cest ainsi la langue et au message linguistique de prciser le sens de limage, de le fixer, enfin darrter la drive smantique laquelle toute image convie. 2. Polysmies des tags

Si une description, une lgende peut permettre de circonscrire les rseaux de signification dune image, quen est-il pour les tags, simples mots-cls portant en eux-mmes une signification limite ? La polysmie savre en ce sens limite, dpendant entirement du jugement dun individu le tag n'est finalement qu'une chane de caractres dont le sens exact est connu de lui seul. Lindexation par mots-cls est infiniment subjective et ne peut surtout rsoudre les
87 88

Rgis Debray, Vie et mort de l'image, Gallimard, Paris, 1994. 526 p. Michel Foucault, Les mots et les choses. Gallimard, Paris, 1966. 405 p. 89 Roland Barthes, Rhtorique de limage, Communication, n4, 1964.

69

problmes de polysmie des images en particulier lorsquelle lui surajoute celle du mot isol. Car cest bien limpossibilit d'organiser les tags entre eux sous la forme d'une taxinomie ou d'un thsaurus laquelle nous sommes confronts dans une logique de folksonomie. L o les langages contrls grent les liens smantiques et syntaxiques du vocabulaire, les folksonomies dans leur organisation libre et non hirarchise ne le permettent pas. Deux tags diffrents peuvent tre synonymes voire identiques ou presque sans qu'on puisse les relier, ou encore deux utilisateurs peuvent partager un tag identique, mais en avoir une conception diffrente. Ds lors, cest bel et bien une forte nonorganisation, voire dsorganisation, qui prside lvolution du contenu tagu90 , les tags constituent dans leur globalit une simple liste de mots et dexpressions de mme niveau ne permettant pas rellement de grer la synonymie. Ainsi comment diffrencier les images tagguer avec avocat , quand certaines se rfrent au fruit et dautres la profession, de mme pour les noms de villes semblables mais de pays diffrents. Effectuer une recherche multi-tags apparat pour linstant comme lunique solution pour restreindre les champs de signification possible. Pour certain la solution consisterait rtablir un minimum de hirarchie au sein du systme, en affinant les catgories. Ainsi, Flickr a introduit ds 2006 la notion de groupes, sries (clusters) de tags, permettant de faon simple par le rapprochement de tags entre eux de prciser le sens du terme et de lier les images aux catgories ainsi soulignes. Par exemple, le mot avocat amne une page proposant plusieurs clusters, sries associant mots-cls lis et images thmatiques, dont lun regroupe des images du fruit, un autre des photographies de tribunal et de magistrats et un troisime, des photos de recettes ralises partir de laliment.

B.

Problme des multilinguismes et Restriction du champ

smantique
1. Rgulation par les foules

Lun des problmes de la folksonomie largement soulev par ses rfractaires est celui de la stabilit du systme dans laccs et la description des documents concerns. Si tout un chacun peut indexer par nimporte quel mot-cl considr comme adquat, quelle

90

Olivier le Deuff, Folksonomies : Les usagers indexent le web , BBF, 2006, n 4, p. 66-70 en ligne http://bbf.enssib.fr .

70

est linstance permettant une rgulation des entres smantiques, de leur globale pertinence ? Ltude de Scott Golder et Bernardo Huberman91 tente de rpondre cette question. Dans leurs travaux, ils analysent deux corpus de donnes issues du systme dindexation collaborative de Del.icio.us. Le premier analyse les tags correspondant un ensemble de 212 URL elles-mmes rparties dans 19422 signets. Le second ensemble comprend cette fois une liste alatoire de 68 668 signets. Selon les auteurs, les faiblesses documentaires des systmes de tags , comme labsence de prise en compte des relations smantiques, ou de hirarchie entre les termes, ne semblent pas discriminant. Les tags parviennent engendrer des modles rcurrents de catgorisation des donnes, et il ressort ainsi que des usagers indexent laide des mmes tags des sites donns. Les conclusions des deux auteurs attestent que des rgularits apparaissent indpendamment du type de tag employ. Si les usagers semblent chacun employer une grande varit de tags, lanalyse de la rpartition de ceux-ci dans le temps montre quil existe des phnomnes de saturation qui semblent indiquer lmergence de consensus autour de la dfinition des ressources auxquelles ils sont indexs. La suggestion de tags dj indexs entranerait une paralysie qui amnerait les utilisateurs adopter des tags similaires pour catgoriser un mme contenu. Cest, semble-t-il, la mise en partage, la circulation des tags qui fait fonction de rgulation (feedback). Le collectif permet dattnuer les subjectivits, il est alors possible dassister llaboration de descriptions homognes, de catgories reconnues de tous. Une indexation reprsentative des objets se met en place selon un principe dauto-rgulation de nos perceptions documentaires. Dans une interview Adam Bosworth, Vice-Prsident en charge de lingnierie de la firme Google confirme cette capacit de la folksonomie engendrer des systmes dindexation stables : La sagesse des foules fonctionne

tonnamment bien. Les systmes qui marchent sur le Web fonctionnent du bas vers le haut ('bottom-up'). (...) Par exemple Flickr ne dit pas ses utilisateurs quel tag utiliser pour leurs photos. Loin de l. N'importe qui peut dposer n'importe quel tag sur n'importe quelle photo. Mais - et c'est la cl - Flickr offre un retour sur les tags les plus utiliss et les plus populaires, et les gens souhaitant attirer l'attention sur leurs photos (...) apprennent rapidement utiliser ce lexique si celui-ci fait sens. Cela rend le systme tonnamment stable. Del.icio.us fait la mme chose. Le succs de Google pour rendre les recherches plus
91

Golder Scott . & Huberman Bernardo ., The Structure of Collaborative Tagging Systems , Information Dynamics Lab, HP Labs , 2005. (En ligne : http://www.hpl.hp.com/research/idl/papers/tags/tags.pdf )

71

pertinentes reposait sur la puissance de cette sagesse populaire (PageRank)... 92. Il ressort de ces propos que si le principe de communautarisation de lindexation peut-tre garant de son homognit et donc de son efficacit, les systmes de gestion des tags mis en avant par les sites de partage eux-mmes jouent galement un rle de modrateur dans lutilisation de tel ou tel terme, dans sa mise en avant au sein du nuage et de son adoption par les usagers. 2. Un vocabulaire limit, Folksonomie et multilinguisme

Toutefois si les modes de gestion des tags adopts par les sites comme Flickr savrent efficaces pour la rgulation de lindexation, ne peuvent-ils pas galement engendrer une uniformisation restrictive des termes utiliss pour caractriser une image ? Sous prtexte dune visibilit accrue les internautes se tourneraient vers lemploi rcurrent dun terme banalis, unanimement adopt. Mais quelle pertinence est envisage quand il sagit de relier une image une catgorie renfermant des milliers ditems, de mme, est-ce rellement efficient demployer un tag pour sa popularit plutt que pour son adquation relative limage. Cette pratique semble, pour reprendre lexpression dric Sutter, tre source dinfo-pollution93, vidant de leur sens de nombreux mots-cls, devenant indexeur vide parce que trop employ et selon des orientations pas assez circonscrites. Comme lexplique Olivier Le Deuff : Les photos recevant les mots-cls de vacances sont tellement innombrables, que cela na plus grand intrt si ce nest pour celui qui les a indexes ainsi94 , les singularits lexicales, lunicit des termes, semblent seffacer au profit de la rcurrence et dune uniformisation de la dnomination, de mme quon assiste des rptitions iconiques, que se multiplient les images dun mme contenu visuel. Comme le prcise Daniel Rubinstein et Katrina Sluis, Au travers des mcanismes smantiques du tagging et des mtadonnes ajoutes, cest toute la spcificit de chaque photographie en ligne qui semble efface et ce par la facult dun simple mot-cl capable de regrouper des milliers dimages disparates sous un hyperlien. Mais 4,150,058 photographies tagues avec party peuvent-elles tre incorrectes ? 95

Traduit par mes soins, http://acmqueue.com/modules.php?name=Content&pa=showpage&pid=337 Eric Sutter, Pour une cologie de linformation , Documentaliste - Sciences de linformation, no 2, vol. 35, 1998, p. 83-86 94 Olivier Le Deuff, Folksonomies : Les usagers indexent le Web , BBF, 2006, n 4, p. 66-70 (en ligne http://bbf.enssib.fr ) 95 Daniel Rubinstein et Katrina Sluis, life more photographic, Photographies, Vol n1, septembre 2008, traduit par nos soins.
93

92

72

Le systme en visant la stabilit aboutit ainsi une limitation smantique. Si ce principe est central dans les systmes dindexation mtiers, attach la multitude dimages prsentes sur ces sites de partage il tend confiner une masse de donnes sous un mme terme indexeur. La recherche dune image devient inoprante puisque renvoyant une galerie de rsultats pouvant se compter en milliers. Une autre critique adresse lindexation par tags est celle de la pauvret des termes utiliss, la majorit de ceux employs sont bien souvent gnriques, ils napportent alors que peu dlments smantiques, aucune catgorisation du contenu et participe de cette globalisation neutralisante de la catgorie. Il convient galement de traiter ici du problme du non multilinguisme de la folksonomie, il n'existe pas encore de moyens pour relier un mme tag selon quil soit exprim en anglais, en franais ou en tout autre langue. Le site Technorati96 propose sur sa page de tags, de visionner tous les mots-cls enregistrs quelle que soit leur langue, le nuage de tags se transforme alors en une liste sur laquelle des caractres asiatiques ou arabes ctoient une multitude de termes anglais. Ce systme est loin doffrir une lisibilit lensemble, de plus de nouveaux soucis smantiques apparaissent inhrent lutilisation non spcifie de divers langages, ainsi le mot-cl pain fait-il rfrence laliment en franais, ou plutt au terme anglais se rfrant la douleur ? Il convient toutefois de noter la prdominance des termes anglais dans les index, assurant lusager employant cet idiome en lange de requte dobtenir des rsultats pertinents. Bien sr et selon un principe circulaire ce quasi monopole de la langue anglaise, du moins en terme defficacit des requtes, ne peut que saccrotre, les usagers trangers pour assurer une bonne indexation et circulation de leurs images ayant alors recours des tags anglais, augmentant ainsi leur nombre dans la base. Selon de nombreux spcialistes de la documentation, lindexation par les usagers peut sembler moins coteuse en temps dindexation, mais cest le temps pass retrouver linformation qui saccrot. On se place ainsi dans le schma exactement inverse des systmes dinformations hirarchises, o cest le cot dindexation par les professionnels qui est plus lev, mais la recherche dinformations facilite pour lusager.

96

http://technorati.com/tag/?showall=1

73

Chapitre 3

Le gotagging comme nouveau systme dindexation

74

Sommaire du chapitre

I. Les prsupposs dune indexation par coordonnes gographiques ........ 76


. Lindexation par les mtadonnes EXIF .................................................................. 76 1. 2. 3. La remise en question de la photographie comme index ...................................... 76 La structure informationnelle des images ............................................................. 78 Les mtadonnes comme outil de classement ...................................................... 79

B. La golocalisation .................................................................................................... 81 1. 2. Les principes ......................................................................................................... 81 Les photographies golocalises ........................................................................... 82

II. Les mises en application sur le Web ......................................................... 84


. La golocalisation dans les sites de partage ............................................................. 84 1. 2. 3. Flickr ..................................................................................................................... 84 Zooomr.................................................................................................................. 86 Picasa .................................................................................................................... 87

B. Des exemples de sites ddis .................................................................................... 88 1. 2. 3. Panoramio ............................................................................................................. 88 Locr ....................................................................................................................... 90 Loc.alize.us ........................................................................................................... 91

III. Vers un dplacement de la sphre documentaire ...................................... 92


. Vers une recherche documentaire incarne .............................................................. 92 1. 2. 3. Les groupes Flickr ................................................................................................ 93 Panoramio ou le nouvel ordre documentaire ........................................................ 96 Echanger son exprience en plus de ses images ................................................... 98

B. Vers de nouveaux modes de recherche dimages ................................................... 100 1. 2. Les applications composites : golocalisation et locative media ........................ 100 Limage comme interface de navigation............................................................. 103 75

I. Les prsupposs dune indexation par coordonnes gographiques


Depuis le dbut des annes 2000 de plus en plus de travaux de recherche visent mettre au point des systmes automatiques de classement des images bass sur la gestion de leur localisation gographiques. Nous concevons le gotagging comme une mthode dindexation nouvelle et originale proposant une alternative lindexation purement textuelle des images. Divers sites disposent aujourdhui de cet outil et proposent par ce biais une forme originale de navigation au sein des bases de donnes o lapproche visuelle prime.

A.

Lindexation par les mtadonnes EXIF

Nous lavons vu prcdemment les mtadonnes peuvent renouveler les possibilits dindexation, engendrer une nouvelle forme de base de donnes de notices et faire correspondre les informations documentaires directement limage, de faon interne. Si les champs de mtadonnes descriptives et textuelles servent aujourdhui les professionnels de la documentation, dautres types de mtadonnes ont t mises au point et permettent une indexation jusquici indite des images et ouverte tous. 1. La remise en question de la photographie comme index Lindexation textuelle est largement majoritaire au sein du traitement et de la gestion des bases de donnes dimages. Le recours la smantique, puis la folksonomie est apparu comme une cl dorganisation des collections en ligne, par lintermdiaire des mots et du langage naturel, les mots-cls d'indexation permettant alors de reprsenter le contenu des documents : thmes, sujets, aspects, etc. Une transparence semble ainsi se former entre le mot et limage, le terme choisit pour la reprsenter paraphrasant le contenu de limage, limage se rduisant au mot. La photographie en effet, parce qu'elle ressemble ce qu'elle reprsente et qu'elle est donc proche de notre exprience perceptive, est rpute comprhensible immdiatement par tout un chacun. Limage donnerait lire sa signification sans la mdiation de conventions, par pure transparence : son sens lui serait donc immanent, aisment traduisible par linterface langagire, limage reprsentant son rfrent il suffirait de nommer celui-ci pour aboutir la rduction verbale de limage, la cl de son indexation. 76

Comme le souligne Patrick Peccatte : La prgnance de cette formulation indicielle dans les tudes visuelles, dont on peut s'tonner qu'elles ne semblent pas avoir propos d'autres concepts majeurs depuis plus de vingt ans, montre qu'il reste difficile de s'affranchir de la forme ontologique du lien qu'entretiendraient un objet (photographi) avec un sujet (photographiant) produisant un autre objet (photographique). Et cela, mme sans thorisation particulire. 97. Selon l'approche documentaire et textuelle, l'indexation est une reprsentation extrieure, surajoute forcment rductrice du contenu. Le dveloppement de la photographie numrique a engendr une remise en cause de la notion tablie dindex comme caractrisant le rapport de la photographie au photographi. Cette soudaine mfiance passe dans un premier temps par la prise en compte de la dmatrialisation de limage. Labsence de processus et de traces chimiques sur une surface sensible semble interfrer avec la notion indicielle de la photographie, lui tre antinomique et provoque le dclassement de limage numrique comme objet photographique. Comme lexplique Tom Gunning : Lindicialit de la photographie dpend dune relation physique entre lobjet photographi et limage ainsi cre. Limage se forme sur le ngatif grce la transformation de lmulsion photosensible sous laction de la lumire rflchie par lobjet photographi et passant travers les objectifs et le diaphragme. Dans une image numrique, en revanche, au lieu dune mulsion photosensible affecte par lobjet lumineux, la formation de limage rpond au codage de donnes sur la lumire en une matrice de chiffres. 98. Dans cette perspective beaucoup considrent que la relation de contigit entre lobjet et limage se trouve rompue avec le numrique. Depuis les interprtations ont rtabli la photographie numrique dans sa potentialit dempreinte, offrant donc au numrique une nature photographique possible. posteriori donc la polmique a permis de revenir sur le monopole thorique de lindicialit forg par Krauss, et de faire merger de nouvelles considrations quant au statut pistmologique de la photographie. Ainsi apparaissent des thories selon lesquelles : L'assimilation de l'objet photographique un simple fichier informatique n'est en soi qu'une approximation sans grand intrt mais permet de comprendre trs

Patrick Peccatte, Notes sur la structure informationnelle de la photographie , Du bruit au signal (et inversement), 5 aout 2008, en ligne http://blog.tuquoque.com/post/2008/08/05/Notes-sur-la-structureinformationnelle-de-la-photographie 98 Tom Gunning, "La retouche numrique l'index. Pour une phnomnologie de la photographie" (traduit de l'amricain par Marc Phline), tudes photographiques, n 19, dcembre 2006, p. 96-119.

97

77

facilement en quoi il est ncessaire et naturel de convoquer d'autres cadres conceptuels que la smiotique pour progresser 99 , et de la smantique pour indexer. Si le numrique offre bien une rvolution elle survient non au niveau ontologique de la photographie mais celui de son indexation, une indexation qui lui est consubstantielle. Ainsi n'importe quelle partie du support d'enregistrement d'un document lectronique se trouve d'une part susceptible d'tre accde comme contenu documentaire, d'autre part de servir d'index pour ce contenu. On peut ainsi affirmer que tout systme numrique est un systme documentaire et mobilise une indexation. En fait, un systme numrique est un systme documentaire ds qu'il en existe une indexation. 2. La structure informationnelle des images Nous proposons donc de considrer la photographie comme une structure non plus strictement indicielle, mais informationnelle selon lexpression de Patrick Peccatte. Si pour Barthes la sphre iconographique tait bien dfinie par une structure informationnelle cette acception devait tre comprise dans son sens smiotique (informatif ou documentaire), limage ntant rien sans les mots, lunivers du texte. Nous envisageons la photographie non seulement pour ce quelle reprsente, mais pour les informations quelle contient dont limage proprement parler nest quune strate, visuelle en loccurrence, parmi dautres. Il en ressort une tentative doffrir la photographie une nouvelle dfinition, affranchie de sa dpendance la notion dindice et prenant en compte les paramtres plus larges de ses composants, on suit Patrick Peccatte quand il propose de voir la photographie numrique comme une structure d'informations type dont une des composantes

(l'image) peut tre restitue visuellement l'aide d'un dispositif banalis. L'image et une partie des autres composantes de la structure enregistrent directement et automatiquement certains paramtres caractristiques d'un vnement tandis que les autres composantes gnres indirectement dcrivent l'vnement ou l'image elle-mme. 100. Une

photographie quelle soit numrique ou non ne doit plus, dans cette optique, tre considre uniquement pour ce quelle reprsente, ce changement de regard port sur lobjet entrane un changement au niveau du principe de lindexation des images fixes. Ces nouvelles donnes intrinsques aux images rappellent que la photographie est avant toute image rvle un processus technique sexprimant par des choix de prise de vue, ces donnes permettent ainsi de spcifier une caractristique fondamentale de la
99

100

Patrick Peccatte, loc.cit. Ibid., p.3.

78

photographie: le cadrage, la dcoupe de la ralit enregistre comme une image. Comme le dmontre Andr Gunthert, il convient den finir avec le ftichisme de la continuit de matire entre les choses et les images sur quoi reposerait la photographie argentique. Mme dans le cas d'un signal analogique, pas plus le dispositif optique que le support d'enregistrement ne constituent des intermdiaires neutres d'un flux manant de l'objet. Au contraire, les photographes savent bien qu'en changeant d'objectif ou de film, ils disposent au moment de la prise de vue d'une marge de manuvre importante, qui leur permet de modifier l'aspect, la gomtrie ou les couleurs d'une scne. On ne saurait dcrire un appareil photographique comme un mdiateur transparent du rel: il doit plutt tre compris comme une machine slectionner des interprtations, selon un ensemble de paramtres aux interactions complexes, qui requirent des choix prcis. Un aiguillage plutt qu'un miroir. 101 . Avoir accs ces informations lve le voile jet par la suffisance artificielle de limage conue comme double iconique du rel. Contre la transparence qui se veut en ralit opacit sur les conditions de production dune image, il ressort que si une photographie est une image, limage nest pas toute la photographie. Lindexation des images peut alors tre puise dans les donnes intrinsques aux images et les dfinissants. 3. Les mtadonnes comme outil de classement Le numrique facilite une approche renouvele de lindexation puisquil a permis de considrer en quoi une photographie nest plus proprement parler uniquement lobjet iconique mais se compose de donnes essentielles dans lapproche contextuelle ou technique de limage. Si la photographie numrique est un fichier, elle contient comme nous lavons vu dans la partie prcdente, une srie de mtadonnes pouvant offrir des informations et tre utilises comme voie possible dindexation. Ces donnes qui entourent limage sont consultables au niveau du fichier EXIF de la photographie. EXIF est une abrviation de EXchangeable Image File. Ce format dfinit les informations d'ordre technique contenues dans les fichiers image. Comme les champs IPTC, ce sont donc des mtadonnes de type interne. Ces informations renseignent le plus souvent sur les paramtres de prise de vue, distance focale et ouverture, mais les champs date et heure peuvent galement tre mentionns, si le matriel le permet, le lieu ou plus prcisment les coordonnes gographiques sont visibles. Lensemble de ces lments inscrivent ainsi limage dans un contexte spatio-temporel.
Andr Gunthert, L'empreinte digitale. Thorie et pratique de la photographie l're numrique , ARHV, 3 octobre 2007, en ligne http://www.arhv.lhivic.org/index.php/2007/10/03/506-l-empreinte-digitale .
101

79

Ces paramtres peuvent servir de nouveaux moyens dindexation des images, en offrant par exemple une organisation temporelle des collections. Ce cas savre surtout pertinent dans un contexte priv de classement personnel de ses images, dans un cadre dchange, de mise en ligne, les dates spcifiques, moins quelles ne soient relies un vnement mmorable collectivement noffre pas une bonne entre dindexation. Certains sites de partage offrent des modes de classement et de recherche par moment, Zooomr102 propose une entre dans ses collections partir dun choix temporel entre les tlchargements du dernier mois, semaine ou encore jour, ces types de segmentations temporelles tant les seules universellement valables et, faisant sens au plus grand nombre. Les mtadonnes de lieu peuvent au contraire aboutir une pertinence tant au niveau de lindexation que de la recherche de documents. Se rfrant aux tudes de Nancy Van House103 la localisation gographique apparat, dans un contexte domestique et de pratique prive de la photographie, comme une information naturellement voue au classement des photos. Il ressort des enqutes de la chercheuse une certaine aisance de la part des particuliers avec ce mode dindexation des images. Si lon considre les sites de partage des collections et de recherche dimages lindexation par lieu de prise de vue offre une belle ergonomie, notamment grce lintroduction dune carte qui se fait index amenant la recherche sur les voies de la navigation. Certes il ne sagit pas l dun procd rvolutionnaire mais dun moyen de classement des images, existant dj lpoque de la photographie analogique et connaissant aujourdhui dans son application au numrique et au Web de nettes volutions. La premire tant la possibilit dun placement automatique des images sur la carte alors quun tel classement faisait autrefois forcment appel la mmoire des sujets pour tre valide, les donnes contenues dans limage remplace la recherche dinformations, ou de remmoration. La photographie argentique classe par nom lieu est le plus souvent rattache une date particulire ou sinscrit dans la dure, un vnement familial, etc. Il est rare de classer par le lieu pour le lieu dans le cas des collections argentiques personnelles, le gotagging au contraire agit par extraction de lieu indpendamment de toute date, ou vnement. Les images sont donc spatialises parfois automatiquement mais le lien temporel ne suit pas. Enfin on note une nouvelle diffrence au niveau du sujet, du point gographique index, le lieu pris en compte dans le cas des mtadonnes gographiques est
http://www.zooomr.com/ Cf Nancy Van House et alt, From 'What?' to 'Why?': The Social Uses of Personal Photos, School of Information Management and Systems, University of California, Berkeley, 2004, (en ligne http://people.ischool.berkeley.edu/~vanhouse/van%20house_et_al_2004a.pdf )
103 102

80

celui de la prise de vue, au contraire le sujet indexant manuellement ses images et les classant par re gographique le fera en privilgiant le nom du paysage, du site visible.

B.

La golocalisation
1. Les principes

Le terme de Golocalisation est rcent et correspond lensemble des mesures techniques et des coordonnes gographiques qui composent une information, un document numrique localis. Il tait auparavant question de Gomatique pour dfinir lensemble des procdures de traitement des donnes gographiques par ordinateur. Golocaliser cest adjoindre des mtadonnes gographiques aux ressources numriques (sites Web, photographies, vidos, etc.), si cela consiste initialement prciser les coordonnes de type longitude et latitude, il est galement possible de prciser laltitude ou les noms de lieux on parle dans ce dernier cas plus spcifiquement de Gotagging (il est noter que cette opration accompagne presque toujours celle de golocalisation). Cette pratique sest largement popularise par le dveloppement et la diffusion grand public des technologies GPS et par les avances de la cartographie satellitaire sur le Web. Aujourdhui la golocalisation englobe de larges usages permettant la fois de situer (reprer, cartographier), daccder (donner, tracer des itinraires) et de sinformer sur ce qui est proximit. La golocalisation devient effective par son couplage une opration de cartographie, avec les nouvelles technologies GPS et dInternet toutes sortes de cartes sont cres et intgrent des contenus golocaliss. Concernant les images fixes, les informations ncessaires leur golocalisation se trouvent dans les mtadonnes EXIF (Exchangeable Image File Format) de la photographie. Le dveloppement des appareils intgrant un systme GPS facilite lindexation automatique des images en fonction du lieu de prise de vue. Nanmoins les tlphones portables savrent en avance sur les appareils photos pour ce qui est de la golocalisation. l'heure o les compacts numriques avec GPS intgr commencent voir le jour, les tlphones portables de ce type sont pour leur part bien plus nombreux et aguerris l'exercice consistant inscrire en direct des informations GPS dans les Exif d'une image. dfaut de pouvoir disposer d'un appareil photo numrique avec GPS intgr, il reste possible de se tourner vers un rcepteur GPS externe. Cet appareil agit comme un vritable journal de bord de tous les dplacements, enregistrant les coordonnes GPS selon 81

un intervalle de temps souhait, reste ensuite synchroniser ces informations enregistres avec les informations Exif (date et heure) contenues dans les images. C'est la confrontation de ces deux sources qui permet de rcrer l'itinraire sur une carte et d'y associer automatiquement des photos. Si aucun rcepteur GPS nest utilis ds la prise de vue, les donnes de type latitude et longitude ne seront pas renseignes dans les mtadonnes des images. Le Gopositionnement demeure nanmoins possible mais seffectue manuellement,

directement sur les sites de partage dimages ou sur les applications ddies comme nous le verrons plus loin. 2. Les photographies golocalises Ds le dbut des annes 2000, plusieurs laboratoires de recherche pour la plupart amricains, ont pour but dlaborer des plateformes de partages dimages o le lieu gographique serait la fois un critre de classement des collections et une voie daccs aux photographies. En 2003, le projet World Wide Media eXchange (WWMX) men par Kentaro Toyama104 pour Microsoft, est lun des premiers proposer une organisation des collections photographiques selon leurs coordonnes spatiales et les placer sur une interface cartographique. Pointant du doigt les lacunes de la recherche dimages par motscls, les concepteurs arguent de la simplicit et des possibilits dindexation automatique permises par le traitement des informations gographiques. Le navigateur du WWMX propose ainsi au public de naviguer parmi des collections dimages la fois selon le lieu mais aussi le temps grce une interface cartographique et chronologique, il est ainsi prvu de permettre lutilisateur de retrouver des images dun lieu prcis mais diffrents moments de la journe voire saisons. PhotoCompas105, une interface labore par Mor Naaman, reprend ces mmes caractristiques et ajoute la possibilit de dcouvrir des images gographiquement proche grce des outils de slection de la direction cardinale, en cliquant sur les icones de Nord, Sud, Sud-Est, etc., lusager a donc la possibilit de naviguer parmi les images environnant celle slectionne de prime abord. Nous pourrions galement citer des projets plus rcents comme Photo Tourism (sur lequel nous reviendrons dans le dernier point du chapitre) ou encore The Big Picture, de Carlo Torniai, dont le but, sil semble proche de WWMX, prtend galement employer un nouveau genre

104

Cf. Kentaro Toyama et alt., Geographic Location Tags on Digital Images, in Proc. ACM Conference on Multimedia, October, 2003. 105 Cf. http://infolab.stanford.edu/~mor/worklinks.html

82

de mtadonnes standardis et spcifique au gotagging, permettant de conserver des informations gographiques plus prcises que les seules coordonnes EXIF, le tout dans la perspective dune application sur le Web. Tous ces diffrents travaux ont pour objectif de permettre aux images dune base de donnes dentrer en rsonnance les unes avec les autres grce leurs coordonnes gographiques, et ainsi crer une exprience enrichit de la recherche dimages et de leur visionnage. Applique la sphre du Web, la golocalisation est devenue une mthode dindexation originale et une pratique rpandue dans le cadre toutefois prcis des sites de partage dimages. Outre un moyen sr de se rappeler o une image fut prise le gopositionnement des images offre un systme de classement, dans le meilleur des cas automatique, et une facilit de la recherche grce aux sites ayant dvelopp des interfaces cartographiques associes un moteur de recherche. Depuis le dbut des annes 2000 le nombre de personnes utilisant la golocalisation comme systme dindexation, de classement et de marquage des images sest considrablement accru. Comme le mentionne Carlo Torniai: le rsultat dune recherche dimages ayant pour tag geo:lat sur Flickr retourne 16048 rsultats entre octobre 2003 et octobre 2004, 89514 pour lanne suivante et 171574 pour la priode allant de Octobre 2005 Octobre 2006 106 . Nombreux sont aujourdhui les sites offrant aux internautes la possibilit dajouter des mtadonnes gographiques leurs images utilises pour le classement, qui est plus un positionnement, et la recherche qui devient alors navigation sur une interface cartographique. Les sites classiques de mise en ligne et en commun des collections dimages personnelles, par lintroduction dun module cartographique de type Google le plus souvent deviennent ainsi des exemples courants de Mashups oprants. Toutefois reprsenter des photographies sur une interface cartographique ne va pas sans poser quelques problmes dergonomie, en particulier dans le cas dune base de donnes amplement fournie. En effet comment faire figurer sur une carte mme numrique, des centaines voire milliers dimages dun seul et mme lieu ? Cette question fut tudie trs tt dans lhistoire du gotagging, au dbut des annes 2000 des chercheurs de luniversit de Berkeley en Californie rflchissent la cration dun site o les images seraient indexes, classes et prsentes par leur lieu de prise de vue. Dans ltude de Kentaro Toyama107 apparat la problmatique de la reprsentation visuelle des images sur

106

Carlo Torniai et alt., Sharing, Discovering and Browsing Geotagged Pictures on the Web, 11 mars 2009, (en ligne : http://www.hpl.hp.com/personal/Steve_Cayzer/downloads/papers/geospatial_final.pdf ). 107 Kentaro Toyama, op.cit.

83

une mme page cartographique garantissant celle-ci une lisibilit optimale. Plusieurs solutions sont envisages, de la miniature photographique au symbole de localisation comme le spot jusqu la grille de spots dont la taille reflte le nombre dimages localises cet emplacement. Aujourdhui et comme nous allons le montrer dans la partie suivante, les divers sites ddis au gotagging ont tous mis au point leur propre ergonomie et gestion de la densit des images en un point spcifique, allant de la slection de certaines images leur reprsentation par des symboles chiffrs en rfrence leur nombre par localisation. Le problme de lisibilit tant la plupart du temps rsolu avec un niveau de zoom lev permettant datteindre un degr de dtail ncessaire une visualisation de la localisation exacte des images.

II. Les mises en application sur le Web


A. La golocalisation dans les sites de partage

De nombreux sites de partage de photographies proposent aujourdhui loption de gotagging la fois comme moyen de classement personnel des images et comme voie daccs aux contenus du site. 1. Flickr Tmoin de lengouement soudain suscit par le Gotagging, Flickr108 lance sa propre interface cartographique associe un outil de golocalisation durant lt 2006. Le site comporte bien des portes d'accs vers ce contenu localis, qu'il s'agisse de la carte du monde, de la page d'accueil du projet Lieux dfini comme un livre ouvert sur tous les lieux du monde ou encore les diffrents champs assortis de la mention O avez-vous pris cette photo ? qui invitent le visiteur s'intresser ce principe et renseigner ses images. Ce service qui vient complter la palette dj large de moyens mis en uvre par le site pour explorer sa base dimages, permet aux utilisateurs de slectionner sur une carte la rgion, le lieu o la photographie a t prise et dy placer limage, les donnes correspondant la latitude et longitude de la position sont alors ajoutes aux informations conserves sur le site. Le gopositionnement de ses images intervient la fin de la procdure classique dupload, une indexation-positionnement automatique des images en fonction de leur localisation seffectue en cochant l'option Importation automatique des
108

http://www.flickr.com/

84

informations GPS en tant que donnes gographiques . Il est galement possible dattribuer manuellement des coordonnes gographiques des images partir de son gestionnaire personnel Organizr, par un simple gliss-dpos de la photographie au bon emplacement sur la carte. La consultation des photographies stockes et gographiquement indexes sur Flickr se fait partir de la page Map. Cette interface cartographique permet une requte par nom de lieu, mais aussi par simple navigation et zoom sur la carte, une barre dimages miniatures en lien avec la zone slectionne apparat alors, ces images sont repres sur la carte laide de points de couleur. Il est alors possible de cliquer sur un point de la carte pour mettre en vidence limage lie, ou au contraire de slectionner une image dans la barre de navigation pour lagrandir et mettre en vidence sa localisation laide dun symbole toil venant entour le point.

Ill. 14 Capture dcran de linterface cartographique de Flickr

Pour toute image slectionne il est possible daller consulter le compte du photographe, ou de continuer la navigation en circulant dimages en images voisines. Les photographies gopositionnes sont regroupes en deux catgories, la fameuse slection Interestingness de Flickr, regroupant les images les plus populaires du site, un onglet recent fait quant lui apparatre les dernires images tlcharges en lien avec le lieu. Toutefois gopositionner manuellement ses images sur Flickr est un exercice assez fastidieux, il en est de mme de la navigation sur la carte Explore qui manque dintuitivit. Lapparition des miniatures ntant pas synchronise avec le dplacement ou le niveau de zoom appliqu sur la carte mais ncessitant une ractualisation de la requte aprs tout 85

changement inhrent la navigation cartographique. De plus le service utilise Yahoo Maps dont la prcision et le degr de zoom est loin dtre suffisant pour positionner avec justesse limage sur le lieu exact de la prise de vue. Il convient enfin de prciser que loutil najoute pas les informations, coordonnes gographiques de latitude et longitude aux donnes EXIF de limage, mais les intgre seulement aux informations externalises sur le site. Les images comportant dj les mtadonnes Exif, de type geo:long et geo:lat sont, quant elles, automatiquement rfrences sur la carte. 2. Zooomr Zooomr109 a t lanc en 2005 par Kristopher Tate. Le 19 juin 2006, Thomas Hawk, photographe et bloggeur connu a t embauch par Zooomr en tant que "Chef vangliste". En 2006 Zooomr sort "Zooomr: Mark II" introduisant les "SmartSets", l'amlioration du Geo-tagging et des amliorations dans la vitesse de chargement des pages. Si une image avec des mtadonnes gographiques au format EXIF est tlcharge elle sera automatiquement place sur la carte. Le procd manuel est similaire celui de Flickr la seule diffrence quune carte Google est ici utilise, permettant un degr de prcision bien suprieur et de minimiser les erreurs ou approximations lors dun positionnement manuel des images. Les recherches dimages seffectuent soit par requte smantique soit par navigation sur une carte, le systme permet aussi la slection dune image et laffichage des photographies prises aux alentours. Lapplication de recherche par navigation sur la carte est accessible via longlet Discover, Zooomr noffre pas de barre ou de mosaque dimages en parallle de la carte mais a mis en place un autre systme de prsentation des images : celles-ci apparaissent sous la seule forme de vignettes sur le fond de carte. Pour pallier le risque dillisibilit quentrainerait la juxtaposition des miniatures, chaque vignette comporte un chiffre mentionnant le nombre dimages localises au mme point. Un simple clic de souris sur la vignette entrane louverture dune fentre dans laquelle il est possible de faire circuler les photographies en lien avec le lieu prcis. Si le principe offre une lisibilit la carte cest au dtriment de celle des images qui ne sont regardables que par leur vignette de petite dimension, de plus une seule image est place en illustration de la srie rendant les autres invisibles lutilisateur.

109

http://www.zooomr.com/

86

Ill. 15 Capture dcran de la carte de Zooomr lchelle de Paris

3. Picasa Picasa nest pas proprement parler un site de partage dimages mais un logiciel proposant des applications de gestion, de retouche et de mise en ligne des photographies. Rachet en 2004 par Google, la socit lance en 2006 Picasa Web Album, une nouvelle version de Picasa qui permet de publier trs facilement sur le Web les photos des utilisateurs. La fonction de golocalisation sur Picasa110 se fait plus discrte que sur Flickr. Dans la barre dicnes se trouvant sous chaque photo se trouve un symbole Gomarquer , celui-ci commande l'ouverture d'une fentre GoogleEarth. Pour localiser les photos il convient alors soit de passer par le champ de recherche textuel, peut-tre plus rapide mais moins intuitif que le glisser-dposer auquel Flickr fait appel, ou de dplacer manuellement le marqueur sur la carte de faon bnficier d'une plus grande prcision. Une fois la localisation termine, un marqueur en forme de cible se trouve associ l'image pour signaler que l'opration est effective. Le mme procd peut tre accompli l'chelle d'un album, directement au moment de sa cration, en renseignant le champ lieu de prise de vue. La fonction "Gomarquer avec Google Earth" permet d'enregistrer le lieu des prises de vue dans le dossier "Mes lieux prfrs" de Google Earth. Il est alors possible
110

http://picasa.google.fr/

87

daccder aux lieux des prises de vue dans Google Earth, directement partir de Picasa.

Ill. 16 Capture dcran de loutil de gotagging de Picasa sur linterface Google Earth

Quand la photo est positionne, les coordonnes GPS sont stockes dans les donnes EXIF de limage, directement dans le fichier de la photo avec pour avantage de conserver ces informations lors par exemple de lenvoie de limage un tiers qui aura lui aussi accs au gopositionnement de limage sur Google Earth. Cette option est propose dans le seul but que les utilisateurs profitent de leurs images dans un cadre diffrent, les photographies ne sont pas par la suite accessible sur GE par tout internaute.

B.

Des exemples de sites ddis

En parallle des sites communautaires ou dhbergement des images, des sites sont apparus ayant comme principale fonction doffrir un systme de golocalisation efficace aux internautes. Si une dimension sociale cohabite le plus souvent avec la pratique du gotagging elle lui est le plus souvent totalement consacre. 1. Panoramio Cr en 2005 par deux informaticiens espagnols, se site fut le premier tre entirement ddi la golocalisation des images. Ds le dpart le positionnement de photographies sur une carte Google est le principal moyen de classer, organiser et chercher 88

ses images. Google, intress par les services proposs par le site, le rachte en 2007 et dcide de faire de Panoramio111 l'outil par dfaut permettant d'interfacer les photos des internautes avec les cartes de Google Earth dans un premier temps puis de Google Maps. Le site se place ds sa cration parmi les premiers en termes de photos golocalises avec 500000 en octobre 2006, mais laccord fait bondir le nombre d'utilisateurs et de clichs mis en ligne puisquon passe un million dimages en mars 2007 pour atteindre les deux millions en juin de la mme anne. Ce service permet d'hberger jusqu' 2 Go d'images, de crer une carte du monde personnelle et d'afficher dessus des photos. L'interface est pure et le procd de golocalisation dune grande simplicit. Le site reconnat les mtadonnes gographiques de type EXIF et les situe automatiquement sur la carte, la localisation manuelle des images est galement possible par le lien Placer cette photo . Panoramio permet alors de positionner ses photographies sur la carte au moyen d'une recherche sur un champ texte Lieu ou par le biais d'un glisser dposer sur la carte aprs slection de la zone gographique. Il suffit de Cliquer ensuite sur la miniature de l'image pour vrification : elle s'affiche son juste emplacement dans une fentre d'aperu Google Maps. Comme pour Zooomr linterface cartographique du site est fournie par Google.

Ill. 17 capture dcran de la carte de Panoramio

111

http://www.panoramio.com/

89

La recherche seffectue soit par mots-cls de lieux soit en naviguant directement sur la carte par lutilisation du zoom. La page est scinde en deux parties avec dun ct la carte elle-mme et de lautre une mosaque dimages en miniatures, la diffrence de Flickr tout changement de direction ou de niveau de prcision appliqu sur lespace cartographique induit une actualisation des images proposes. La slection dimages peut donc seffectuer aussi bien au niveau de la mosaque que de la carte, lusager parvient alors la page dhbergement de la photographie en question. Limportance de la golocalisation se rvle alors tout fait par la prsence sur la droite de limage dun nouvel encart cartographique situant doublement la photographie la fois dans une fentre de localisation trs dtaille et plus gnralement lchelle du globe. Des images prises proximit mais ne provenant pas forcment du mme photographe sont galement visibles et visualisables. Reprenant les proprits plus classiques des sites communautaires les commentaires laisss par les autres utilisateurs apparaissent sous limage. Laccent est bien mis ici sur le contexte et la proximit gographique des images, le nom du photographe apparait en dessous de limage et amne sa page personnelle. L encore une option de golocalisation est propose, voir toutes les images du photographe en question sur la carte du site o aller consulter directement celles retenues sur Google Earth. 2. Locr Cr en 2006 par six informaticiens allemands, Locr112 est un autre service d'hbergement et de partage de photos en ligne. Il se distingue notamment de Flickr par l'importance accorde la localisation des clichs prsents et par l'intgration de contenus Wikipedia en lien avec la position gographique de limage regarde. Comme tous les sites les donnes de position gographique peuvent tre entres manuellement ou automatiquement laide dun GPS. Locr fournit cet effet un logiciel sous Windows qui permet dautomatiser ce processus, mais la diffrence de la plupart le site permet galement de gotagger des photos prises par un Smartphone directement depuis ce dernier. Il nest donc pas ncessaire de tlcharger ces images sur son ordinateur mais le site est entirement utilisable partir de son tlphone portable. Cette option fait lobjet dune importante promotion par les crateurs du site prnant quavec Locr les mobiles se font interactifs et deviennent de vritables tour oprateurs portatifs, Our daily lifes go mobile est le slogan de cette fonctionnalit.
112

http://www.locr.com/

90

Ill. 18 Capture dcran du site Locr, recherche de photographies en lien avec la ville de Japur

Les collections de photographies sont consultables selon plusieurs modes, il est ainsi possible daccder aux groupes, albums personnels des utilisateurs, dernires images tlcharges mais loption essentielle reste la carte. Linterface est trs proche de celle de Panoramio carte et mosaque de mme lorsquune image est slectionne lusager est conduit sur la page de stockage de limage. La photographie est l aussi reprsente ct dun encart cartographique sous lequel sont disposes les images du site prises proximit, si cette fonction est l aussi similaire celle de Panoramio il est noter la prcision des informations donnes puisque les images ont chacune mentionn la distance et lorientation les sparant de la photographie cible. Si les commentaires pour chaque image ne sont visibles que pour les membres du site, les informations contextuelles de Wikipedia sont par contre accessibles par tous offrant un contre point informationnel non ngligeable et spcifique Locr. 3. Loc.alize.us Loc.alize.us113 est un mashup utilisant la fois lAPI de Flickr et Google Maps et fut cr en 2006 par Martin Kleppe, jeune Web designer de lagence Sumaato. Le site propose un bookmarklet, outil permettant le gotagging de ses images partir de la lecture des fichiers EXIF. Il est galement possible de tlcharger directement ses photographies depuis le site Flickr et de les positionner sur linterface cartographique de Google. Ce

113

http://loc.alize.us/#/geo:0.000000,0.000000,2,k/

91

mashup peut mettre en lien des photos et des tags de Flickr ainsi que les utilisateurs partir de lieu gotagu. Linterface se prsente sous les mmes traits que celles utilisant les cartes Google, avec une slection dune cinquantaine de photographies apparaissant mesure que lon zoom et se dplace sur la carte. Le positionnement sur la carte dune image de la mosaque est soulign par le passage de la souris, la photo slectionne apparait dans une fentre de visionnage accompagne de son titre, sil en est, il est alors possible dtre diriger vers la page Flickr de la photo correspondante. Loc.alize.us se distingue aussi par son service de gocodage des images, permettant dassocier une image avec une adresse prcise, la fonction de recherche dadresses tant fournit par Google et GeoNames.org. Ce site relativement indpendant doit donc surtout tre considr comme une mthode efficace de visionner ses images Flickr sur une Google Maps, secondant loption geotagging de Flickr loc.alize.us est une application plus ergonomique et efficace que le site rfrent.

Ill. 19 Capture dcran du site de Loc.Alize.Us

III.
A.

Vers un dplacement de la sphre documentaire


Vers une recherche documentaire incarne

Au del dun moyen dindexation dune nouvelle forme, impliquant un nouveau rapport aux images parce que considre dans leur contexte spatial, la pratique du gotagging implique galement une approche renouvele de la pratique mme de partage dimages sur le Web en y insufflant une dimension documentaire, recherche et partage 92

sagrmente dun versant informationnel, un change dexprience, o limportance du vcu rempli une fonction jusque l indite. 1. Les groupes Flickr

Conformment la dmarche qui caractrise Flickr en termes de possibilit daccs aux collections, le gotagging en plus de la carte Explore aboutit une autre application : les pages Places114. Cet outil, par rapport la carte, se concentre sur un lieu, une ville le plus souvent, et dtaille sur une mme page les diffrents lments et contenus en lien et visibles sur Flickr. Linterface, dveloppe grce au succs du gotagging sur le site, permet dagrger des donnes multiples sur le mme lieu, de runir sur une mme page les photographies dun lieu. Une page Places contient un encart cartographique reprsentant la ville, une slection dimages en lien juges remarquables, des classeurs dutilisateurs ddis au lieu mais aussi depuis 2008 des vidos et enfin les groupes dont le thme est centr sur le lieu. La dmarche ici par rapport Explore est plus documentaire et propose la dcouverte visuelle dun lieu partir des photographies gotaggues du site. Les contenus visuels saccompagnent souvent dinformations annexes telles que lheure locale ou la mto.

Ill. 20 Capture dcran de la page Flickr Places ddie Paris

114

http://www.flickr.com/places/

93

Site communautaire par excellence la pratique du gotagging sur Flickr se place, en plus de loption Lieux, dans un horizon social. Si lon effectue une recherche avec

Geotagged comme intitul au sein des Groupes Flickr, plus de 20000 rsultats sont renvoys nous prsentant soit des groupes ayant directement le terme ou une acception proche pour intitul (geotag, geotagging,etc.), soit comportant le mot dans leur texte de prsentation, ou dexplication des rgles. Plusieurs types de groupes sur le gotagging existent parmi lesquels les spcialistes ou frus de la technique rassembls dans GeoTagging Flickr115. Les 4335116 membres recenss ont tous en commun la passion de ce systme de classement et de localisation des images ; formant une communaut ils schangent les diverses techniques et noms de logiciel ou dernires trouvailles permettant un gotagging efficace et simplifi. Plus nombreux sont les groupes ddis au geotagging de photographies lies une ville ou rgion spcifique comme Geotagged Italy, Geotagged London. Dans un esprit thmatique seules les images prises dans laire gographique en question sont acceptes, limportance tant dans le rassemblement dimages dun mme environnement et dans la possibilit de situer avec prcision o la photo a t prise et donc o se situe tel monument ou paysage. Un esprit de photoclub dun nouveau genre se retrouve dans les productions de ces collectifs, esprit qui se manifeste dans limportance attribue au territoire comme thme et sa monstration, dans la volont de donner une identit visuelle une ville, rgion ou un pays travers la pratique photographique. Communaut de lieux, rassemblant les habitants aussi bien que les voyageurs. Il conviendrait certainement de sintresser au cas des groupes ddis aux arrondissements de Paris, chacun comportant sa propre page et son rseau de membres particulier. Si la pratique du gotagging nest pas ici centrale on retrouve limportance du lieu et laspect communautaire forg partir de la notion de territoire. Ces groupes, qui associent tous une carte leur pool, offrent pour la plupart une image renouvele de la capitale, et permettent de mettre en avant une nouvelle vision des lieux. Ainsi le groupe du XIXe arrondissement, propose une collection htroclite dimages rassembles par des photographes habitant les environs ou par des touristes de passage ayant trouv dans ce groupe une vitrine pour leur travaux, un lieu dexpression de leur vision du quartier. Ces photographies semblent pour la plupart accompagnes une exprience de marche dans la ville et dessinent en creux le portrait dun photographe flneur. cette dimension de reprise en main du territoire sajoute pour certains groupes,
115 116

http://www.flickr.com/groups/geotagging/ Chiffre relev le 23/03/09 ;

94

dont celui du XIXe arrondissement fait partie, une dimension communautaire locale qui apparat au travers du forum du groupe par la prsence dinformations concernant la vie sociale et les diverses manifestations culturelles se droulant dans le quartier.

Ill. 21 Capture dcran de la galerie du groupe Paris 19e arrondissement sur flickr

Les groupes ddis au gotagging de villes, rgions ou pays sont nombreux mais de petite taille, en moyenne une centaine de membres y sont inscrits pouvant nanmoins poster plusieurs milliers dimages sur le pool. Toutefois faire partie dun groupe enclin au gotagging ne signifie pas forcment gotagguer soi-mme ses images. Si dans certains groupes en faveur du gotaggage des images de nombreuses photographies se retrouvent sur la carte du groupe, elles ne le sont jamais toutes, certains utilisateurs sarrtant lajout des tags des noms gographiques. Le gotaggage vritable des images dans les groupes ddis Flickr ne fait donc pas office de rgle et son absence ne semble pas discriminante au niveau communautaire. Si lintrt du gotagging se situe principalement dans la localisation de photos de lieux, de paysages et monuments, on constate que de nombreuses photographies sur Flickr sont gotaggues sans entretenir de charge iconique, de lien visuel direct avec la localisation rfrente, mais possdant une relation moins vidente et plus distendue au lieu. Ces pratiques se constatent par exemple dans le gotaggage de photos de nourriture, de repas. 95

Elles sont aussi typiques des communauts de got qui abondent sur le site et usent du gotagging comme dun outil de localisation et de regroupement idal pour leur objet. Ainsi le groupe Geotagged Street Art117, qui rassemblent les amoureux des graffitis et autres uvres graphiques urbaines demandent ses membres de gotagguer leurs images. Cest lmergence dune nouvelle forme de carte que lon assiste alors, o les objets situs se substituent peu peu la reprsentation gographique mme pour devenir lments dune carte relationnelle et communautaire. De nombreuses pages sont ainsi ddies cette thmatique et pour certains administrateurs de groupes le gotagging offre un nouveau moyen de connaissance des objets, une cl de lecture des images en confrant naturellement une localisation et donc un contexte spatial aux photos. 2. Panoramio ou le nouvel ordre documentaire Panoramio est, comparativement Flickr, moins ax sur le versant social de limage, sil est possible de commenter les photographies dautrui, de se crer des contacts, aucune application nexiste pour rassembler les usagers autour de thmatique commune, pour crer des groupes. Le site sest dvelopp comme une interface de partage spcifique, capable doffrir une nouvelle approche du Monde, permettant de lexplorer de faon visuelle. Le gotagging est central dans lutilisation de Panoramio, opration directement lie au tlchargement des images elle permet une dclinaison de services aussi bien pour le photographe possdant un compte, avec notamment la cration de cartes personnelles avec itinraire trac, que pour linternaute y naviguant. Le partage dimages se fait principalement, et de part lergonomie mme du site et les applications proposes, autour de la notion de territoire, du contexte de prise de vue. Les diverses discussions dveloppes sur le forum franais du site, labondance de post diffusant conseils et rclamations quant au refus de certaines images sur Google Earth, commentant lacceptation de certaines images tmoignent bien de lengouement des usagers pour la liaison Panoramio-Google Earth. Sorte de coulisses, de backoffice de Google Earth, Panoramio engendre ds lors des pratiques non plus seulement sociale quant au partage dimages mais vritablement de documentation visuelle. Pour de nombreux utilisateurs du site poster ses images sur Panoramio consiste faire uvre documentaire. Comme lexplique un internaute sur le forum franais du site : Ma passion de l'architecture m'a amen proposer de nombreuses photos d'intrieur d'glises que j'ai

117

http://www.flickr.com/groups/geotagged-streetart/

96

toujours choisies autant pour leur intrt documentaire qu'esthtique 118, et le site dapparaitre comme un atlas photographique en devenir, aiguisant le dsir de partager ses images non plus dans lespace restreint dun site mais lchelle de cette application grand public et ouverte tous. Si toutes les images de Panoramio sont potentiellement susceptibles de figurer sur GE, de nombreuses sont refuses, dcisions souvent difficile comprendre pour les internautes dont le but tait de faire figurer leurs images sur le site. Un exemple de ces dceptions courantes, Bon ben dcidment c'est trs space la politique d'acceptation...J'ai fait mon deuil et accept la triste vrit : seuls les plans larges de l'intrieur des glises sont accepts... Sauf qu'un vitrail (d'une srie de 3) vient d'tre accept et qu' ct de a les plans larges de la mme cathdrale ont t refuss, de mme qu'une photo en extrieur ...Je veux bien qu'on chafaude des thories mais j'ai tout de mme l'impression que c'est du grand n'importe quoi. 119

Ill. 22 Capture dcran dune photographie de Panoramio sur Google Earth

Loin de ne constituer quun dsir vain de visibilit cette volont de figurer sur la carte mondiale de Google est souvent charge dun fort sentiment de lgitimit, une considration positive de ses images comme parfaitement reprsentative des lieux. Lon constate la lecture des diverses discussions que le projet mme de GE est pris trs au srieux par les usagers de Panoramio, beaucoup regrettant le manque de qualit de certaines images acceptes, dautres considrant limportance de faire figurer des images
http://www.panoramio.com/forum/viewtopic.php?p=89417&highlight=#89417, en ligne le 23/03/09 http://www.panoramio.com/forum/viewtopic.php?t=8527&postdays=0&postorder=asc&start=15, en ligne le 23/03/09
119 118

97

illustrant les sites classs, monuments historiques et patrimoniaux, Je n'ai pas post ces photos en tant qu'uvres religieuses mais en tant que photos du patrimoine national (uvres rpertories l'inventaire des monuments historiques). Je dois avouer que je ne suis pas trs content quand je vois la quantit de photos mdiocres tant par leur valeur intrinsque que par la qualit de la prise de vue. 120 Le but de lassociation entre les deux sites est doffrir aux internautes un contre point aux images satellitaires par lajout de ces vignettes photographiques proposant une vision spcifique de la zone. Limage slectionne dans Panoramio rsonne dans lusage de GE comme une incarnation du lieu. Rsolument Web 2.0 puisque faisant appel aux internautes pour gnrer directement du contenu, la slection des images pour GE est nanmoins rigoureuse et soumise une charte121 dapprciation des photographies selon laquelle seules les images prises en extrieur, celles de monuments, de paysages, de rues, btiments ou espaces verts sont acceptes. Il existe bien sr de nombreuses exceptions comme pour la prsence de personnes limage accepte si les gens sont une partie invitable du lieu , ou pour les intrieurs de monuments qui doivent correspondre une large perspective , etc. Ces rgles de publication des photographies sur Google Earth engendrent une modification automatique des images au sein mme de Panoramio o les usagers dsirant retrouver leurs images sur linterface de Google vont privilgier le transfert dimages en adquation avec la charte. 3. Echanger son exprience en plus de ses images ct du tout communautaire de Flickr et de limportance primordiale du gotagging sur Panoramio dautres sites ont su dvelopper une approche spcifique de cette forme dindexation, approche se basant sur la notion de partage dexprience partir de limage toujours golocalise. Ces sites oprent une prise en compte de la spcificit de limage gotague, savoir la prgnance des lieux, le fait que la majorit des images gopositionnes par les usagers sur une interface cartographique reprsentent un territoire, un monument et se trouvent naturellement en lien avec une exprience personnelle. Les photographies tant souvent prises dans un contexte de voyage, de vacances ou de contact quotidien avec lendroit, ces sites considrent limportance doffrir aux internautes la fois de nouvelles formes dalbums de vacances et la cration de sites de prparation au voyage indits, le tout rsolument Web 2.0 puisque sappuyant sur les connaissances et
120 121

http://www.panoramio.com/forum/viewtopic.php?p=89417&highlight=#89417, en ligne le 23/03/09 Cf annexes

98

productions de chacun.

Le partage dexprience sera ainsi au centre du lien

communautaire et limage apparait comme un dclencheur de sociabilit, un support la narration partage du vcu. Le slogan de Locr : Partagez vos impressions et expriences avec des gens du monde entier. Montrez vos photographies prfres et utilisez Locr comme une plateforme de communication internationale , tmoigne bien de laspect communautaire et social du site engendr partir du golotagging des images. Avec la possibilit de voir les images des autres internautes prises proximit se multiplient les possibilits de rencontrer des personnes ayant expriment le mme voyage, visiter les mmes monuments, rendant plus aise pour lobservateur la recherche dinformations sur un lieu. Locr renforce sa dimension documentaire grce aux champs Wikipedia intgrs la page dhbergement des images, ces informations supplmentaires qui entourent les images offrent en plus du contexte gographique des informations historiques, culturelles ou autre.

Ill. 23 Capture dcran des informations Wikipedia sur Locr

Autre site plus rsolument tourn vers une nouvelle offre de tourisme, Zoom And Go
122

a fait de la prparation au voyage et du tmoignage dexprience son champ

dopration :

122

http://www.zoomandgo.com/

99

Zoom And Go a pour but de conseiller les voyageurs sur les lieux visiter, les choses voir, faire et sur les lieux o se poser, partir de lexprience des autres routards ou des recommandations des locaux du monde entier. Des informations et images sont ainsi fournies par les internautes concernant les villes et sites touristiques mais aussi sur les htels frquents et nots par les usagers. Ce partage dexprience autour du lieu, se charge dun versant lucratif certain et laisse prsager les horizons conomiques potentiels de ce genre de site et plus gnralement du gotagging. On conoit les possibilits pour les diverses entreprises intresses de viser un public non plus seulement par une contextualisation smantique des publicits partir des recherches des usagers mais vritablement par une contextualisation spatiale, gographique se rfrant directement aux besoins localiss des internautes. Et lon suit le raisonnement de Olivier Ertzscheid et Gabriel Gallezot quand ils affirment qu Au del de laspect pratique induit par ces techniques de golocalisation, ces dernires font dsormais de chacun dentre nous des citoyens non plus simplement connects mais situs 123.

B.

Vers de nouveaux modes de recherche dimages

Jusqu prsent le gotagging a mis en vidence lmergence dun nombre consquent de nouveaux usages, la plupart relevant du champ documentaire, et bas sur le rapport des contenus visuels, informationnels leur reprsentation gographique. Cette pratique se dmarque toutefois des autres systmes dindexation en crant une sphre iconique ddie, favorisant son usage, que sont les photographies de lieu, de sites gographiques, mais aussi par sa capacit renouveler les modes de visualisation des images et les principes de navigation au sein dune collection. 1. Les applications composites : golocalisation et locative media

Si pour linstant le gotagging des contenus sest plus ou moins cantonn des pratiques proches des rseaux sociaux, de nombreuses perspectives se laissent apprcier et un horizon conomique affleure pouvant laisser envisager un essor du systme. La technologie du GPS, et les applications en dcoulant dont fait partie le gotagging, ont favoris une interaction entre lespace rel et mental, la cration dun lien entre une exprience physique, celle de la circulation en un lieu, de la connaissance physique dun
Olivier Ertzscheid et Gabriel Gallezot, Etude exploratoire des pratiques dindexation sociale comme une rengociation des espaces documentaires. Vers un nouveau big bang documentaire ? , Document numrique et socit, ADBS ditions, 2006, (en ligne : http://affordance.typepad.com/mon_Weblog/files/sdndocsoc.pdf ).
123

100

espace, et le monde cognitif de la reprsentation, venant ainsi modifier notre rapport au territoire. La golocalisation semble pouvoir tre mise profit pour rvler le territoire, favoriser de nouvelles formes dexpression permettant de le qualifier ou de lenrichir, jusqu crer ce que lon nomme dsormais un espace augment . Pour Lev Manovitch, le dploiement des mdias localiss, les technologies de gopositionnement ont contribu tendre et densifier le territoire, cest en ce sens quil convient davantage, selon lui, de parler despace que de ralit augmente. Nous naviguons donc aujourdhui dans cet espace augment au sein duquel se distinguerait trois niveaux dintervention : la localisation, la reprsentation de cette localisation par le biais dun mdia et lusage de cette localisation. Il nous est dsormais possible de dterminer notre position gographique ou notre itinraire, et partir de ces donnes, daccder des informations de proximit ou des services contextualiss, c'est--dire adapts notre position, situation spatiale. Appliquer les principes de localisation des donnes, des sites Web, des systmes dinformation, permet ainsi aux informations numriques dinteragir avec le monde physique. Les systmes de go-positionnement et les technologies qui sy rapportent nous propulsent dans lexprience immatrielle de la navigation entre deux espaces. Comme lexpliquent trs bien les chercheurs Ertzschield et Gallezot en prenant comme rfrence Google Earth : la navigation sur ce support documentaire () est de nature schizophrnique. Les espaces de la carte et du territoire semblent se confondre au nom des deux prmisses suivantes : nous sommes sur la carte, et la carte est (tout au moins numriquement) lchelle du territoire. Cest cette inscription documentaire subjective (et qui peut tre dcline linfini selon la localisation gographique depuis laquelle sont envoyes les requtes et le type de service quelles visent) que stigmatise et illustre lessor des techniques de Geotagging. 124. Nous nallons plus aux cartes pour trouver o nous sommes mais nous disons aux cartes o nous avons t, o nous nous situons. Ces go-annotations personnelles fonctionnent donc sur le jtais l ou je suis ici , un change perptuel dexpriences passes ou prsentes en lien avec un territoire, un nouveau flux informationnel motiv par une volont de tmoignage, ou par le dsir de faire partager des informations pouvant tre utiles dautres. On observe un mouvement de subjectivation de sa propre inscription au sein du Web et de la recherche documentaire devenant change dexprience.

124

Olivier Ertzscheid et Gabriel Gallezot, op.cit., p.8.

101

Une multiplication des offres mettant en jeu la fois le contenu fourni directement par lusager et le gopositionnement de celui-ci merge entranant la cration dinterfaces cartographiques, nouvelles pages lambda des sites Web. Google avait pressenti ce mouvement et propose des Googles Maps personnalisables et surtout publiables sur le Web, autant doutils dmocratiss de gotagging et de cartographie nous reconnectent avec nos univers personnels, nous permettant dinscrire nos expriences personnelles dans le flux informationnel de la toile. Concernant les technologies de gotagging, de multiples perspectives de recherche apparaissent, avec pour toile de fond le dploiement grande chelle de la tlphonie mobile connecte, ultime outil de connexion permanente, de go-positionnement ais, nous projetant dans un toujours connect, un toujours situ. Il suffit pour sen convaincre dobserver le nombre dapplications de sites de gotagging qui se dveloppent sur mobiles, prnant un accs permanent aux fonctionnalits de recherche, aux cartes thmatiques de Google et autres. Le dveloppement de lInternet mobile alli aux fonctionnalits dj existantes des tlphones portables offre une instantanit des recherches sur le net, une accessibilit des informations ou des services contextualiss, le tout en fonction de notre propre exprience et par la connectivit des usagers entre eux. Cest ainsi que La frontire entre dun ct, un espace documentaire factuel (adresses, heures douverture des restaurants par exemple) et de lautre un espace documentaire incarn et totalement subjectiv, tombe dfinitivement. 125 . De ce nouvel tat de fait apparaissent des requtes documentaires dun genre nouveau, des requtes transactionnelles plaant ncessairement la pratique du gotagging dans un contexte de ressource conomique, sous couvert toujours dun change dexprience, dune utilit sociale de loutil. On parle de plus en plus de Locative media (que lon pourrait traduire par mdia localis) pour dsigner des systmes dinformations numriques dots de coordonnes gographiques permettant aux mondes physique et numrique de sinterpntrer leurs points de convergence. Le terme de mdia localis a t initialement propos en 2003 par Ben Russel et Marc Tuters du Locative Media Lab, comme une tentative de catgorisation des nouvelles formes dart visant explorer lintersection de lespace virtuel et de lespace physique. Les mdias localiss ont attir lattention dune nouvelle gnration dartistes et de techniciens, bientt rejoints par des chercheurs et universitaires, qui ont cherch

125

Ibid, loc.cit.

102

explorer lutilisation des technologies de golocalisation dans des interventions artistiques, des cartographies personnalises ou des dfinitions de rseaux sociaux. Les enjeux des mdias localiss touchent la fois les rseaux relationnels, le marketing, lunivers du jeu, lurbanisme Dans leur diversit, les mdias localiss forment un ensemble dapplications qui visent se saisir dun territoire physique, dun espace public investi et enrichi par les outils numriques. Quon y navigue aujourdhui par curiosit ou par intrt ces premires applications visent comprendre et interroger la faon dont se tissent les rseaux humains, dont vivent les communauts, et tentent doffrir de nouvelles voies ladministration et au maintien de vritables territoires, la fois numriques et physiques. 2. Limage comme interface de navigation Au-del de laspect social, documentaire et potentiellement conomique, le gotagging offre en plus dun systme dindexation innovant une nouvelle voie dans la recherche dimages. Premire interface disponible ou le recours au texte dans la phase de recherche nest plus automatique et peut devenir secondaire, les systmes de recherche par carte du monde apparaissent comme le premier moteur de recherche majoritairement visuel, une recherche dimages par limage c'est--dire celle de la carte. Si les sites utilisant le gotagging conservent une possibilit de requte par mots cls, ceux-ci perdent de leur primaut lusage. Dans le cas dune recherche dimages prcise quant une ville ou un site gographique, entrer directement le mot cl dans la barre de recherche parat tre une solution des plus rapides, si tant est que le terme choisi soit renseign dans la base ; nous considrons toutefois cette pratique comme inaugurale dans le temps de la requte et vite remplace par une navigation cartographique, une circulation dans lespace gographique reprsent. la recherche directe par mot cl se substitue une recherche fluide, de proche en proche, de lieux en lieux favorisant une srendipit des rsultats, une flnerie au sein des collections qui fait cho celles des nouveaux photographes parcourant leur ville et tmoignant de leur quotidien. Et cette dcouverte des collections opre par une circulation dimages en images travers la carte fait du gotagging linstigateur de la navigation par proximit visuelle. Parce que la carte, reprsentation visuelle, se substitue lindex, au nuage de tags dans le cas de la folksonomie, cette pratique dindexation nous permet galement denvisager les prmisses dune recherche dimages par limage. Au-del de fournir une navigation par limage au sein de la base, cette pratique offre une contextualisation visuelle aux images, les replaant dans la mention de leur 103

environnement gographique. Les images peuvent sembler couper de leur contexte par leur inscription au sein dune base de donnes, telle Flickr qui dispose de multiples biais dexploration des collections, individualisant et isolant chaque image au sein de catgories. Si linterface cartographique abstrait limage de son corpus originel, elle lui confre nanmoins son contexte spatial. partir de cette notion de re-contextualisation gographique des images et de navigation par proximit visuelle, des chercheurs dhorizons divers ont pouss ces nouvelles caractristiques dans une voie encore indite. De nombreux projets voient peu peu le jour avec pour objectif doffrir une reconstitution du hors champs de chaque image laide dimages gographiquement voisines. Une approche renouvele du territoire apparat saccompagnant dun nouveau mode de visionnage des images dans lequel le recours la 3D joue un rle essentiel. Cest un vritable brouillage entre virtuel et physique, entre une visualisation plane et en perspective dont il sagit alors. Parmi ces projets il convient de sintresser loption Look Around126 de Panoramio. Apparue en 2008, cette application permet de visualiser un lieu, un monument selon plusieurs angles correspondants aux divers points de vue offerts par les photographies des membres du site. Les quipes de Panoramio ont ainsi index les photos qui montraient les mmes lieux et les ont relies entre elles en relevant les coordonnes qui leur taient communes. Cette application pour linstant seulement propose pour les sites prsentant une forte densit d'images comme la tour Eiffel, Notre dame, etc., permet de se dplacer de manire interactive d'une photo l'autre en pousant, chaque fois, le point de vue de la suivante. On passe ensuite dune perspective une autre par dplacement du curseur sur limage, par slection dune des vues matrialises par un cadre polygonale adoptant le point de vue de la photo correspondante. Cette application favorise la dcouverte dynamique dun lieu et une nouvelle approche de la collection photographique. PhotoTourism127 est un autre projet qui apparat ds 2005 dans les laboratoires de recherche de Microsoft. Soutenu par lquipe de Noah Snavely, Photo Tourism vise concevoir un systme permettant de visualiser les sites gographiques, monuments, lieu urbain dans son ensemble en mettant bout bout des images dune mme base de donnes et reprsentant un mme objet, sujet. Il sagit donc de jouer sur la similarit et la proximit gographique des images, de dterminer leur angle de prise de vue, la position du photographe en fonction de limage pour permettre de relier les photographies entre elles.
126 127

http://www.panoramio.com/blog/hi-look-around/ http://phototour.cs.washington.edu/

104

Le logiciel prend appui sur les similarits prsentes dans les diffrents clichs, les algorithmes tant chargs d'extraire une centaine de points distinctifs de chaque image. Ds lors qu'un mme point distinctif est trouv dans plusieurs images, le logiciel est en mesure de calculer sa position 3D. Ces diffrentes donnes permettraient ainsi la correspondance et la mise en lien des images entre elles.

Ill. 24 Capture dcran de Look Around de Panoramio

Ce logiciel permettrait donc de naviguer la fois virtuellement dans un paysage et de parcourir en mme temps une collection dimage, le lieu observ ntant accessible qu partir de ces images. Les usagers naviguent dans lespace virtuel pour dcouvrir les images et leur reprsentation de lespace en question. Linterface proposait un espace de reconstitution 3D, dans lequel les usagers peuvent se mouvoir, entour dune barre de visualisation des photographies composant le dit paysage et alors observables isolment. En slectionnant une image il est alors possible dobtenir des informations et daccder aux annotations dorigines de limage. Photo Tourism est demeur un projet sans application complte sur Internet, ses concepteurs ont nanmoins appliqu leurs recherches llaboration et la mise en service

105

dun autre logiciel de visualisation des images en 3D nomm Photosynth128. Ouvert depuis peu au public, cette application de Microsoft fonctionne selon les mmes principes que ceux mis en jeu par Photo Tourism, la reconstitution dun lieu en 3D par lagencement dimages photographiques contextualises. Cet outil ne fonctionne toutefois et pour linstant, qu partir de collections personnelles et thmatiques, et ne prend pas encore en charge le croisement des corpus. Il propose en somme une faon originale de parcourir ses propres sries dimages, de mettre en relation ses photographies dun mme lieu de naviguer travers elles par un biais uniquement visuel.

Ill. 25 Capture dcran dune reconstitution de la Tour de Pise en 3D sur Photosynth

Si le gotagging tend se dvelopper, ce type dindexation des images reste encore relativement peu utilis compar au tagging par mots-cls notamment. Lexplication du nombre restreint dimages gotaggues sur Flickr (par rapport aux milliards dimages que compte la base) et de la mconnaissance des sites ddis par le grand public se trouve peuttre du ct du manque dautomatisation du systme. Peu dappareils numriques sont encore quips de module GPS, obligeant les usagers du site recourir au gopositionnement manuel, pratique considre pour beaucoup comme fastidieuse. Elle savre, de plus, souvent propice aux erreurs de localisation, en particulier avec la carte Yahoo disponible sur linterface de Flickr, trop peu prcise mme au niveau de dtails le plus lev.

128

http://photosynth.net/

106

Les utilisateurs dans le contexte dun gotaggage non automatique des images, se retrouvent souvent confronts au problme de savoir quelle localisation ils sont tenus de tagguer, le lieu de la prise de vue et ou celui du sujet photographi. Une diffrence existe donc entre la pratique manuelle et celle automatise, quand un utilisateur de plateforme de partage gopositionne manuellement ses images il semble avoir tendance placer son image selon la situation non pas de la prise de vue mais de la localisation du monument, du lieu-dit ou remarquable. Au contraire les GPS eux enregistrent les coordonnes gographiques lendroit ou ils se situent. Le gotagging constitue pour linstant une proposition de navigation par interface visuelle encore limite malgr les possibilits lucratives qui sesquissent. Lon peut tre amen penser que la gnralisation des photophones avec GPS intgr va permettre de rpandre et de dvelopper cette pratique.

107

Chapitre 4

Indexation et recherche dimages par le contenu

108

Sommaire du chapitre I. La recherche de limage par limage ...................................................... 110


A. La recherche par le contenu .................................................................................... 110 1. 2. Les principes ....................................................................................................... 110 Lindexation et la requte ................................................................................... 112

B. Les Caractristiques symboliques .......................................................................... 114 1. 2. 3. La couleur ........................................................................................................... 114 La texture ............................................................................................................ 116 Autres caractristiques de limage ...................................................................... 116

II. Une observation des sites en lignes ........................................................ 118


A. Les recherche par lexemple ................................................................................... 118 1. 2. La requte globale : ............................................................................................. 118 La requte partielle : ........................................................................................... 120

B. Les requtes par esquisses ...................................................................................... 122 1. 2. Retrievr ............................................................................................................... 123 Gazopa ................................................................................................................ 124

C. Lannotation automatique des images .................................................................... 125 1. 2. Les principes ....................................................................................................... 126 Les applications en ligne..................................................................................... 127

D. Les systmes de reconnaissance faciale ................................................................. 130 1. 2. 3. Les principes ....................................................................................................... 130 Les applications grand public ............................................................................. 132 Les applications du Web ..................................................................................... 135

III. Les enjeux de la recherche par le contenu .............................................. 137


A. Le retour du texte ? ................................................................................................. 137 1. 2. Les avantages du bi-modal ........................................................................... 137 Conservation et partage des annotations ............................................................. 138

B. Des prospectives vise commerciales .................................................................. 139 1. 2. 3. Pour quels usages dans la sphre de lusager non pro ? ..................................... 140 La fin du piratage des images ? .......................................................................... 142 Lenjeu des sites marchands ............................................................................... 144

109

I. La recherche de limage par limage


Nous avons dj mentionn lintrt actuel port sur les bases dimages, les techniques dindexation et celles de recherche dimages au sein de ces bases. Cependant, la problmatique de la recherche d'images se rsume soit en une problmatique de recherche de mots en se basant majoritairement sur les attributs textuels des images tels que le nom du fichier ou des lments de texte quon peut rattacher aux images, soit lemploi du gotagging et des interfaces cartographiques ne sappliquant de faon pertinente qu une sphre iconographique spcifique. De nouvelles solutions tendent tre trouves du ct de lindexation et de la recherche par le contenu des images.

A.

La recherche par le contenu


1. Les principes

Larchivage des images et des squences vidos aussi bien pour les chanes de tlvision, les journaux, les muses et mmes pour les moteurs de recherche sur Internet ne se fait quau prix dune tape dannotation manuelle laide de mots-cls. Cette indexation reprsente une tche longue et rptitive pour lhumain, surtout avec les bases dimages qui deviennent aujourdhui de plus en plus grandes. De plus, comme nous lavons dj mentionn, cette tche est trs subjective la culture, la connaissance et aux sentiments de chaque personne. Le besoin de mthodes dindexation et de recherche directement bas sur le contenu de limage nest donc plus dmontrer. Le premier prototype de systme fut propos en 1970 et attira lattention de la communaut des chercheurs. Les premiers systmes dindexation dimages par le contenu sont cres au milieu des annes 90, non pas dans la perspective dune application sur internet mais pour des bases de donnes fournies, spcialises et pour la plupart fermes129. Les systmes dindexation par le contenu permettent de rechercher les images dune base dimages en fonction de leurs caractristiques visuelles. Ces caractristiques, encore appeles caractristiques de bas-niveau sont la couleur, la texture, la forme et tout autre caractristique de limage que lon peut imaginer. Nous appellerons ces caractristiques des caractristiques symboliques. Les premiers systmes crs pour la recherche dimages par le contenu sont du type recherche par similarit. La requte de
129

Pour un aperu des avances et projets divers du domaine voir R.Datta, et alt, Image retrieval: Ideas, influences, and trends of the new age, ACM Comput. Survey, Avril 2008, article 5, 60 pages.

110

lutilisateur se fait sous la forme dun exemple (croquis, image, etc.), le systme ralise un calcul de similarit entre cet exemple et les images de la base puis slectionne les meilleures dentre elles. Ce calcul de similarit se fait partir de signatures pr calcules sur limage dont lobjectif est de rsumer le contenu colorimtrique, textural ou autre de cette dernire. Dans une recherche dimages par similarit lutilisateur fournit une image, dite image question ou requte, afin de trouver dautres images qui lui sont similaires. La notion de similarit reste toutefois dfinir mais, en gnral, cest une similarit visuelle en couleur, texture et/ou forme qui est utilise. Le principal problme est alors de savoir comment choisir une (des) caractristiques adquates et comment les combiner. Dans cette section, nous prsentons les principes des systmes de recherche dimages par le contenu, la faon dont ceux-ci oprent pour grer la (les) requte(s), calculer la ressemblance et lancer les rsultats. Lapparition de ce domaine de recherche, en ce qui concerne les images et les documents audiovisuels, date de la premire moiti des annes quatre-vingt-dix, et est donc encore rcente. Comme lindique Patrick Gros dans son article, lmergence de cette discipline a suscit un double mouvement, denthousiasme chez les chercheurs qui y ont vu un domaine nouveau dinvestigation et qui, selon leur habitude, ont beaucoup promis afin dattirer des financements pour mener leurs activits, et dinquitude chez certains professionnels de la documentation audiovisuelle qui y ont vu une remise en cause de leur mtier, voire un danger de disparition de leur emploi. 130. Depuis le dbut des annes 90, plusieurs systmes dindexation et de recherche dimage par le contenu (CBIR) ont t tablis. Le systme QBIC (Query by Image Content) a t dvelopp par IBM en 1995, il permet notamment lutilisateur de faire la requte par le contenu visuel dimage, exemple par exemple : la couleur, la texture. Une de ses versions centre sur lappariement par couleur est aujourdhui accessible sur le site du Muse de lHermitage131. Virage, qui est dvelopp par la socit Excalibur Technologies est un systme de CBIR semblable QBIC, il possde une caractristique additionnelle permettant de combiner des requtes en utilisant diffrents descripteurs : lutilisateur peut ajuster limportance lie aux caractristiques visuelles selon leur signification. la suite des travaux dIBM sur le systme QBIC, le domaine sest dvelopp sous le vocable

130

Patrick Gros, Description et indexation automatiques des documents multimdias : du fantasme la ralit , Interstices, 29/05/07, en ligne : http://interstices.info/jcms/c_19256/description-et-indexationautomatiques-des-documents-multimedias-du-fantasme-a-la-realite 131 http://www.hermitagemuseum.org/fcgi-bin/db2www/qbicColor.mac/qbic?selLang=English

111

gnral dindexation multimdia par le contenu , pour le distinguer dune indexation qualifie de manuelle et de smantique.

Ill. 26 Capture dcran de linterface de recherche par couleur du logiciel QBIC sur le site du muse de lHermitage

2.

Lindexation et la requte

Ces systmes sexcutent en deux tapes : ltape dindexation et ltape de recherche. Dans ltape dindexation, des caractristiques sont automatiquement extraites partir de limage et stockes dans un vecteur numrique appel descripteur visuel. Les techniques prsentes ci-aprs, dites d'indexation, se proposent d'attacher une image ou une vido un ensemble de descripteurs de contenu, dans le but de mesurer la ressemblance avec les descripteurs correspondant la requte. Dans ltape de recherche, le systme en fonction de la requte de lutilisateur, lui renvoie les rsultats correspondant la plupart sous forme dune galerie dimages ordonnes en fonction de la similarit entre leur descripteur visuel et celui de limage requte en utilisant une mesure de distance. Il existe trois faons deffectuer une requte dans un systme dindexation et de recherche dimages : la requte par mots cls, la requte par esquisse, la requte par exemple. Pour travailler avec des requtes par mots cls, le systme doit extraire des mots cls partir dune image. Le systme se base alors sur l'annotation textuelle des images, ralise manuellement, cest aujourdhui la mthode la plus employe, beaucoup de moteurs de recherche dimages tels que Google, Yahoo, lutilisent. Elle est pourtant loin 112

dtre parfaite, quelques mots nexprimant pas le sens dune image, lutilisateur dsireux de trouver des images contenant un thme ou sujet prcis devra filtrer le contenu des pages de rsultats regroupant les photos pertinentes et celles hors de propos. Puisque la requte par mots cls a des inconvnients, les systmes de recherche dimages par le contenu utilisent souvent deux autres mthodes : la requte par lexemple et celle par esquisse. Dans la premire approche, soit le systme choisit quelques images au hasard dans la base dimages et les montre lutilisateur, soit lutilisateur parcourt la base dimages et choisit une requte ou encore donne sa propre image requte. Dans la deuxime approche, la requte se fait par bauche graphique (sketch), les systmes permettent souvent de choisir entre une requte par bauche de formes de contours ou une requte par bauche de couleurs et textures de rgions voire de combiner ces options. La forme est un lment galement largement utilis par les diffrents systmes mis au point. QBIC propose ainsi une petite palette graphique : lutilisateur trace une forme et le systme retrouve les images possdant des formes semblables. Dcrire une forme ne pose pas de problme majeur. En revanche la difficult pour les systmes informatiques est de retrouver la forme trace dans limage, de la dlimiter. En effet, dans une image normale, les objets se superposent : ils sont constitus de parties de couleur, de texture et de formes trs diffrentes. La notion mme d'objet est mal dfinie. Une voiture par exemple est un assemblage d'objets (roues, jantes, carrosserie, etc.). Lutilisateur humain pense la forme comme tant celle dun objet (la voiture en l'occurrence), et lui associe par consquent une valeur smantique. Mais comment lordinateur peut-il savoir qu'on veut la voiture avec ses roues et ses enjoliveurs et pas seulement ces deux objets pris sparment ? Pourquoi la voiture serait-elle la forme extraire plutt que lessuie-glace, qui a au moins une couleur uniforme ? Ce problme de dlimitation des formes, QBIC l'a rsolu en extrayant les formes de toutes les images manuellement. 132. Il ressort de cet exemple quune tape manuelle de circonscription des formes est encore requise, sil est envisageable doprer cette description sur une base de donnes close une telle entreprise est videmment impossible lchelle dInternet. Des requtes par rgions sont galement possibles, il sagit alors de retrouver toutes les images de la base ayant certaines rgions semblables celles de limage requte. Dans ce cas, soit le systme segmente une image, soit on utilise une structure spatiale. Dans le premier cas, aprs avoir segment une image, lutilisateur choisit les rgions, formes

132

Patrick Gros, op.cit.

113

souhaites partir de limage segmente pour interroger la base de donnes. Dans le deuxime cas, la structure souvent utilise est larbre quartenaire, celle-ci permettant de stocker les caractristiques visuelles des diffrentes rgions dimage et de filtrer les images en augmentant au fur et mesure le niveau de dtails. Cette technique est toutefois loin dtre idale, En ce qui concerne les rgions, le problme est tudi de longue date. Les petites rgions sont trs instables. Celles correspondant un objet rencontrent le problme de dlimitation voqu propos des formes. Comment savoir quelles sont les rgions les plus intressantes dans une image ? Reste loption de ne rechercher que quelques rgions dans une image, moins dune dizaine en gnral. Cela permet de sparer le centre de limage de ce qui est soit au premier soit au dernier plan.133 Dans tous les cas, aprs avoir pris en compte les requtes (images ou rgions) le systme va extraire un vecteur caractristique de ces requtes et va le comparer avec ceux des images de la base. Les requtes par lexemple sont les plus visuelles et galement les plus souvent utilises. Mais cette approche a un inconvnient, les systmes supposent que plus il y a d'exemples de questions disponibles, meilleurs sont les rsultats. Par consquent, les utilisateurs pensent quils peuvent avoir plus de rsultats pertinents sils ajoutent de nouveaux exemples au rsultat de la requte prcdente. Cependant, cette supposition n'est pas toujours vraie, les exemples additionnels pouvant contenir des caractristiques inappropries et faire baisser la performance du systme.

B.

Les Caractristiques symboliques

Une image contient plusieurs caractristiques symboliques. Comme le prcise Patrick Gros En labsence de toute indication sur limage, on en est rduit observer le signal bidimensionnel qui la constitue. Informatiquement, une image se prsente comme une table rectangulaire dlments lmentaires appels pixels, chacun codant sous la forme dun ou de plusieurs nombres (gnralement trois) linformation dintensit lumineuse ou de couleur prsente en un point. Ce sont donc ces nombres que lon va utiliser pour dcrire les images 134 . 1. La couleur

Toujours engag dans la course pour une indexation et une recherche des plus efficaces, Google a depuis peu mis au point un nouveau filtre de recherche concernant la
133 134

Ibid, op.cit. Ibid. op.cit.

114

recherche d'images avec la possibilit de choisir la couleur dominante escompte. Un filtre supplmentaire portant sur les couleurs est ainsi disponible depuis le mois davril 2009 pour la version mondiale du moteur, un dploiement rapide l'ensemble des versions localises de Google est annonc. L'utilisateur peut dcider d'effectuer une recherche d'images en spcifiant la couleur dominante qu'il dsire. Un panel de seize couleurs est mis disposition via un lien All colors dispos droite des filtres usuels. Ce choix de la part de Google tmoigne bien de lattractivit du descripteur couleur. La couleur est en effet trs souvent le premier descripteur qui est employ pour la recherche dimages, elle est le descripteur le plus accessible puisque directement code au niveau de chaque pixel. Plusieurs travaux ont dj prouv que sil sagit dun descripteur assez simple il demeure nanmoins efficace. La technique classique de calcul des zones de couleur est celle de lhistogramme. Le principe est de dterminer la couleur prsente dans limage et la proportion de la surface de limage qu'elle remplit. Cest ce quon appelle un histogramme de couleur, selon Wikipedia135 Les histogrammes de couleurs peuvent tre construits dans plusieurs plages de couleurs, RVB (Rouge, Vert, Bleu) ou toute autre plage de couleurs de toute dimension. Un histogramme de couleurs est produit en dcoupant d'abord les couleurs de l'image dans un certain nombre de cases, puis en comptant le nombre de pixels dans chaque case . Bien videmment, un tel procd de description est assez simpliste mais il est suffisant pour rechercher des images de coucher de soleil dans une collection dimages de villes ou maritimes... Cette technique est trs utilise, les histogrammes sont faciles et rapides calculer, robustes la manipulation des images comme la rotation et la translation. Cependant lutilisation dhistogrammes pour l'indexation et la recherche dimages pose quatre problmes. Tout dabord, ils sont de grandes tailles, donc par consquent il est difficile de crer une indexation rapide et efficace en les utilisant tels quels. Deuximement, ils ne possdent pas dinformations spatiales sur les positions des couleurs. De plus, ils sont sensibles de petits changements de luminosit, ce qui est problmatique pour comparer des images similaires, mais acquises dans des conditions diffrentes. Et enfin, ils sont inutilisables pour la comparaison partielle des images (objet particulier dans une image), puisque calculs globalement sur toute limage. Plusieurs travaux rcents ont t effectus pour amliorer ces problmes. Il existe deux approches suivies par les

135

http://fr.wikipedia.org/wiki/Histogramme_de_couleurs

115

chercheurs lune des plus rpandues consiste ajouter des informations spatiales lhistogramme en utilisant plus finement la distribution des couleurs. Patrick Gros remarque ainsi qu un pixel jaune entour de bleu ne donnera pas du tout le mme effet entour de jaune. On peut ainsi pondrer limportance de chaque pixel dans lhistogramme en fonction de son environnement immdiat, ce qui augmente grandement la puissance descriptive de lhistogramme. Par ailleurs, de nombreuses distances existent pour comparer des histogrammes et juger ainsi de la ressemblance entre les images. Le choix de cette distance influe bien entendu sur les rsultats, et est un facteur dterminant de la rapidit du systme. Malheureusement, les distances les plus intressantes sont trs onreuses calculer. 136. 2. La texture

Lide est de dcrire la texture de limage, cest--dire le fait quune image de nuage ne ressemble pas une image dherbe, de marbre ou de feuillage. Comme le prcise Patrick Gros Cette deuxime approche consiste donc faire abstraction de la couleur et sintresser uniquement aux distributions locales des intensits lumineuses. On va ainsi chercher dterminer dans quelle mesure un pixel clair est plutt entour de pixels clairs ou foncs.137 . La texture est tudie depuis une vingtaine dannes et plusieurs techniques ont t dveloppes pour lanalyser. Certaines approches rcentes semblent donner de bons rsultats. Une mthode trs connue pour analyser la texture est la matrice de cooccurrences de Haralick, qui calcule les niveaux de gris dune image. Le problme est que la notion de texture na pas de dfinition formelle expliquant le nombre important de descripteurs proposs depuis les cooccurrences dHaralick en 1973. Il est noter toutefois que chacun deux a un domaine dusage restreint, sans que ce domaine ne soit lui-mme bien dfini. Aussi trouve-t-on des descripteurs de texture dans de nombreux outils mais leur utilit nest pas souvent prouve. 3. Autres caractristiques de limage

Il existe plusieurs autres caractristiques ou descripteurs de limage qui peuvent tre utilises pour mesurer la similarit dune image, telles que la forme, les points dintrt, les invariants, et plus encore. La forme est une caractristique visuelle importante
136

Patrick Gros, Description et indexation automatiques des documents multimdias : du fantasme la ralit , Interstices, 29/05/07, en ligne : http://interstices.info/jcms/c_19256/description-et-indexationautomatiques-des-documents-multimedias-du-fantasme-a-la-realite 137 Ibid,Op.cit.

116

et elle est une des caractristiques de base pour dcrire le contenu d'une image. Cependant, la description des formes est une tche difficile, surtout dans un contexte de segmentation faible et en particulier si lon recherche la similitude et non lexactitude. Ainsi dans les systmes de recherche rcents, peu emploient la forme comme critre de recherche. D'autres caractristiques telles que des invariants, les points dintrts sont recherchs pour amliorer les performances des systmes de recherche dimages. Dans leurs travaux Iqbal et Aggarwal138 ont ajout la structure de l'image la couleur et la texture pour le systme CIRES. Dautres chercheurs139 ont prsent un systme de recherche dimages bas sur la couleur, lorientation d'objet et la position relative. Chacune de ces combinaisons a des avantages et des inconvnients et chacune peut tre bien adapte pour certaines bases d'images, mais ne fonctionnera pas correctement avec d'autres. Les problmes du bon choix de caractristiques pour dcrire limage et de la pondration de ces caractristiques ont t poss, mais ils ne sont pas encore rsolus. Alors quun consensus minimal sur lutilisation de la couleur et de la texture semble se dgager des travaux prsents ces dernires annes, certains systmes ajoutent dautres caractristiques, variables selon les systmes et surtout selon les applications vises. Quant la pondration des caractristiques dans la fonction de mesure de la similarit entre les images, elle varie aussi fortement selon les systmes, les applications et mme selon les requtes. Ces critres ne sont pas forcment dordre symbolique, mais plutt dordre smantique. Deux approches sont proposes pour rsoudre ce problme : lune demande lutilisateur de donner un ordre dimportance pour chaque caractristique (par exemple 35% de couleur, 50% de texture), lautre dcrte leur importance partir des requtes pour faire un retour de pertinence. La premire approche est trs difficile effectuer car lutilisateur nest pas toujours capable de quantifier le poids accord chaque descripteur. La deuxime approche est utilise de plus en plus dans les systmes dindexation et recherche des images lheure actuelle et donne des rsultats trs prometteurs.

Qasim Iqbal, J.K. Aggarwal, Combining structure, color and texture for image retrieval: a performance evaluation. Proc. Of International Conference on Pattern Recognition (ICPR), 2002, Quebec (Canada). 139 Sciascio, (1997), Similarity Evaluation In Image Retrieval Using Simple Features. Proc. of Storage and Retrieval for Image and Video Databases V, 1997, San Jose (USA), vol. 3022.

138

117

II. Une observation des sites en lignes


De nombreux moteurs spcialiss dans la recherche dimages sont apparus depuis peu sur Internet. Ils ont tous dvelopp des applications novatrices bases sur les principes de la recherche dimages par le contenu et la recherche dimages par similarit. La plupart de ces moteurs fonctionnent partir de la base Flickr, ou de toutes autres bases de donnes dj bien organises, ce qui non seulement facilite le travail du moteur mais peut aussi faire du moteur une annexe du site source, une autre voie parmi les nombreuses dj existantes dans le cas de Flickr dexplorer les collections.

A.

Les recherche par lexemple


1. La requte globale :

La requte globale consiste soumettre une image exemple au moteur de recherche dimages qui devra alors prendre en compte tous les paramtres de la photographie pour fournir des images similaires. Apparu en version publique sur le Web depuis quelques mois seulement, Tineye140 est un nouveau site fonctionnant sur ce mode de requte globale, la recherche se fait donc de manire purement visuelle en soumettant une image au logiciel. Cette approche renouvelle la recherche dimages sur le Web puisque le questionnement de la base de donnes ne se fait plus par saisie de mots cls mais par image-cl, image-exemple. Si lon soumet une image au moteur du site, le logiciel ramnera toutes les occurrences de cette image quil a indexe, proposant ainsi toutes les adresses internet des pages sur lesquelles limage est prsente. Les critres de recherche ne sont pas textuels, mais le logiciel de TinEye se base en ralit sur lanalyse des pixels dune image pour identifier une image et ses caractristiques, permettant au moteur de la retrouver mme si elle t fortement modifie en taille ou altre au niveau de couleurs. Il utilise pour cela un algorithme produisant une empreinte ou signature digitale de limage recherche qui par la suite sera compare lindex. Depuis son lancement, le moteur dindexation du site na cess danalyser le Web pour agrandir sa base de donnes qui comporte aujourdhui plusieurs centaines de millions ditems.

140

http://tineye.com/

118

Dans son principe TinEye est donc plus un comparateur dimages quun moteur de recherche, partir de limage tmoin la recherche seffectue par similarit, les images trouves seront identiques ou trs proches de limage fournie pour la recherche. Bien que cette technique calcule effectivement la diffrence relle entre deux images, elle ne prend pas du tout en compte le contenu smantique de l'image. Elle est donc dpendante de l'angle de prise de vue de l'objet et non-robuste aux transformations classiques susceptibles d'tre appliques aux images comme les translations, symtries, rotations ou encore les changements d'chelle.

Ill. 27 Capture dcran dune recherche effectue sur Tineye

Le systme de calcul de Tineye se base donc sur lutilisation de descripteurs locaux qui se sont rvls, dans la pratique, extrmement performants notamment pour des tches de dtection de copie, permettant dobtenir de faibles taux de fausse dtection. Selon Patrick Gros Cela est d au fait quils dcrivent de manire trs discriminante la texture locale de chaque point. Ils permettent donc de retrouver des objets prcis. Cest pourquoi ils sont si adapts pour la dtection de copies 141. Il convient de noter dans le cas de Tineye que ce site ne repose pas encore sur une indexation par le contenu mais fonctionne par la cration dune signature digitale propre chaque image et servant de rfrence. Si nous sommes bien dans la recherche dimages par limage, cette technique ncessite de savoir prcisment ce que lon recherche pour tre employe, de possder une image source.
141

Patrick Gros, Opus cit., Interstices, 29/05/07, en ligne : http://interstices.info/jcms/c_19256/description-etindexation-automatiques-des-documents-multimedias-du-fantasme-a-la-realite

119

2.

La requte partielle :

Ce type dinterrogation porte sur une zone prcise constitutive de limage. Mais dans le cas des applications grand public cette terminologie consiste choisir un ou plusieurs paramtres en particulier afin daffiner la recherche sans pour autant avoir dimage au dpart. Xcavator142 est un moteur de recherche ddi aux images qui permet de rechercher des photographies au sein dune base de plusieurs millions dimages comprenant galement des illustrations flash, des dessins voire des vidos. En thorie adress aux professionnels de la recherche dimages, le site repose sur lindexation de fonds de diverses agences dimages en ligne, il est toutefois possible deffectuer une recherche ne prenant en compte que les images libres de droits (ce qui ne signifie pas gratuites), issues de Fotolia ou iStockphoto, et celles soumises droits dauteurs, la plupart des images proposes par Xcavator sont donc payantes.

Ill. 28 Capture dcran dune recherche effectue sur Xcavator

La requte dbute par la slection dune catgorie ou linscription dun mot clef dans la barre de recherche. Une galerie de dessins et de photographies est alors propose. Lusager a alors le choix deffectuer une recherche basique par comparaison de la base avec une image slectionne comme exemple, ou une recherche experte dans laquelle lui est propose une option de tri des images par couleur. Avec cette option si un utilisateur a besoin dune photo dans des tons prcis, il peut slectionner la couleur souhaite et Xcavator affiche une liste de fichiers dont les couleurs saccommodent la slection.
142

http://www.xcavator.net/

120

Le site comprend galement un outil assez sommaire desquisse de formes disponible dans les deux types de recherche, permettant partir de limage requte dindiquer les formes ou lignes de force privilgier lors de linterrogation de la base. La petite taille de la vignette sur laquelle il nous est donn dintervenir ne permet quune bauche approximative nous faisant douter de lutilit de cette option. Une fois quune image est dfinitivement slectionne elle saffiche dans une barre sous la galerie, nomme Lightbox elle permet lutilisateur daccder lagence et/ou au site dtenteur des droits de limage.

Ill. 29 Capture dcran dune recherche effectue sur Tiltomo partir de la base Catchy Colors

Tiltomo143 est un autre site proposant des recherches dimages par similarit et selon une slection de descripteurs. Plusieurs caractristiques peuvent tre prises en compte, le thme, la couleur et la texture. Lutilisateur doit dabord interroger textuellement la base de Flickr pour obtenir limage requte. Le site propose alors pour chaque image visible deux modes de requte : Par thme, le site propose alors une analyse du sujet des images. Les crateurs du

moteur conseillent davoir recours ce mode si le sujet de limage exemple est ce qui prime dans la recherche dimages similaires. Il est galement permis dutiliser cette requte par thme coupl avec loption "Show ONLY images from the reference photographer". En suivant ce lien seules les images du photographe de limage requte apparaitront dans la galerie.
143

http://www.tiltomo.com/

121

Par couleur et texture. Les rsultats pour ce mode sont trs htroclites, une

recherche effectue avec le tag Tree et la slection duneimage-cl, aboutit une slection dimages de bbs, jeunes maris, assiette repas. Sur cette page de rsultats parmi une galerie de trente images seulement deux sont visuellement proches de limage requte. Tiltomo est un moteur qui fonctionne seulement partir de deux bases de donnes. Issues de Flickr elles demeurent indpendantes lune de lautre, les recherches seffectuent donc soit : Sur la base gnrale, constitue dune slection de photographies issue de Flickr, et

comptant environ 140 000 items. Cette base permet une grande varit dans les thmes, sujets et les tags, et constitue donc la collection idale pour tester la requte par thme. Sur la base issue du groupe The Catchy Colors . Elle comprend un grand

nombre de photographies aux couleurs remarquables, et savre donc plus naturellement dvoue la requte par couleur et texture. Concernant ce site on regrettera la petite taille des deux bases de donnes ne permettant pas vraiment dexplorer en profondeur les fonctionnalits proposes. Nous pouvons enfin mentionner un autre site permettant deffectuer des recherches dimages par slection de critres, il sagit de Picitup144. Si lon accde en premier lieu aux images par le mode dinterrogation textuelle, par la suite une multiplicit de filtres visuels est alors propose (visage, produit, couleur, orientation, taille...) ainsi quune option de recherche par similarit sous chaque image de la galerie de rsultats, option qui pour linstant ne savre que peu performante. Picitup explore les images de Yahoo!, Flickr et Picasa, et offre la possibilit de ne reprer que les images sous licence Creative Commons ou d'exclure le contenu commercial.

B.

Les requtes par esquisses

Ces outils permettent donc lutilisateur de dessiner des images requtes. Il est bien sr parfois difficile de faire lesquisse dun objet donn de faon prcise et les logiciels ne sont pas toujours performants pour traiter les ressemblances entre le dessin et limage. Les systmes de recherche dimages par le contenu utilisent majoritairement le paradigme requte par image-cl ou combinent les deux approches ensembles.

144

http://www.picitup.com/picitup/index.jsp

122

1.

Retrievr

Retrievr145 offre un moyen original denvisager la recherche dimages sur internet. Cr par Christian Langreiter, partir des travaux de Chuck Jacobs, Adam Finkelstein et David Salesin de luniversit de Washington146. Cette application effectue une recherche de similarit dans la base de donnes de Flickr essentiellement auprs des images interestingness , en se basant sur les formes dessines par lutilisateur et les couleurs choisies. La reconnaissance est possible soit par image , en tlchargeant une photo ou en indiquant son url, soit par sketch (dessin) en excutant un croquis directement en ligne grce une application en Flash. Ce dernier mode est le plus surprenant. Il suffit de dessiner une forme et, automatiquement, saffichent des planches de photos en rapport avec celle-ci. Sil est possible de reprsenter un dessin laide du pinceau virtuel les esquisses peuvent galement tre agrmentes de couleurs. Les rsultats se rvlent la plupart du temps alatoires et droutants mais globalement, si lutilisateur vite les dtails inutiles et se concentre sur le choix des bonnes couleurs dans la palette, le logiciel offre quelques belles propositions dimages correspondantes. Une utilisation rapide du site permet dobserver que la recherche dimages seffectue aussi bien en prenant en compte les couleurs que les formes dominantes, ou lignes de force. Prenons pour lexemple un usager dsirant rechercher des images de fleurs, si son premier trac est excut en trait noir ne soulignant que la forme florale le logiciel ira puiser dans le stock dimages en noir et blanc de la base, et sortira les images comprenant des lignes proches de celles esquisses. Si au contraire il mentionne la couleur dsire lors de lesquisse les images rsultant de la recherche auront toutes pour teinte dominante celle utilise. De laveu mme de son crateur Retrievr ses limites. La premire chose avoir lesprit est que cette application ne fonctionne pas selon une reconnaissance exacte dobjets, de visages ou de texte, so if you're drawing an outline sketch of a chair, it almost certainly won't get you one back (except your index only contains images of chairs) 147. Seules les formes les plus prononces et les aplats de couleurs sont pris en compte par le logiciel. De mme, sil ne prend pas en compte les rapports de proportion

145 146

http://labs.systemone.at/retrievr/ Chuck Jacobs, Adam Finkelstein et David Salesin, Fast Multiresolution Image Querying, Proceedings of SIGGRAPh 95, Washington, 1995. (en ligne http://grail.cs.washington.edu/projects/query/mrquery.pdf ) 147 Citation extraite des FAQ du site http://labs.systemone.at/retrievr/about

123

entre les lments dessins, il sapplique nanmoins conserver lagencement des formes esquisses au sein des images proposes.

Ill. 30 Capture dcran dune recherche effectue sur Retrievr avec loutil de requte par esquissse

2.

Gazopa

Gazopa148 est un autre moteur de recherche dimages similaires propos par Hitachi et pour linstant en version Beta priv. ct de la requte par esquisse, le site propose de nombreuses autres fonctionnalits de recherche, lutilisateur pouvant se servir de ses propres images uploades sur le site, de ladresse URL dune image trouve sur le Net et de mots-cls. Plusieurs types de descripteurs daffinage des rsultats sont galement proposs aux usagers, tel que la couleur ou la forme, celle-ci pouvant tre extraite de limage source elle-mme. Tout comme les sites vus jusqu prsent et lexception de Tineye, Gazopa recherche les images par similarit, ressemblance, et non par exactitude. En ce qui concerne la recherche par esquisse, linterface flash propose par le site est plus dveloppe que celle de Retrievr, malgr tout il n'est toujours pas facile de dessiner main leve l'objet recherch, il vaut donc mieux souvent commencer par une recherche par motcl si lon souhaite une requte efficace et pas forcment ludique. Lune des particularits de Gazopa est, malgr sa version encore lessai, sa grande adaptabilit aux diffrents outils et appareils offrant accs Internet. Il offre ainsi la
148

http://www.gazopa.com/sign_in

124

possibilit de tlcharger un plug-in permettant linstallation de lapplication sur les i phone. Grce lcran tactile du mobile toutes les options de recherche sont conserves, il est donc possible deffectuer une requte par esquisse directement sur le tlphone. Gazopa dveloppe galement une application sur Facebook, et un plug-in firefox qui permet de lancer une recherche depuis n'importe quelle image dun site internet.

Ill. 31 Capture dcran de la page daccueil du moteur Gazopa

Si ce site peut tre utilis comme un moteur de recherche dimages lambda, il convient de prendre en compte sa dimension conomique et ses applications commerciales, associ diffrents sites de ventes en ligne, la recherche par similarit peut devenir recherche de produit et le procd bien lucratif.

C.

Lannotation automatique des images

Si la plupart des sites de recherche dimages observs jusqu prsent disposent doptions de recherche par analyse de similarits, ils utilisent galement les mots-cls comme mode dinterrogation des bases de donnes. On en revient ainsi au problme initial, savoir comment permettre une indexation smantique des images qui soient automatiques ou du moins le plus rapide possible quand les collections traiter dpassent les millions de photos ? Comme nous lavons dj mentionn la seule indexation textuelle automatique des images est celle se basant sur le nom, la lgende ou le texte entourant limage, elle ne dcrit donc pas le contenu de limage et engendre un nombre important derreurs dindexation car le texte pris en charge par le systme ne correspond que rarement avec limage. La plupart des sites cits plus haut ont rsolu de faon partielle ce problme en 125

ayant recours aux collections de bases de donnes dj smantiquement indexes comme Flickr partir desquelles fonctionne leur moteur. De nouveaux projets se sont depuis peu dvelopps tendant utiliser les principes de la recherche par analyse du contenu visuel afin de gnrer du contenu smantique. Il sagit donc de dcrire par le contenu des fichiers visuels pour aboutir une automatisation de lindexation smantique, des moteurs de recherche hybrides performants. 1. Les principes

L'annotation automatique d'images est un domaine du traitement d'images permettant d'associer automatiquement des mots-cls ou du texte des images partir de leur contenu afin de pouvoir ensuite rechercher des images par requte textuelle. L'image est d'abord analyse par l'extraction de descripteurs visuels, des mots exemples sont utiliss pour permettre au moteur dtre capable d'engendrer automatiquement des annotations de nouvelles images selon des techniques d'apprentissage automatique. Les premires mthodes dans ce domaine se basaient sur un apprentissage des corrlations entre les descripteurs d'images et les annotations, puis des techniques utilisant des mthodes issues de la traduction automatique ont vu le jour, permettant de faire une traduction entre le vocabulaire textuel, et ce qu'on considrait comme un vocabulaire visuel, o chaque mot serait un groupe de rgions similaires obtenues par regroupement (clustering). Selon Christophe Millet, l'annotation automatique d'images cherche combler les lacunes des approches actuelles permettant la recherche d'images partir de requte textuelle 149. La premire consiste annoter manuellement les images, ce qui n'est plus envisageable avec le nombre croissant d'images numriques, et confronte lindexation au problme de la subjectivit du choix du terme indexeur. La seconde approche, adopte par les moteurs de recherche d'images sur le Web, est d'utiliser les mots de la page Web contenant l'image comme annotation de celle-ci, avec l'inconvnient de ne pas prendre du tout en compte le contenu de l'image. Si des systmes d'annotation automatique d'images commencent merger, ils connaissent certaines limites, celui notamment de ne pouvoir prendre en charge quun nombre restreint dimages, le nombre d'objets reconnus reste de l'ordre de 10 100, alors que les humains sont capables de reconnatre de l'ordre de 10

149

Christophe Millet, Annotation automatique dimages : annotation cohrente et cration automatique dune base dapprentissage, Thse dtat, Telecom Paris, soutenue le 14 Janvier 2008, (en ligne http://chr.millet.googlepages.com/these-christophe-millet.pdf

126

000 objets.150 . Un autre problme soulev est celui de lambigit de limage, de sa description et de son rattachement une annotation, comment choisir parmi plusieurs hypothses de reconnaissance dune forme ou rgion donne, celle qui permet une annotation globale de l'image smantiquement juste. Deux sortes de dsambigusation peuvent tre dveloppes comme le prcise Christophe Millet, la premire utilise les relations spatiales, et s'assure que par exemple le ciel est toujours au-dessus de la mer. La deuxime tient compte du contexte de l'image, en utilisant la relation entre les objets et les milieux dans lesquels ils se trouvent : on a plus de chance de trouver un lphant dans la savane, et un dauphin dans l'eau. 151 2. Les applications en ligne

Si de nombreux travaux universitaires ont t mens sur lannotation automatique des images, peu ont abouti la cration dun moteur de recherche efficient. On retiendra ainsi le projet de chercheurs de l'universit amricaine de Pennsylvanie ayant dvelopp un systme de reconnaissance et de description automatise d'images. Bas sur une mthode statistique, le projet s'intitule "Automatic Linguistic Indexing of Pictures in Real-Time" (ALIPR)152. L encore, plutt que de baser la recherche sur le texte environnant les photos, l'objectif est d'apprendre aux ordinateurs reconnatre le contenu mme des clichs, qu'il s'agisse d'immeubles, de paysages, de personnes etc. partir dun logiciel de reconnaissance des objets et des formes l'aide de mots cls indexs manuellement. La mthode utilise par les chercheurs consiste dans un premier temps rfrencer la main une base de photos la plus large possible. Soixante mille photos ont dj t tagues l'aide de mots dcrivant leur contenu. "Nous avons par exemple slectionn une centaine de photos de parcs et les avons rfrences avec des mots-cls tels qu'arbre, herbe, paysage etc." explique Jia Li, professeur la Penn State. "Cela permet de construire un modle statistique grce auquel la machine apprend reconnatre divers lments tels que la couleur ou la texture de ces photos. 153.

150 151

Ibid. Christophe Millet, op.cit.,p.6. 152 http://alipr.com/ 153 Cf Les explications dans la section FAQ du site.

127

Ill. 32 Capture dcran de la page daccueil de ALIPR

Le systme dcrit les images l'aide d'un vocabulaire de plus de 300 mots, pour l'instant en langue anglaise. Ces mots-cls permettent de rfrencer les images avec des tags spcifiques sans ncessiter lintervention humaine. Le processus d'indexation de l'image se droule en comparant l'image plusieurs dizaines de milliers d'autres contenues dans une base de donnes. L'analyse suggre alors 15 mots-cls correspondant au mieux l'image. James Wang, autre professeur en charge du projet dclare " avoir entran leur systme de reconnaissance reconnatre des concepts et des objets afin d'indexer automatiquement des images rencontres pour la premire fois ". Il ajoute que " la grande majorit des analyses donne 15 tags dcrivant correctement l'image " permettant ainsi une grande prcision dans la recherche. Grce cette technique, l'ordinateur doit par la suite tre capable de reconnatre les mmes lments dans de nouveaux clichs. De sorte qu'une personne faisant une recherche pourra utiliser les mmes mots-cls pour obtenir des images pertinentes. Depuis peu sur Internet ont merg quelques sites de recherche dimages vocation grand public et fonctionnant selon les principes et technologies dattribution automatise dune indexation smantique aux images. Nous retenons ici le site Behold154, dont le principe de fonctionnement du moteur sappuie sur un calcul des probabilits dassociation

154

http://www.behold.cc/

128

pertinente entre un concept et une image en analysant lagencement des pixels de limage en question. Chaque image analyse est ensuite rattache une catgorie. Behold est lun des sites ayant pour principe la liaison dune indexation smantique des images et une recherche par le contenu. La recherche dimages sur ce site se fait exclusivement partir de requte par mots-cls, toutefois Behold ne se cantonne pas une simple indexation textuelle des images mais est capable de reconnatre et dassocier un certain nombre de concepts partir dimages. La recherche seffectue partir denviron un million dimages extraites depuis les collections de Flickr. Lutilisateur commence par taper librement dans la barre de recherche un mot-cl, une premire galerie de rsultats apparat alors. Il est ensuite possible daffiner la recherche en slectionnant un des concepts propos par le logiciel, celui-ci effectuant alors un tri des images en fonction de la demande. Par exemple si lusager dsire trouver des images des rues de Paris, il pourra affiner sa recherche en choisissant la catgorie city , si au contraire il dsire des vues plus larges de la ville la catgorie skyline sera plus adapte.

Ill. 33 Capture dcran dune recherche effectue sur Behold

Depuis peu, Behold suggre automatiquement son utilisateur les filtres vecteurs de rsultats par lintroduction dune barre de miniatures au dessus de la galerie dimages. Les rsultats semblent performants mais les recherches sont encore limites, le moteur ne prenant en compte quune quinzaine de catgories smantiques partir desquelles limage est analyse. La plupart des moteurs mis au point selon cette technique dannotation automatique requiert malgr tout une phase de renseignement manuel ne serait-ce que pour la 129

constitution de la base dapprentissage partir de laquelle le moteur effectue les indexations. Si cette opration est ralisable dans le cadre dun projet universitaire, scientifique men sur une collection ditems restreints, son application sur Internet est moins vidente en raison du nombre toujours croissant dimages circulant sur le Web et de leur grande htrognit . Une solution dveloppe par quelques socits spcialises est davoir recours au crowdsourcing , de mme que pour lindexation purement textuelle des images, le recours aux internautes pour effectuer une phase prliminaire dindexation par mots-cls est envisageable et souvent efficace.

D.

Les systmes de reconnaissance faciale

Les technologies de reconnaissance faciale sont un champ de recherche largement mis en avant par les avances de la biomtrie. Elles ressortent plus prcisment de la branche des analyses morphologiques, au mme titre que la reconnaissance des empreintes digitales, de la forme de la main, des dessins du rseau veineux de l'il, de liris, etc. autant dlments qui ont l'avantage d'tre stables dans la vie d'un individu et ne subissent pas autant les effets du stress par exemple, que l'on retrouve dans l'identification comportementale. Les domaines dapplications de ces technologies sont plus largement
dvous lauthentification didentit, dans le cadre de scurisation de donne ou de lieux, lamlioration des systmes de vido-surveillances, etc.

Depuis une dizaine dannes ce domaine se trouve au centre de projets en lien avec le traitement dimages, lindexation et la recherche des images par leur contenu. Dans ce champ des nouveaux medias, lapplication aujourdhui la plus rpandu de la dtection et de la reconnaissance des traits humains est celle de lidentification. Il sagit de permettre un regroupement, un classement des images par similarit de traits et donc leur indexation sous un mme tag. 1. Les principes En raison de la grande diversit des apparences dun visage humain, llaboration dun logiciel ddi sa dtection est une entreprise des plus complexes qui suggre de surmonter la variabilit des visages en termes de taille, de forme, de couleur ou encore de texture. Les difficults auxquelles font face les systmes danalyse de visages sont nombreux :
forte variabilit des paramtres intrinsques comme lexpression faciale et lorientation du

130

visage ; mais aussi des paramtres extrinsques comme les conditions de prises de vues de limage (surexposition, ombres portes sur le visage ) ou les occultations partielles.

Le but de la dtection faciale dans le champ de la photographie numrique est donc didentifier, partir dune image, les rgions o apparait un visage et ce quelle que soit sa position, son orientation, ou les conditions de luminosit. La dtection des visages sur une image est la premire tape indispensable llaboration dun systme de reconnaissance facial. Le but est ainsi de localiser et dextraire la rgion du visage de larrire plan de limage. Au dbut des annes 1970, la reconnaissance par le visage se base principalement sur des attributs faciaux mesurables comme lcartement des yeux, des sourcils, des lvres, la position du menton, la forme, etc. Une grande majorit des systmes se concentre
galement sur la dtection des yeux comme caractristique centrale. Les yeux semblent offrir un critre des plus aiss dtecter, lapparence du nez changeant avec la pose du visage et celle de la bouche avec lexpression faciale155. Depuis les annes 1990, les diffrentes

technologies utilises exploitent toutes les dcouvertes effectues dans le domaine du traitement dimage. Ainsi existent-il des techniques de reconnaissance par analyse du visage qui mettent en uvre un ou plusieurs dtecteurs bas niveau (contour, symtrie,
couleur ) et des mthodes bases sur lapparence qui sinspirent des algorithmes dapprentissage statique ou dynamique partir de modles. De nombreuses mthodes de dtection et de localisation des caractristiques faciales ont donc t dveloppes ces dernires annes prenant en compte des caractristiques

multiples. Pour que ces techniques soient des plus efficientes elles doivent se baser sur des lments du visage qui sont le moins susceptibles aux changements. Ainsi les grands traits suprieurs des orbites, les secteurs entourant les pommettes, les cts de la bouche et dautres caractristiques similaires sont les caractristiques physiques les plus stables et permettent dignorer les changements qui interviennent avec le temps. Trois mthodes sont principalement utilises par les fabricants de systmes biomtriques : lEigenface156, lanalyse de points particuliers et le traitement automatique de visage. Le traitement automatique de visage est une technologie rudimentaire, elle caractrise les visages par des distances et des proportions entre des points particuliers comme les yeux, le nez les coins de la bouche. Aussi prouv que les autres technologies,

155

Cf article sur lanalyse du visage en biomtrie en ligne http://www.biometrie-online.net/techno/visage/Tvis.php 156 Cf larticle Wikipedia pour plus dinformations http://en.wikipedia.org/wiki/Eigenface

131

le traitement automatique de visage est la plus efficace dans des situations de capture dimage avec peu dclairage. La technique dite de lEigenface utilise quant elle une reprsentation des lments caractristiques dune image de visage partir dimages modles en niveau de gris. Des variantes de Eigenface sont frquemment utilises comme base pour dautres mthodes de reconnaissance. Enfin lanalyse de points particuliers est la technologie didentification faciale la plus largement utilise. Si cette technologie se rapproche de lEigenface, elle permet de mieux sadapter des changements daspect facial tels que le sourire, le froncement des sourcils, etc. Le problme de la reconnaissance de visages dans le contexte dune base de donnes dimages pourrait se poser ainsi : tant donne une image de visage quelle est lidentit de la personne correspondante. Pour ce faire, il est ncessaire davoir des images de rfrence, sous la forme dune base de donnes de visages de toutes les personnes connues par le systme. A chaque visage est associ un vecteur de caractristiques. Ces caractristiques sont supposes tre invariantes pour une mme personne, et diffrentes dune personne lautre. La reconnaissance consiste alors comparer le vecteur de caractristiques du visage reconnatre avec celui de chacun des visages de la base. Une fois les oprations de dtection et danalyse de similarit des visages effectues intervient alors ltape dindexation. Chaque ensemble de visages similaires doit tre associ un tag, en loccurrence le nom de la personne, pour permettre non seulement le classement des photographies mais aussi leur recherche. Cette indexation rsulte la plupart du temps dune opration dannotation automatique des images telle que nous en avons dcrit le procd auparavant, annotation qui permet dassocier chaque catgorie de visages similaires cre lidentit nominative dune personne. 2. Les applications grand public Si les technologies de dtection des visages sont largement investis par le domaine de la surveillance et de scurit biomtriques, depuis quelques annes on assiste galement leur mergence au sein dapplications grand public. Depuis peu les constructeurs dappareils photos numriques ont dots les boitiers reflex et bridge de fonctionnalits nouvelles de reconnaissance des visages. Par cette option de mise au point lappareil est capable dadapter ses paramtres en fonction des objets dtects dans le champ. En parallle de la dtection des visages comme outil de prise de vue, ces technologies sont 132

apparues depuis quelques annes seulement au sein de logiciels de gestion personnelle des collections photographiques. Lenjeu pour les dveloppeurs est de prsenter cette technique comme une offre supplmentaire de classement des images, un systme de tri automatique des images selon les personnes dtectes mais facilitant galement grandement la recherche dune photo particulire. En 2006 Google acquire la start-up Neven Vision spcialiste des traitements de limage et des logiciels de reconnaissance photographiques. Celle-ci a dvelopp une technologie de reconnaissance faciale capable d'analyser des photos et documents vido la recherche de personnes, de lieux, et d'objets. Ce n'est pas toujours ais de faire une recherche sur vos photographies personnelles, et cela est certainement beaucoup plus difficile que de chercher sur le Web. A moins que vous preniez le temps de les nommer et de les organiser (...) les chances de retrouver la photo cache aux fins fonds de votre ordinateur sont minces peut-on lire sur le blog de Google157.

Cette alliance doit donc permettre au moteur de recherche daccrotre sa gamme doutils daide la gestion des collections personnelles dimages et donc damliorer les potentialits de Picasa.

Ill. 34 Capture dcran de lapplication de reconnaissance facial de Picasa

La fusion Google /Neven Vision a ainsi abouti ds 2008 lintgration dune fonction de reconnaissance automatique des visages au sein de la dernire version de Picasa, un outil plus spcifiquement accessible avec la mise jour de Picasa Web Albums. Avec sa
157

Traduit par nos soins, En ligne http://googleblog.blogspot.com/2006/08/better-way-to-organizephotos.html

133

technologie, Google simplifie grandement le processus de reconnaissance des visages puisque le service est cens les dtecter automatiquement. Aprs une analyse de chaque album, les photographies comportant un visage reprable sont slectionnes, il suffit alors l'utilisateur de renseigner le nom de la personne pour chaque visage dtect. Au fil des ajouts de photos dans les galeries, l'application est capable de suggrer automatiquement des tags en se basant sur les photographies prcdentes. Mike Horowitz, chef de produit de Picasa, affirme dans une interview accorde Stephen Shankland sur le site CNET158, que leur technologie fonctionne bien quand la personne fait face l'appareil photo , avouant qu'il y a un certain nombre de facteurs qui limitent les chances de russite, en particulier les vues de profil et les conditions de lumires difficiles . Disponible galement dans la nouvelle version de Picasa ddies aux Macs, cette application vient en concurrence du logiciel de gestion et de traitement dimages spcifique cette socit, iPhoto '09, apparu la mme poque sur le march. Apple dans la dernire version de son logiciel a ainsi inclus une option de reconnaissance faciale qui lui faisait jusqualors dfaut. iPhoto passe en revue les images stockes dans lordinateur de lusager afin de dtecter les visages. Lorsqu'un nom est associ par l'utilisateur un visage, l'ensemble des clichs qui correspondent une mme personne sont alors localiss.

Ill. 35 Capture dcran de la page Visages de iPhoto 09

158

Stephen Shankland, Revamped Google Picasa site identifies photo faces , CNET.News,2 septembre 2008, en ligne http://news.cnet.com/8301-17939_109-10026577-2.html?part=rss&tag=feed&subj=Webware

134

Une sorte de trombinoscope baptis Visages classe par nom les images de chaque individu identifi. De l, il est aussi possible par simple survol d'un clich dajouter l'identifiant Facebook de la personne, un lien privilgi avec le rseau social tant propos, au mme titre qu'avec le site de partage de photos Flickr. Il va sans dire que cette technologie nouvelle dindexation des images en fonction des personnes reprsentes, applique au champ de la vido, offre une perspective des plus intressantes en ce qui concerne la gestion des archives audiovisuelles. La reconnaissance et lindexation automatique des personnes sur les squences vidos par la cration dun moteur de fouille ddi laisse prsager un gain de temps de traitement documentaire important et une optimisation de lusage des collections en terme de recherche. 3. Les applications du Web Depuis peu sont galement apparues des sites Web spcialiss dans la reconnaissance des visages et proposant des applications centres sur cet outil. MyHeritage159 est un rseau social focalis sur la famille et la gnalogie. Il permet aux membres de crer leur propre site familial, de partager leur photos et vidos, de crer leur arbre gnalogique et de rechercher des anctres. MyHeritage permet de tagguer automatiquement ses photos grce un systme de reconnaissance facial. Le logiciel permet de dtecter automatiquement les visages humains sans que l'utilisateur n'ait tagguer ses photos, si la personne fait partie de l'arbre gnalogique, alors elle sera automatiquement reconnue. De plus et dans un versant plus ludique MyHeritage offre une technologie de reconnaissance faciale qui permet de dcouvrir quelle clbrit l'on ressemble le plus, ainsi quune application o les utilisateurs peuvent galement comparer la ressemblance d'un enfant ses parents. En 2007 une jeune socit sudoise a lanc Polar Rose160, un logiciel en ligne de reconnaissance faciale qui fonctionne partir des collections personnelles des usagers en ligne sur Flickr. Polar Rose permet aux usagers de classer, chercher et partager leurs images partir de leur contenu. Le site fonctionne ainsi comme un moteur de recherche caractre priv, capable de reconnatre les visages de ses propres collections dimages grce donc une technologie de reconnaissance faciale associe la cration d'un modle 3D partir d'images 2D, modle faisant abstraction de la luminosit et de tout autre facteur qui peuvent affecter le
159 160

http://www.myheritage.fr/ http://www.polarrose.com/

135

processus de reconnaissance. Plus concrtement le site fonctionne selon deux tapes, linstallation dAPI sur des sites partenaires, avec pour le moment des partenariats tablis entre le site, Flickr et Facebook, partir desquels limage en 3D est constitue et lgende. Le modle est ensuite intgr la base de donnes de Polar Rose. Un plug-in pour Firefox (une version pour Internet Explorer est l'tude), permet de chercher des images dans cette base de donnes partir d'un nom (et d'ventuellement corriger les mauvaises indexations).

Ill. 36 Capture dcran de loutil de reconnaissance facial dans lapplication Flickr

Comme tout systme de reconnaissance faciale, si la technologie est capable de crer une "empreinte visuelle" unique partir des photos, elle n'est pas capable de dfinir l'identit de la personne. Sil est bas sur des problmatiques dindexation et de recherche par le contenu, son fonctionnement savre encore largement tributaires de lindexation textuelle, seule une tape de renseignement du nom de la personne est garante dune utilisation probante du moteur. Loriginalit du site est davoir fait appel aux internautes pour rsoudre ce problme, l'aide dun plug-in mis leur disposition, ils pourront indiquer le nom et les informations concernant la personne reprsente. partir d'une certaine quantit de donnes rcoltes sur une mme personne, le systme pourra dterminer son identit sur une nouvelle photo, de faon automatique, et indpendamment de l'expression du visage ou de langle de prise de vue de limage.

136

III.
A.

Les enjeux de la recherche par le contenu


Le retour du texte ?
1. Les avantages du bi-modal

Certains moteurs du Web privilgient la combinaison texte-image lors dune session dinterrogation. On peut donc avec cette mthode avoir recours une image requte et la recherche par mot cl. La recherche par image exemple circonscrit des champs dusages trs spcifiques et difficilement adaptables un mode dutilisation des moteurs grand public qui demeure bien souvent bas sur la requte par mot-cl. Le principe de la recherche de document sur un moteur est dexprimer sa requte sous la forme d'une squence de descripteurs emprunts au mme vocabulaire que celui utilis pour l'indexation, le logiciel compare ensuite la requte et l'index pour proposer les documents dont l'index concide tout ou en partie avec la requte. Dans le cas dune indexation par des descripteurs dits de bas niveaux, ceux propres aux images que sont la couleur, la forme ou encore la texture, linterrogation des bases dimages ne peut se faire qu partir de requtes mettant en jeu un vocabulaire identique, on proposera donc des requtes par limage et non par des termes de haut niveau soit smantiques. On se trouve souvent face un cart entre le besoin de lutilisateur, quil dsire exprimer en langue naturelle et qui est de trs haut niveau smantique, et les descriptions des images dont on dispose, qui sont, elles, de bas niveau smantique. Entre l'homme capable d'appliquer une grille smantique sur un contenu visuel et la machine capable de lire des pixels et de calculer des algorithmes complexes, le foss smantique n'a toujours pas t franchi, On obtient de manire automatique des descripteurs qui refltent le contenu physique des documents, et l'indexation manuelle permet d'obtenir des concepts interprtant le document dans son contexte. Il y a donc un gouffre smantique entre les descripteurs physiques de l'analyse automatique et les concepts smantiques de l'interprtation manuelle.161 Cest ce quon nomme le semantic gap : comment traduire la

Bruno Bachimont : L'indexation automatique - enjeux, possibilits et limites [en ligne]. Disponible sur : http://www.culture.gouv.fr/culture/dglf/rifal/indexation.htm

161

137

recherche dune image illustrant des thmes ou concepts prcis partir dune indexation par descripteurs de couleur ou de forme. Tout le but des nouveaux projets sur la recherche dimages par le contenu est de gnrer du contenu smantique sur des fichiers visuels, de dpasser le foss smantique. Il sagit dindexer par le contenu pour arriver une automatisation de lindexation smantique, aboutissant llaboration de moteurs de recherche hybrides, permettant la fois une recherche en langage naturel et une slection des images par similarit, proximit visuelle. Constatant les usages spcifiques qui dcoulent dune requte entirement visuelle, les recherches ont tendance depuis peu saxer de plus en plus vers la cration doutils bimodaux, privilgiant la combinaison texte-image lors dune session dinterrogation. Cette mthode permet dallier la fois lutilisation dune image requte et dy associer une annotation textuelle, ou de dbuter par une recherche smantique classique puis daffiner les rsultats par comparaisons dimages selon des descripteurs spcifiques. Les avantages de l'annotation automatique d'images par rapport la recherche d'image par le contenu (CBIR) sont que les requtes peuvent tre spcifies plus naturellement par l'utilisateur, sous forme de requte textuelle. Dans les systmes de CBIR, l'utilisateur doit rechercher les images par des concepts tels que la couleur ou la texture, ou alors doit donner une image exemple pour laquelle il souhaite trouver des images similaires. Les moteurs bimodaux confrent une aisance dutilisation aux usagers et sont galement capables de grer des collections dimages non seulement importantes mais aussi croissantes, puisque lindexation textuelle est gnre automatiquement. 2. Conservation et partage des annotations

Lun des problmes dans la circulation des images sur le Web est la perte des donnes informationnelles entourant limage. Si une image est mal renseigne, notamment au travers de ses mtadonnes, lon peut aboutir lobtention dimages esseules, images se retrouvant dans le flux du Web sans informations contextuelles. Le systme des moteurs de recherche de type Google Images, bas sur une indexation textuelle des images faite partir des informations les entourant, savre dune efficacit encore limite, ces moteurs offrent toutefois la possibilit de replacer limage dans le contexte de la page Web, de lui confrer parfois quelques lments de contexte. Le problme au sein des interfaces de recherche par limage, de recherche par le contenu est labsence de prise en compte des lments contextuels de limage. L o le 138

gotagging replaait tout du moins limage dans un horizon gographique, les moteurs de recherche par le contenu semblent abstraire limage de la sphre informationnelle pour ne garder que les caractres visuels alors seuls critres dintelligibilit, de lecture de limage. Cette lacune semble dcuple avec les interfaces fonctionnant en amont partir des sites tel que Flickr, puisquon assiste une sorte de double abstraction de limage, celle-ci dj dans le flux de son site source se trouve nouveau extirpe par le moteur. Un nombre toujours croissant doprations est alors ncessaire pour retrouver sa source, son photographe et autres dtails, sil en est, de sa prise de vue. En plus de son interface de visualisation 3D, le projet Photo Tourism162 avait galement prvu de mettre au point un systme permettant non seulement de conserver les annotations des images, mais aussi den gnrer pour celles sen trouvant dpourvues. Dans cette application de mise en relation des images gographiquement proches jusqu la recration dun paysage en 3D, les auteurs avaient donc envisag la possibilit de confrer aux images une strate informationnelle venant se surajouter la dimension de contextualisation gographique. Il sagissait l de prmisses lide dune annotation smantique automatique des images, dans le projet toutes celles partageant les mmes coordonnes ou certaines suffisamment proches se voient attribuer les mmes informations. Un glissement dannotations dune image lautre tait donc prvu, opration effectue non en fonction dune analyse visuelle des images mais selon leur localisation, critre alors conu comme dterminant dans lattribution ou non des informations aux images.

B.

Des prospectives vise commerciales

Si lindexation par coordonnes gographiques et les interfaces cartographiques ddies la recherche dimages circonscrivent, comme nous lavons vu, une sphre iconographique particulire, les moteurs de recherche dimages par le contenu tendent pour leur part ne prendre en compte que certains types de recherche. Les diffrentes formes de requte permises par ces moteurs dcrivent des dsirs et pratiques documentaires spcifiques voire professionnelles, pas toujours adapts une utilisation grand public de ces techniques.

162

Voir Chapitre 3, p.

139

1.

Pour quels usages dans la sphre de lusager non pro ?

Les besoins dimages, leurs utilisations et les faons dinterroger une base de donnes varient considrablement dun usager lautre, selon quil soit journaliste, historien, artiste ou simple curieux, un internaute agit toujours selon un besoin particulier luvre derrire la question. Si certains internautes peuvent vouloir accder aux images par lintermdiaire de la description de leur contenu visuel, couleur, texture et forme, dautres nenvisagent la recherche qu partir de mots-cls, du recours au sens smantique. Le point commun des moteurs de recherche dimages par le contenu est quils fonctionnent selon le critre de similarit visuelle, les descripteurs de bas niveaux appliqus sur les images ayant pour fonction de permettre cette recherche de limage ressemblante. Les systmes de recherche dimages dvelopps jusqu prsent ont pour la plupart tenu compte des diffrents niveaux et types dusages, ils ont ainsi multipli les modes de requtes dans le but de rpondre aux divers besoins dimages manifests par les utilisateurs. Tous proposent, et pour certain de faon exclusive, la requte par image exemple. Si ce mode dinterrogation de la base de donnes semble rvolutionnaire et inscrit loutil dans le pur champ de la recherche visuelle, permettant de se librer du recours jusqualors systmatique au mot, la question qui merge lusage est alors celle de son intrt. Car ce mode de recherche, aussi novateur quil puisse tre, soulve par la mme occasion quelques limites, privant de son emploi lutilisateur indcis ou nayant pas dide, dexemple soumettre. On peut galement se demander si lutilisation dune unique image exemple nengendre pas une spcification limite de la recherche, excluant de ce fait des images moins visuellement proches selon les critres des descripteurs mais tout aussi pertinente dans le domaine du sens. Du point de vue des usages enfin, le public non expert peut trouver laborieux de manipuler et de juger de limportance des paramtres de recherche dtaille que sont la couleur, la forme ou la texture qui permettent dobtenir plus de prcision mais se rvlent moins intuitif que le texte. On en revient ainsi au problme dj voqu du foss smantique, pouvant faire rencontrer lusager des difficults dans la formulation de ses besoins sur des interfaces ou le recours au texte nest le critre ni prdominant ni fonctionnel. Lutilisation des moteurs image requte circonscrit donc un type de recherche particulire, prcise et dtermine, loin des schmas de navigation hasardeuse, et semble donc sadresser un public averti. Nous pouvons pour lexemple nous rfrer Tineye, le moteur fonctionne partir dune image requte sur laquelle seffectue une recherche globale. Le retour de rsultats est bas non 140

sur la proximit visuelle mais sur lexactitude iconique, seules les images identiques lexemple sont recherches. Le recours une image exemple est dans ce cas absolument ncessaire, sans elle aucune recherche nest possible. partir de ce principe une application phare du moteur, prne par la socit cratrice, est la dtection des copies dimages illgales circulant sur le Web (cf. partie suivante). Dans loptique dune utilisation plus grand public, moins spcialiste, du moteur, ce dernier peut galement permettre de rechercher lorigine des images du net. La circulation incessante des documents sur Internet engendre lapparition de nombreuses images orphelines , documents ayant au cours de leur emploi et remploi fini par perdre une partie de leurs informations, de leur contexte, aboutissant souvent une restriction de leur sens. Lusager curieux peut envisager avec Tineye de remonter au site source dune image, ou du moins de trouver des pages Web o le document possde encore certaines informations, o son histoire est relate, et pourquoi pas de comparer, travers les diffrents sites recenss, les divers modes de prsentation de la dite image, lusage qui en est fait. Dautres moteurs, conscients du manque dintuitivit de la requte exemple, permettent le recours au mot-cl pour dbuter la recherche, et loption de comparaison de similarit dans un second temps, encore faut-il pour que le systme savre efficace que les images soient textuellement correctement indexes. On comprend dans ce contexte limportance que revtent les recherches sur lannotation automatique des images, systmes pouvant permettre comme nous lavons vu la fois une interrogation intuitive de la base parce que langagire et une comparaison des images selon leur critres propres, visuels. Si beaucoup de moteurs de recherche dimages peuvent par bien des cts apparatre comme des solutions plus ludiques que vritablement performantes ou essentielles, un systme se dmarque toutefois : la reconnaissance faciale. Cette technique est aussi bien prise des professionnels qui voient en elle la possibilit de reprer plus aisment les documents dans lesquels une personne apparait, quelle se dveloppe de plus en plus sous forme de logiciels ou de sites Internet usage du grand public. Les utilisations possibles de la reconnaissance faciale sont nombreuses et facilement accessibles aux usagers les plus novices. Il devient ainsi possible de retrouver les photos d'une personne dtermine sur les sites communautaires ou les sites d'information, regrouper ses photos de famille dans le cas des logiciels ou sites de gestion des images, identifier des personnes sur des documents informatifs. Face la profusion de clichs disponibles sur le net, ce type de solution est une nouvelle alternative aux mthodes de recherche et de classification 141

reposant essentiellement sur des informations textuelles. Le recours au mot-cl, devenu nom de la personne, est dans ce cas indispensable, et offre par consquent une bonne adaptabilit du systme aux besoins des utilisateurs mme si ici aussi les usages sont spcifiques et se doublent dune circonscription du champ iconique aux photographies, images de personne. Les sites en ligne qui dveloppent ce systme misent lefficacit et lexhaustivit de leur indexation sur la participation des usagers, il reste encore dterminer si les utilisateurs joueront le jeu de cette tape d'identification, tout comme il reste mesurer en quoi ce systme offre une relle efficacit de classement des images aux particuliers. 2. La fin du piratage des images ?

Pour de nombreux photographes et agences, la diffusion de photographies sur Internet est un moyen simple et rapide de faire connatre leur travail ou collection et donc daccroitre leur public. Si le nombre dimages disponibles sur le Web ne cesse daugmenter, le nombre de copies, de rutilisation illgale des images augmente lui aussi. Publier une image sur Internet ne signifie pas labandon des droits dauteurs, si des communauts de dfenseurs de la culture libre ont dvelopp ces dernires annes des formes de licences permettant un libre remploi des images par les internautes, comme le prne Creative Commons, la plupart des images circulant sur le Web sont toujours soumises copyright et donc une lgislation stricte quant leur acquisition ou utilisation. Il existe deux types de "vol" de photographies : La copie pure et simple, qui implique au voleur de prlever (par exemple par

copier-coller, glisser-dplacer) et d'hberger nouveau le fichier image sur son site, page personnelle de blog. Une autre technique est le hotlinking de l'image, de plus en plus rpandu, et

pourtant illgale. Le hotlink est l'affichage d'une image en la prenant directement la source du site qui la propose. Au lieu d'enregistrer l'image sur son ordinateur et ensuite de linsrer sur son blog ou site, on utilise directement l'url de cette image pour la publier. Cette technique, pour qui connat les rouages des serveurs Web, est dcelable et contournable relativement facilement. La copie dimage en revanche s'avre sensiblement plus difficile contrer. Des mthodes existent pour limiter le vol d'images sur Internet, en grant la dfinition, la taille daffichage des images, par la dsactivation du clic-droit de la souris supprimant loption de copiage de limage. Il est galement possible dempcher le glisser-dplacer 142

dune image, ou louverture de la barre de gestion des images. Toutes ces techniques demeurent toutefois limites, fastidieuses et ne se prsentent pas en outil dissuasif. Jusqu prsent la dtection des images voles , ne pouvait seffectuer qu partir de Google Images. Le moteur savre dans ce cas de figure simple dutilisation mais moyennement efficace. Google propose au travers de son outil ddi aux images de pouvoir rechercher selon divers critres, mots-cls tout ce qui est affichable sous forme de fichier bitmap : photographies, schmas, dessins, etc. Une recherche sur les mots-cls lis vos images phare permet donc de dceler d'ventuels sites les utilisant sans autorisation. L'une des facilits de Google Images est de permettre de rechercher toutes les images hberges sur un domaine donn. Indexes dans sa base de donnes, cette option permet notamment de dtecter les hotlinks. Les limites videntes du recours Google pour ce genre de dtection dimages sont lies aux limites dindexation connues par le moteur. Quil sagisse des images du dtenteur des droits ou de celles du copieur , elles doivent tre indexes sur le moteur, pour que la recherche soit oprante. Or, lindexation des images sur GI est non seulement lente mais aussi fluctuante, certains blogueurs rapportant par exemple la dsindexation puis rindexation rgulire de leurs images, la prise en compte par le moteur dune partie seulement de leurs images en ligne. De plus comme toute recherche effectue sur Google la dtection sopre partir des mots-cls de la requte ou du texte entourant limage et non en fonction de limage elle-mme. Dans ce contexte on mesure combien lapparition du moteur de recherche Tineye est en passe de rvolutionner la dtection des usages illgaux dimages. Par sa capacit dtecter non pas les images ressemblantes mais identiques, sa robustesse au recadrage et variation de couleurs Tineye fait preuve dune grande performance en la matire. Lapplication a dj intress lAFP et Getty Image clients qui ont pass des accords avec la maison mre de Tineye, Ide Inc. Le site offre ainsi la possibilit pour les auteurs, les agences ou tous les dtenteurs de droits de vrifier les diffusions et usages illgaux des images sur internet, de retrouver les sites sur lesquels sont diffuss des photographies, logos, tout type dimages soumis des droits. Demain avec la recherche de vidos, que TinEye annonce disponible pour la fin de lanne 2009, le moteur pourrait permettre la fois de suivre la diffusion et la propagation dune vido virale, tout en offrant une nouvelle solution pour surveiller et raliser la protection de droits audiovisuels sur Internet.Dans un versant commercial toujours mais plus marketing, Tineye peut aussi permettre aux agences de communication, publicitaires de vrifier si une photographie, un logo est dj utilis ou non. Ce type de recherche 143

visuelle peut avoir un impact potentiel fort sur les ventes des images proposes par les microstocks (Fotolia, istockfoto,etc.) puisquil devient non seulement simple mais aussi rapide de vrifier si l'un des annonceurs concurrents utilise ou non le mme visuel, et le cas chant d'en choisir un diffrent. Des exemples de ces applications sont ainsi visibles sur la page Cool Searches163 de linterface. Bien sr et au mme titre que Google image, lune des conditions de lefficacit de la recherche est lindexation des images par le moteur, lheure actuelle Tineye assure avoir index 1 043 884 366 images du Web et continue de le parcourir.

Ill. 37 Capture dcran du module Cool Searches de Tineye

3.

Lenjeu des sites marchands

Si Tineye se place dans le crdo dune utilisation commerciale, les autres sites de recherche par similarit cette fois ne dpareillent pas. Des applications telles que Gazopa ou Xcavator ne masquent pas leur vise lucrative, Xcavator par son affiliation avec des sites de microstocks ou des banques dimages en ligne se positionne, selon son propre slogan comme un moteur de recherche dvou aux professionnels, permettant aux agences de communication de trouver plus facilement une image daprs leur souhait. Gazopa quant lui, se destine de faon plus affirme au grand public, si comme nous lavons mentionn, des options ludiques de recherche sont proposes, lapplication phare du site est sa capacit aller chercher des images similaires au sein des pages de site marchand. Ainsi un utilisateur effectuant une requte par dessin ou tlchargeant une image de botte, de voiture, se verra proposer des rsultats issus de vendeurs en ligne mls
163

http://tineye.com/cool_searches

144

des images vise non commerciale. Lutilisation de Gazopa semble destine long terme devenir bien plus un moteur de recherche de produit similaire que dimages proprement parler. Si pour linstant les sites et images indexs sont encore peu nombreux et essentiellement dorigines anglo-saxonnes, le dveloppement de linterface, encore en Beta priv, promet doffrir une gamme varie dutilisation aux usagers. L o Gazopa se dmarque et semble envisager de faon pertinente les potentialits, la fois pratiques et conomiques, de la recherche par le contenu se retrouve du ct de son plugin pour iPhone. Par la combinaison du camphone, de lcran tactile et de la 3G, il devient possible dinterroger la base de donnes de Gazopa de faon embarque. La recherche sur mobile seffectue en temps rel, instantanment, devant un objet devenant image, sujet de requte.

Ill. 38 Capture dcran de la prsentation de loption pour I Phone de Gazopa

L'ide rejoint celle de l' " Internet des objets " rve pour les technologies sans fil courte porte, une technologie cratrice de liens entre l'Internet et les objets physiques. Si ces nouveaux modes de recherche et dinterrogation des donnes du Web semblent favorables lusager, le constituant en sujet toujours connect, ces technologies sont galement largement lucratives pour les entreprises pouvant leur assurer des retombes ludiques et publicitaires.

145

Selon un principe proche, le projet Point & Find de Nokia164 est en dveloppement depuis plus d'un an et demi et cherche faire concider reconnaissance de forme et contenus mobiles. Une version Beta prive du logiciel et consacre au cinma est d'ores et dj disponible au Royaume-Uni et aux tats-Unis. Le principe est simple : un objet photographi avec l'appareil d'un tlphone portable et soumis la base de donnes du projet permet de dclencher en retour certaines actions. Il est possible, daprs les vidos de dmonstration, de viser l'affiche d'un film, ce qui, aprs analyse, permet de recevoir en retour des informations sur celui-ci ou un lien vers sa bande-annonce. Ce nouveau type dapplication peut tre galement un excellent support publicitaire interactif et permet denvisager de nouvelles pistes marketing, sous rserve de matriser les diffrents aspects : reconnaissance de forme, comparaison avec une banque d'images et identification de l'objet. La socit invite d'ailleurs les professionnels intresss par le procd se manifester pour imaginer les applications et campagnes publicitaires de demain. Nokia Point & Find et les autres applications du genre peuvent se constituer en maillon d'un environnement plus vaste prenant en compte notamment le positionnement GPS.

164

Cf http://pointandfind.nokia.com/?home

146

Conclusion
Les systmes dindexation et de recherche par le contenu sont ils en passent de rvolutionner le traitement des images sur le Web ? Apparues comme nous lavons vu ds les annes quatre vingt dix et largement dveloppes depuis, ces techniques de description et de catgorisation visuelle des images peinent donner des systmes pertinents de recherche dimage en raison du manque de fiabilit de leur mthode dindexation. travers lobservation mene des divers moteurs de recherche par le contenu aujourdhui en ligne nous avons ainsi pu constater les limites non seulement techniques mais aussi dusages de ces derniers. Au travers des divers exemples voqus apparat la difficult de passer, pour lusager, dautomatismes de recherche bass sur le langage naturel des requtes exprimes par le sondage de limportance des diffrents descripteurs, vecteurs visuels. Toutefois ces moteurs ne doivent pas tre considrs comme des outils annexes ou anecdotiques, ils semblent de plus en plus mme doffrir une aide efficace dans le cas dun besoin spcifiques dimage. Que se soit par exemple pour la dtection de copies circulant sans droit avec Tineye, pour une recherche avance dimages professionnelles avec Xcavator, ou pour la reconnaissance faciale qui a fait son entre de puis peu au sein des logiciels de gestion des bases dimages personnelles, les applications dindexation et de recherche par le contenu senvisagent dans des pratiques spcialises. Une utilisation ludique de ces moteurs est bien sr possible, la simplicit, lergonomie des interfaces y invitant souvent. Nanmoins, si lon considre la fonctionnalit premire de ces technologies, savoir la recherche dimages sur le Web, leur usage appelle un public averti, ayant dj dfini ses besoins prcis en termes de couleur, de forme, de rendu global de limage.

Si le monde de la recherche scientifique sest vertu dans lintimit des laboratoires et depuis peu au grand jour mettre au point des systmes de traitement documentaire automatique des images, le Web na toutefois pas attendu aprs eux pour dvelopper des mthodes dindexation applicables aux sources iconiques. Depuis ces dernires annes de nouveaux moyens pour indexer, rechercher, naviguer au sein de bases iconographiques ont vu le jour. Du cot de la recherche par mots cls tout dabord avec laffinage des critres de requte sur Google ou plus spcifiquement avec 147

lapparition de la folksonomie projetant lindexation dans une sphre collaborative et sociale. Loin de ne figurer quun simple outil de gestion des images en ligne les tags apparaissent alors comme autant de voies de communication entre usagers, de lieux dchanges et dexpressivit. Dautres systmes ont galement merg reposant pour leur part sur une prise en compte plus importante des donnes propres chaque image et facilement exploitable que sont les mtadonnes et en particulier les coordonnes gographiques. Le gotagging envahit peu peu le Web et avec lui se dessinent une sphre iconique ddie et de nouveaux usages documentaires centrs sur la notion de territoire. Lespace physique semble rinvestit, augment par nos pratiques visuelles. Mit en perspective avec ses diverses reprsentations cartographiques en ligne il senrichit dautant dlments contextuels, historiques, sociaux, et dans un mouvement circulaire nos sources gotaggues profitent leur tour de ce regain dinformations spatialises.

La sphre visuelle du Web demeure constitue de systmes dindexation dimages plus ou moins bricols, adapts tant bien que mal du texte aux images. Si les mthodes de gestion documentaire des images semblent htrognes, il en est de mme des offres, des possibilits de recherches demeurant plus que disparates mais pourtant fonctionnelles et adaptes semble-t-il des usages spcifiques. En labsence dun systme dindexation unifi des images tel quil en existe pour le texte, il convient alors peut-tre de considrer chaque systme existant comme un rvlateur de pratiques visuelles particulires, quil a engendres ou dont elles rsultent. Cette tude nous fait dune part repenser la ncessit dun systme uniformis de traitement de limage sur internet et nous laisse envisager dautre part lutilit dune varit de techniques qui semblent aller de pair avec la diversit des usages et requtes faites sur le web et de leurs perptuelles volutions. Les systmes dindexation existants sont donc compris comme des solutions certes limites mais adaptes chacune des pratiques particulires et des corpus iconographiques spcifiques.

Cette tude a galement permis de souligner limportance du rle du photographe amateur dans la constitution de corpus iconographiques, de collections dimages raisonnes, de base de donnes navigables, bref dans la circulation des images sur le Web. Une circulation de plus en plus documente, vectrice dchanges, de sociabilit et de

148

crativit. Selon Henry Jenkins165, la possibilit offerte aux gens de sapproprier et de diffuser du contenu (grce aux outils darchivage, dannotation, et aux technologies dchanges de donnes), aboutit lapparition de nouvelles formes de crativit, et un rinvestissement actif du sujet dans la sphre culturelle. Ainsi se dessine trs nettement le retour de lamateur praticien, au moment mme o un nouveau tournant social et conomique surgit avec lancrage des socits modernes dans lre de lhypermdia, du numrique. Nous assistons aujourdhui une dmocratisation constante de lacquisition des technologies informatiques et denregistrements. Les foyers squipant de plus en plus en appareils multimdia, cette dmocratisation aboutit lmergence dune figure renouvele de lamateur, dun nouveau public-acteur dans le paysage artistique et culturel. Pour Jean-Louis Weissberg166 les offres varies de logiciels de traitement dimages, dchantillonnages musicaux, de botes outils accessibles tous, encourageant la cration de documents au sein des familles. Pour lauteur, ces Home multimdia 167permettent de faire voluer les pratiques de rception vers celles de production, replaant ainsi lamateur dans une logique dinventions, dans une pratique crative. Cette implication croissante du public dans la production et les politiques dchanges des informations sur le Web nest pas sans avoir de consquences sur la notion mme de document. On assiste louverture du Web sur un champ non scientifique ou officiel, son ouverture sur les donnes personnelles des gens devenant entits informationnelles, Si le Web favorise une transgression de lordre documentaire ordinaire, inversement il documentarise des expressions qui relevaient autrefois de lintime et de lphmre en les enregistrant, les traant, les indexant. 168. Le Web favorise conjointement deux mouvements jusque l opposs : le dveloppement d'changes spontans, conversations verbales ou visuelles et leur fixation sur un support public, prenne et document.

Enfin quen est-il des rves originels dune recherche de limage par limage, de laffranchissement des images de la sphre du texte sensment alinante et limitative qui avaient motives les premiers projets dune recherche dimages partir, et partir
Henry Jenkins, Convergence Culture. When old and new media collide, New York University Press, New York, 2006. 166 Jean-louis Weissberg, Prsence distance, lHarmattan, Paris, 1999, p 187-192. 167 Ibid, Lamateur : mergence dune figure politique en milieu numrique , in Multitudes, n5, mai 2001. 168 Jean Michel Salan, Web, Texte, conversation et redocumentarisation, Presses Universitaires de Lyon, 2008, en ligne http://jadt2008.ens-lsh.fr/IMG/pdf/JADT-2008-JMS.pdf
165

149

seulement, de leur critre visuels ? Aux vues des implications du gotagging au sein des plateformes de partage dimages, du recours presque toujours ncessaire de tags lexicaux dans le cas du gotagging et en considrant enfin les projets les plus rcents dannotation textuelle automatique des images, il semble que les perspectives dautonomisation des images ne soient plus aujourdhui que de simples utopies. Les images ont besoin des mots pour tre indexes, mais aussi recherches, trouves. Malgr les meilleures interfaces de navigation visuelles, nous en revenons toujours au champ lexical pour dfinir une requte. Les travaux de recherche dans le champ de lindexation des images se poursuivent mais dans une optique de gnration automatique dannotation des contenus iconiques. Des recherches menes plus loin non seulement pour des raisons duniversalit des savoirs mais aussi et surtout parce que les mots sont toujours le seul moyen pour les rgies publicitaires de contextualiser leurs annonces. En ce temps croissance fulgurante des donnes du Web, aussi bien textuelles que visuelles, o le Web devient une machine documentariser, vritable continent documentaire sans prcdent, les socits ont plus que jamais besoin doutils leur permettant dutiliser les informations disponibles comme support de leur visibilit. Ainsi apparat-il peu peu au sein du Web une dichotomie entre pratiques visuelles vernaculaires et spcialises, vritable partition entre une indexation formelle et technicienne dune part et une indexation sociale de lautre. La sphre officielle et professionnelle visible sur le Web rvle des besoins dune mise au point de systmes stables dindexation visant un traitement des images des fins bien souvent commerciales. A ses cts merge un Web dont les contenus ouverts et crs par des utilisateurs lambda engendrent un foisonnement de pratiques nouvelles. Notre travail a ainsi dvoil comment le Web 2.0 tend se concevoir comme un espace dexprimentations touchant galement les systmes dindexation et leur rappropriation par les usagers travers le prisme des pratiques sociales.

150

Bibliographie

Histoire de la photographie et thorie de limage

Barthes Roland, Rhtorique de limage , Communication, n4, 1964.

Debray, Rgis. Vie et mort de l'image, Paris, Gallimard, 1994. 526 p.

Gunning Tom, La retouche numrique l'index. Pour une phnomnologie de la photographie , tudes photographiques, n 19, dcembre 2006, p. 96-119, en ligne
http://etudesphotographiques.revues.org/index1322.html

Gunthert Andr, Poivert michel, LArt de la photographie, des origines nos jours, Paris, Citadelles & Mazenod, 2007, 620 pages

Jenkins Henry, Convergence Culture. When old and new media collide, New York University Press, New York, 2006

Jonas, Irene, la photographie de famille au temps du numrique , Enfances, familles, Gnrations, n7, automne 2007.

Joschke, Christian, Aux origines des usages sociaux de la photographie , Actes de la recherche en sciences sociales, n154, avril 2004, p 53-65.

Foucault Michel, Les mots et les choses. Gallimard, Paris, 1966. 405 p.

Krauss, Rosalind, Notes sur l'index , L'Originalit de l'avant-garde et autres mythes modernistes, Paris, Macula, 1993, p. 69.

Rubinstein Daniel et Sluis Katrina, life more photographic, Photographies, Vol n1, septembre 2008. 151

Weissberg, Jean-louis, Lamateur : mergence dune figure politique en milieu numrique , Multitudes, n5, mai 2001.

Weissberg Jean-louis, Prsence distance, lHarmattan, Paris, 1999, p 187-192. Patrick Peccatte, Notes sur la structure informationnelle de la photographie , Du bruit au signal (et inversement), 5 aout 2008, en ligne
http://blog.tuquoque.com/post/2008/08/05/Notes-sur-la-structure-informationnelle-de-laphotographie

Gestion et traitement documentaire lre du numrique


Gnralits

Association des archivistes franais, Abrg darchivistique : principes et pratiques du mtier darchiviste , Association des archivistes franais, Paris, 2004, p. 259-263.

Roger T Pedauque, Document : forme, signe et medium, les re-formulations du numrique, Paris, ENSSIB, 2003, en ligne http://archivesic.ccsd.cnrs.fr/docs/00/06/21/99/PDF/sic_00000511.pdf

Salan, Jean-Michel, Le dfi du numrique : redonner sa place la fonction documentaire, ADBS,2008, en ligne https://papyrus.bib.umontreal.ca/jspui/bitstream/1866/2225/1/salaunjm-defi-documentaliste-mktg.pdf

Salan jean Michel, La redocumentarisation, un dfi pour les sciences de linformation , tudes de Communication n 30, Entre information et communication, Les nouveaux espaces du document, Universit de Lille3, dcembre 2007

Salan

Jean-Michel,

Web,

texte,

conversation

et

redocumentarisation,

Presses

Universitaires de Lyon, 2008, en ligne http://jadt2008.ens-lsh.fr/IMG/pdf/JADT-2008JMS.pdf

152

Sutter Eric, Pour une cologie de linformation , Documentaliste - Sciences de linformation, no 2, vol. 35, 1998, p. 83-86

Zacklad Manuel, Rseaux et communauts dimaginaire documdiatises , in Skare, R., Lund, W. L., Varheim, ., Document (Re)turn, Frankfurt, Peter Lang, 2007, 279-297, en ligne : http://hal.archivesouvertes.fr/docs/00/18/01/85/PDF/imaginaire_document_Skare_Lund_V arheim.pdf

Indexation des documents visuels

Bachimont Bruno. Bibliothques numriques audiovisuelles : des enjeux scientifiques et techniques. , Document numrique, 1998, vol. 2, n 3-4, p. 219-242

Bachimont, Bruno, Image et audiovisuel : la documentation entre technique et interpretation. Critique et perspectives , Documentaliste-Sciences de linformation, 2005/6, Volume 42, p. 348-353

Bachimont Bruno, L'indexation automatique - enjeux, possibilits et limites [en ligne]. Disponible sur : http://www.culture.gouv.fr/culture/dglf/rifal/indexation.htm

Didier, Marie, Indexation, structuration et encodage des fonds iconographiques : le fonds Lon Lefebvre de la Bibliothque Municipale de Lille , mmoire dtude, Ecole Nationale Suprieure des Sciences de lInformation et des Bibliothques, Paris, 2005, (en ligne : http://www.enssib.fr/bibliotheque-numerique/document-809

Kattnig, Ccile En quoi les nouvelles technologies renouvellent-elles le traitement intellectuel de limage ?, Actes de colloques tenu les 23 et 24 octobre 2003 Lyon dans le cadre des rencontres nationales cdidoc-fr, 2003, en ligne http://www2.acrennes.fr/testscdi/rencontrelyon/kattnig/kattnig.pdf

Manzarena Antoine, lindexation dimages, [en ligne], disponible sur : http://www.abhatoo.net.ma/index.php/fre/content/download/2563/28254/file/Indexation%2 0d'images.pdf

153

Indexation du Web et mtadonnes

Boutin, ric, Ertzscheid, Olivier, Gallezot, Gabriel Perspectives documentaires sur les moteurs de recherche : entre srendipit et logiques marchandes, 2007, en ligne : http://hal.archivesouvertes.fr/docs/00/17/21/69/PDF/ertzsgallbout.pdf

Dublin Core Metadata Initiative, DC-Library Application Profile (DC-Lib), en ligne : http://dublincore.org/documents/2004/09/10/library-application-profile/

Ertzscheid Olivier et Gallezot, Gabriel Etude exploratoire des pratiques dindexation sociale comme une rengociation des espaces documentaires. Vers un nouveau big bang documentaire ? , Document numrique et socit, ADBS ditions, 2006, (en ligne : http://affordance.typepad.com/mon_weblog/files/sdndocsoc.pdf

Kobayashi, M. and Takeda, K, Information Retrieval on the Web, ACM Computing Surveys, 2000, Vol.32, No.2, 144-173.

Peccatte Patrick. Mtadonnes: une initiation Dublin Core, IPTC, EXIF, RDF, XMP, etc., en ligne : http://peccatte.karefil.com/Software/Metadata.htm

Folksonomies et pratiques sociales de la photographie amateur


Aurnhammer M, Hanappe P, Steels L, Integrating collaborative tagging and emergent semantics for image retrieval, In Proc. of the Collaborative Web Tagging Workshop (WWW 06) (May 2006) http://www.semanticmetadata.net/hosted/taggingws-www2006files/17.pdf

Boyd Danah, Marlow Cameron, Naaman Mor, Davis Marc, Tagging Paper, Taxonomy, Flickr, Academic Article, To read, Proceedings of Hypertext 2006, New York: ACM Press, http://www.danah.org/papers/Hypertext2006.pdf 154

Burgess Jean, Vernacular Creativity, Cultural Participation and New Media Literacy: Photography and the Flickr Network, AoIR 7.0: Internet Convergences, Brisbane, Australia, September 2006

Cardon Dominique et alt., The Stength of Weak cooperation: Case Study on Flickr, 2008, [en ligne], disponible sur http://hal.archives-

ouvertes.fr/docs/00/25/66/49/PDF/weak-coop-flickr-v1.1.pdf

Crepel, Maxime, Les folksonomies comme support mergent de navigation sociale et de structuration de linformation sur le web , Rseaux, n 152, juin 2008, p. 169-204, en ligne : http://www.cairn.info/revue-reseaux-2008-6-p-169.htm

Golder Scott . & Huberman Bernardo, The Structure of Collaborative Tagging Systems, Information Dynamics Lab, HP Labs, 2005, En ligne :

http://www.hpl.hp.com/research/idl/papers/tags/tags.pdf

Le Deuff Olivier, Folksonomies : Les usagers indexent le web , BBF, 2006, n 4, p. 6670, en ligne http://bbf.enssib.fr

Marieke Guy, Tonkin Emma, Folk-sonomies. Tidying up Tags? , Dlib Magazine , N 1, Volume 12, 2004, en ligne : http://www.dlib.org/dlib/january06/guy/01guy.html

Van House Nancy et alt, From 'What?' to 'Why?': The Social Uses of Personal Photos, School of Information Management and Systems, University of California, Berkeley, 2004, en ligne http://people.ischool.berkeley.edu/~vanhouse/van%20house_et_al_2004a.pdf

Gotagging

Kentaro Toyama et alt., Geographic Location Tags on Digital Images, in Proc. ACM Conference on Multimedia, October, 2003.

155

Seitz M. Steven, Snavely Noah, Szeliki Richard, Photo Tourism: Exploring Photo Collections in 3D, ACM Transactions on Graphics (SIGGRAPH Proceedings), 2006, 835846, en ligne http://phototour.cs.washington.edu/Photo_Tourism.pdf

Torniai Carlo et alt., Sharing, Discovering and Browsing Geotagged Pictures on the Web, 11 mars 2009, en ligne http://www.hpl.hp.com/personal/Steve_Cayzer/downloads/papers/geospatial_final.pdf

Naaman Mor., Paepcke Andreas et Garcia-Molina Hector, Automatic organization for digital photographs with geographic coordinates, In Proc. ACM/IEEE-CS Joint Conf. on Digital libraries,

Naaman Mor, Paepcke Andreas, et Garcia-Molina Hector, From where to what: Metadata sharing for digital photographs with geographic coordinates, 11th International Conference on Cooperative Information Systems, 2003, Catania, Sicily, Italy, en ligne : http://ilpubs.stanford.edu:8090/756/1/2003-62.pdf

Naaman Mor, Eyes on the World, IEEE Computer Magazine, Vol. 39, No. 10, Oct 2006, en ligne : http://infolab.stanford.edu/~mor/research/naamanComp06.pdf

Indexation par le contenu


Aggarwal J.K., Qasim Iqbal Combining structure, color and texture for image retrieval: a performance evaluation, Proc of International Conference on Pattern Recognition (ICPR), 2002, Quebec, Canada.

Celentano Augusto, Sciascio Eugenio Di, Di Bari Politecnico, Similarity Evaluation In Image Retrieval Using Simple Features, Proc. of Storage and Retrieval for Image and Video Databases V, 1997, San Jose (USA), vol. 3022.

156

Datta Ritendra, Joshi Dhiraj, Li Jia et Wang James Z., Image retrieval: Ideas, influences, and trends of the new age, ACM Computing. Surveys, Avril 2008, article 5, 60 pages, en ligne http://infolab.stanford.edu/~wangz/project/imsearch/review/JOUR/datta.pdf

Jacobs Chuck, Finkelstein Adam et Salesin David, Fast Multiresolution Image Querying, Proceedings of SIGGRAPh 95, Washington, 1995, en ligne http://grail.cs.washington.edu/projects/query/mrquery.pdf

Li Jia et Wang James Z., Real-Time Computerized Annotation of Pictures, MM06, October 2327, 2006, 10 p.

Millet Christophe, Annotation automatique dimages : annotation cohrente et cration automatique dune base dapprentissage, Thse dEtat, Telecom Paris, soutenue le 14 Janvier 2008, en ligne http://chr.millet.googlepages.com/these-christophe-millet.pdf

Reconnaissance faciale
Zhao W., Chellappa R., Rosenfeld A. & Phillips P.J., Face Recognition: A Literature Survey, ACM Computing Surveys, 2003, pp. 399-458

Boon Kee Low, Hjelmas Erik, Face Detection: A Survey, Computer Vision and Image Understanding, n83, 2001, p 236274, en ligne http://www.sandrosufba.hpg.com.br/inteligencia_artificial/artigos/Hjelmas2001.pdf

Webographie

Sites et Blogs scientifiques

Actualit de la Recherche en Histoire Visuelle : http://www.arhv.lhivic.org/index.php/ Affordance.info : http://affordance.typepad.com/mon_weblog/

Du bruit au signal : http://blog.tuquoque.com/ Internet Actu : Flickr: http://www.internetactu.net/

Sites et Plateformes de partage dimages http://www.flickr.com/ 157

Loc.alize.us: http://loc.alize.us/ Zooomr: Locr : http://www.zooomr.com/

Plateformes dimages gotaggues http://www.locr.com/

Panoramio : http://www.panoramio.com/

Moteurs de recherche dimages http://www.behold.cc/ http://www.gazopa.com/sign_in

Behold: Gazopa :

Google Image: http://images.google.fr/ Tiltomo: Tineye: Xcavator : http://www.tiltomo.com/ http://tineye.com/ http://www.xcavator.net/

Articles en ligne

Allard Laurence, Lamateur : une figure de la modernit esthtique, Lowiki, 1995 http://www.culturesexpressives.fr/doku.php

Chatonsky Gregory, La rvolution a lieu New-york , Incident.net, 03/07/2003, en ligne : http://incident.net/users/gregory/wordpress/03-la-revolution-a-eu-lieu-a-new-york/

Douine Rmi, Extension du domaine de la recherche vido , ARHV, le 8 dcembre 2008, en ligne http://www.arhv.lhivic.org/index.php/2008/12/08/885-extension-du-

domaine-de-la-recherche-video

Ertzscheid Olivier, La bibliothque du congrs et FlickR : des accs desaxs , Affordance.info, janvier 2008, en ligne :

http://affordance.typepad.com/mon_weblog/2008/01/la-bibliothque.html

158

Fievet Cyril, de recherche vido, une nouvelle tape , InternetActu, 16 mars 2007, en ligne : tape/ http://www.internetactu.net/2005/03/16/moteurs-de-recherche-vido-une-nouvelle-

Gros Patrick, Description et indexation automatiques des documents multimdias : du fantasme la ralit , Interstices, 29/05/07, en ligne :

http://interstices.info/jcms/c_19256/description-et-indexation-automatiques-desdocuments-multimedias-du-fantasme-a-la-realite

Guillaud Hubert, Quand YouTube remplacera Google , InternetActu, le 11 dcembre 2008, en ligne http://www.internetactu.net/2008/12/11/quand-youtube-remplacera-google/

Gunthert Andr, L'empreinte digitale. Thorie et pratique de la photographie l're numrique , ARHV, 3 octobre 2007, en ligne : http://www.arhv.lhivic.org/index.php/2007/10/03/506-l-empreinte-digitale

Gunthert Andr, Flickr une des choses les plus importantes qui soit arrive la photographie ,Internet actu, en ligne http://www.internetactu.net/

Nobis Pierre, Chercher des images par limage, Documentation Rouen, 15 novembre 2008, en ligne : http://documentaliste.ac-rouen.fr/spip/spip.php?article205

O Reilly Tim, What is Web 2.0 ? , OReilly, 09 septembre 2005, (en ligne http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html

OReilly Tim, Why Dell.com (was) more enterprise 2.0 than Dell Ideastorm, OReilly Radar, 29/09/2008, en ligne http://radar.oreilly.com/2008/09/why-dell-dot-com-is-moreenterprise.html

Sinha Rashmi, cognitive analysis of tagging. , Rashmis blog, 27 Septembre 2005, en ligne http://rashmisinha.com/2005/09/27/a-cognitive-analysis-of-tagging/

159

Table des Illustrations


Ill. 1 Capture dcran dune recherche effectue sur Google Image partir du mot-cl

LHIVIC. ............................................................................................................................... 28 Ill. 2 Capture dcran des options de recherche avance sur Google Image ....................... 29 Ill. 3 Capture dcran dune session de Google Image Labeler........................................... 31 Ill. 4 Capture dcran de loutil Google Audio Indexing .................................................... 32 Ill. 5 Capture dcran du nuage de tags de Flickr ............................................................... 49 Ill. 6 Capture dcran du Pool du groupe Flickr BlackandWhite ....................................... 52 Ill. 7 Capture dcran de la liste de tags de la photo Fofie aux fourneaux ................... 54 Ill. 8 Capture dcran dune photographie ayant ayant t taggue par le groupe

Viremoi .......................................................................................................................... 56 Ill. 9 Capture dcran dune partie du Mini Game Fastr ..................................................... 59 Ill. 10 Capture dcran de la galerie du groupe One Letter ................................................. 60 Ill. 11 Capture dcran de la galerie de photographies de la Bibliothque du Congrs sur Flickr.................................................................................................................................... 64 Ill. 12 Capture dcran de la galerie dexemples de photographies fournies par les Institutions participant The Commons sur Flickr.............................................................. 65 Ill. 13 Capture dcran de la page Creative Commons de Flickr ........................................ 67 Ill. 14 Capture dcran de linterface cartographique de Flickr ......................................... 85 Ill. 15 Capture dcran de la carte de Zooomr lchelle de Paris...................................... 87 Ill. 16 Capture dcran de loutil de gotagging de Picasa sur linterface Google Earth ... 88 Ill. 17 capture dcran de la carte de Panoramio ................................................................. 89 Ill. 18 Capture dcran du site Locr, recherche de photographies en lien avec la ville de Japur ................................................................................................................................... 91 Ill. 19 Capture dcran du site de Loc.Alize.Us ................................................................. 92 Ill. 20 Capture dcran de la page Flickr Places ddie Paris ........................................ 93 Ill. 21 Capture dcran de la galerie du groupe Paris 19e arrondissement sur flickr.......... 95 Ill. 22 Capture dcran dune photographie de Panoramio sur Google Earth ..................... 97 Ill. 23 Capture dcran des informations Wikipedia sur Locr ........................................... 99 Ill. 24 Capture dcran de Look Around de Panoramio .................................................... 105 Ill. 25 Capture dcran dune reconstitution de la Tour de Pise en 3D sur Photosynth ... 106 Ill. 26 Capture dcran de linterface de recherche par couleur du logiciel QBIC sur le site du muse de lHermitage ................................................................................................... 112 160

Ill. 27 Capture dcran dune recherche effectue sur Tineye ........................................... 119 Ill. 28 Capture dcran dune recherche effectue sur Xcavator ...................................... 120 Ill. 29 Capture dcran dune recherche effectue sur Tiltomo partir de la base Catchy Colors ................................................................................................................................ 121 Ill. 30 Capture dcran dune recherche effectue sur Retrievr ......................................... 124 Ill. 31 Capture dcran de la page daccueil du moteur Gazopa...................................... 125 Ill. 32 Capture dcran de la page daccueil de ALIPR ..................................................... 128 Ill. 33 Capture dcran dune recherche effectue sur Behold ......................................... 129 Ill. 34 Capture dcran de lapplication de reconnaissance facial de Picasa ..................... 133 Ill. 35 Capture dcran de la page Visages de iPhoto 09 ................................................... 134 Ill. 37 Capture dcran de loutil de reconnaissance facial dans lapplication Flickr ....... 136 Ill. 38 Capture dcran du module Cool Searches de Tineye ............................................ 144 Ill. 39 Capture dcran de la prsentation de loption pour I Phone de Gazopa ................ 145

161

Table des Matires


Introduction..3 Chapitre 1 I. Internet : un nouvel espace documentaire................................................. 11
A. Moteur de recherche et volution des contenus du Web .......................................... 11 1. 2. Du Web aux moteurs de recherche ....................................................................... 11 Extension des espaces documentaires indexables ................................................ 14

B. Indexation des contenus et publicits contextualises .............................................. 16 1. 2. Double articulation et indexation textuelle ........................................................... 16 Une indexation vise conomique ..................................................................... 18

II. Lindexation des documents visuels par les moteurs de recherche .......... 21
A. Accroissement des contenus visuels par le Web 2.0 ................................................ 21 1. 2. Nouvelle approche du document .......................................................................... 21 Lexplosion visuelle du Web ................................................................................ 23

B. Les systmes dindexation de la firme Google......................................................... 26 1. 2. 3. Chercher le texte avant limage ............................................................................ 26 Google Image et Google Image Labeler ............................................................... 28 Les solutions pour la vido ................................................................................... 31

Chapitre 2 I. Lapparition dune indexation sociale ...................................................... 36


A. Lindexation des collections iconographiques ......................................................... 36 1. 2. 3. Une indexation smantique surajoute ................................................................. 36 Indexation, classification et thsaurus .................................................................. 38 Indexation et mtadonnes.................................................................................... 40

B. La folksonomie ......................................................................................................... 43 1. 2. LApparition de la folksonomie sur le Web ......................................................... 43 Les principes de la folksonomie ........................................................................... 46 162

3.

Une tude de cas : Flickr....................................................................................... 48

II. Vers les nouveaux usages de la folksonomie ........................................... 50


A. Les pratiques sociales et communautaires ................................................................ 51 1. 2. 3. Des tags aux groupes ............................................................................................ 51 Commenter par les tags ......................................................................................... 53 Tags et jugement de got ...................................................................................... 55

B. Les dtournements cratifs de lindexation .............................................................. 57 1. 2. 3. Dfinition dun mashup ........................................................................................ 57 Mashups et jeux de mots ....................................................................................... 58 Mashups artistiques............................................................................................... 60

C. Flickr Commons et les nouvelles pratique documentaires ....................................... 61 1. 2. The Commons sur Flickr ....................................................................................... 62 Flickr comme moteur de recherche ...................................................................... 66

III. Les limites de la folksonomie ................................................................... 68


A. Polysmie, synonymie et subjectivit....................................................................... 68 1. 2. Problmes de lindexation smantique des images ............................................... 68 Polysmies des tags .............................................................................................. 69

B. Problme des multilinguismes et Restriction du champ smantique ....................... 70 1. 2. Rgulation par les foules ....................................................................................... 70 Un vocabulaire limit, Folksonomie et multilinguisme........................................ 72

Chapitre 3 I. Les prsupposs dune indexation par coordonnes gographiques ........ 76


A. Lindexation par les mtadonnes EXIF .................................................................. 76 1. 2. 3. La remise en question de la photographie comme index ...................................... 76 La structure informationnelle des images ............................................................. 78 Les mtadonnes comme outil de classement ...................................................... 79

B. La golocalisation .................................................................................................... 81 1. Les principes ......................................................................................................... 81 163

2.

Les photographies golocalises ........................................................................... 82

II. Les mises en application sur le Web ......................................................... 84


A. La golocalisation dans les sites de partage ............................................................. 84 1. 2. 3. Flickr ..................................................................................................................... 84 Zooomr.................................................................................................................. 86 Picasa .................................................................................................................... 87

B. Des exemples de sites ddis .................................................................................... 88 1. 2. 3. Panoramio ............................................................................................................. 88 Locr ....................................................................................................................... 90 Loc.alize.us ........................................................................................................... 91

III. Vers un dplacement de la sphre documentaire ...................................... 92


A. Vers une recherche documentaire incarne .............................................................. 92 1. 2. 3. Les groupes Flickr ................................................................................................ 93 Panoramio ou le nouvel ordre documentaire ........................................................ 96 Echanger son exprience en plus de ses images ................................................... 98

B. Vers de nouveaux modes de recherche dimages ................................................... 100 1. 2. Les applications composites : golocalisation et locative media ........................ 100 Limage comme interface de navigation............................................................. 103

Chapitre 4 I. La recherche de limage par limage ...................................................... 110


A. La recherche par le contenu .................................................................................... 110 1. 2. Les principes ....................................................................................................... 110 Lindexation et la requte ................................................................................... 112

B. Les Caractristiques symboliques .......................................................................... 114 1. 2. 3. La couleur ........................................................................................................... 114 La texture ............................................................................................................ 116 Autres caractristiques de limage ...................................................................... 116

164

II. Une observation des sites en lignes ........................................................ 118


A. Les recherche par lexemple ................................................................................... 118 1. 2. La requte globale : ............................................................................................. 118 La requte partielle : ........................................................................................... 120

B. Les requtes par esquisses ...................................................................................... 122 1. 2. Retrievr ............................................................................................................... 123 Gazopa ................................................................................................................ 124

C. Lannotation automatique des images .................................................................... 125 1. 2. Les principes ....................................................................................................... 126 Les applications en ligne..................................................................................... 127

D. Les systmes de reconnaissance faciale ................................................................. 130 1. 2. 3. Les principes ....................................................................................................... 130 Les applications grand public ............................................................................. 132 Les applications du Web ..................................................................................... 135

III. Les enjeux de la recherche par le contenu .............................................. 137


A. Le retour du texte ? ................................................................................................. 137 1. 2. Les avantages du bi-modal ........................................................................... 137 Conservation et partage des annotations ............................................................. 138

B. Des prospectives vise commerciales .................................................................. 139 1. 2. 3. Pour quels usages dans la sphre de lusager non pro ? ..................................... 140 La fin du piratage des images ? .......................................................................... 142 Lenjeu des sites marchands ............................................................................... 144

Conclusion..148 Bibliographie..152 Table des illustrations.161

165