Vous êtes sur la page 1sur 8

La Gazette europenne des langues, le bulletin d'information du CELV, prsente des actualits concernant les vnements du CELV, les

projets et ressources, ainsi que les dveloppements au sein de la Division des politiques linguistiques et d'autres secteurs pertinents du Conseil de l'Europe. Le premier numro de la Gazette europenne des langues est sorti en fvrier 2000. Au cours des annes suivantes, la Gazette est passe de quatre seize pages. Aprs une brve interruption, celle-ci est rapparue dans un format en ligne en automne 2005.
Mda.Subject: ECML: New issue of the European Language Gazette / CELV: nouveau numro de la Gazette europenne des langues

Le CELV vous invite proposer des projets et dposer vos candidatures pour son quatrime programme moyen terme (2012-2015) Le Centre europen pour les langues vivantes (CELV) du Conseil de l'Europe a le plaisir de vous informer que le numro lectronique Hiver 2010/Printemps 2011 de la Gazette europenne des langues vient de paratre: http://wwwecml.at/Portals/1/gazette/gazette-17F.htm Les projets du programme actuel du CELV (2008-2011) toucheront leur fin l'automne 2011. A cette occasion, une confrence internationale sera organise du 29 septembre au 1er octobre 2011, afin de promouvoir les rsultats de ces projets et de prsenter les nouvelles orientations des travaux du Centre. Ce numro spcial de la Gazette dvoile les orientations gnrales des futures dactivits du CELV et est consacr lAppel manifestations dintrt pour son programme dactivits moyen terme 2012-2015. Le CELV, mis en place en 1995 Graz (Autriche) dans le cadre dun accord partiel largi du Conseil de lEurope, a ft ses 15 ans dexistence en juillet 2010. Il lance son nouveau programme pour la priode 2012-2015. Sous la direction des 34 Etats membres, le CELV travaille conformment la politique du Conseil de lEurope. Celle ci-consiste "encourager la diversit linguistique et culturelle dans le but de promouvoir le dialogue interculturel, la citoyennet dmocratique et les droits de lhomme." (tat en juillet 2009). Parmi les priorits de ce programme, la France soutiendra en particulier les domaines suivants : lducation aux langues pour les migrants les langues rgionales ou minoritaires La langue des signes franaise Motiver lapprentissage des langues Lappel manifestation dintrt Apprendre par les langues est en ligne sur www.ecml.at, le site du CELV, dont lergonomie a rcemment t revue. On y trouve des fonctionnalits nouvelles comme "Le livre du mois". Il suffit de sy inscrire. La Gazette est publie trois fois par an et prsente les derniers dveloppements relatifs aux vnements, projets et ressources du Centre Europen pour les Langues Vivantes,

aux activits de la Division des politiques linguistiques et aux autres secteurs du Conseil de l'Europe. Meilleurs voeux pour 2011 de la part de l'quipe du CELV ! Le CELV lance un appel manifestations dintrt pour son quatrime programme d'activits moyen terme (2012-2015) Les projets du programme actuel du CELV (2008-2011) toucheront leur fin l'automne 2011. Une confrence internationale sera organise cette occasion, afin de promouvoir les rsultats de ces projets et de prsenter les orientations futures du travail du Centre. Ce numro spcial dvoile l'orientation gnrale des activits futures du CELV et est consacr l'appel manifestations d'intrt pour le prochain programme moyen terme 2012-2015.

LA GAZETTE BABLABLA 2

Le projet
Responsable : Anne-Marie Mercier-Faivre - Groupe 18e sicle-Lyon UMR 5611 (LIRE)

Sommaire
1. Intrt scientifique de la constitution d'une collection numrise des gazettes europennes de langue franaise 2. Historique du projet : l'exprience de la Gazette d'Amsterdam, une numrisation en mode image 3. Le projet Gazette de Leyde 4. Dveloppements futurs envisags

Intrt scientifique de la constitution d'une collection numrise des gazettes de langue franaise
Pour comprendre l'intrt scientifique de ce projet, il faut, comme le rappelle Pierre Rtat dans la prsentation des cdroms de la Gazette d'Amsterdam, prendre en compte la place

de la presse europenne de langue franaise dans la civilisation d'Ancien Rgime. La presse europenne de langue franaise sous l'Ancien Rgime, essentiellement constitue de gazettes, se caractrise par sa vitalit, par le nombre [...] des journaux crs, par sa trs large expansion gographique -jusqu'en Russie ou dans l'empire Ottoman avec une forte concentration en Allemagne et dans les Pays-Bas [...] . Moyen de diffusion du savoir et des nouvelles entre les lites sociales, politiques et intellectuelles [...] dans des zones gographiques trs vastes et connectes entre elles , les gazettes jouent un rle de mdiation et d'unification linguistiques et culturelles. On peut les considrer comme un lieu stratgique de cration et d'affirmation d'une conscience europenne au dbut de l're moderne, ce qui leur confre un caractre historique trs particulier . Ces gazettes transmettent une information essentiellement politique de caractre international . La presse du 18e sicle d'expression franaise se caractrise par sa dimension europenne : c'est aussi pour concurrencer la Gazette de France, trs contrle par le pouvoir royal, qui avait un privilge exclusif sur tout le royaume, que de nombreuses entreprises ditoriales ont vu le jour, Londres, Bruxelles, Rotterdam, La Haye, Leyde, Amsterdam, Utrecht, Clves, Cologne, Trves, Berne et Avignon (qui n'tait pas franaise l'poque)... Cet ensemble offre donc une masse considrable de textes en langue franaise, diffuss dans toute l'Europe, jusqu' Moscou et l'Amrique, une ressource prcieuse pour les chercheurs, tant historiens que littraires : politique, histoire des ides, des sciences et des arts, naissance des formes et du discours journalistique... Toute l'histoire du monde y est inscrite presque au jour le jour ; un mme vnement peut tre relat travers des nouvelles manant de divers endroits, on y lit aussi bien le quotidien des grandes villes europennes (et au-del, jusqu' Constantinople et Saint Petersbourg), ou des bourgs de province, jusqu'aux colonies, avec la naissance des tats d'Amrique, ou l'Afrique et l'Asie. Malheureusement, cette richesse en fait la difficult : il est trs rare de pouvoir consulter une collection complte, les exemplaires tant souvent disperss dans diffrents pays. Il est donc important de mettre disposition des chercheurs cet outil prcieux qui permet de relier la culture et l'histoire d'une poque avec ses media d'information. Le groupe de Lyon a men bien ce travail en publiant sur CD-Rom la collection de la Gazette d'Amsterdam (1691-1796) et poursuivra avec d'autres journaux.

Historique du projet: l'exprience de la Gazette d'Amsterdam, une numrisation en mode image


La premire ralisation du laboratoire fut la collection de la Gazette d'Amsterdam qui a t diffuse dans toute l'Europe de 1691 1796. Cet ensemble de 12 cdroms, qui se voulait le premier lment d'un projet plus vaste de collection des gazettes europennes de langue franaise sous l'Ancien Rgime, a t publi en 2000 par la Voltaire Foundation. Notre laboratoire s'est intress depuis 1993 l'dition numrique des gazettes. Une premire demande de financement a t soumise la fondation Volkswagen, sans rsultat positif. C'est en 1994 que le projet a vraiment pu prendre corps, cela grce des crdits allous par le Ministre des affaires trangres. Pierre Rtat avait dcouvert dans

les rserves du fond ancien de ses archives une belle collection annote de la Gazette d'Amsterdam. Pascale Ferrand et Pierre Rtat ont alors travaill la reconstitution et l'archivage numrique de cette gazette avec l'appui technique du responsable informatique de l'ISH qui tait alors Daniel Roux, actuellement en poste dans l'quipe Histoire de l'Art. Notre budget global tait de 200KF, 80 ont t utiliss pour le microfilmage. Pour exploiter le corpus d'une ampleur considrable que constitue une gazette, il fallait d'abord rsoudre le difficile problme documentaire qu'elle reprsente et qui a fait que cette source historique a longtemps t nglige non seulement cause des orientations passes de la science historique, mais aussi cause de graves difficults de consultation des collections . Celles que l'on trouve sont en effet rares, disperses, toujours lacunaires et d'un accs difficile. C'est pourquoi, prcisment, on souhaitait reconstituer les collections et les reproduire pour en favoriser la consultation. Cependant, cette reproduction se heurtait l'obstacle majeur que constitue la massivit des corpus. En reproduction papier de type fac simile, il aurait fallu constituer d'normes collections difficilement publiables. Chaque livraison d'une gazette de type classique comprenant 6 8 pages, le total d'une collection, par exemple pour la Gazette d'Amsterdam, reprsente plus de 80.000 pages. C'est donc la possibilit de reproduire les gazettes sous forme numrique qui a permis de franchir cet obstacle et a suscit l'intrt des chercheurs dsirant avoir leur disposition un reprint lectronique de la totalit d'une collection de gazette. Cette ralisation s'est faite en trois tapes : une tape de recherche et d'identification de l'archive, une tape de recueil sous forme de microfilms enfin une tape de numrisation et d'organisation des donnes numriques.

tape de recherche et d'identification de l'archive


Cette premire tape est l'aboutissement du travail du laboratoire sur la presse ancienne entrepris ds les annes soixante-dix. Travail dont tmoignent les publications de l'quipe 18e et, pour ce qui concerne plus particulirement le reprage des collections, le Rpertoire des gazettes europennes de langue franaise de Pierre Rtat, publi par la Bibliothque nationale de France.

tape de recueil de l'information


Il faut souligner tout d'abord que la numrisation directe des gazettes est impossible, les bibliothques refusant de soumettre leur fonds anciens cette opration qui endommage les documents. A partir de 1996, nous avons donc reconstitu la collection complte de la Gazette d'Amsterdam, partir des microfilms qui nous ont t fournis par huit bibliothques : Bibliothque du Ministre des affaires trangres, Archives nationales, Archivio di Stato, de Naples, Bibliothque Publique et Universitaire de Genve, Bibliothque municipale de Grenoble, Bibliothque de l'Institut de France, Bibliothque Mazarine, Bibliothque Sainte-Genevive. Ces bibliothques ont bien sr t choisies en fonction de leurs collections, mais aussi parce qu'elles acceptaient le microfilmage de leurs gazettes et ne nous demandaient pas de copyright, le problme de la ngociation des droits demeurant un point dlicat.

tape de numrisation en mode image et de prsentation de l'archive


Nous avons fait numriser ces microfilms en format image, ce mode ayant l'avantage de reproduire le document en conservant sa forme originale, lment que tout connaisseur du livre et des textes anciens apprcie. Nous avons choisi comme format logique de numrisation le tiff TCITT Groupe 4 multi pages et comme format de diffusion le pdf. Ce dernier format, tout juste dvelopp l'poque, prsentait l'avantage d'tre multi plateformes et d'offrir un viewer libre de droit : Acrobat Reader. Ce choix s'est rvl judicieux puisque ce format s'est gnralis dans les annes qui ont suivi. Une fois l'archive numrise, et la collection reconstitue, nous avons d contrler la lisibilit de chaque image et vrifier l'intgrit des livraisons (plus de 11.130). Phase dont il ne faut jamais ngliger la dure. Les trois phases de reprage, d'archivage et de numrisation tant acheves, la question s'est pose de la prsentation et donc de l'indexation de cette archive massive. Nous sommes partis du fait qu'elle est naturellement dcoupe en units de 6 8 pages, constituant une livraison de la gazette, laquelle est reprable par sa date et son numro d'ordre annuel. Nous avons donc index la Gazette d'Amsterdam partir de ces critres, ce qui donne plus de 11.000 points d'entre dans le texte. A cette poque nous nous tions pos la question d'une indexation complmentaire. Nous avions cart d'office l'indexation thmatique parce que cette archive numrique tait susceptible d'intresser aussi bien les historiens que les littraires ou d'autres types de lecteurs, ce qui excluait de dresser un index thmatique trop spcifique. Nous avions ensuite cart une indexation en full text. D'une part parce que les essais d'OCR raliss l'poque taient rests sans succs (90% des caractres taient rejets), d'autre part parce que l'utilit d'une telle indexation, rapporte au temps qu'il aurait fallu investir pour constituer un OCR efficace, n'tait pas probante. Ce choix d'une ralisation en mode image ne nous est pas propre puisqu'il est aussi celui de la BnF dans son projet d'archivage des journaux publis entre 1814 et 1944. Notre dition des textes numriss a cependant une supriorit notable sur celle offerte par Gallica puisqu'elle permet d'accder directement la premire page d'un numro du priodique reproduit.

Le projet "Gazette de Leyde"


Notre laboratoire s'est depuis intress un mode de mise disposition des collections de gazette qui permettrait d'aller au-del du reprint lectronique et permettrait de circuler dans le texte grce une indexation de termes sensibles . - Nous avons cart l'indexation thmatique parce que notre archive numrique tait susceptible d'intresser aussi bien les historiens que les littraires ou d'autres types de lecteurs, ce qui excluait de dresser un index thmatique trop spcifique. - Nous avons ensuite cart une indexation en full text parce que l'utilit d'une telle indexation, rapporte au temps ncessaire pour la constituer sans OCR efficace sur les textes du XVIIIe sicle, n'est pas probante (la Gazette de Leyde reprsente entre 324 millions (hypothse basse) et 428 millions de caractres).

Cela nous a amens nous demander si tous les lments du texte sont une clef d'entre pour les lecteurs contemporains d'une gazette du XVIIIe sicle. La rponse est non . Il s'agit donc pour nous de dterminer quels lments textuels sont le plus souvent recherchs par les lecteurs qui ne se satisfont pas d'un accs la gazette par date ou numro de livraison ? Lorsqu'on examine une gazette, dans un premier temps on constate que le titre de la rubrique , A Venise, le 17 Fvrier , permet de trouver une nouvelle recherche. Cependant la lecture des gazettes montre que l'intitul des nouvelles ne rend pas toujours compte de leur contenu. Ici la nouvelle est celle apporte par un courrier de Rome et concerne cette ville. De mme les nouvelles de Turquie sont susceptibles d'apparatre dans les rubriques Allemagne (article de Vienne) ou Italie (article de Venise) [...] les nouvelles d'outre-atlantique [sont] souvent incluses dans les rubriques GrandeBretagne ou PAYS-BAS . Les nouvelles de Chine et des ctes asiatiques par exemple passent aussi bien par Rome [...] que par Constantinople via Vienne [...] ou bien Madras [...] . Il faut donc examiner la gazette d'un point de vue purement formel. On constate alors que les italiques abondent dans un texte majoritairement imprim en romanes. Ces italiques sont toujours utilises pour noter les noms ou adjectifs de lieu et les patronymes. La possibilit d'entrer dans le texte en interrogeant le mot Rome par exemple permet donc d'atteindre aussi bien les nouvelles en provenance de cette contre que les nouvelles qui y sont relatives. On constate galement que les bulletins et les pices officielles reproduites par la gazette sont donns en italiques. Mais, dans ce cas les noms ou adjectifs de lieu et les patronymes sont en romains. Nous aurions donc besoin d'un systme qui permettrait d'indexer le texte de la gazette partir des mots que la gazette elle-mme met en valeur : les italiques dans les blocs en romain et, inversement les romains dans les blocs en italiques. Ainsi il serait possible de trouver ou de suivre une nouvelle, en croisant noms propres et date et/ou lieu d'origine de l'information. D'autre part, afin de pouvoir parcourir le texte de la gazette dans la perspective de recherches thmatiques nous aurions besoin d'un systme de type word spoting. Pour reprendre une thmatique sur laquelle nous avons rcemment travaill : l'criture de la catastrophe au XVIIIe sicle, nous aurions besoin de rechercher par exemple toutes les occurrences d'une srie telle que : Catastrophe Dsastre Flaux Tremblement de terre Secousse Peste ..... Nos besoins se situent donc entre ce que propose Gallica et ce que promet Google : entre collection d'images sans indexation et full text. Plus qu'une solution de compromis ce que nous recherchons c'est une solution qui adapterait l'indexation aux spcificits de l'objet index et de la lecture qui en est faite par le lecteur contemporain. Depuis septembre 2005, le professeur Hubert Emptoz, directeur de l'quipe Numrisation et Reconnaissance dans les Images de documents (intgre dans le LIRIS (Laboratoire d'InfoRmatique en Image et Systmes d'information, Lyon)) s'est associ notre projet dans le cadre du Cluster 13 ((Culture, patrimoine et cration/ numrisation et reconnaissance des documents)), structure fonctionnant avec des fonds de la rgion Rhne Alpes et dirige par Philippe Rgnier (CNRS). Une bourse de doctorant a t alloue Loris Eynard, en thse avec H. Emptoz, et celui-ci a travaill au dveloppement

des outils de recherche et de transcription utiliss sur le site. La structure du cluster doit nous aider poursuivre la numrisation. Avec l'aide du directeur de la BIU, M. Micol et de la conservatrice du fond ancien, Mme Perrat, nous avons pu numriser en numrisation directe et en 800 DPI l'anne 1785 de la gazette, prsente dans leurs collections. Le dmontage de la reliure (une reliure du XIXe sicle, fort heureusement pour nous, peu intressante) a permis de raliser un travail de qualit. D'autres annes doivent tre numrises et nous comptons sur l'aide du Cluster et d'autres structures pour poursuivre cette entreprise.

Dveloppements futurs envisags


Perspectives : largissement d'autres gazettes
Le Courrier, dit Courrier d'Avignon, a t numris par les bibliothques municipales d'Avignon et de Marseille. Grce aux crdits allous par le Cluster, le centre 18e Lyon a achet des copies sur CD Rom et commencera ds que possible la numrisation des collections de cette gazette. Ces deux Bibliothques nous ont accord la possibilit d'une mise en ligne accessible tous.

Cration dun rpertoire de liens vers la presse ancienne numrise


Une rubrique de liens vers la presse ancienne numrise et dj en ligne, cre par Denis Reynaud (LIRE/Lumire-Lyon2) a t ajoute ce site en juillet 2009. Cette rubrique sera rgulirement enrichie.

Un projet europen : EGITEC


Un projet europen a t dpos en 2007 sous le titre European gazettes in the eighteenth century : les gazettes europennes au dix-huitime sicle avec l'acronyme EGITEC . Il s'inscrit dans le cadre du 7me programme cadre de recherche et de dveloppement (PCRD) ( Programme spcifique Coopration Histories and identities articulating national and European identities SHS 2005-5.2.1 (1er appel date limite 10 mai 2007)). Son but est de mettre en rseau diffrentes entreprises de numrisation et de construire un projet de recherches sur les identits europennes l'uvre dans la presse d'Ancien Rgime. Une coopration s'est dj mise en place avec :

Le groupe de recherche Gazette des Deux-Ponts de l'Universit de Trves, dirig par le Professeur Hans-Ulrich Seifert. L'universit de Trves a runi des copies sur film et sur microfiche d'un trs grand nombre de numros de la Gazette des Deux- Ponts en vue d'obtenir un exemplaire complet virtuel de la revue qu'aucune bibliothque europenne ne possde dans son intgralit (la plus riche collection du journal se trouve aux Deux-Ponts, la Bibliotheca Bipontina, avec laquelle la BU de Trves collabore troitement). Cette universit a dj ralis un certain nombre de projets de numrisation dans le domaine des tudes 18istes (la

version lectronique d'une trs grande encyclopdie du 18ime / 19ime sicle (http://www.kruenitz1.uni-trier.de/ ), un portail bilingue consacr au Marquis d'Argens et une base de donnes iconographique sur les ditions illustres du Candide de Voltaire). Un travail en cours sur la version numrise des uvres de Frdric le Grand (plein texte franais, mode image pour la premire dition allemande) met en uvre des procds de reconnaissance automatique de caractres (http://ub-dok.uni-trier.de/friedrich/). Ainsi pour le projet de numrisation de la Gazette des deux-Ponts, on profitera de cette exprience en reconnaissance automatique de caractres et de la prsence de chercheurs confirms. La bibliothque royale de Belgique collabore depuis plusieurs annes avec le centre d'tudes du 18e sicle de Lyon, fournissant les microfilms de sa collection de la Gazette de Leyde. Elle participera au projet en donnant accs ses collections pour raliser cette fois une numrisation directe de haute qualit. Le Groupe d'tude du dix-huitime sicle de l'Universit de Lige, plac sous la responsabilit conjointe de Daniel Droixhe et de Franoise Tilkin. Dans le cadre du projet europen, le Groupe d'tude du XVIIIe sicle pourrait, si les moyens lui en sont donns, assurer la numrisation du Journal Gnral de l'Europe (17851792), mais aussi d'autres journaux, dont l'Esprit des Journaux (1772-1818). On trouvera sur le site de ce groupe une belle prsentation de ce priodique, un index, et une liste de liens vers son texte numris.

Malgr un avis favorable, le projet EGITEC est en suspens et sera repropos sous une forme actualise et enrichie, adapte au prochain appel d'offre europen. suivre, donc... En attendant, les gazettes de Leyde et d'Avignon progresseront lentement mais rgulirement grce des financements rgionaux (Cluster 13, Rhne-Alpes) et grce l'aide de l'UMR 5611 (antenne CNRS-Lyon2). Anne-Marie Mercier-Faivre Certains lments de ce rsum sont extraits de textes prsents aux rencontres LyonBergen sur la lecture numrique (septembre 2005) et aux Rencontres rgionales Numrisation et valorisation du patrimoine crit (avril 2006) par P. Ferrand et A.-M. Mercier-Faivre, (UMR LIRE)

Vous aimerez peut-être aussi