Vous êtes sur la page 1sur 5

CORPVS CHRISTIANORVM THESAVRVS PATRVM GRAECORVM

epuis plusieurs deècennies deèjaé, les deèveloppements des tech-

D niques de calculs statistiques, de calculs de freè quences et de tris

sont appliqueès aux sources eècrites ; si les langues modernes ont eè teè les

premieéres aé en beèneèficier, les langues anciennes ont rapidement suivi

le mouvement. C'est ainsi, par exemple, que les sources latines font

l'objet de traitements informatiques depuis de nombreuses anneè es, et

que le Corpus Christianorum leur a accordeè une large place dans le cadre

des Thesauri Patrum Latinorum et des Instrumenta Lexicologica Latina . Ce

sont preèciseèment les deèmarches novatrices, dans le domaine du latin,

du Centre de Traitement Eè lectronique des Documents ( cetedoc) de

l'Universiteè catholique de Louvain, sous la direction du professeur

Paul Tombeur, qui ont ouvert la voie aé un traitement similaire des

sources grecques et permis la creèation d'une seèrie intituleèe Thesaurus


Patrum Graecorum .

Deèveloppeè au deèpart sur les bases des travaux du cetedoc sur les

textes latins, le traitement des sources grecques se voulait avant tout

lexical, de type morpho-seèmantique : il s'agissait, dans un texte donneè,

de classer toutes les formes du texte, de regrouper les formes iden-

tiques, d'attribuer aé chacune d'entre elles un lemme ou û entreèe de

dictionnaire ý, et de lever les ambigu|ëteès reèsultant des homographies

(formes semblables mais relevant des deux ou plusieurs lemmes pos-

sibles). Les reèsultats eètaient preèsenteès dans des volumes proposant

aux lecteurs une seèrie d'instruments, allant de la concordance lemma-

tiseèe elle-meême (les formes preèsenteèes dans leurs contextes textuels),

aux index inverses, aux listes de lemmes et de formes et aé diverses

listes de freèquence. La taille des textes traiteès empeêchant de publier

l'ensemble de ces outils sur papier, le choix de la microfiche s'est im-

poseè comme le moyen le plus commode, et le plus stable dans la

dureèe. Pour la reèalisation de l'ensemble de ces outils, le cetedoc a

adapteè au grec les logiciels deèveloppeès pour le latin.

Quelques options speècifiques ont cependant eèteè prises du coêteè du

grec, dont deux meèritent d'eêtre signaleèes. La premieére fut de chercher

aé traiter des corpus d'auteurs complets, au deètriment d'index d'Ýuvres

seèpareèes, ce qui a rendu inutile la creèation d'une seèrie qui aurait servi

ö 169 ö
de paralleéle aux Instrumenta Lexicologica Latina , puisque les reèsultats

eètaient destineès aé para|être dans les seuls Thesauri . La seconde option

fut de ne preèparer et de ne publier que des instruments lemmatiseès,

sans passer par l'eèquivalent des volumes de la û Series A. Formae ý du

latin. Ces options ont entra|êneè deux conseèquences.

La premieére conseèquence eètait que la volonteè de traiter des corpus

complets rendait plus important encore le choix des auteurs. Pour des

raisons qui tiennent aux projets en cours aé l'Universiteè catholique de

Louvain, le premier auteur analyseè fut Greègoire de Nazianze, un au-

è glise du
teur grec chreètien, Peére de l'E iv e
s. (sur cet auteur et le projet

qui le concerne, voir la preèsentation du Corpus Nazianzenum ). Ce choix

a naturellement orienteè le deèveloppement du grec au cetedoc vers le

domaine de la patristique, et cela d'autant plus que d'autres centres

d'analyse statistique des langues anciennes concentraient leurs efforts

sur des Ýuvres de la litteèrature grecque classique. Mais les Peéres grecs

sont aussi des auteurs repreèsentatifs de la socieèteè byzantine : ils utili-

sent les meêmes mots, les meêmes cadres conceptuels et le meême bagage

culturel que les auteurs byzantins profanes ; tous ont en commun la

volonteè de s'inscrire dans l'heèritage de l'Antiquiteè classique, et cette

volonteè confeére aé leur langue et aé leur lexique des caracteéres bien par-

ticuliers, faits de conservatisme et d'innovations. C'est pourquoi les

efforts d'analyse des textes grecs se sont ouverts aé des Ýuvres non

patristiques, en particulier aux Ýuvres des historiens et chroniqueurs

byzantins. Pour eèviter une trop grande dispersion, deux axes ont eèteè

suivis de manieére prioritaire mais non exclusive : d'une part, les Ýuvres

de l'ensemble des Peéres Cappadociens (Greègoire de Nazianze, Basile de

Ceèsareèe, Greègoire de Nysse [en preèparation], Amphiloque d'Iconium,

Asteére d'Amaseèe et Firmus de Ceèsareèe), et, d'autre part, les historiens du

vi e
s. (Procope de Ceèsareèe [publieè], Agathias le Scholastique, Meènandre

Protecteur, Theèophylacte Simocatta [en preèparation], etc.). Ces deux

axes permettront des analyses non seulement sur des corpus d'auteurs,

mais aussi sur des corpus de groupes d'auteurs.

Si les historiens ont trouveè place, aux coêteès des Peéres, dans une col-

lection intituleèe Thesaurus Patrum Graecorum , c'est en raison de leur ap-

ö 170 ö
partenance commune aé un monde chreètien, de tradition classique et de

langue grecque. Derrieére cette uniformiteè apparente se cache toutefois

une grande diversiteè ! Dans le domaine de la langue, le monde by-

zantin est caracteèriseè par un pheènomeéne de diglossie, c'est-aé-dire

d'eècart croissant entre une langue litteèraire, fideéle aé ses modeéles clas-

siques, et une langue parleèe, lieu d'adaptations, d'influences et

de creèations de toutes sortes. Comme il est naturel, des usages de la

langue parleèe finissent par entrer, de manieére plus ou moins orga-

niseèe, dans la langue litteèraire ; plus les auteurs sont tardifs, plus leurs

Ýuvres sont permeèables aé ces innovations de la langue parleèe.

L'analyse lexicale des textes doit rendre compte de ce pheènomeéne, et la

lemmatisation doit pouvoir les inteègrer.

C'est la seconde conseèquence des options du projet grec. Deèsireux

de rendre compte des reèaliteès lexicales de textes aussi divers que des

Ýuvres patristiques et des Ýuvres historiographiques, dont les dates


e
de composition partent du iv sieécle apreés Jeèsus-Christ pour avancer

dans le temps jusqu'aé la fin de l'eèpoque byzantine, le systeéme d'analyse

neècessitait un travail de reèflexion approfondie sur la nature des

lemmes, sur la nature des neèologismes, des formes populaires, des

emprunts, etc. Des innovations morphologiques dans la deè clinaison

ou dans la conjugaison impliquent-elles la creèation de lemmes nou-

veaux ? Quels lemmes deèfinir pour des mots reèsultant d'emprunts aé

des langues eètrangeéres et qui apparaissent sous plusieurs formes possi-

bles ? Telles sont quelques questions auxquelles le projet devait

apporter des reèponses. Ce qui sous-tend l'ensemble de l'analyse des

formes, c'est la conception du rapport de la forme aé son lemme, et

l'ensemble des lemmes doit proposer une repreè sentation aussi exacte

que possible de l'eètendue du champ lexical de la langue grecque. La

liste des lemmes et les liens entre lemmes et formes constituent le

û Dictionnaire Automatique Grec ý (D.A.G.) ; le D.A.G. est le

û coeur ý du traitement des textes ; le D.A.G. est lui-meême un projet

scientifique, en arrieére-plan de la publication des Thesauri , et c'est lui

qui assure la coheèrence d'ensemble de la collection.

ö 171 ö
La conception du dictionnaire comme projet confeé re aé la seèrie The-

saurus Patrum Graecorum une identiteè particulieére : elle n'est pas qu'une
simple collection de volumes juxtaposant des concordances d'auteurs.

Elle est aussi, et surtout, l'expression d'un projet plus vaste, dont

chaque volume est un eèleèment et une eètape. Aé terme, les volumes de

Thesauri sont destineès aé preèsenter au public une image de la richesse du


domaine lexical grec : dans cette optique, la seè rie Thesaurus Patrum

Graecorum receéle une grande originaliteè parmi les publications relevant


de la linguistique computationnelle.

Prof. Dr. Bernard Coulie


Directeur Thesaurus Patrum Graecorum

Thesaurus Patrum Graecorum : Universiteè catholique de Louvain


Institut orientaliste

Place Blaise Pascal 1

B-1348 Louvain-la-Neuve (Belgique)

teèl. +32 10 473793 ; fax +32 10 472001

www.corpuschristianorum.org

http ://tpg.fltr.ucl.ac.be

e-mail : coulie@ori.ucl.ac.be

ö 172 ö