Vous êtes sur la page 1sur 421

BEIHEFTE ZUR ZEITSCHRIFT FR ROMANISCHE PHILOLOGIE

BEGRNDET VON GUSTAV GRBER HERAUSGEGEBEN VON GNTER HOLTUS

Band 354

NICOLAS MAZZIOTTA

Ponctuation et syntaxe dans la langue franaise mdivale


tude dun corpus de chartes originales crites Lige entre 1236 et 1291

n
MAX NIEMEYER VERLAG TBINGEN 2009

Les matriaux utiliss dans le cadre de la prsente tude sont accessibles ladresse suivante: http://hdl.handle.net/2268/25773.

Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet ber http://dnb.ddb.de abrufbar. ISBN 978-3-11-023105-2 ISSN 0084-5396

 Max Niemeyer Verlag, Tbingen 2009 Ein Imprint der Walter de Gruyter GmbH & Co. KG http://www.niemeyer.de Das Werk einschlielich aller seiner Teile ist urheberrechtlich geschtzt. Jede Verwertung auerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulssig und strafbar. Das gilt insbesondere fr Vervielfltigungen, bersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Gedruckt auf alterungsbestndigem Papier. Gesamtherstellung: Hubert & Co., Gttingen

Prface

Louvrage de Nicolas Mazziotta est un travail profondment original et nouveau. Lauteur sest en effet x pour tche de rpondre la question suivante: Comment, daprs ce quon peut observer dans les chartes crites en franais Lige avant 1292, la ponctuation originale interagit-elle avec la syntaxe dans la langue franaise mdivale? Il sagit l en effet dun champ danalyse presque totalement neuf, de deux points de vue. Dune part, les tudes sur la ponctuation sont assez rares, et celles sur la ponctuation des textes franais mdivaux le sont encore davantage. Dautre part, la plupart de ces analyses ont recherch les critres demploi des signes de ponctuation aux divers niveaux de reprsentation et de performance du texte; or N. M. a opr un choix trs diffrent, et trs ambitieux: celui de placer son enqute au seul plan de la syntaxe. En cela, il reprend lhypothse de M.-G. Boutier selon laquelle la structuration syntaxique du texte suft rendre compte de lessentiel de la ponctuation. Cette proposition, trs forte, demandait tre valide sur un corpus important: grce cet ouvrage, cest dsormais ralis. Certes, nous y reviendrons, valider cette hypothse ne revient pas poser quelle est la seule possible; une telle analyse, mme russie, ninvalide pas dautres approches, dautres hypothses, en particulier des explications plus complexes croisant syntaxe et intonation, par exemple. Mais aprs ce travail on peut considrer comme acquis que syntaxe et ponctuation ont partie lie. Pour mener bien son enqute, lauteur a travaill sur un corpus quantitativement important (148 chartes, plus de 60 000 mots), et il sest attach fournir de chaque nonc et de chaque lment de ce corpus, ponctu ou non, une analyse syntaxique intgre permettant ensuite dintervenir avec les outils de calcul statistique et de traitement informatique. Ce faisant, N. M. na pas choisi la facilit: il aurait pu, de faon plus traditionnelle, se contenter de slectionner uniquement les cas dusage de marques de ponctuation, et den dcrire le contexte. Le candidat a prfr partir de la population globale des constituants linguistiques, pour voir lesquels, dans quelles fonctions et positions, attiraient une ponctuation, lesquels au contraire y taient rtifs. Lorganisation de louvrage est claire et progressive. Aprs une brve mais dense Introduction qui souligne les difcults et les nouveauts (dont lhypothse teste ici) de sa recherche, et une spcication des concepts requis, lauteur donne un excellent chapitre 2, qui retient le meilleur des travaux fondateurs de Catach et dAnis, et propose une organisation conceptualise de la spatialit de lcrit qui, par tapes, permet de dnir les ponctogrammes comme des units spcies par un trait, la nonparaphrasabilit. On a l lun des aspects qui font loriginalit de ce travail: il ne sagit plus de considrer les marques de ponctuation comme des units chacune prise dans

son contexte; mais bien au contraire, cest leur organisation densemble qui fait sens, cest la faon dont elles structurent le tissu ici pos comme tissu syntaxique. Une telle approche ncessitait ladoption dune conception linguistique qui permette de structurer le texte en lments. N. M. a choisi de se situer dans le cadre de la linguistique argumentale (Tesnire, Lazard, Lemarchal), et il a construit un modle proposant une structuration des constituants par relations et hirarchise. Une fois les fondements poss, lanalyse des donnes constitue la seconde partie de louvrage. Les rsultats sont clairement exposs, en particulier en tableaux et gures. La spcicit de chacun des ponctogrammes apparat clairement: sans surprise, le punctum rvle son crasante domination et sa polyvalence. On ne peut qutre impressionn par tout la fois lampleur de cette dmarche et lexigence de rigueur quelle rvle: on trouvera l bien des gards un modle, reproductible car non impressionniste et explicite, pour des tudes comparables. Grce une telle dmarche, ltude de la ponctuation gagne dnitivement son domaine propre et rvle son importance. De notre point de vue, il sagit l dune tape importante, peut-tre fondatrice; mais ce ne peut tre quune tape. En effet, lhypothse syntaxique demandait tre vrie; et cette analyse vrie que toute marque de ponctuation peut sexpliquer par lexistence dune frontire syntaxique. Trois chapitres dcrivent les corrlations entre chaque type dunits syntaxiques et chacun des ponctogrammes; ce travail a le mrite de rvler des rgularits: la frquence du marquage ponctu nest pas la mme suivant la nature des structures argumentales; et une quinzaine de tableaux permettent dailleurs de voir si lattraction (ou la rpulsion) de telle unit avec tel signe se fait vers la gauche ou vers la droite. Mais le fait que cette relation ne soit pas systmatique, quil ny ait pas ponctuation ds lors quil y a frontire syntaxique, montre quil subsiste un reste analyser. Divers travaux antrieurs avaient mis laccent sur la valeur pragmatique, intonative peut-tre, du marquage ponctu. Peut-tre une prochaine tape pourrait-elle consister rexaminer ces hypothses, au moins en ce qui concerne certains pongtogrammes, et mettre au jour dautres rgularits, telles que par exemple celle quon a pu mettre en vidence pour lemploi du comma dans un manuscrit de la Queste del saint graal: certes, son emploi concide avec certaines frontires syntaxiques, de deux types: aprs Ha ou H en dbut de prise de parole, et la jonction de deux lments de phrase corrls (Car ausi com Cayns ocist Abel au vendredi ausi ocist Judas son creator au vendredi., ms. K de Lyon, f. 211c, corresp. p. 217 de ld. Pauphilet). Cest lhtrognit de ces deux types demploi qui nous a conduite rechercher le trait quils ont en commun: la volont du copiste dindiquer une monte de la voix (Marchello-Nizia 2007). Or on constate que par exemple un emploi du comma analys par lauteur uniquement du point de vue syntaxique (0.1.1.2, p. 4 et s.), et qui se trouve dans une charte dont la rfrence est: Document 123605, 6, ressortirait clairement une autre analyse, intonative et corrlative: ce comma accompagne la reprise-rptition du que, cest dire quil marque, plus quune frontire syntaxique, une indication de continuit prvoir, tant dans lintonation (lvation de la voix?) que dans la corrlation qui est tablir entre les deux que de mme fonction. Ce premier ouvrage du jeune chercheur quest encore Nicolas Mazziotta marque notre avis un moment capital dans le renouveau des tudes sur lvolution de la ponctuation: ce travail remarquable et novateur dans ses exigences et sa mthodolo-

VI

gie apporte des rsultats incontournables, toute autre tape devra dabord prendre en compte ces acquis. Christiane Marchello-Nizia

Remerciements
Quil me soit permis de remercier les personnes suivantes pour laide quelles mont apporte, que ce soit sur le plan scientique que sur le plan motionnel. Je remercie tout dabord mes professeurs et collgues de lUniversit de Lige: Marie-Guy Boutier (qui a dirig cette tude), Pierre Swiggers, Jean-Marie Klinkenberg, tienne vrard, Grald Purnelle, Philippe Lambert, ainsi quEsther Baiwir, Pascale Renders et France Gabriel. Ma gratitude va galement mes collgues de lcole Normale Suprieure Lettres et sciences humaines de Lyon: Cline Guillot, Serge Heiden et Alexei Lavrentiev. Je remercie galement les membres du jury extrieurs lUniversit de Lige, qui ont valu la thse qui a engendr ce livre: Christiane MarchelloNizia et Gnter Holtus. Mes amis et la famille ont galement permis ce travail daboutir; merci Laurent Bozard, Brigitte Antoine et Jean-Christophe Vanhalle, Lionel Lardinois, Pierre Doyen et Rmy , mais aussi Laetitia Godfroid et Christophe Lejeune ainsi qu Vronique Voisin. Merci galement mes frres Julien, Pierre-Franois et Thomas (pour sa protection), ma sur Olivia et mes parents Bernadette et Franois. Les membres de ma belle-famille mritent galement ma gratitude: Annette de Martin, Anne Lochet et Kvin Jeanls. Merci enn Catherine pour son indfectible conance et son amour sans limite, ainsi qu Jeanne pour la joie quelle nous procure chaque jour. Nicolas Mazziotta

VII

Table des matires

Table des gures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Liste des tableaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.1 Objectifs de ltude . . . . . . . . . . . . . . . . . . . . . . . . . 0.1.1 tudes prcdentes . . . . . . . . . . . . . . . . . . . . . 0.1.1.1 Pluralit des valeurs de la ponctuation mdivale 0.1.1.2 Le pari de la syntaxe . . . . . . . . . . . . . 0.1.2 Position de la prsente tude . . . . . . . . . . . . . . . . 0.2 Corpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.2.1 Gense du projet Kharts et constitution du corpus . . . . 0.2.2 Problmes lis au corpus . . . . . . . . . . . . . . . . . . 0.2.2.1 Htrognit des types discursifs . . . . . . . 0.2.2.2 Quantit de donnes . . . . . . . . . . . . . . 0.3 Plan de ltude . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.3.1 Premire partie: modlisation . . . . . . . . . . . . . . . 0.3.2 Deuxime partie: analyse des donnes . . . . . . . . . . . 0.4 Ressources techniques . . . . . . . . . . . . . . . . . . . . . . . . 0.5 Travail en cours . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.5.1 Erreurs et volutivit . . . . . . . . . . . . . . . . . . . . 0.5.2 Programmation des requtes . . . . . . . . . . . . . . . . Pralables pistmologiques: concepts et terminologie 1.1 Mcanisme de conceptualisation . . . . . . . . 1.2 Impratifs terminologiques . . . . . . . . . . . 1.2.1 tablir une terminologie . . . . . . . . 1.2.2 Positionnement . . . . . . . . . . . . . 1.3 Conventions de schmatisation des concepts . . 1.3.1 Prsentation des conventions . . . . . . 1.3.2 Intrts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

XVII XXVII

1 1 2 2 4 4 5 5 6 6 8 9 9 9 10 11 11 12 13 14 15 15 16 17 17 18 19 20 20 20

Thorie de lcriture et ponctuation . . . . . . . . . . . 2.1 Regard linguistique sur lcriture . . . . . . . . . 2.1.1 Lcriture et les regards possibles . . . . 2.1.2 Constitution du concept de langue crite

IX

2.2

2.3

2.4 3

2.1.2.1 Un moule denvisagement de lobjet langue 2.1.2.2 Relation entre criture et langue . . . . . . 2.1.2.3 Vers une dnition de la langue crite . . . Classement et nomination des units de la langue crite . . . . 2.2.0 Pralables . . . . . . . . . . . . . . . . . . . . . . . . 2.2.0.1 Orientation de la dmarche de classement . 2.2.0.2 Lactivit pratique de transcription . . . . . 2.2.1 Unit de base et premire dichotomie . . . . . . . . . 2.2.2 Critre fonctionnel de double articulation . . . . . . . 2.2.2.1 Types de grammmes . . . . . . . . . . . 2.2.2.2 Types de topmes . . . . . . . . . . . . . . 2.2.3 Critre spatial . . . . . . . . . . . . . . . . . . . . . . 2.2.3.1 Autonomie des plrgrammes . . . . . . . 2.2.3.2 Axes de construction et de combinaison grammmes . . . . . . . . . . . . . . . . . 2.2.4 Paraphrasabilit et plurisystme . . . . . . . . . . . . 2.2.4.1 Paraphrasabilit . . . . . . . . . . . . . . 2.2.4.2 Abrviations et plurisystme . . . . . . . . 2.2.5 Synthse: hirarchie des scriptmes . . . . . . . . . . La ponctuation comme objet dtude . . . . . . . . . . . . . . 2.3.1 Recherche dune dnition . . . . . . . . . . . . . . . 2.3.1.1 Dnitions existantes . . . . . . . . . . . . 2.3.1.2 Dnition adopte . . . . . . . . . . . . . 2.3.2 Valeur des ponctogrammes . . . . . . . . . . . . . . . 2.3.2.1 Multiplicit des fonctions . . . . . . . . . 2.3.2.2 Largeur du champ . . . . . . . . . . . . . 2.3.3 Inventaire des formes . . . . . . . . . . . . . . . . . . Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . des . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21 21 24 24 25 25 25 27 29 29 30 30 30 32 34 35 36 38 38 38 38 42 42 43 43 45 45 47 47 48 49 49 50 53 53 56 57 59 60 60 60 62 64 64 65

Modle danalyse linguistique . . . . . . . . . . . . . . . . . . . . . . . 3.1 Pralables mthodologiques . . . . . . . . . . . . . . . . . . . . . 3.1.1 Concepts et terminologie linguistique . . . . . . . . . . . 3.1.2 Les units de base . . . . . . . . . . . . . . . . . . . . . 3.1.2.1 Unit maximale: le texte . . . . . . . . . . . . 3.1.2.2 Unit minimale: le mot . . . . . . . . . . . . . 3.1.3 Dcrire lancien franais . . . . . . . . . . . . . . . . . . 3.1.3.1 Dcrire la langue: triple organisation de lnonc 3.1.3.2 Comprendre un tat de langue pass . . . . . . 3.1.3.3 Juger et prvoir la structure . . . . . . . . . . 3.1.3.4 Relativit des modles . . . . . . . . . . . . . 3.2 Morphologie et syntaxe . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 La syntaxe comme un systme de relations . . . . . . . . 3.2.1.1 Un systme de dpendances . . . . . . . . . . 3.2.1.2 Relation minimale . . . . . . . . . . . . . . . 3.2.2 La morphologie et le systme de marques . . . . . . . . . 3.2.2.1 Expression et contenu . . . . . . . . . . . . . 3.2.2.2 Marques et spcication . . . . . . . . . . . .

3.3

3.4

Des marques qui nexpriment pas que des relations . . . . . . . . . . . . . . . . . . . . . . 3.2.3 Niveaux danalyse syntaxique . . . . . . . . . . . . . . . 3.2.3.1 Tripartition de la syntaxe selon Gilbert Lazard 3.2.3.2 Des marques tous les niveaux . . . . . . . . Parties du discours . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Limpasse de la voie traditionnelle . . . . . . . . . . . . . 3.3.2 Limpasse de la voie syntaxique . . . . . . . . . . . . . . 3.3.3 Catgories smantiques grammaticalises et syntaxe de mot 3.3.3.1 Verbes . . . . . . . . . . . . . . . . . . . . . 3.3.3.2 Noms . . . . . . . . . . . . . . . . . . . . . . 3.3.3.3 Adverbes . . . . . . . . . . . . . . . . . . . . 3.3.4 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . Description analytique de lancien franais des chartes . . . . . . . 3.4.1 Du texte la phrase, en passant par lnonc . . . . . . . 3.4.1.1 Dlimiter lnonc et la phrase . . . . . . . . . 3.4.1.2 Phrases-noncs et noncs non phrastiques . . 3.4.1.3 Enchanement des noncs phrastiques . . . . 3.4.1.4 Synthse . . . . . . . . . . . . . . . . . . . . 3.4.2 Subdivision de la phrase et structure argumentale . . . . . 3.4.2.1 Relations argumentales: gnralits . . . . . . 3.4.2.2 Actants et marques morphologiques . . . . . . 3.4.2.3 Circonstants . . . . . . . . . . . . . . . . . . 3.4.2.4 Cas intermdiaires . . . . . . . . . . . . . . 3.4.2.5 Synthse . . . . . . . . . . . . . . . . . . . . 3.4.3 Construction du prdicat . . . . . . . . . . . . . . . . . . 3.4.3.1 Problme des temps composs . . . . . . . 3.4.3.2 Position adopte . . . . . . . . . . . . . . . . 3.4.4 Construction des arguments . . . . . . . . . . . . . . . . 3.4.4.1 Noms: spcication synthtique additionnelle . 3.4.4.2 Noms: spcication analytique segmentale . . 3.4.4.3 Noms: spcication squentielle . . . . . . . . 3.4.4.4 Adverbes . . . . . . . . . . . . . . . . . . . . 3.4.4.5 Propositions avec prdicat personnel . . . . . . 3.4.4.6 Propositions avec prdicat non personnel . . . 3.4.4.7 Synthse . . . . . . . . . . . . . . . . . . . . 3.4.5 Construction des noncs non phrastiques . . . . . . . . . 3.4.5.1 Structure exprimant un procs . . . . . . . . . 3.4.5.2 Structure nexprimant pas un procs . . . . . . 3.4.6 Relations immdiates . . . . . . . . . . . . . . . . . . . . 3.4.6.1 Apposition et dtermination . . . . . . . . . . 3.4.6.2 Spcication de la dtermination . . . . . . . 3.4.6.3 Adverbes . . . . . . . . . . . . . . . . . . . . 3.4.6.4 Propositions avec prdicat personnel . . . . . . 3.4.6.5 Propositions avec prdicat non personnel . . . 3.4.6.6 Synthse . . . . . . . . . . . . . . . . . . . . 3.4.7 Problmes gnraux . . . . . . . . . . . . . . . . . . . .

3.2.2.3

66 67 67 68 69 69 70 71 72 73 74 75 76 77 77 79 82 85 86 86 90 96 98 101 104 104 105 106 106 107 109 110 111 114 118 119 119 121 122 122 126 127 131 136 137 137

XI

3.4.7.1 3.4.7.2 3.4.7.3 3.4.7.4 3.4.7.5 3.4.7.6 Conclusions . .

3.5 4

Relations argumentales ou relations diates? . . . . . . . . . . . . . . . . . Coordination . . . . . . . . . . . . . . Hirarchie des appositions . . . . . . . Porte des slections . . . . . . . . . . Structures discontinues . . . . . . . . . Hors systme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

imm. . . . . . . . . . . . . . . . . . . . . . . . . . . .

138 141 144 145 147 148 149 151 151 152 153 153 154 154 155 156 156 157 158 158 159 159 160 161 162 162 162 162 163 164 164 165 167 167 167 168 168 169 169 170 170 171 171 171

Mthode danalyse statistique . . . . . . . . . . . . . . . . . . . 4.1 Introduction aux principes de statistiques employs . . . . . 4.1.1 Individus et variables . . . . . . . . . . . . . . . . 4.1.2 Distribution et reprsentations graphiques . . . . . 4.1.2.1 Donnes . . . . . . . . . . . . . . . . 4.1.2.2 Histogramme . . . . . . . . . . . . . . 4.1.2.3 Courbe de densit . . . . . . . . . . . 4.1.2.4 Bote moustaches . . . . . . . . . . . 4.1.3 Test dhypothse . . . . . . . . . . . . . . . . . . 4.1.3.1 Concept dhypothse nulle . . . . . . . 4.1.3.2 Jugement de lutilisateur . . . . . . . . 4.2 Statistiques et validit des analyses . . . . . . . . . . . . . 4.2.1 Nature des donnes . . . . . . . . . . . . . . . . . 4.2.2 Pertinence des questions . . . . . . . . . . . . . . 4.2.3 Formalisation des donnes . . . . . . . . . . . . . 4.2.4 Finesse de la description . . . . . . . . . . . . . . 4.2.4.1 Rintroduction des informations . . . . 4.2.4.2 Commentaire des donnes insufsantes 4.2.5 volution du corpus et de la dmarche danalyse . 4.2.5.1 Reproductibilit . . . . . . . . . . . . 4.2.5.2 Recherche de linattendu . . . . . . . . 4.2.5.3 Perfectibilit des tapes . . . . . . . . 4.3 Mode opratoire . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Ordre de lanalyse . . . . . . . . . . . . . . . . . 4.3.2 Prsentation des dpouillements et des rsultats . . Tendances gnrales . . . . . . . . . . . . . . . . . . . . . 5.0 Dnition des donnes . . . . . . . . . . . . . . . . . 5.0.1 Choix des individus et taille de lchantillon . 5.0.2 Dnition des individus . . . . . . . . . . . 5.0.2.1 Variables morphosyntaxiques . . 5.0.2.2 Variables positionnelles . . . . . 5.0.2.3 Variables ponctuationnelles . . . 5.0.2.4 Dnition complte de lexemple 5.1 Tris plat . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1 Variables morphosyntaxiques . . . . . . . . 5.1.1.1 Variable MI . . . . . . . . . . . . 5.1.1.2 Variable MF . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

XII

5.2

5.3

5.1.1.3 Variable MN . . . . . . . . . . . . . . . . . . 5.1.1.4 Variable MR . . . . . . . . . . . . . . . . . . 5.1.1.5 Synthse des variables morphosyntaxiques . . 5.1.2 Variables positionnelles . . . . . . . . . . . . . . . . . . 5.1.3 Ponctuation . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.3.1 Donnes . . . . . . . . . . . . . . . . . . . . 5.1.3.2 Difcults . . . . . . . . . . . . . . . . . . . Tris croiss par variable . . . . . . . . . . . . . . . . . . . . . . . 5.2.1 Guide de lecture . . . . . . . . . . . . . . . . . . . . . . 5.2.1.1 Tableau de contingence . . . . . . . . . . . . . 5.2.1.2 Test du 2 (chi-carr) . . . . . . . . . . . . 5.2.1.3 Rapport de chances . . . . . . . . . . . . . . . 5.2.1.4 Structure de lcart . . . . . . . . . . . . . . . 5.2.1.5 Test exact de Fisher . . . . . . . . . . . . . . 5.2.2 Examen des tris croiss . . . . . . . . . . . . . . . . . . . 5.2.2.1 Variable MI . . . . . . . . . . . . . . . . . . . 5.2.2.2 Variable MF . . . . . . . . . . . . . . . . . . 5.2.2.3 Variable MN . . . . . . . . . . . . . . . . . . 5.2.2.4 Variable MR . . . . . . . . . . . . . . . . . . 5.2.2.5 Variable LID . . . . . . . . . . . . . . . . . . 5.2.2.6 Variable LIF . . . . . . . . . . . . . . . . . . 5.2.3 Synthse et critique de la dmarche . . . . . . . . . . . . 5.2.3.1 Ponctuation et segmentation en constituants . . 5.2.3.2 Un panorama trop gnral . . . . . . . . . . . 5.2.3.3 Atomisation des individus . . . . . . . . . . . Tris croiss sur une variable de synthse . . . . . . . . . . . . . . 5.3.1 Procdure . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1.1 Fusion des variables . . . . . . . . . . . . . . 5.3.1.2 Sparation par modalit de MI . . . . . . . . . 5.3.1.3 Dcomposition des carts . . . . . . . . . . . 5.3.2 Examen des tris croiss . . . . . . . . . . . . . . . . . . . 5.3.2.1 Phrase . . . . . . . . . . . . . . . . . . . . . . 5.3.2.2 Propositions personnelles de fonction argumentale . . . . . . . . . . . . . . . . . . . . . . . 5.3.2.3 Propositions non personnelles de fonction argumentale . . . . . . . . . . . . . . . . . . . . . 5.3.2.4 Arguments non propositionnels . . . . . . . . 5.3.2.5 Propositions personnelles de fonction immdiate 5.3.2.6 Propositions non personnelles de fonction immdiate . . . . . . . . . . . . . . . . . . . . . 5.3.2.7 Constituants non propositionnels de fonction immdiate . . . . . . . . . . . . . . . . . . . 5.3.3 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.3.1 Rgularits . . . . . . . . . . . . . . . . . . . 5.3.3.2 Tableaux synoptiques . . . . . . . . . . . . . . 5.3.3.3 Points forts et questions . . . . . . . . . . . .

172 172 173 173 174 174 174 176 177 177 177 180 180 181 181 182 183 184 185 185 186 187 187 188 190 191 191 191 192 193 194 194 201 205 208 211 215 216 218 219 219 224

XIII

Frquences de marquage . . . . . . . . . . . . . . . . . . . . . . . . . . 6.0 Procdure danalyse . . . . . . . . . . . . . . . . . . . . . . . . . 6.0.1 Dnition des donnes . . . . . . . . . . . . . . . . . . . 6.0.1.1 Variables additionnelles . . . . . . . . . . . . 6.0.1.2 Slection des individus . . . . . . . . . . . . . 6.0.2 tapes de lanalyse . . . . . . . . . . . . . . . . . . . . . 6.1 Examen des structures argumentales et de la coordination . . . . . 6.1.1 Phrase et proposition personnelle . . . . . . . . . . . . . 6.1.1.1 Frquence du marquage initial . . . . . . . . . 6.1.1.2 Frquence du marquage nal . . . . . . . . . . 6.1.1.3 Synthse de lanalyse sur la ponctuation de la phrase . . . . . . . . . . . . . . . . . . . . . . 6.1.2 Prdicat . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.2.1 P0 et PPD de manire gnrale . . . . . . . . . 6.1.2.2 P0 et PPF de manire gnrale . . . . . . . . . 6.1.2.3 1,0,P0,0,0 et PPD dans MI.pers . . . . . . . 6.1.2.4 Synthse . . . . . . . . . . . . . . . . . . . . 6.1.3 Actants et A4 . . . . . . . . . . . . . . . . . . . . . . . . 6.1.3.1 0,0,S1,0,0 (phrase): PPD . . . . . . . . . . . . 6.1.3.2 0,0,S1,0,0 (phrase): PPF . . . . . . . . . . . . 6.1.3.3 0,1,S1,pers,1 (phrase): PPD . . . . . . . . . . 6.1.3.4 0,0,R2,0,0 (phrase, pers): PPD . . . . . . . . 6.1.3.5 0,0,R2,0,0 (phrase, pers-arg, pers-arg, pers): PPF . . . . . . . . . . . . . . . . . . . . . . . 6.1.3.6 0,0,R2,pers,1 (pers): PPD . . . . . . . . . . . 6.1.3.7 0,0,R2,pers,1 (phrase, pers): PPF . . . . . . . 6.1.3.8 0,1,R2,0,0 (phrase): PPD . . . . . . . . . . . . 6.1.3.9 0,1,R2,pers,1 (pers-arg): PPD . . . . . . . . 6.1.3.10 0,0,R2,pers,0 (phrase, pers): PPF . . . . . . . 6.1.3.11 0,0,R3,0,1 (phrase, pers-arg, pers-arg, pers): PPF . . . . . . . . . . . . . . . . . . . . . . . 6.1.3.12 1,0,R3,0,1 (phrase): PPF . . . . . . . . . . . . 6.1.3.13 0,0,A4,0,1 (pers-arg, pers-arg, pers): PPF . . 6.1.3.14 Synthse . . . . . . . . . . . . . . . . . . . . 6.1.4 Circonstants . . . . . . . . . . . . . . . . . . . . . . . . 6.1.4.1 0,0,C5,pers,0 . . . . . . . . . . . . . . . . . . 6.1.4.2 0,0,C5,0,0 (phrase, pers-arg, pers): PPF . . 6.1.4.3 0,0,C5,0,1 (pers, pers): PPD . . . . . . . . . 6.1.4.4 0,0,C5,0,1 (phrase, pers-arg, pers-arg, pers, pers): PPF . . . . . . . . . . . . . . . . . . . 6.1.4.5 0,0,C5,pers,1 (phrase): PPF . . . . . . . . . 6.1.4.6 0,0,C5,pers,1 (phrase, pers-arg, pers): PPF . . 6.1.4.7 1,0,C5,pers,1 (phrase): PPF . . . . . . . . . . 6.1.4.8 0,1,C5,0,0 (phrase, pers-arg, pers, pers): PPD 6.1.4.9 0,1,C5,0,1 (phrase, pers-arg, pers): PPD . . . 6.1.4.10 0,1,C5,pers,1 (phrase, pers): PPD . . . . . . 6.1.4.11 0,1,C5,pers,1 (phrase): PPD . . . . . . . . . .

229 229 229 230 230 231 232 232 232 241 247 250 250 256 258 259 261 261 263 265 267 269 272 272 273 274 275 276 277 278 279 282 282 287 288 290 292 292 293 294 295 296 297

XIV

6.2

6.3

6.4

6.1.4.12 Synthse . . . . . . . . . . . . . . . . . . . . Coordination . . . . . . . . . . . . . . . . . . . . . . . . 6.1.5.1 Prparation des donnes . . . . . . . . . . . . 6.1.5.2 Analyse . . . . . . . . . . . . . . . . . . . . . 6.1.5.3 Synthse . . . . . . . . . . . . . . . . . . . . Syntaxe immdiate . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1 Rvision des tableaux synoptiques pour la syntaxe immdiate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2 Examen des ruptures . . . . . . . . . . . . . . . . . . . . 6.2.2.1 0,0,Ap,0,0 (synt): PPD . . . . . . . . . . . . . 6.2.2.2 0,1,Ap,pers,1 (synt-arg, synt): PPD . . . . . . 6.2.2.3 1,0,Dt,0,1 (synt): PPF . . . . . . . . . . . . . 6.2.2.4 0,0,Ap,pers,1 (synt-arg, synt): PPF . . . . . . 6.2.2.5 0,0,Ap,pers,0 (synt-arg): PPF . . . . . . . . . 6.2.3 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . Relateurs et C6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Attraction de PPD.1 par les C6 et les coordonnants . . . . 6.3.1.1 Ressemblances . . . . . . . . . . . . . . . . . 6.3.1.2 Donnes numriques . . . . . . . . . . . . . . 6.3.2 Rpulsions de PPF.1 . . . . . . . . . . . . . . . . . . . . 6.3.2.1 C6 . . . . . . . . . . . . . . . . . . . . . . . . 6.3.2.2 Relateurs non coordonnants . . . . . . . . . . 6.3.2.3 Relateurs coordonnants . . . . . . . . . . . . . Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.1 Cohrence dans le corpus . . . . . . . . . . . . . . . . . 6.4.2 Interfrences non contrles . . . . . . . . . . . . . . . . 6.4.2.1 Interfrences smantiques . . . . . . . . . . . 6.4.2.2 Interfrences nonciatives . . . . . . . . . . . 6.4.3 Remise en question du modle . . . . . . . . . . . . . . . 6.4.3.1 Lexmes employs . . . . . . . . . . . . . . . 6.4.3.2 Coordination et apposition . . . . . . . . . . . 6.4.3.3 Description de la syntaxe immdiate . . . . . . 6.4.3.4 Coordonnants et autres relateurs . . . . . . . . 6.4.4 Rgles et proportions de marquage expliqu . . . . . . 6.4.4.1 Interdictions . . . . . . . . . . . . . . . . . . 6.4.4.2 Rgularit des tendances . . . . . . . . . . . . 6.4.4.3 Puissance explicative . . . . . . . . . . . . . . 6.1.5

298 300 301 302 306 308 309 311 311 313 314 315 315 316 317 317 317 317 320 320 323 325 326 326 327 327 328 329 329 329 330 330 330 330 331 332 333 333 333 334 335 336 337 340 341

Forme du marquage . . . . . . . . . . . . . . . . . . 7.1 Donnes soumises lanalyse . . . . . . . . . 7.1.1 Frquence des ponctogrammes . . . . 7.1.2 Cration du tableau de contingence . 7.2 Analyse factorielle des donnes . . . . . . . . 7.2.1 Dcomposition du tableau . . . . . . 7.2.2 Reprsentation bidimensionnelle . . . 7.2.3 Interprtation . . . . . . . . . . . . . 7.2.4 Rduction du tableau de contingence

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

XV

7.3 7.4

7.5

7.2.4.1 Modalits de faible effectif . . . . . . 7.2.4.2 Analyse du tableau rduit . . . . . . Tests statistiques sur les groupements obtenus . . . . . . Ponctogrammes rares . . . . . . . . . . . . . . . . . . . 7.4.1 Ponctogramme : . . . . . . . . . . . . . . . . 7.4.2 Ponctogramme . . . . . . . . . . . . . . . . 7.4.3 Ponctogramme ; . . . . . . . . . . . . . . . . 7.4.4 Ponctogramme // . . . . . . . . . . . . . . . . 7.4.5 Ponctogramme / . . . . . . . . . . . . . . . . 7.4.6 Ponctogramme . . . . . . . . . . . . . . . . Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . 7.5.1 Implications smiotiques de la varit des formes 7.5.1.1 Facultativit . . . . . . . . . . . . . 7.5.1.2 Force . . . . . . . . . . . . . . . . . 7.5.2 Problmes lis la substance . . . . . . . . . . . 7.5.2.1 Validit des transcriptions . . . . . . 7.5.2.2 Ponctogrammes et systme graphique

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

342 347 350 352 352 353 354 355 356 356 356 356 357 357 357 358 358 359 359 359 360 362 364 364 364 365 367 367 367 368 369 369 369 370 370 371 371 371 372 372 373 373 378 383

Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1 Progression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1.1 Premire partie: modlisation . . . . . . . . . . . . . . . 8.1.2 Deuxime partie: analyse des donnes . . . . . . . . . . . 8.1.3 Tableau de synthse . . . . . . . . . . . . . . . . . . . . 8.2 lpreuve dautres matriaux . . . . . . . . . . . . . . . . . . . 8.2.1 Charte luxembourgeoise ou lorraine de 1245 . . . . . . . 8.2.1.1 Lecture suivie . . . . . . . . . . . . . . . . . . 8.2.1.2 Signes expliqus . . . . . . . . . . . . . . . . 8.2.1.3 Rsultats . . . . . . . . . . . . . . . . . . . . 8.2.2 Charte champenoise de 1270 . . . . . . . . . . . . . . . . 8.2.2.1 Lecture suivie . . . . . . . . . . . . . . . . . . 8.2.2.2 Signes expliqus . . . . . . . . . . . . . . . . 8.2.2.3 Rsultats . . . . . . . . . . . . . . . . . . . . 8.2.3 Apports des analyses . . . . . . . . . . . . . . . . . . . . 8.3 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.1 Enrichissement du corpus . . . . . . . . . . . . . . . . . 8.3.1.1 Meilleure reprsentation des modalits . . . . 8.3.1.2 Meilleure description externe . . . . . . . . . 8.3.2 Faits linguistiques exploits . . . . . . . . . . . . . . . . 8.3.2.1 Approfondissement et amlioration du modle 8.3.2.2 Autres points de vue . . . . . . . . . . . . . . 8.3.3 Interfrences avec le systme graphique . . . . . . . . . .

Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Travaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B Documents darchives . . . . . . . . . . . . . . . . . . . . . . . . Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

XVI

Table des gures

1.1 1.2 1.3 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 2.14 2.15 2.16 2.17 2.18 2.19 2.20 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12

Reprsentation dun concept et de ses caractres . . . . . . . . . . . . Reprsentation dun concept non nomm . . . . . . . . . . . . . . . . Reprsentation dune hirarchie de concepts . . . . . . . . . . . . . . Concept de langue . . . . . . . . . . . . . . . . . . . . . . . . . . . Concept de langue crite . . . . . . . . . . . . . . . . . . . . . . . Exemple de ralisation (Document 12720708, 1) . . . . . . . . . Exemples de puncti (Document 12720708, 2) . . . . . . . . . . . Exemple daccent dcal (Document 12770203, 27) . . . . . . . Concept de scriptme . . . . . . . . . . . . . . . . . . . . . . . . . Types de scriptmes . . . . . . . . . . . . . . . . . . . . . . . . . . Types de grammmes: critre fonctionnel . . . . . . . . . . . . . . Types de topmes: critre fonctionnel . . . . . . . . . . . . . . . . Exemple de cngramme marqu (Document 12820201, 2) . . Types de plrgrammes: critre dautonomie . . . . . . . . . . . . . Exemple de t (Document 12820201, 2) . . . . . . . . . . . . . Types de plrgrammes: axe de construction . . . . . . . . . . . . . Types de cngrammes: axe de construction (provisoire) . . . . . . Types de nbulogrammes . . . . . . . . . . . . . . . . . . . . . . . Exemple dabrviation par contraction (Document 12711203a, 11) Exemple dabrviation par lettre suscrite (Document 123607, 6) . . Concept de logogramme . . . . . . . . . . . . . . . . . . . . . . . Types de scriptmes (classement complet) . . . . . . . . . . . . . . Concept de ponctuation . . . . . . . . . . . . . . . . . . . . . . . . Schmatisation du type de texte charte selon Marie-Guy Boutier Concept de texte . . . . . . . . . . . . . . . . . . . . . . . . . . Concept doccurrence . . . . . . . . . . . . . . . . . . . . . . . Concept de mot . . . . . . . . . . . . . . . . . . . . . . . . . . Concept de lexme . . . . . . . . . . . . . . . . . . . . . . . . Concept dnonc . . . . . . . . . . . . . . . . . . . . . . . . . Concept de syntaxe . . . . . . . . . . . . . . . . . . . . . . . . Reprsentation de la relation minimale . . . . . . . . . . . . . . Concept de constituant immdiat . . . . . . . . . . . . . . . . . Concept de relation . . . . . . . . . . . . . . . . . . . . . . . . Reprsentation de la spcication . . . . . . . . . . . . . . . . . Structure de ont doneit a Jakemin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17 17 17 22 24 26 27 27 28 28 29 30 31 31 32 34 34 36 36 37 37 39 42 50 51 53 53 53 54 62 64 64 64 66 66

XVII

3.13 3.14 3.15 3.16 3.17 3.18 3.19 3.20 3.21 3.22 3.23 3.24 3.25 3.26 3.27 3.28 3.29 3.30 3.31 3.32 3.33 3.34 3.35 3.36 3.37 3.38 3.39 3.40 3.41 3.42 3.43 3.44 3.45 3.46 3.47 3.48 3.49 3.50 3.51 3.52 3.53 3.54 3.55 3.56 3.57 3.58 3.59

Types de fonctions syntaxiques suivant les termes relis . . . . . . Types de syntaxe . . . . . . . . . . . . . . . . . . . . . . . . . . Types de parties du discours . . . . . . . . . . . . . . . . . . . . Types dnoncs en fonction de leur structure morphosyntaxique . Relations smantiques marquant des relations syntaxiques . . . . . Principaux constituants immdiats de la phrase . . . . . . . . . . Reprsentation de R2 . . . . . . . . . . . . . . . . . . . . . . . . Reprsentation de S1 . . . . . . . . . . . . . . . . . . . . . . . . Types dactants en fonction de leur forme . . . . . . . . . . . . . Reprsentation de la relation attributive impliquant S1 et R2 . . . Types dactants en fonction de leur potentiel commutatoire . . . . Types darguments en fonction de leur potentiel commutatoire . . Types de circonstants . . . . . . . . . . . . . . . . . . . . . . . . Types darguments . . . . . . . . . . . . . . . . . . . . . . . . . Relation attributive impliquant R2 et A4 . . . . . . . . . . . . . . Types de constituants immdiats de la phrase (classement complet) Reprsentation des relations syntaxiques impliquant des arguments Reprsentation des relations argumentales simples . . . . . . . . . Reprsentation de la dpendance . . . . . . . . . . . . . . . . . . Reprsentation de la combinaison avec dpendance . . . . . . . . Convention dannotation des relations . . . . . . . . . . . . . . . Reprsentation de la relation attributive . . . . . . . . . . . . . . Structure de P0 complexe (lauxili est argumental) . . . . . . . . Structure de P0 complexe (lauxili nest pas argumental) . . . . . Concept de relateur . . . . . . . . . . . . . . . . . . . . . . . . . Structure de a savoir est que. . . . . . . . . . . . . . . . . . . . . . Structure de a savoir faisons que. . . . . . . . . . . . . . . . . . . Structure de fera loer me femme . . . . . . . . . . . . . . . . . . Structure de a savoir vos faisons ke. . . . . . . . . . . . . . . . . . Structure de o mon frere tesmonghier . . . . . . . . . . . . . . . Structure de me constraindre a tenir. . . . . . . . . . . . . . . . . Structure rejete de Jakemes. . . conoistre veriteit . . . . . . . . . . Structure de Henri. . . salut en Nostre Signeur . . . . . . . . . . . Structure de Jakemes. . . conoistre veriteit . . . . . . . . . . . . . Structure de En nom du Pere. . . Amen . . . . . . . . . . . . . . . Structure de sires Gerars aroit. . . . . . . . . . . . . . . . . . . . . Types de combinaisons . . . . . . . . . . . . . . . . . . . . . . . Structure de lhe mon saingnor. . . . . . . . . . . . . . . . . . . . Types de slections . . . . . . . . . . . . . . . . . . . . . . . . . Structure de le decs dame Magon . . . . . . . . . . . . . . . . . Structure de lhes a mon sainor. . . . . . . . . . . . . . . . . . . . Fonctions du relateur au niveau argumental . . . . . . . . . . . . Fonctions du relateur au niveau immdiat . . . . . . . . . . . . . Structure de ci devant . . . . . . . . . . . . . . . . . . . . . . . . Structure de trop damajousement . . . . . . . . . . . . . . . . . . Structure de par deseur avec dtermination (hors contexte) . . . . Structure de par deseur avec dtermination (relateur) . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

66 68 75 85 90 90 93 93 93 95 96 97 98 99 101 102 103 103 103 104 104 104 105 105 108 116 116 117 117 117 118 120 120 121 122 123 124 124 126 126 126 128 128 129 130 130 130

XVIII

3.60 3.61 3.62 3.63 3.64 3.65 3.66 3.67 3.68 3.69 3.70 3.71 3.72 3.73 3.74 3.75 3.76 3.77 3.78 3.79 3.80 3.81 3.82 4.1 4.2 4.3 4.4 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.10 5.11 5.12 5.13 5.14

Structure de par deseur sans dtermination (relateur) . . . . . . Structure de par desor les quatuose. . . . . . . . . . . . . . . . . Apposition dune relative et dun nom . . . . . . . . . . . . . . Apposition dune relative et dun nom: fonctions du relateur . . Apposition dune compltive et dun nom . . . . . . . . . . . . Structure de avons pendu. . . por que. . . . . . . . . . . . . . . . Structure rejete de la relation entre nom et participe coorients . Structure de la relation entre nom et participe coorients . . . . . Types de relations . . . . . . . . . . . . . . . . . . . . . . . . . Relation mdiate entre un nom et un innitif relat . . . . . . . Structure de la dtermination dun nom par un innitif relat . . Interprtation argumentale de des siez jornaz. . . doit le moiti. . . Interprtation immdiate de des siez jornaz. . . doit le moiti. . . . Structure de Jakes. . ., li maire. . . de Liege faisons savoir ke. . . . Structure de Ermensens. . . et Henri. . . (coordonnant spciant) . Dcomposition dune coordination (1) . . . . . . . . . . . . . . Dcomposition dune coordination (2) . . . . . . . . . . . . . . Structure de aura li glise le deus et li voweiz le tierce . . . . . . Interprtation des C5 de niveau ambigu . . . . . . . . . . . . . Structure de on bonier dalu de terre. . . (hirarchie 1) . . . . . . Structure de on bonier dalu de terre. . . (hirarchie 2) . . . . . . Structure de on bonier dalu de terre. . . (structure plate) . . . . Structure de lhe Tyri de Jace . . . . . . . . . . . . . . . . . . . Histogramme des R2 par phrase, par charte . . . . Estimateur de densit des R2 par phrases, par charte Bote moustache des R2 par phrase, par charte . . Probabilit que R2 5% . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . .

130 130 132 132 134 135 136 136 137 139 139 140 140 141 142 143 143 143 146 146 146 147 147 154 154 155 156 187 188 188 189 189 189 189 190 195 195 198 198 199 199

Synthse aprs tris croiss gnraux: segmentation et ponctogrammes Synthse aprs tris croiss gnraux: segmentation, relateurs et ponctogrammes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Synthse aprs tris croiss gnraux: interruption . . . . . . . . . . . Synthse aprs tris croiss gnraux: ponctogramme devant et derrire Synthse aprs tris croiss gnraux: ponctogramme devant seulement Synthse aprs tris croiss gnraux: ponctogramme derrire seulement Synthse aprs tris croiss gnraux: aucun ponctogramme . . . . . . Synthse aprs tris croiss gnraux: cas intermdiaires . . . . . . . . Attractions entre PPD et MM, au niveau phrase . . . . . . . . . . . . Rpulsions entre PPD et MM, au niveau phrase . . . . . . . . . . . . Attractions signicatives entre PPD et MM, au niveau phrase (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre PPD et MM, au niveau phrase (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau phrase . . . . . . . . . . . . Rpulsions entre PPF et MM, au niveau phrase . . . . . . . . . . . .

XIX

5.15 5.16 5.17 5.18 5.19 5.20 5.21 5.22 5.23 5.24 5.25 5.26 5.27 5.28 5.29 5.30 5.31 5.32 5.33 5.34 5.35 5.36 5.37 5.38 5.39 5.40 5.41 5.42 5.43 5.44 5.45

Attractions signicatives entre PPF et MM, au niveau phrase (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre PPF et MM, au niveau phrase (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et MM, au niveau pers-arg . . . . . . . . . . . Rpulsions entre PPD et MM, au niveau pers-arg . . . . . . . . . . . Attractions signicatives entre PPD et MM, au niveau pers-arg (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre PPD et MM, au niveau pers-arg (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau pers-arg . . . . . . . . . . . . Rpulsions entre PPF et MM, au niveau pers-arg . . . . . . . . . . . . Attractions signicatives entre PPF et MM, au niveau pers-arg (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre PPF et MM, au niveau pers-arg (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et MM, au niveau pers-arg . . . . . . . . . . . Rpulsions entre PPD et MM, au niveau pers-arg . . . . . . . . . . . Attractions signicatives entre PPD et MM, au niveau pers-arg (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre PPD et MM, au niveau pers-arg (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau pers-arg . . . . . . . . . . . Rpulsions entre PPF et MM, au niveau pers-arg . . . . . . . . . . . Attractions signicatives entre PPF et MM, au niveau pers-arg (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre PPF et MM, au niveau pers-arg (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et MM, au niveau synt-arg . . . . . . . . . . . Rpulsions entre PPD et MM, au niveau synt-arg . . . . . . . . . . . Attractions signicatives entre PPD et MM, au niveau synt-arg (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre PPD et MM, au niveau synt-arg (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau synt-arg . . . . . . . . . . . . Rpulsions entre PPF et MM, au niveau synt-arg . . . . . . . . . . . . Attractions signicatives entre PPF et MM, au niveau synt-arg (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre PPF et MM, au niveau synt-arg (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et MM, au niveau pers . . . . . . . . . . . . . Rpulsions entre PPD et MM, au niveau pers . . . . . . . . . . . . . Attractions signicatives entre PPD et MM, au niveau pers (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre PPD et MM, au niveau pers (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau pers . . . . . . . . . . . . . .

200 200 201 202 202 203 203 203 204 205 205 206 206 206 207 207 208 208 209 209 209 209 210 210 211 211 212 212 213 213 213

XX

5.46 5.47 5.48 5.49 5.50 5.51 5.52 5.53 5.54 5.55 5.56 5.57 5.58 5.59 5.60 5.61 5.62 5.63

Rpulsions entre PPF et MM, au niveau pers . . . . . . . . . . . . . . Attractions signicatives entre PPF et MM, au niveau pers (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre PPF et MM, au niveau pers (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et MM, au niveau pers . . . . . . . . . . . . . Rpulsions entre PPD et MM, au niveau pers . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau pers . . . . . . . . . . . . . Rpulsions entre PPF et MM, au niveau pers . . . . . . . . . . . . . Attractions signicatives entre PPF et MM, au niveau pers (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre PPF et MM, au niveau pers (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et MM, au niveau synt . . . . . . . . . . . . . Rpulsions entre PPD et MM, au niveau synt . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau synt . . . . . . . . . . . . . . Rpulsions entre PPF et MM, au niveau synt . . . . . . . . . . . . . . Proportions de marquage . . . . . . . . . . . . . . . . . . . . . . . . Tableau synoptique des tendances gnrales, PPD . . . . . . . . . . . Tableau synoptique des tendances gnrales, PPF . . . . . . . . . . . Tableau synoptique des tendances gnrales, PPD (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tableau synoptique des tendances gnrales, PPF (sans les constituants naux) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et la phrase par charte . . . . . . . . . . . . . . Rpulsions entre PPD et la phrase par charte . . . . . . . . . . . . . . Attractions entre PPD et la proposition argumentale par charte . . . . Rpulsions entre PPD et la proposition argumentale par charte . . . . Attractions entre PPD et la proposition immdiate par charte . . . . . Rpulsions entre PPD et la proposition immdiate par charte . . . . . Graphiques des frquences de marquage initial des propositions . . . Attractions entre PPF et la phrase par charte . . . . . . . . . . . . . . Rpulsions entre PPF et la phrase par charte . . . . . . . . . . . . . . Graphiques des frquence de marquage nal des propositions . . . . . Graphiques des frquences de marquage nal de la phrase (haut) et de la p. imm. (bas) par rapport p. arg. . . . . . . . . . . . . . . . . . . Attractions entre PPD et le prdicat par document . . . . . . . . . . . Rpulsions entre PPD et le prdicat par document . . . . . . . . . . . Attractions entre PPD et le prdicat par construction prcdente . . . . Rpulsions entre PPD et le prdicat par construction prcdente . . . . Marquage nal du prdicat par document (attractions) . . . . . . . . . Attractions entre le prdicat et PPF par construction suivante . . . . . Rpulsions entre le prdicat et PPF par construction suivante . . . . . Attractions signicatives entre RB et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . .

214 214 214 215 215 216 216 216 216 217 217 218 218 220 222 223 224 225 234 234 235 235 236 237 239 241 242 244 246 251 252 253 253 257 257 258 262

6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 6.10 6.11 6.12 6.13 6.14 6.15 6.16 6.17 6.18 6.19

XXI

6.20 6.21 6.22 6.23 6.24 6.25 6.26 6.27 6.28 6.29 6.30 6.31 6.32 6.33 6.34 6.35 6.36 6.37 6.38 6.39 6.40 6.41 6.42 6.43

Rpulsions signicatives entre RB et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . Attractions signicatives entre MMP et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . Attractions signicatives entre RB et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre RB et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . Attractions signicatives entre RB et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre RB et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . . . . Attractions signicatives entre MMP et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . Attractions signicatives entre RB et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, pers-arg, pers) . . . . . . . . . Rpulsions signicatives entre RB et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, pers-arg, pers) . . . . . . . . . Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, pers-arg, pers) . . . . . . Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, pers-arg, pers) . . . . . . Attractions signicatives entre RB et PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . Attractions signicatives entre MMP et PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . Structure de savoir faisons que. . . . . . . . . . . . . . . . . . . . . . Structure de a savoir faisons que. . . (rappel) . . . . . . . . . . . . . . Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,R2,pers,0 (niveaux: phrase, pers) . . . . . . . . . . . . . . . Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,R2,pers,0 (niveaux: phrase, pers) . . . . . . . . . . . . . . . Attractions signicatives entre RB et PPF, pour les constituants de type 0,0,R3,0,1 (niveaux: phrase, pers-arg, pers-arg, pers) . . . . . . . . . Attractions signicatives entre MMS et PPF pour les constituants de type 0,0,R3,0,1 (niveau: phrase), rduit . . . . . . . . . . . . . . . . .

262 263 263 264 264 265 265 267 267 268 268 270 270 271 271 273 273 273 274 274 275 275 276 276

XXII

6.44 6.45 6.46 6.47 6.48 6.49 6.50 6.51 6.52 6.53 6.54 6.55 6.56 6.57 6.58 6.59 6.60 6.61 6.62 6.63 6.64 6.65 6.66

Rpulsions signicatives entre MMS et PPF pour les constituants de type 0,0,R3,0,1 (niveau: phrase), rduit . . . . . . . . . . . . . . . . . Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,A4,0,1 (niveaux: pers-arg, pers-arg, pers) . . . . . . . . . . Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,A4,0,1 (niveaux: pers-arg, pers-arg, pers) . . . . . . . . . . Attractions signicatives entre RB et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . Rpulsions signicatives entre RB et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . Attractions signicatives entre RB et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, pers) . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre RB et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, pers) . . . . . . . . . . . . . . . . . . . . Attractions signicatives entre MMP et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, pers) . . . . . . . . . . . . . . . . . Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, pers) . . . . . . . . . . . . . . . . . Attractions signicatives entre RB et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, pers-arg, pers, pers) . . . . . Rpulsions signicatives entre RB et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, pers-arg, pers, pers) . . . . . Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, pers-arg, pers, pers) . . Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, pers-arg, pers, pers) . . Attractions signicatives entre RB et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . Rpulsions signicatives entre RB et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . Attractions signicatives entre RB et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, pers-arg, pers, pers) . . . . . . . . . . Rpulsions signicatives entre RB et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, pers-arg, pers, pers) . . . . . . . . . . Attractions signicatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, pers-arg, pers, pers) . . . . . . . Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, pers-arg, pers, pers) . . . . . . .

277 279 279 287 287 288 288 289 289 289 289 290 291 291 292 293 293 293 293 294 294 294 295

XXIII

6.67 6.68 6.69 6.70 6.71 6.72 6.73 6.74 6.75 6.76 6.77 6.78 6.79 6.80 6.81 6.82 6.83 6.84 6.85 6.86 6.87

6.88

6.89 6.90 6.91

6.92

Attractions signicatives entre RB et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . . Rpulsions signicatives entre RB et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . . Attractions signicatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . Structure dune phrase comprenant deux circonstants (modle choisi) . Structure dune phrase comprenant deux circonstants (modle alternatif) Marquage initial de MC.n par constituant prcdent . . . . . . . . . Marquage initial de MC.n par constituant prcdent . . . . . . . . . Reprsentation de la spcication (rappel) . . . . . . . . . . . . . . . Structure de Ermensens. . . et Henri. . . (rappel) . . . . . . . . . . . . Reprsentation de la spcication de la coordination (revue) . . . . . Tableau synoptique des tendances en syntaxe immdiate, PPD (revu) . Tableau synoptique des tendances en syntaxe immdiate, PPF (revu) . Attractions signicatives entre RB et PPD, pour les constituants de type 0,0,Ap,0,0 (niveau: synt) . . . . . . . . . . . . . . . . . . . . . . . . Attractions signicatives entre MMP et PPD, pour les constituants de type 0,0,Ap,0,0 (niveau: synt) . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,0,Ap,0,0 (niveau: synt) . . . . . . . . . . . . . . . . . . . . . . Attractions signicatives entre MMP et PPD, pour les constituants de type 0,1,Ap,pers,1 (niveaux: synt, synt-arg) . . . . . . . . . . . . . . Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,1,Ap,pers,1 (niveaux: synt, synt-arg) . . . . . . . . . . . . . . Attractions signicatives entre RB et PPD, pour les constituants de type 1,0,C6,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre RB et PPD, pour les constituants de type 1,0,C6,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . Attractions signicatives entre RB et PPD, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, pers, persarg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre RB et PPD, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, pers, persarg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Proportions de marquage des C6 et des Co . . . . . . . . . . . . . . . Ralisation de ponctogramme aprs un C6: grattage (Document 12700929, 18) . . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions signicatives entre MMS et PPF, pour les constituants de type 1,0,Rl,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, pers, pers-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre MMS et PPF, pour les constituants de type 1,0,Rl,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, pers, pers-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

296 296 296 296 299 299 304 304 305 305 306 310 310 312 312 312 314 314 318 319

320

321 322 323

324

324

XXIV

6.93

6.94

6.95

Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, pers, pers-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, pers, pers-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Graphique des proportions de marquage expliqu par les environnements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dcomposition en valeurs propres . . . . . . . . . . . . . . . . . . Analyse factorielle des correspondances: points-colonnes . . . . . . Analyse factorielle des correspondances: points-lignes . . . . . . . Analyse factorielle des correspondances: forme des ponctogrammes environnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre CiF et RB pour punctus . . . . . . . . . . . . . Rpulsions entre CiF et RB pour punctus . . . . . . . . . . . . . Attractions entre CiF et RB pour punctus / . . . . . . . . . . . . . Rpulsions entre CiF et RB pour punctus / . . . . . . . . . . . . . Attractions entre CiF et RB pour punctus / . . . . . . . . . . . . . Rpulsions entre CiF et RB pour punctus / . . . . . . . . . . . . . Analyse factorielle des correspondances: forme des ponctogrammes environnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analyse factorielle des correspondances: forme des ponctogrammes environnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analyse factorielle des correspondances: forme des ponctogrammes environnement (points-lignes et points-colonnes spars) . . . . . . Analyse factorielle des correspondances: forme des ponctogrammes environnement (points-lignes et points-colonnes spars), facteurs 2 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ralisation de : (Document 124706, 17) . . . . . . . . . . . . . . Ralisation de : (Document 12710725, 9) . . . . . . . . . . . . Ralisation de (Document 12770701, 14) . . . . . . . . . . . Ralisation de (Document 12860515, 2) . . . . . . . . . . . . Ralisation de // (Document 12831226, 10) . . . . . . . . . . . Ralisation de / (Document 12740531a, 27) . . . . . . . . . . . Ralisation de (Document 12890112, 2) . . . . . . . . . . . . . . et . . . . . . . et . et . et . et et . . . . . . . .

325

326 332 336 338 339 339 342 342 343 343 343 343 345 346 347

7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 7.10 7.11 7.12 7.13 7.14

7.15 7.16 7.17 7.18 7.19 7.20 7.21

349 353 353 353 354 355 356 356

XXV

Liste des tableaux

2.1 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.10 5.11 5.12 5.13 5.14 5.15 5.16 5.17 5.18 5.19 5.20 5.21 5.22 5.23 5.24 5.25 5.26 5.27 5.28 5.29 5.30 5.31 5.32 5.33 5.34

Inventaire des ponctogrammes relevs . . . . . . . . . . . . . . . . . Exemple de dnition dindividu . . . . . . . . . . . . . . . . . Exemples de dnition dindividu . . . . . . . . . . . . . . . . Exemple de tri plat . . . . . . . . . . . . . . . . . . . . . . . Tri plat de MI . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de MF . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de MN . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de MR . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de LID . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de LIF . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPD . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPF . . . . . . . . . . . . . . . . . . . . . . . . . . Exemple de tableau de contingence . . . . . . . . . . . . . . . . Exemple de tri crois . . . . . . . . . . . . . . . . . . . . . . . Exemple de tri crois: valeurs attendues . . . . . . . . . . . . . Tri crois MI PPD . . . . . . . . . . . . . . . . . . . . . . . Tri crois MI PPF . . . . . . . . . . . . . . . . . . . . . . . . Tri crois MF PPD . . . . . . . . . . . . . . . . . . . . . . . Tri crois MF PPF . . . . . . . . . . . . . . . . . . . . . . . Tri crois MN PPD . . . . . . . . . . . . . . . . . . . . . . . Tri crois MN PPF . . . . . . . . . . . . . . . . . . . . . . . Tri crois MR PPD . . . . . . . . . . . . . . . . . . . . . . . Tri crois MR PPF . . . . . . . . . . . . . . . . . . . . . . . Tri crois LID PPD . . . . . . . . . . . . . . . . . . . . . . . Tri crois LID PPF . . . . . . . . . . . . . . . . . . . . . . . Tri crois LIF PPD . . . . . . . . . . . . . . . . . . . . . . . Tri crois LIF PPF . . . . . . . . . . . . . . . . . . . . . . . Exemple de dnition dindividus, MM en dernire colonne . . Exemple de dcomposition de la table de contingence MM 0,0,C6,0,0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPD pour les constituants MI.phrase . . . . . . . . Tri plat de PPF pour les constituants MI.phrase . . . . . . . . Tri plat de PPD pour les constituants MI.pers-arg . . . . . . . Tri plat de PPF pour les constituants MI.pers-arg . . . . . . . . Tri plat de PPD pour les constituants MI.pers-arg . . . . . . . Tri plat de PPF pour les constituants MI.pers-arg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . PPD: . . . . . . . . . . . . . . . . . . . . .

45 170 170 170 171 172 172 173 173 173 174 174 177 178 178 182 182 183 184 184 184 185 185 185 186 186 186 192 193 194 198 201 202 205 207

XXVII

5.35 5.36 5.37 5.38 5.39 5.40 5.41 5.42 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 6.10 6.11 6.12 6.13 6.14 6.15 6.16 6.17 6.18 6.19 6.20 6.21 6.22 6.23 6.24 6.25 6.26 6.27 6.28

Tri plat de PPD pour les constituants MI.synt-arg Tri plat de PPF pour les constituants MI.synt-arg . Tri plat de PPD pour les constituants MI.pers . . Tri plat de PPF pour les constituants MI.pers . . . Tri plat de PPD pour les constituants MI.pers . . Tri plat de PPF pour les constituants MI.pers . . Tri plat de PPD pour les constituants MI.synt . . Tri plat de PPF pour les constituants MI.synt . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

208 210 211 212 215 215 217 218 233 233 235 235 236 238 238 240 241 242 242 242 243 243 243 245 247 247 249 249 249 250 256 259 261 264 266 266

Tri crois dbut de phrase PPD . . . . . . . . . . . . . . . . . . . . Tri crois dbut de phrase PPD, (sans les documents1265-05b, 127203, 1283-02-13a, 1289-01-12) . . . . . . . . . . . . . . . . . . . . . Tri crois dbut de prop. argumentale PPD . . . . . . . . . . . . . . Tri crois dbut de prop. immdiate PPD . . . . . . . . . . . . . . . Tri crois types de propositions PPD . . . . . . . . . . . . . . . . . Tri crois phrases et autres prop. PPD . . . . . . . . . . . . . . . . Tri crois prop. argumentales ou non PPD . . . . . . . . . . . . . . Probabilits de diffrence de marquage initial des propositions . . . . Tri crois n de phrase PPF . . . . . . . . . . . . . . . . . . . . . . Tri crois n de phrase PPF, (sans le document 1272-03) . . . . . . Tri crois n de prop. argumentale PPF . . . . . . . . . . . . . . . Tri crois n de prop. immdiate PPF . . . . . . . . . . . . . . . . Tri crois types de propositions PPF . . . . . . . . . . . . . . . . . Tri crois phrases et autre proposition PPF . . . . . . . . . . . . . . Tri crois propositions argumentales ou non PPF . . . . . . . . . . Probabilits de diffrence de marquage nal des propositions . . . . . Probabilits de diffrence de frquence de marquage nal de la phrase par rapport p. arg. . . . . . . . . . . . . . . . . . . . . . . . . . . . Frquence de marquage nal de la p. imm. par rapport p. arg.: statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Proportions de marquage expliqu par la ponctuation de la phrase . . . Tri plat de la position (limite de phrase ou non) pour les positions non ponctues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de la position (limite de phrase ou non) pour les positions ponctues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPD pour les prdicats non initiaux . . . . . . . . . . . . Tri plat de PPF pour les prdicats non naux . . . . . . . . . . . . . Tri plat de PPD pour les 1,0,P0,0,0 dans pers . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 0,1,S1,pers,1 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri crois entre MMP et PPD, pour les constituants de type 0,1,S1,pers,1 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

XXVIII

6.29 6.30 6.31 6.32 6.33 6.34 6.35 6.36 6.37 6.38 6.39 6.40 6.41 6.42 6.43 6.44 6.45 6.46 6.47 6.48 6.49 6.50 6.51 6.52 6.53 6.54 6.55 6.56

Tri plat de PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, pers-arg, pers) . . . . . . . . . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 0,0,R2,pers,1 (niveau: pers) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 0,0,R2,pers,1 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri crois entre MMS et PPF, pour les constituants de type 0,0,R2,pers,1 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 0,1,R2,pers,1 (niveau: pers-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 0,0,R2,pers,0 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 0,0,R3,0,1 (niveaux: phrase, pers-arg, pers-arg, pers) . . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 1,0,R3,0,1 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri crois MMS PPF, pour les constituants de type 1,0,R3,0,1 (niveau: phrase, Document 1272-03 retir) . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 0,0,A4,0,1 (niveaux: pers-arg, pers-arg, pers) . . . . . . . . . . . . . . . . . . . . . . . . Proportions de marquage expliqu par la ponctuation des actants . . . Tri plat de la position (limite dactant ou non) pour les positions non ponctues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de la position (limite dactant ou non) pour les positions ponctues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri crois phrases et incidentes PPD . . . . . . . . . . . . . . . . . Tri crois phrases et incidentes (groupes) PPD . . . . . . . . . . . Tri crois incidentes PPD . . . . . . . . . . . . . . . . . . . . . . . Tri crois phrases, incidentes et autres circonstants propositionnels PPD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri crois incidentes et autres circonstants propositionnels PPD . . . Tri crois phrases et incidentes PPF . . . . . . . . . . . . . . . . . Tri crois phrases et incidentes PPF . . . . . . . . . . . . . . . . . Tri crois phrases et incidentes (phrase) PPF . . . . . . . . . . . . . Tri crois phrases, incidentes et circonstants propositionnels PPF . . Tri crois incidentes et circonstants propositionnels PPF . . . . . . Tri plat de PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, pers) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, pers-arg, pers, pers) . . . . . . . . . . . . . . . .

267 269 272 272 272 273 274 275 276 277 277 278 281 281 281 283 284 284 284 285 285 286 286 286 286 287 288 290

XXIX

6.57 6.58 6.59 6.60 6.61 6.62 6.63 6.64 6.65 6.66 6.67 6.68 6.69 6.70 6.71 6.72 6.73 6.74 6.75 6.76 6.77 6.78 6.79 6.80 6.81 6.82 6.83 6.84

Tri plat de PPF, pour les constituants de type 0,0,C5,pers,1 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 1,0,C5,pers,1 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, pers-arg, pers, pers) . . . . . . . . . . . . . . . . . . . . . Tri crois position nale ou non PPD . . . . . . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 0,1,C5,pers,1 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 0,1,C5,pers,1 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Proportions de marquage expliqu par la ponctuation des complments Tri plat de la position (limite de complment ou non) pour les positions ponctues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de la position (limite de complment ou non) pour les positions non ponctues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri crois des positions de coordination et PPD . . . . . . . . . . . . Tri crois des positions de coordination MC.coord et MC.dbut et PPD Tri crois des positions de coordination MC.coord et MC.centre et PPD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri crois des positions de coordination MC.coord et MC.centre et PPD (coordonnants retirs) . . . . . . . . . . . . . . . . . . . . . . . Tri crois des positions de coordination MC.coord et MC.n et PPD Tri crois des positions de coordination (sans MF.Co) et PPF . . . . . Proportions de marquage expliqu par la ponctuation de la coordination Tri plat de la position (limite de coordination ou non) pour les positions ponctues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de la position (limite de coordination ou non) pour les positions non ponctues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Proportions de marquage expliqu par une tendance gnrale . . . . . Tri plat de la position (limite de constituant attirant le marquage ou non) pour les positions ponctues . . . . . . . . . . . . . . . . . . . . Tri plat de la position (limite de constituant attirant le marquage ou non) pour les positions non ponctues . . . . . . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 0,0,Ap,0,0 (niveau: synt) Tri plat de PPD, pour les constituants de type 0,1,Ap,pers,1 (niveaux: synt, synt-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 1,0,Dt,0,1 (niveau: synt) Tri plat de PPF, pour les constituants de type 0,0,Ap,pers,1 (niveaux: synt, synt-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri crois entre MMS et PPF, pour les constituants de type 0,0,Ap,pers,1 (niveaux:synt, synt-arg) . . . . . . . . . . . . . . . . . . . . . . . . .

292 292 293 294 295 295 297 297 300 300 301 302 303 303 303 304 306 307 307 307 308 308 308 311 313 314 315 315

XXX

6.85 6.86 6.87 6.88 6.89 6.90 6.91 6.92 6.93 6.94 6.95 6.96 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 7.10 7.11 7.12 7.13 7.14 7.15 7.16 8.1

Tri plat de PPF, pour les constituants de type 0,0,Ap,pers,0 (niveau: synt-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 1,0,C6,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPD, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, pers, pers-arg) . . . . . . . . Tri crois C6 ou Co PPD . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 1,0,C6,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri plat de PPF, pour les constituants de type 1,0,Rl,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, pers, pers-arg) . . . . . . . . Tri crois MI PPF pour les constituants 1,0,Rl,0,0 . . . . . . . . . . Tri plat de PPF, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, pers, pers-arg) . . . . . . . . Proportions de marquage expliqu par une tendance gnrale (repris) . Tri plat de la position (limite de constituant attirant le marquage ou non) pour les positions ponctues (repris) . . . . . . . . . . . . . . . Tri plat de la position (limite de constituant attirant le marquage ou non) pour les positions non ponctues (repris) . . . . . . . . . . . . . Tri crois des proportions de marquage environnements . . . . . . . Tri plat des formes de ponctogrammes . . . . . . . . . . . . . Tri crois environnement forme du ponctogramme . . . . . . Points-colonnes, donnes numriques (1er facteur) . . . . . . . . Points-colonnes, donnes numriques . . . . . . . . . . . . . . Points-lignes, donnes numriques . . . . . . . . . . . . . . . . Tri crois RB actant ponctuable la nale pour . . . . . . . Tri crois environnement forme du ponctogramme (revu) . . . Tri crois environnement forme du ponctogramme (revu) . . . Points-lignes, donnes numriques . . . . . . . . . . . . . . . . Points-colonnes, donnes numriques . . . . . . . . . . . . . . Tri crois forme des ponctogrammes (rduit) environnement nonc, Coord.) . . . . . . . . . . . . . . . . . . . . . . . . . . Tri crois attraction de . . . . . . . . . . . . . . . . . . . . . Tri crois contexte lattirant . . . . . . . . . . . . . . . . . Tri crois attraction de / . . . . . . . . . . . . . . . . . . . . . Tri crois opposition vs / . . . . . . . . . . . . . . . . . . . Tri crois contexte lattirant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (C5F, . . . . . . . . . . . . . . . . . .

315 318 318 319 323 324 325 325 331 331 331 332 334 335 336 338 340 342 344 344 348 348 350 350 351 351 351 352 363

Tableau synthtique des tendances dgages . . . . . . . . . . . . . .

XXXI

Introduction

Comment, daprs ce quon peut observer dans les chartes crites en franais Lige avant 1292, la ponctuation originale interagit-elle avec la syntaxe dans la langue franaise mdivale? Voil une interrogation qui en amne immanquablement une foule dautres, parmi lesquelles on peut compter: quentend-on par ponctuation? quentendon par syntaxe? quest-ce quune charte? quest-ce que la langue crite, exactement? quels documents ont t observs?1 Notre introduction ne rpondra pas toutes ces questions pralables. Elle se limitera poser le cadre de notre travail, cest--dire tout ce qui a constitu les donnes desquelles nous sommes parti. Pour le reste, elle nindiquera que le chemin que nous avons emprunt pour rechercher, sinon une rponse, une perspective nouvelle pour aborder la ponctuation mdivale. On ne trouvera donc pas de dnition des termes ponctuation ou syntaxe dans ces quelques pages introductives, pas plus quune explication de ce que nous entendons par langue crite. La clarication de ces termes ncessitera, on le verra, de longs dveloppements qui nauraient pas leur place ici. Que lon veuille bien nous pardonner, mais il faudra se rsigner comprendre ces mots de manire intuitive dans un premier temps. Par contre, le lieu nous parat opportun pour que nous y posions les objectifs de ltude (0.1) et pour que nous dlimitions prcisment notre corpus et que nous dcrivions en quelques mots les problmes quil pose (0.2). Cela fait, nous exposerons le plan de notre dmarche (0.3). Enn, nous clorons cette introduction sur une brve prsentation des ressources techniques qui ont t ncessaires pour traiter notre objet (0.4) et sur un avertissement quant au caractre perfectible des mthodes dont nous avons fait usage (0.5).

0.1

Objectifs de ltude

Dans cette section, nous prsentons les diffrentes options suivies jusqu prsent pour tudier la ponctuation de lancien franais (0.1.1) avant de dnir la position que nous tiendrons tout au long de notre tude (0.1.2).

Ce travail, ralis sous la direction de Marie-Guy Boutier, est issu de la thse de doctorat que nous avons dfendue le 21 dcembre 2007 lUniversit de Lige. Le jury en tait le suivant: Jean-Marie Klinkenberg (prsident), Christiane Marchello-Nizia, Marie-Guy Boutier (promotrice), Gnter Holtus, Grald Purnelle (secrtaire) et Pierre Swiggers.

0.1.1

tudes prcdentes

Deux attitudes se sont dveloppes dans le champ de la recherche sur la ponctuation mdivale: celle qui souligne la pluralit des valeurs de signes et juge lanalyse syntaxique incapable de rendre compte elle seule des habitudes des scribes (0.1.1.1); et celle qui, ne rejetant pas le bien-fond de cette pluralit, consiste nanmoins choisir de se servir de la syntaxe comme moyen privilgi pour accder aux emplois de la ponctuation (0.1.1.2). 0.1.1.1 Pluralit des valeurs de la ponctuation mdivale

a. Les pionniers. La premire tude linguistique de la ponctuation dans les manuscrits mdivaux du domaine gallo-roman est due Mario Roques (1952). Dans son article Le manuscrit fr. 794 de la Bibliothque Nationale et le scribe Guiot, qui concerne plus les habitudes de Guiot que la ponctuation elle-mme, il met en vidence des habitudes graphiques qui donnent de la nettet la prsentation et la lecture (193). Ayant somme toute peu de matriaux sa disposition, Mario Roques se borne signaler ces habitudes graphiques sans vritablement les systmatiser. Il conclut en formulant le souhait que la ponctuation mdivale soit tudie de manire diachronique, insistant sur le besoin de tenir compte, dans cette entreprise, des habitudes et des ncessits de pense, de lecture, de diction, auxquelles [les signes de ponctuation] correspondent, et qui ont vari suivant les poques, les auteurs, les orateurs et les lecteurs (196). En philologue chevronn, il souligne ainsi limportance de la relation entre le texte et son environnement, mais ne pose aucune balise quant ltude proprement linguistique des pratiques de ponctuation mdivale. Un nouveau palier est franchi avec la publication de larticle Ponctuation et unit de lecture dans les manuscrits mdivaux ou: je ponctue, tu lis, il thorise, propos la communaut par Christiane Marchello-Nizia (1978). Cette dernire compare la ponctuation de six ditions (terme regroupant en loccurrence les copies et ditions imprimes) du Jouvencel de Jean de Bueil (compos entre 1461 et 1466), en prenant comme point de dpart les conceptions que les traits anciens livrent: la ponctuation serait lexpression dune pause dans la voix (34). Demble, Christiane MarchelloNizia choisit de compter les majuscules parmi les signes de ponctuation, une option que suivent galement toutes les tudes ultrieures. Selon cette tude, la ponctuation se rencontre des endroits qui correspondent aux limites de structures syntaxiques et au dbut dadverbes et de conjonctions capitales pour lorganisation du message, mais les diffrentes ditions ne se servent pas des signes de la mme manire pour segmenter le texte: chacune se distingue des autres par la ponctuation (42). Lanalyse rvle galement que les thories syntaxiques ne sufsent pas puiser les informations que nous livre la ponctuation. La conclusion est nette: pour avoir une chance de la comprendre un jour, il ne faut pas isoler la ponctuation dans ses rapports avec la syntaxe telle que nous la concevons, mais tenter dapprhender les units de lecture que nous livrent les scribes eux-mmes. b. Dnition progressive des types de valeurs. La mme ide dinsufsance de nos outils thoriques (Marchello-Nizia 1978, 44) se retrouve dans la conclusion de ltude dHlne Nas (1979) sur le manuscrit B de la Conqueste de Constantinople de Villehardouin:

Lorsque lon sait que la philologie moderne a relev et dict des rgles trs strictes dordre des mots en ancien franais, [. . .] conditionn par les lments initiaux de la phrase, il est particulirement droutant de constater que les manuscrits mdivaux ne permettent pas vraiment de reprer ces lments initiaux. quelle ralit correspond exactement la notion de phrase en ancien franais? (55).

Aux yeux dHlne Nas, qui gnralise ses dcouvertes, la ponctuation na pas de valeur grammaticale. Il en rsulte que les tudes suivantes sefforcent de mettre en relation la ponctuation avec dautres structures que les structures syntaxiques. Ainsi, ltude de Cline Barbance (1995) compare cinq manuscrits des Cas des nobles hommes et femmes de Laurent de Premierfait (15e sicle) et divise son analyse en plusieurs parties: Ponctuation et structure syntaxique (511), Ponctuation et smantique (516), Ponctuation mtalinguistique2 (521). Ce classement, bien quil permette dexpliquer un grand nombre de signes, met nouveau en vidence, sans pouvoir lexpliquer, une grande libert de la part des copistes. Se dtachant encore davantage dun cadre prdni par une analyse linguistique, Alexei Lavrentiev (2000) introduit son tude sur la ponctuation dans les manuscrits et incunables de lImage du monde de Gossuin de Metz (13e sicle) en afrmant:
Une caractristique importante qui semble marquer la ponctuation de la plupart des textes franais mdivaux est un gros cart entre les doctrines de ponctuation, qui ne manquent pas, et la pratique quon peut constater dans les manuscrits. (26).

Par la simple observation des formes des marques et de leur frquence, lauteur repre un certain nombre dunits de lectures, qui montrent que la ponctuation interagit avec les majuscules et se retrouve essentiellement devant les connecteurs, entre les phrases et entre les syntagmes coordonns. Dautres tentatives, comme celle de Susan Baddeley (2001), adoptent une dmarche smasiologique, partant des signes la recherche de leur valeur, pour aboutir nouveau la conclusion que la ponctuation mdivale nest pas syntaxique. Nous avons nous-mme montr (Mazziotta 2007b) que lorganisation du texte des chartes en parties du discours (au sens diplomatique) structurant linformation quelles contiennent tait, dans le cas de documents mans dune cour particulire, clairement soutenue par lemploi de la ponctuation. La pluralit des valeurs de la ponctuation mdivale la rapproche de son homologue moderne. En effet, ds les premires tudes linguistiques consacres la ponctuation du franais moderne, Ludmilla Vdnina (1980 et 1989), hritire du fonctionnalisme praguois, distingue un plan smantique, un plan communicatif et un plan grammatical, correspondant terme terme aux plans smanticorfrentiel, nonciatifhirarchique et morphosyntaxique de la thorie des trois points de vue (3.1.3.1). Depuis, les tudes sur la ponctuation moderne rendent gnralement compte de cette pluralit. Quelle que soit la priode tudie, il semble que seul un examen simultan des informations livres par chacun des trois points de vue approcherait lexhaustivit.

Nous cririons nonciative.

c. Vers un programme. Le dveloppement des recherches pousse ainsi progressivement abandonner lide que lanalyse syntaxique fournit la clef absolue de ltude. Cela mne Alexei Lavrentiev rappeler:
Comme lont dmontr les tudes prcdentes, lemploi de la ponctuation peut tre conditionn par de multiples facteurs: syntaxiques, smantiques, pragmatiques, rythmiques et mme esthtiques (dcoratifs). (Lavrentiev paratre).

Il propose ensuite une liste dunits ponctuables reprenant ces catgories et devant permettre de traiter efcacement la ponctuation dun grand nombre de textes:
Parmi les grandes catgories, nous avons distingu (A) les frontires entre les units de la macrostructure textuelle; (B) les frontires lies au changement de plan nonciatif, et, en gnral, tout ce qui est li au discours direct [. . .]; (C) les frontires entre les propositions indpendantes (y compris juxtaposes et coordonnes); (D) les frontires entre les propositions subordonnes et leur principale; (E) les frontires entre les syntagmes coordonns et juxtaposs; les dbuts et ns dnumration; (F) les syntagmes ponctuables lintrieur de propositions (complments circonstanciels, appositions, reformulations, etc.) [. . .] (Lavrentiev paratre, 1.2).

0.1.1.2

Le pari de la syntaxe

Paralllement cette volution, tentant lexprience alors nouvelle de ltude exhaustive des signes de ponctuation dans une seule charte luxembourgeoise, Marie-Guy Boutier (2001) fait le pari que la majorit des signes de ponctuation peuvent tre expliqus laide des structures syntaxiques. La perspective est rsolument synchronique et cadre sur ltude du systme dun seul document. Presque tous les signes trouvent une justication syntaxique, ce qui mne une conclusion forte: [Il est permis] de supposer, sous-jacent cet usage particulier, un vritable systme de la ponctuation [. . . ]. (443) Enthousiasm par ces rsultats, nous prenons la dcision de la suivre en faisant notre tour ltude complte de la ponctuation dune autre charte, ligeoise cette fois (Mazziotta paratre), ce qui nous permet de constater que la syntaxe, si elle ne peut tout expliquer, suft dcrire la grande majorit des signes rencontrs. Continuant sur cette lance, nous essayons, dans la contribution Inconstance ou consensus? Marquage de la protase en tte de phrase dans les chartes ligeoises du 13e sicle (Mazziotta 2007a), de comparer la ponctuation dune structure syntaxique particulire au travers dun petit corpus de chartes ligeoises dans une perspective toujours synchronique. La conclusion de ce travail est que malgr la variation, la majorit des chartes suivent une tendance commune. Manifestement, en dpit de lindniable inuence de la smantique ou de la structure discursive sur la ponctuation, il semblerait que, dans le cas des chartes mdivales, la syntaxe puisse constituer un point de rfrence sufsamment rentable pour tre tudi pour lui-mme. 0.1.2 Position de la prsente tude

En consquence de la section prcdente, nous avons choisi de poursuivre notre recherche en privilgiant la description des relations entre les signes de ponctuation et 4

les structures syntaxiques. Nous traiterons ainsi une partie du problme gnral de la ponctuation mdivale et nous sommes conscient des limites que nous posons aux rsultats de notre travail. Cette tude npuisera donc pas le sujet. ce jour, une tude gnrale sur la partie exacte de la ponctuation que la syntaxe permet dexpliquer fait encore dfaut. Nous proposons dexplorer notre corpus (0.2) dans cette direction. Dans la mesure o la ponctuation met en vidence des units de lecture tributaires des reprsentations linguistiques intriorises par les scribes, ltude de la ponctuation dans ses rapports avec la syntaxe constitue un moyen privilgi daccder ces reprsentations. Cela nous permettra de vrier si les structures que nos outils danalyse identient correspondent bien des units de lecture pour les gens qui les employaient. La description des rapports entre la ponctuation et le systme syntaxique des chartes originales crites en franais Lige avant 1292 impose nos yeux une dmarche qui consiste : 1. dlimiter le corpus employ; 2. dnir exactement ce que nous entendons par ponctuation et syntaxe; 3. dcrire le systme graphique le plus indpendamment possible du systme syntaxique (et inversement); 4. valuer les corrlations entre les deux systmes dcrits. Nous dlimiterons le corpus dans la prsente introduction (0.2). Les autres tapes seront abordes ensuite et serviront de guide la progression dont nous ferons le plan ci-dessous (0.3).

0.2

Corpus

Depuis 1998, le service de linguistique franaise et dialectologie wallonne de lUniversit de Lige, dirig par Marie-Guy Boutier, sest engag dans Kharts, un projet ddition et dtude linguistique de chartes originales rdiges en franais en Wallonie dans le courant du 13e sicle. La gense du projet Kharts, par laquelle sexplique la constitution de notre corpus, fera lobjet du point 0.2.1. Nous valuerons ensuite les problmes poss par les caractristiques intrinsques ce choix de textes (0.2.2). 0.2.1 Gense du projet Kharts et constitution du corpus

Kharts trouve sa place dans la plus vaste dmarche ddition des Documents linguistiques de la France, inaugure en 1974 par Jean-Gabriel Gigot et son dition des documents originaux conservs dans le dpartement de Haute-Marne, prpare sous la direction de J. Monfrin (Gigot 1974). Cette premire pice ouvre la marche du projet, destin runir les textes non littraires originaux rdigs en langue vulgaire dans le domaine franais. Trois sries devaient se partager la collection, couvrant les domaines dol (srie franaise) et doc, mais aussi le domaine du franco-provenal. Il y tait notamment prvu dditer des chartes originales conserves dans les diffrents fonds darchives de la France (la srie franco-provenale est un recueil dditions de 5

textes dialectaux non littraires). la mort de Jacques Monfrin, la direction du projet fut reprise par lactuelle directrice de lcole des Chartes, Franoise Vielliard, avec la collaboration de Martin-Dietrich Glegen. Le premier volume des Documents linguistiques de la Belgique romane, srie parallle la srie franaise parat en 1984. Il comprend les chartes du Hainaut (Ruelle 1984) et se voit accompagn, trois ans plus tard, des chartes amandes (Mantou 1987). Le troisime volume que devrait comprendre la srie, encore manquant, sera ddi aux chartes de Wallonie. Rpondant linvitation que lui t personnellement Jacques Monfrin pour combler cet hiatus, Marie-Guy Boutier entreprend le projet Kharts, destin dans un premier temps fournir les matriaux ncessaires llaboration du tome trois des Documents linguistiques de la Belgique romane et donc couvrir la Wallonie (provinces de Lige, de Namur et de Luxembourg). Le corpus tudi dans le cadre du projet Kharts sera constitu pour commencer des chartes originales conserves dans les provinces de Lige et de Namur. Le travail a dbut par ldition de celles qui sont entreposes aux Archives de ltat Lige. Toutes les chartes originales antrieures lavnement de lvque Hugues de Chalon (1292) seront tudies, la plus ancienne datant du mois de mai 1236 (il sagit du document rfrenc Document 123605), soit un corpus valu actuellement 285 chartes. Il a rapidement t dcid que les ditions fournies par le projet seraient lectroniques et accompagnes dune reproduction digitale des documents. Actuellement, deux personnes participent activement au projet Kharts bien que son avance ait t quelque peu ralentie depuis 2004 : Marie-Guy Boutier et nousmme. Dans la mesure du possible les tudiants intresss sont invits collaborer au projet. Cest ainsi que Stphanie Audrit, Nicolas Brugali et nous-mme avons pu, encore tudiants, proposer une nouvelle dition pour certains des documents cibls par le projet voir respectivement Audrit 2003, Brugali 2003 et Mazziotta 2001. Le travail volue lentement, mais il est dj sufsamment avanc pour que nous ayons notre disposition une transcription diplomatique able de 148 documents ligeois voir la liste des rfrences en n de volume. Le critre de slection est ici li la abilit des ditions disponibles: seuls les documents dont la transcription diplomatique est sufsamment aboutie font partie du corpus retenu pour la prsente tude. 0.2.2 Problmes lis au corpus

Du fait de sa nature et de la manire dont il a t constitu, le corpus pose plusieurs problmes lis son htrognit (0.2.2.1) et la quantit de donnes quil rend accessibles (0.2.2.2). 0.2.2.1 Htrognit des types discursifs

Le grand nombre de types dactions juridiques enregistres dans les chartes inuence certainement la varit des structures textuelles. a. Classement diplomatique des documents. En dpit dune structure gnrale commune, qui fonde la dnition du terme charte et la pertinence du regroupement des documents dans un seul chantillon, les chartes que nous tudions forment un ensemble incontestablement htrogne. Quiconque a pratiqu quelque peu ce genre de

texte est conscient de cette htrognit. Si bien que les manuels de diplomatique les plus rcents nhsitent pas afrmer que [l]a charte nest pas proprement parler un terme technique, mais plutt un terme gnrique, recouvrant une varit confuse de documents. Ntant pas technique, le mot est assez ou. [. . .] Une charte contient soit une concession de biens, de droits,. . . soit une dcision judiciaire. (Guyotjeannin et al. 1993, 25, italiques en grasses dans le texte). La majorit des diplomatistes ont choisi daccepter la dnition oue du mot charte. Le classement des actes sur base de laction juridique quils enregistrent est dlaiss,3 au prot dune typologie base sur la qualit de lauteur (la personne juridique sidentiant comme lmetteur de lacte crit) ou du bnciaire (celui qui prote lacte juridique). On distingue alors les actes publics (souverain, princier ou seigneurial, pontical ou encore piscopal) des actes privs.4 Suivant ce critre, tous les documents du corpus entrent dans la dernire de ces catgories. b. Inadquation du classement. Du point de vue du linguiste, la solution ne convient pas tout fait. Les structures morphosyntaxiques mobilises dans un texte dpendent grandement du message quil vhicule. Nous aurons loccasion de revenir sur la dnition du texte dans les pralables du chapitre consacr lanalyse morphosyntaxique (3.1.2.1). Pour lheure, donnons un exemple concret du problme que laisse subsister la typologie communment accepte. On sait ds les premiers mots de ces trois chartes quelles ne traitent pas des mmes actions et que leur structure en sera certainement diffrente:
Nos, Guis, cuens de Flandres, faizons savoir a_tos ke nos Geramont et les appendances et Bornehem et les appendances ki astoient nostre franc aluel avons receut en_s [2] ligement a_tenir de mon saingnor Henri, par le grasse de Deu eveske de Liege, et de ses successeurs eveskes de Liege perpetuement [. . .] (Document 12630527a, 1). A tos cheaus ki ches letres verunt et orunt, maistre Jehans de Sain_Tron, chanoines de Hui, et Watiers de le Wege, [2] chevaliers, arbitre esliut del besten ki a est entre le glise Saint Lambert de Liege, dune part, et mon segnor Gilon, [3] chevalier dOtoncort et ses oirs, dautre part, [. . .], salus et conisanche de verit. (Document 12700510, 1). Je, Lambers de le Fosse, citains et eskevien de Liege, en me plain sens et en me bone memore, a me testament a queil ciste lettre [2] est achie et saelee de ces meimes saias fai je tele addition [. . .] (Document 12830213a, 1).

Par exemple, nous savons davance que le troisime de ces documents contiendra une liste de dispositions et de legs, alors que le deuxime contiendra un verdict. Ces diffrences quant au contenu des textes inuencent leur structure discursive. Par ailleurs, il est probable que cette dernire, mme si elle ne se trouve pas au cur de notre tude, inuence la ponctuation: on ne ponctue pas de la mme manire une liste et une sen3

[L]a diplomatique a pu sortir du dbat o elle risquait de senliser, en prenant en compte un critre plus juridique (la nature de laction juridique et le statut des protagonistes) que diplomatique (la forme de lacte et la nature de son authentication). (Guyotjeannin et al. 1993, 115). Cest--dire tout acte manant dune personne prive, ou dune personne publique agissant pour le compte dune personne prive, dnition propose par Robert-Henri Bautier et la Commission internationale de diplomatique, cf. Guyotjeannin et al. 1993, 104.

tence darbitrage.5 Malheureusement, un classement par type discursif (et indirectement par type juridique), outre le fait quil demanderait des comptences dhistorien et de juriste, ncessiterait une tude dtaille de la question. Pareil travail naurait pas sa place ici. 0.2.2.2 Quantit de donnes

Suivant que lon considre les textes dans leur ensemble ou les units smiotiques et linguistiques quils vhiculent, on devra conclure lindigence ou lextrme richesse du corpus. a. La faible quantit de documents pousse ignorer les donnes extralinguistiques. Lhtrognit des types dactes nest pas le seul facteur inuencer la validit dune tude centre sur des documents originaux. Faute davoir t restreinte a priori, lextrme varit des auteurs, des scelleurs, des imptrants et des scribes mne irrmdiablement une disproportion: certains auteurs, comme par exemple la cour allodiale de Lige,6 sont lorigine de quelque 55 documents du corpus, alors quun seul acte est man du duc Henri de Limbourg (Document 12370916). On pourrait certes classer les documents en fonction de ces observations objectives, mais que donnerait un tel classement sur un corpus aussi rduit? Pas grand-chose, assurment, compte tenu du fait que lon ne pourrait garantir la reprsentativit des diffrents groupes forms. Nous avons donc d nous rsoudre travailler dans des conditions qui sont loin dtre optimales, en attendant que le corpus senrichisse ou quil soit possible de le comparer dautres textes issus dautres fonds darchives. Cela rendra peut-tre possible la description adquate de plusieurs partitions consistantes. Nous ne ferons donc qupisodiquement rfrence la description extralinguistique des chartes. b. La quantit dmesure dunits linguistiques et smiotiques pousse rduire la richesse des documents. Si nous pouvons regretter le peu de donnes disponibles pour classer les documents les uns par rapport aux autres, il nen est pas de mme lorsque nous abordons les lettres, mots, signes de ponctuation et structures syntaxiques quils comportent. Chacune de ces sortes dunits permet disoler des milliers doccurrences, voire des dizaines de milliers. Ainsi, sans aborder ici la question du discernement des units et titre dexemple, le corpus tudi contient pas moins de 64252 occurrences de mots. Quelle que soit loptique adopte pour les traiter,il faut bien admettre que cette quantit est trop importante pour tre manipule efcacement par un tre humain. Face pareil foisonnement, il sera ncessaire de rduire les donnes.

5 6

Une ide que nous avons dj avance dans Mazziotta paratre, 1.1. Cette cour, qui porte le nom particulier de Casa Dei (formes romanes: Chise Dieu, Cise Dieu, etc., soit le type _Chaise Dieu_) est comptente en matire dalleux, cest--dire de biens possds en pleine proprit. Elle est compose de propritaires de tels biens (qui sont dits hommes de la Chaise Dieu), lesquels chappent ainsi la juridiction scabinale. Voir Bertrand 2004, 165s.

0.3

Plan de ltude

Nous organiserons notre expos en deux parties: la premire sera consacre la construction des concepts ncessaires lanalyse, tandis que la seconde contiendra lanalyse proprement dite. 0.3.1 Premire partie: modlisation

Les chapitres 1 3 constitueront la premire partie du travail. Dans le premier, qui sera relativement abstrait, nous poserons les bases quon pourrait qualier de mtaconceptuelles: il sera question dexposer la manire dont les concepts intgrs aux modles de description de la langue crite et de la syntaxe seront construits. Le chapitre 2 relvera la fois de la smiotique et de la linguistique. Nous y proposerons une systmatisation nouvelle des units de la langue crite, menant ainsi un classement complet do mergera une dnition prcise du terme ponctuation. Le chapitre 3, quant lui, traitera exclusivement de linguistique. Nous y introduirons un modle danalyse syntaxique personnel, ce qui nous mnera dnir concrtement ce que le mot syntaxe signie nos yeux. On pourra voir comment les concepts et analyses dcrits dans cette premire partie ont t appliqus systmatiquement au corpus en se reportant aux annexes.7 0.3.2 Deuxime partie: analyse des donnes

Dans la deuxime partie, nous mettrons en relation les units (relevant des deux domaines modliss) que nous avons pu identier lintrieur de notre corpus. Pour ce faire, nous devrons mobiliser un petit nombre de techniques statistiques simples, dont les concepts fondamentaux seront exposs au chapitre 4, dune manire que nous esprons accessible. Le chapitre 5 sera consacr la recherche de tendances gnrales concernant la frquence des signes de ponctuation aux limites des structures syntaxiques. Nous tenterons de rpondre la question: Quelles structures paraissent plus ponctues que les autres?, ou au contraire: Quelles structures sont clairement les moins ponctues? De cette manire, nous identierons les structures que nous devons tudier de manire plus approfondie. Senchanant avec le prcdent, le chapitre 6 sera focalis sur les structures les plus remarquables pour en faire lexamen dtaill, en prenant nouveau en considration la frquence doccurrence de la ponctuation. Contrastant avec les deux chapitres quil suit, lexamen qui formera le corps du chapitre 7 tiendra compte de la forme des signes de ponctuation et non plus uniquement de leur frquence. Enn, dans la conclusion (chapitre 8), nous ferons le point sur notre dmarche et les rsultats que nous avons pu dgager.8

7 8

Voir ladresse permanente http://hdl.handle.net/2268/25773, qui fournit les annexes de la prsente tude. La structure de 8.1 rpond au plan que nous venons dexposer.

0.4

Ressources techniques

Avant de les enfouir dans les annexes, disons quelques mots des logiciels et techniques informatiques employs pour encoder les donnes. Aucun logiciel rpondant exactement nos besoins ntant disponible, nous avons t contraint de dvelopper nous-mme lensemble des programmes employs. De manire trs concrte, voici ce qui a d tre fait. Les chartes ont t transcrites et encodes laide dune norme largement rpandue pour stocker les donnes complexes de nature textuelle: leXtensible Markup Language (XML), qui permet lordinateur de retrouver les mots et les signes de ponctuation originaux au moyen de programmes adquats. Ces derniers sont fournis en annexe.9 Les outils de traitement des donnes prennent la forme de scripts10 crits dans un langage nomm Perl.11 On pourra galement consulter les transcriptions diplomatiques abouties en se reportant aux annexes.12 Les analyses morphosyntaxiques, conformes lexpos du modle du chapitre 3, ont t encodes dans le mme chier informatique que celui qui contenait ldition de chaque charte. Les analyses exhaustives, reprsentes par des botes imbriques suivant un ordre dductif allant des textes aux mots, sont fournies en annexe.13 Enn, les chapitres 4 7 ncessitaient que les donnes soient extraites et soumises un nombre important de calculs. La slection des donnes (rassembles galement laide dun programme Perl) et leur traitement numrique prend la forme de scripts crits dans un langage nomm R,14 particulirement adapt aux traitements statistiques. Quels que soient les programmes et les langages utiliss, il importe de souligner deux choses: la libert des codes sources et labsence de garantie. Les programmes dextraction des donnes ne sont pas forcment infaillibles et contiennent probablement des erreurs. Dans une perspective scientique, il est impratif que le code source des applications soit ouvert et document. Si les codes sont reports en annexe, il reste un important effort de documentation faire. Quon nous laisse poser ici un jugement svre et catgorique sur les logiciels dont les sources, pour des raisons commerciales ou autres, ne sont pas accessibles aux utilisateurs: pareilles pratiques nuisent la science. Cest ainsi que les programmes et standards que nous avons choisi demployer sont libres et ouverts.15

Voir la section Ressources des annexes. La compilation des programmes crits dans un langage de scripts est gnralement effectue lexcution. Version 5.8.7, voir la bible du langage, par son crateur: Wall et al. 2000. Voir la section Transcriptions des annexes. Voir la section Analyses syntaxiques. Version 2.4.0, voir R Development Core Team 2005. Les licences dutilisation de Perl et R sont fournies dans les paquets binaires dinstallation de ces logiciels; voir la section Ressources des annexes.

10 Cest--dire de programmes non compils, lisibles dans nimporte quel diteur de texte.

11 12 13 14 15

10

0.5

Travail en cours

Il est dautre part important de pouvoir prendre en considration le fait que le travail est effectu sur un corpus indit, encore en construction lheure o nous crivons ces lignes.16 Malgr notre soin, les efforts ddition des matriaux17 et dannotation18 comportent certainement encore beaucoup dimperfections. Par ailleurs, une fois le corpus dit et annot sous forme lectronique, en supposant quil soit exempt derreurs et dimprcisions et soit prsent dans un tat dnitif, il reste toujours grer le dlicat problme de lextraction de son contenu. Cet tat transitoire du corpus et des outils, intimement li labondance des donnes et au travail important que leur traitement implique, mne des obstacles techniques et contingents. 0.5.1 Erreurs et volutivit

Commenons par distinguer les erreurs en fonction de leurs causes. Une erreur doit toujours tre situe par rapport aux matriaux traits, mais galement par rapport au modle choisi pour travailler. Elle peut ainsi tre due une inconsistance de lanalyse ou une conceptualisation inadquate des phnomnes observs. Pratiquement, les erreurs les plus problmatiques sont celles de la premire sorte: si durant lencodage, nous avons mal identi un constituant, lidentiant comme un verbe principal alors quil a la fonction de sujet, nous avons commis une erreur accidentelle. Quant aux erreurs de conceptualisation, elles sont situer sur le plan pistmologique: on a mal peru la nature des donnes (erreur a priori). Ce type de biais est inhrent la recherche empirique dans ses activits de rduction autant qu la recherche thorique dans ses activits de modlisation. Nous aurons maintes fois loccasion de faire remarquer que lenregistrement des donnes et la conceptualisation ne constituent que des approximations de la ralit observe.19 Cela signie que les erreurs sont invitables et font corps avec la recherche. Il est cependant ncessaire de les dcrire et de les annoncer: lorsque nous crivons, dans la section dcrivant les relations entre les complments linnitif et le verbe principal:20
Devant ce phnomne complexe, nous avons choisi la solution qui paraissait la plus raisonnable et la plus conforme au modle. (p. 114).

puis que nous dtaillons notre choix dans les lignes qui suivent, nous informons le lecteur sur la porte et limportance de lapproximation que nous avons cru licite de supporter. On sattend donc retrouver les mmes approximations dans les analyses et dans leurs conclusions, ce qui est tout fait normal. Ces erreurs systmatiques ne pourraient tre corriges quen revoyant les fondements du travail.

16 Et sur lequel nous avons jusqu prsent t trs peu nombreux travailler. 17 Revus en partie par Marie-Guy Boutier. 18 Sur lesquels nous avons travaill seul, et qui nont bnci daucune relecture extrieure. 19 Concernant le mcanisme de conceptualisation, 1.1 pour une prsentation gnrale. 20 Nous reviendrons sur ces termes dans le chapitre 3, o les notions quils dsignent seront

systmatises.

11

0.5.2

Programmation des requtes

Une fois dnis les individus et les variables qui servent les dcrire, lanalyse nest possible que si, dune manire ou dune autre, ces individus et leurs modalits spciques sont extraits du corpus. Leur quantit est telle quil nest pas imaginable de procder manuellement, si bien que chaque question oblige crire des programmes informatiques chargs deffectuer cette tche.21 Cette tape du travail, trs technique, prend galement beaucoup de temps.22 Or, comme on le verra,23 les conclusions statistiques et lexprience des textes mnent parfois poser de nouvelles questions aux documents. Parfois, ces questions ultrieures ncessitent de nouveaux dpouillements, qui ncessitent leur tour de nouveaux programmes, cest--dire beaucoup de temps de dveloppement. Nous serons donc forc de limiter nos recherches ce que nos capacits techniques et notre matriel ont permis de traiter jusqu prsent.

21 Voir la section Ressources des annexes. 22 Llaboration de requtes devant donner des rsultats ables (pas derreur) dans des d-

lais raisonnables (temps de traitement) avec le matriel informatique dont nous disposons (ressources matrielles) est un processus exigeant. 23 Voir par exemple la conclusion du chapitre 5, p. 218.

12

Pralables pistmologiques: concepts et terminologie

Le statut proto-scientique,1 de la linguistique, coupl un hritage charg dune lourde tradition, oblige un recadrage terminologique constant, traduisant idalement le systme des units conceptualises.2 Il est prfrable pour un linguiste de se situer pralablement toute tude, par rapport une terminologie construite; la remarque est dautant plus approprie dans le jeune champ de la ponctuation. La thorisation linguistique ne peut faire lconomie dune rexion structure sur la terminologie quelle mobilise. Il est, crit Gilbert Lazard (1999b, 113), difcile, dans ltat actuel de notre discipline, de parler de terminologie sans aborder en mme temps des questions thoriques et mthodologiques. La rciproque est galement tout fait justie: toute rexion thorique mettant en relation de nouveaux concepts ou en rorganisant danciens soulve le problme de la nomination de ces concepts. Cest prcisment ce point de vue que nous allons adopter: partant dun travail dabord dorganisation et de dnition des concepts, nous devrons nommer ces derniers pour quils puissent servir un examen approfondi des faits. Ce chapitre est ainsi destin poser les bases thoriques ncessaires la dnition des diffrents concepts et termes que nous crerons ou mobiliserons pour classer et analyser les units de la langue crite et les structures morphosyntaxiques. Il vise essentiellement cet objectif pratique. Nous nous devons donc de prsenter la manire dont nous allons laborer les concepts et les nommer pralablement tout dveloppement. Les principes resteront abstraits dans les limites du prsent chapitre, mais seront appliqus de manire concrte dans les chapitres 2 et 3. Dsireux avant tout de crer un canevas de travail simple tout en restant rigoureux, nous nous sommes gard de nous aventurer dans lexpos des techniques les plus rcentes dveloppes principalement dans un cadre de recherche informatique, savoir, dune part, le Unied Modelling Language (UML) et, dautre part, les ontologies et le web smantique. La

Ce qualicatif revient Gilles-Gaston Granger, pour qui la linguistique se trouverait actuellement dans ltat de la physique avant Galile (cf. Lazard 1999a, 68) cest--dire une discipline qui nest pas encore une vritable science. Pour Gilbert Lazard, il manque simplement la linguistique de dnir de manire explicite et rigoureuse lobjet ou les objets auxquels doit sappliquer le travail du linguiste dsireux datteindre des connaissances objectives et dnitives, comme sont les connaissances scientiques (Lazard 1999a, 69). Cette dmarche est incontournable, et en ce sens, nous adhrons la rexion de Gilbert Lazard. Nanmoins, la connaissance dnitive parat quant elle peu accessible: toute science inductive (ce qui exclut les mathmatiques et une partie de la logique) se fonde sur le fait quaucune connaissance ne peut tre tenue pour dnitive. Voir un exemple de recadrage dans Lazard 1999b.

13

complexit des mtamodles introduits dans lun ou lautre de ces cadres aurait compliqu lexpos sans pour autant le rendre plus rigoureux.3 Nous aborderons tout dabord brivement les rapports entre lobjet de description et sa conceptualisation (1.1), avant de se centrer sur les impratifs mthodologiques ncessaires la cration dune terminologie rigoureuse (principes repris de Pierre Swiggers, 1.2). Nous expliquerons ensuite comment ce modle peut tre schmatis de manire en simplier lexpos (1.3).

1.1

Mcanisme de conceptualisation

La construction de la terminologie implique tout dabord de conceptualiser la ralit laquelle elle sapplique. La terminologie linguistique ntant avant tout quune sorte de terminologie,4 il est utile de considrer les dmarches pratiques des terminologues pour construire notre systme. Pour ce faire, nous avons besoin des notions5 dobjet, concept, proprit et caractre (Depecker 2002). La ralit est constitue dobjets, perceptibles ou concevables, pourvus de certaines proprits; p. ex.: un vase pos sur une table peut tre fait de verre bleu, mesurer 28,3 cm de haut,. . . Conceptualiser un objet (crer un concept dont il serait une occurrence) revient slectionner une partie de ses proprits comme des traits essentiels quont en commun tous les lments de lensemble des objets particuliers quon cherche dnir; ces proprits slectionnes, on donne le nom de caractres (voir la prsentation quen fait Loc Depecker 2002, 133, Depecker 2003, 54). Ceux-ci permettent une dnition du concept (Rey 1979, 42): un concept se dnit ainsi par une srie de caractres abstraits des proprits des objets. Par rapport lobjet, le concept constitue un modle susceptible de rvision et de remaniements, mais surtout dpendant du regard qui est port sur lobjet. De ce fait, le regard sur lhistoire de la langue, par exemple, sera diffrent selon quon considre son histoire externe ou son histoire interne. Dans le cadre de la construction dune terminologie, cette laboration est idalement beaucoup plus simple que celle de la dnition dune unit naturelle. En effet, parlant de la terminologie employe dans les manuels techniques, Loc Depecker indique la contrainte que de la premire page dun manuel la dernire, une mme unit terminologique dsigne systmatiquement le mme objet, sauf indication explicite (Depecker 2002, 133). Cette contrainte, ncessaire dans le cadre dapplica3

4 5

Voir, au sujet dUML Si Alhir (2003). Ce langage a t cr dans le but pratique de dvelopper des programmes informatiques, mais son haut degr de gnralit permet la conception et la schmatisation de nimporte quelle notion ou processus. En ce qui concerne les ontologies (dans le cadre de linformatique), la page de lOntology Web Language du World Wide Web Consortium (http://www.w3.org/2004/OWL/ ) est un bon point de dpart. Les ontologies permettent de dnir formellement les concepts laide dune notation logique nomme description logic (voir Baader/Nutt 2002 pour un expos dtaill). Afrmation relativiser, voir Rey-Debove 2001. Le problme que pose la mtaterminologie est videmment dun poids pistmologique considrable. Nous ne prenons pas la peine de nous attarder sur ce fait, qui mrite lui seul quantit de rexions. Le seul terme de concept pose notamment le problme de la relation entre terminologie et linguistique (Depecker 2002, 127, prsent dans Depecker 2003, 29) et ne se laisse pas dnir (Rey 1992, 30s.). Voir cependant ci-dessous, note 7.

14

tions techniques (comme la fabrication de composants lectroniques, les manipulations pharmacologiques, etc.), permet dliminer les phnomnes de brouillage du lien entre forme dexpression et contenu (synonymie, homonymie, etc.) lintrieur dun systme terminologique donn. Cela nimplique pas pour autant que ces problmes sont inexistants en terminologie (Depecker 2002, 142), mais quil serait malheureux den laborer une nouvelle sans les viter.6 Cette dmarche de nomination entrane immanquablement un besoin de nologie, qui pourrait sembler prtentieux, mais qui, en ralit, est simplement ncessaire; cela ne signie pas que nous ne rcuprerons aucun terme, mais que nous ne nous priverons pas den crer quand il y aura lieu de le faire. La vision dsormais classique, mais trop belle pour tre facilement applicable propose par Bernard Pottier (1974, 2930) peut tre concrtise: il est ais de construire des dnitions par slection de proprits, de manire construire des smmes hirarchiss dans des relations dhypo-hyperonymie; les hyponymes hritant des caractres de leurs hyperonymes (smes gnriques) et se distinguant de leurs cohyponymes par un ou plusieurs caractres (smes spciques).7 Par exemple, si on compare les concepts de lzard et de chien, le caractre pourvu de quatre pattes, commun tous les quadrupdes, dnit ces dsignations comme cohyponymes de quadrupde (sme gnrique), alors que les caractres mammifre et saurien (smes spciques) permettent de distinguer les deux hyponymes.

1.2

Impratifs terminologiques

Pour laborer nos terminologies, nous suivrons les jalons poss par Pierre Swiggers dans sa Systmatique de la terminologie linguistique (1999). Dans cet article, lauteur tudie la terminologie linguistique sous ses aspects historique (comme objet donn), mthodologique (comme objet constituer) et pistmologique (comme un retour vers lobjet langage). Nous nous focaliserons essentiellement sur laspect mthodologique (1.2.1), puisquil sagit pour nous de construire une terminologie en relation avec la systmatisation du domaine. Nous expliquerons ensuite comment nous nous positionnons historiquement (1.2.2). 1.2.1 tablir une terminologie

Les considrations mthodologiques que Pierre Swiggers expose prescrivent quatre contraintes formelles cinq en comptant la systmaticit pour laborer une terminologie linguistique:8 Transparence: les termes choisis doivent tre maximalement transparents,9 en ce
6 7 8 9

Bien entendu, il est question dviter exclusivement les brouillages et non les proprits lies la hirarchie des concepts, telles que lhypero-hyponymie. La question de la relation entre le concept et le signi (Depecker 2002, 127) nest pas rsolue. Nous assimilons lun lautre. Cit verbatim de Swiggers 1999, 31, avec quelques amnagements typographiques. En guise dexemple, Pierre Swiggers renvoie au systme de termes parataxe, diataxe, apotaxe, anataxe, catataxe, mtataxe, pitaxe et hypertaxe; les sept premiers dsignent diff-

15

que leur signication devra tre univoquement associe la structuration formelle du mtalangage. Adquation: les termes choisis doivent tre dans un rapport de rfrence directe et univoque avec un domaine applicatif, dni par lensemble des termes relatifs ce domaine (cette circularit est incontournable); on pourra parler dadquation par sommation en parlant densembles de termes dcrivant les secteurs dun domaine complexe. Cohrence: la nomenclature terminologique dans son ensemble doit tre cohrente, cest--dire exempte de relations de contradiction interne et unie par des rapports de solidarit, dinclusion, dopposition dnie, de superordination, etc. conomie: la nomenclature terminologique doit tre parcimonieuse, cest--dire utiliser le nombre minimal de termes requis par la description du domaine (ou du problme) et ne doit pas employer des termes de structure complexe l o des termes de structure simple sont disponibles. 1.2.2 Positionnement

Dautre part, comme lexprime Pierre Swiggers, dun point de vue strictement historique,
Une thorie doit se dnir par rapport dautres thories et modles. Cette entre sur le march est une affaire dauto-publicit, de rhtorique positive et ngative, de stratgies dexclusion et de promotion, dexploitation (ou de non-exploitation) des traditions culturelles et scientiques. (Swiggers 1999, 23).

Il nous faudra ncessairement cest le prix de la dmarche scientique nous situer par rapport nos devanciers. Cela peut thoriquement se faire de plusieurs faons: soit par la critique systmatique de leurs thorie et terminologie dans le but dlaborer notre propre thorie dans un mouvement de synthse dialectique entre ces terminologies et les critiques que nous avons leur formuler; soit en situant a posteriori les thories antrieures par rapport la ntre, expose en faisant table rase de ces travaux. Le choix de la mthode de positionnement dpend en grande partie de ltat de lart du domaine dans lequel sinsre la conceptualisation nous verrons ci-dessous que nos choix ne seront pas identiques en ce qui concerne la conceptualisation de la langue crite et celle de la syntaxe.10 Bien entendu, il nest pas souhaitable de poser la terminologie thoriquement, sans gard la ralit des faits, et la construction des axiomes se fera en fonction de cette ralit, cest--dire, en fonction dune intuition qui, pour mthodique quelle soit, ne cessera de devoir tre considre comme telle que nous nous devrons dexpliciter.

rentes dimensions syntaxiques relevant de lordre du segmental, le dernier, dordre suprasegmental, se superposant, se combinant ou sajoutant la syntaxe segmentale (Eynde et al. 1998). Les rgles de construction morphologique de ces termes sont exprimes ainsi: Pour dsigner les dimensions syntaxiques, nous nous servons de termes qui, tout comme le terme syntaxe lui-mme, se composent de deux parties tires du grec: la racine taxe et un prxe appropri. (Eynde et al. 1998, 33). 10 Voir lintroduction du chapitre 2 pour notre position par rapport la langue crite et 3.1.1 concernant la syntaxe.

16

Concept @caractre 1 @caractre 2


F IG . 1.1 Reprsentation dun concept et de ses caractres

@caractre 1 @caractre 2
F IG . 1.2 Reprsentation dun concept non nomm Concept parent @caractre 1 @caractre 2 Concept enfant 1 @caractre 1.1 @caractre 1.2 Concept enfant 2 @caractre 2.1 @caractre 2.2

F IG . 1.3 Reprsentation dune hirarchie de concepts

1.3

Conventions de schmatisation des concepts

Ces principes exposs, convenons prsent dun systme de notations qui soit pratique et nous permette de formaliser la reprsentation des concepts. Ces conventions, qui mettent en vidence les caractres retenus, permettront galement de nous exposer explicitement dventuelles critiques quant la pertinence des choix oprs et des formulations. 1.3.1 Prsentation des conventions

Schmatiquement, on peut reprsenter le concept sous la forme dune bote, laquelle on donnerait une tiquette correspondant son nom. La bote est remplie de la liste des caractres spciques (proprits slectionnes) au concept en question et chaque caractre est prcd du signe @ (gure 1.1). Bien entendu, rien nempcherait de construire un concept qui naurait pas de dnomination (gure 1.2).11 La hirarchisation des concepts est prsente sous forme darbre, chacun des nuds hritant de tous les caractres de ses anctres. Les concepts enfants sont tiquets comme les concepts parents, mais leur dnition complte comporte en outre les caractres des concepts anctres: parent, parent du parent, et ainsi de suite, rcursivement (gure 1.3). Daprs ce schma, les caractres 1 et 2 sont communs au concept parent et aux concepts enfants 1 et 2, qui se dnissent respectivement par les groupes de caractres 1.1, 1.2 et 2.1, 2.2. Cette hirarchisation peut tre reprsente par un embotement quand il nest question que dun seul concept et que lon dsire prciser son ascendance: Concept enfant
11 Dans une perspective purement opratoire, il nest pas non plus impossible de crer un

concept dont les caractres ne seraient pas (encore) dnis.

17

est un Concept parent qui a les caractres numrots 1.1 et 1.2. Par conomie, nous omettons parfois les caractres du concept parent, ce qui met clairement en vidence que le fait dtre un concept parent est un caractre du concept enfant. 1.3.2 Intrts

nos yeux, les conventions de prsentation que nous allons appliquer dans les chapitres 2 et 3 donnent au lecteur un accs facile et rsum lensemble de lexpos qui soutient la dmarche de conceptualisation. Enn, et cela est commun toute tentative de reprsentation formalise, les schmas isolent les diffrents lments de largumentation, de sorte quil devient possible de les critiquer individuellement avant de les remettre en perspective. Il est donc envisageable de corriger par petites touches les concepts proposs, sans pour autant remettre en question lensemble du systme.

18

Thorie de lcriture et ponctuation

Mme entendue intuitivement, la ponctuation est conue comme faisant partie intgrante du systme de lcriture. Nous ne pouvons donc nous passer de la dlimiter dans ce champ. Cest en fait la dnition progressive du concept de langue crite et des units quon y trouve qui va nous permettre de rencontrer notre premier objectif. Nous proposons non seulement de dnir ici le concept de ponctuation, tel quil sera entendu durant toute notre tude, mais surtout de placer cette dnition en bout de course dune construction dont chaque point sera expos de manire pouvoir tre remis en question sil est confront de nouvelles donnes de lexprience. Arm de mthodes thoriques pour dnir nos concepts et notre terminologie (1), nous dnirons le concept de langue crite (2.1) avant dappliquer ces mthodes aux ralits rencontres dans les documents: la dmarche sera dductive du point de vue de llaboration conceptuelle (il sagira dappliquer la mthode dnie absolument), mais elle restera empirique, parce que toujours cadre par les matriaux que nous explorons (2.2). Cette confrontation dgagera une terminologie vocation plus gnrale (dmarche inductive), permettant une dnition du concept de ponctuation (2.3). En ce qui concerne la situation de notre travail dans lvolution de la rexion sur la langue crite, nous devrons dabord exposer nos vues, pour nous situer a posteriori par rapport nos devanciers. Cette solution, qui nest pas sans fausser lgrement lHistoire et qui ne rend peut-tre pas assez justice aux prdcesseurs en question, est la seule qui nous paraisse envisageable dans une dmarche que nous avons demble qualie dempirique: il sagit de partir des donnes observes pour construire une thorie. Mais comment pourrait-on faire autrement, alors que la totalit des visions systmatisantes que nous connaissions de lcriture vise dcrire des systmes modernes, cest--dire contemporains des descripteurs? Transposer ces vues au systme mdival serait pur anachronisme. Vu le sens de notre dmarche, nous ne pourrons donc demble marchander nos choix terminologiques partir de ceux de nos devanciers. Il nous sera possible de leur rendre leur d en signalant la paternit des termes que nous choisirons, mais nous ne pourrons nous positionner face leur systme thorique qua posteriori, lorsque nous aborderons le concept de ponctuation (2.3).

19

2.1

Regard linguistique sur lcriture

Dans un premier temps, il sagit de dnir le concept de langue crite. Comme indiqu ci-dessus, la dnition dun concept est tributaire dun certain regard sur lobjet. En loccurrence, la dnition du concept en question se fait en portant un regard de linguiste sur lcriture.1 Nous aborderons ainsi les regards possibles sur lobjet quest lcriture (2.1.1), puis les regards de linguistes sur cet objet (2.1.2). Cela nous mnera choisir un point de vue et dnir en consquence le concept de langue crite. 2.1.1 Lcriture et les regards possibles

Lcriture est un artfact humain et peut tre considre des diffrents points de vue humains portant sur les artfacts. Elle peut tre envisage en tant quobjet rel et historique, ou tre apprhende travers ses rpercussions, ou encore tre vue comme un tout systmatique. En tant quobjet, lcriture peut recevoir une dnition trs large, les proprits pourront tre aussi nombreuses quon voudra. Les approches sont aussi multiples que sont les sciences de lhomme: historique, palographique, psychologique, esthtique, smiotique, sociologique, linguistique, etc. Lobjet criture est vaste par la complexit et labondance de ses proprits. Intuitivement, on distingue des proprits matrielles (elle se dveloppe dans lespace, elle est presque toujours visible, elle peut tre plus ou moins durable, etc.); des fonctions, quelles soient utilitaires/volontaires ou non (elle sert communiquer distance, dans le temps, elle sert transcoder loral, elle transmet des informations sur le subconscient du scribe,. . .); etc. Lcriture est donc un objet qui peut tre conceptualis par un regard particulier. Chacun des regards quon peut lui porter rduit cet objet une srie de caractres qui permettent de dnir un concept propre une reprsentation scientique, technique ou artistique. Ainsi, le palographe ngligera la proprit transmet des informations sur le subconscient. . . pour laborer le concept de script, alors que le graphologue en fera un caractre essentiel. 2.1.2 Constitution du concept de langue crite

Quant au linguiste, les proprits quil slectionne dans lobjet lui donnent la possibilit de crer le concept de langue crite ou celui de code crit,2 et ainsi dintgrer lcriture son domaine dtude. Il est bien connu que les diffrentes coles linguistiques conceptualisent la langue de faons diffrentes, ce qui en soi pourrait impliquer une grande varit des terminologies en linguistique (Mounin 1974, VII - XXII). Le regard du linguiste peut tre diffrent en fonction de la manire dont il considre la langue, cest--dire le moule denvisagement3 de lobjet langue qui lui permet de conceptualiser ce dernier dans son sens le plus gnral (langage). Il faut donc r1 2 3

Nous verrons ci-dessous le rapport entre les concepts de langue et code crits Nous justierons le choix du premier par notre objectif pratique (2.1.2.2 c). Voir les diffrentes perspectives linguistiques de lanalyse de lcriture infra, 2.1.2.2. La formule est de Pierre Swiggers (1999, 1920), qui numre, dans une liste quil qualie de non exhaustive, pas moins de douze de ces envisagements.

20

pondre deux questions: quelle sera notre vision de lobjet langue (2.1.2.1)? et comment se caractrisera le rapport entre cette conception de la langue et celle quon aura de lcriture (2.1.2.2)? La rponse ces questions nous donnera les moyens de dnir, nous lesprons adquatement, le concept de langue crite (2.1.2.3). 2.1.2.1 Un moule denvisagement de lobjet langue

Le simple fait de choisir un moule denvisagement revient dnir ce quon entend par langue. Il est vrai que vouloir tenter une dnition est ambitieux: la diversit des moules est le tmoin de la difcult dapprocher cette dnition. Pour cette raison, il nous faut choisir a priori notre point de vue, en fonction de nos convictions, plutt que dadopter une dmarche clectique molle. Ce qui rend lgitime que le linguiste prenne lcriture comme sujet dtude et construise le concept de langue crite, cest quune partie des caractres de cette dernire sont directement hrits du concept de langue, ce qui implique une dpendance par rapport au moule denvisagement choisi. Ce nest quen restreignant le concept laide de ce caractre quil peut devenir pertinent pour le linguiste.4 La langue crite tant une langue, elle hrite de tous les caractres de cette dernire. Bien que chaque point mrite discussion et soit sujet polmiques, nous prenons comme point de dpart une vue traditionnelle de ce qui dnit la langue: comportant des units pourvues dune forme dexpression et dun contenu (signes bifaces, cf. Saussure 1967, 97s. Hjelmslev 1968, 65s.); doublement articule (cf. Martinet 1996, 17s.; ide exprime chez Hjelmslev (1968, 58s.) dans lopposition signes vs gures); dont les units sont arbitraires (cf. Saussure 1967, 100s.); dont le potentiel expressif est illimit.5 Cette dnition se situe ainsi dans la ligne du structuralisme fonctionnaliste dvelopp partir de Ferdinand de Saussure, Louis Hjelmslev, Andr Martinet, etc. (gure 2.1). 2.1.2.2 Relation entre criture et langue

Par rapport la langue, lcriture (Swiggers/Van Hoecke 1991, 504), peut tre envisage de trois faons diffrentes, que Jacques Anis et ses collaborateurs prsentent en ces termes:

Une dnition plus restreinte, qui fasse explicitement rfrence la dimension linguistique, nous parait donc souhaitable. Cest le cas de celle que donne Hagge (1985[=1986]: 72) Lcriture est une technique de re-prsentation de la parole par une trace laisse sur un support conservable ou mieux encore celle de Coulmas (1996: 555) Lcriture est un systme denregistrement du langage laide de marques visibles et tactiles en relation systmatique avec les units de la parole. (Jaffr 2001, 530). Cf. Hjelmslev 1968, 138: En pratique, une langue est une smiotique dans laquelle toutes les autres smiotiques peuvent tre traduites, aussi bien les autres langues que toutes les autres smiotiques concevables.

21

langue @systme smiotique @ double articulation @arbitraire @au potentiel expressif illimit
F IG . 2.1 Concept de langue Parmi les diverses approches linguistiques de la langue crite [. . .] on pourrait, en simpliant, dgager trois tendances: le phonocentrisme, qui traite la langue crite comme une reprsentation dforme de la langue parle; le phonographisme, qui traite la langue crite comme une reprsentation structurale de la langue parle, intgrant galement des caractristiques spciques; lautonomisme, qui traite la langue crite comme un systme spcique en interaction relative avec la langue parle. (1988, 77).

Le phonocentrisme est considrer comme hors du dbat (ibid.), puisquil ne vise pas une description de lcrit comme systme. a. Perspective phonographique. Face au terme phonographique, Nina Catach (1988a) a propos le terme glossographique. Selon ce point de vue, dans sa forme aboutie,6 elle postule thoriquement quatre solutions pour articuler les codes oraux et crits avec la langue, ou plutt quatre faons dcrire une langue parle (Catach 2001, 737a):7 1/ traduction de la substance phonique en substance graphique (terme terme); 2/ construction dun code dexpression parallle, mais diffrent (spcicit partielle du code crit); 3/ construction dun code dexpression partiellement parallle, introduisant des oppositions inexistantes loral, et permettant une analyse morphmatique diffrente; 4/ construction dune langue diffrente. Dans la pratique, lunit de base, le graphme, est dnie par Nina Catach comme la dsignation gnrique de diffrentes units, dont les types se distinguent en fonction de ce quelles servent noter (voir p. ex. Catach 2001; Gruaz 1985), ce qui revient toujours dnir les units du code crit par rapport au code oral, puisque, considrant linterfrence entre les deux codes, cest toujours le mme sens de la relation qui est pris en compte (les solutions sont ordonnes en fonction de la distance quelles accusent par rapport loralit). Concrtement, dans son approche du systme graphique du franais, quelle qualie de plurisystme (voir p. ex. Catach 1988a, 248, Catach 2001, 738as.), Nina Catach distingue les graphmes reprsentant des phonmes (phonogrammes), de ceux qui reprsentent des morphmes (morphogrammes) ou des units idographiques, quon reconnat et identie instantanment comme des units de sens (logogrammes), etc. Ainsi, a est un graphme qui reprsente un phonme dans villa, mais pas dans manger, o cest le groupe an qui constitue un phonogramme; dans il viendra, ce mme a reprsente en outre un morphme; par ailleurs, le signe cest est un logogramme. Cette pluralit fonctionnelle de lunit de base du systme graphique est la base de ce que Nina Catach nomme mixit du systme. Nanmoins, pour le franais, 83% des gra6 7

Il est hrit de Vladimr Ho rej (1971) et de Vladimir Gak (1976), cf. Anis et al. 1988, 79. Lcriture double la langue phonmique. (Catach 1988a, 253).

22

phmes noteraient des phonmes (Catach 1998, 63), ce qui contribuerait daprs elle justier une approche prenant loral comme point de rfrence. b. Perspective autonomiste. Jacques Anis (1988, 213) adopte la position selon laquelle la langue existe sous deux formes [orale et crite], entre lesquelles la linguistique ne postule ni hirarchie, ni dpendance; il qualie lui-mme cette position dautonomiste. La thorie, mise au point par Jacques Anis dans les annes 80 (Anis 1983; Anis 1988; Anis et al. 1988), se rclame de Josef Vachek (1973). Il faut y voir une option mthodologique qui se positionne par rapport aux conceptions gnralement acceptes jusqualors et dont Nina Catach est le reprsentant le plus engag. Selon les autonomistes, les thories modernes de la lecture (Anis 1983, 32) ayant mis en vidence quil tait possible de comprendre un texte crit sans accs la forme phonique correspondante, il est envisageable de dcrire la structure du code crit indpendamment du code oral. Les tentatives de descriptions autonomistes, peu nombreuses au demeurant, nomment galement graphmes les units de la langue crite. Jacques Anis rpartit les graphmes en trois classes quil dnit comme suit: les alphagrammes ou graphmes alphabtiques, units purement distinctives; les topogrammes, graphmes ponctuotypographiques, qui contribuent la production du sens, en tant quorganisateurs de la squentialit et indicateurs syntagmatiques et nonciatifs; et les logogrammes ou graphmes correspondant une unit signicative (Anis 1998, 15). La classe des topogrammes correspond ainsi une fonction, dnie exclusivement par la relation entretenue entre les units graphiques.8 c. Positionnement. Les deux perspectives, qui par ailleurs ne sont pas incompatibles (Swiggers/Van Hoecke 1991), se dfendent, et ce nest pas le lieu de juger du bienfond de lune ou de lautre. Nanmoins, au vu de nos objectifs pratiques, il semble raisonnable dopter pour un regard autonomiste. Il est vrai que dun point de vue historique les pratiquants eux-mmes considrent les codes comme indpendants (Parkes 1992, 34), mais le plus important des arguments plaidant en faveur de cette approche est dordre pistmologique. Bien quencore au stade de proto-science, la linguistique doit nanmoins avoir pour objectif de devenir un jour une science proprement parler, et donc demployer des mthodes appropries. La falsiabilit dune thorie par les donnes de lexprience doit tre un impratif. La mthodologie falsicationniste, due Karl Popper (cf. Barreau 2002, 47), est conue comme une alternative une inexistante logique inductive. La condition ncessaire la validit de toute science empirique est que le modle doit pouvoir tre partiellement ou totalement remis en cause lorsquil est confront des donnes qui ne sy conforment pas. Or, nous ne savons rien et nous ne saurons probablement jamais grand-chose sur lintonation mdivale. Cest pourquoi lattitude glossographique ne pourrait dpasser dans ce cadre ltape de la spculation: pas de donne, pas de thorie. Dans lventualit o la ponctuation renseignerait sur cette intonation, cette dernire serait le point darrive de la dmarche, pas son point de dpart. La relation entre la ponctuation du treizime sicle et lintonation de la mme poque ne doit pas tre envisage, non que cette relation soit invraisemblable, mais il est impossible dvaluer la validit dune ventuelle reconstruction.

Voir cependant la critique que Roy Harris formule ce sujet (2.2.3).

23

langue crite @langue @ mdium spatial


F IG . 2.2 Concept de langue crite

2.1.2.3

Vers une dnition de la langue crite

Joignant ces deux prises de position, nous sommes amen dire que toute langue crite est considrer comme une langue part entire (autonomisme). Pour que la dnition soit nanmoins opratoire, il faut trouver ce qui fait la spcicit de la langue crite par rapport la langue: quel caractre spcique pourrait servir les distinguer? Choisir ce(s) caractre(s) revient donc dnir la langue crite par rapport la langue; au linguiste de le(s) choisir dans lensemble des proprits de lobjet criture. On conoit que ce choix nest pas simple et quil mobilise nouveau des reprsentations sur la langue. Dcider que le caractre retenir est @durable revient exclure tout ce qui serait crit la surface de leau (Harris 1995, 45s.) et inclure dans le concept les supports enregistrs comme le disque ou les chiers informatiques audios (Catach 1988a, 244). Dcider que ce caractre est @visuel revient exclure le braille (lorsquil est lu par un aveugle), etc. (Catach 1988a, 244, Harris 1995, 38s.). Il y a lieu de choisir la proprit la plus gnrale qui dnisse lcriture par rapport ce qui lui ressemble le plus: tous les moyens de communication linguistique. On ne stonnera nullement de la nature smiotique de ce caractre si lon veut bien considrer le rapport dinclusion qui fait de la linguistique un sous-domaine de la smiotique. Une solution qui nous parat satisfaisante est ainsi propose en smiotique par Roy Harris (1995, 45):
[. . .] the underlying substratum9 of writing is not visual, but spatial.

Soulignons que cest une proprit matrielle de lcriture qui est prise en compte. Le choix est lgitime, parce que la spatialit est implique dans la formation mise en forme au sens de la linguistique structurale du signiant (Saussure 1967, 155s., 163s., etc. Hjelmslev 1968, 68, 7071, 74, etc.). La substance tant la partie de la matire qui est mobilise par la forme linguistique, le phonticien peut tout ngliger de la matire phonique, sauf la substance. Pareillement, il est du ressort du linguiste de prendre en considration la substance spatiale lorsquil soccupe de la langue crite. Au bout du compte, nous aboutissons au modle conceptuel schmatis par la gure 2.2, qui correspond au concept gnr par un (notre) regard linguistique structuraliste et autonomiste sur lcriture.

2.2

Classement et nomination des units de la langue crite

Cette section sera consacre la taxinomie des units de la langue crite. Une fois abords quelques pralables mthodologiques (2.2.0), nous proposerons une dsi9

Lacception du terme substratum nous parat ici mtaphorique; plus rigoureusement, on emploiera les termes matire et substance.

24

gnation gnrale des units de la langue crite et nous poserons une premire dichotomie (2.2.1). Nous distinguerons les units qui organisent lespace graphique de celles qui sont prcisment lobjet de cette organisation. Sur la base du critre fonctionnel de la double articulation, nous scinderons ces deux types dunits en classes subordonnes (2.2.2). Le critre spatial (2.2.3) ainsi que le problme de la paraphrasabilit des units certaines units peuvent en remplacer dautres (2.2.4) mnera poser de nouvelles distinctions. Nous synthtiserons ensuite notre rexion (2.2.5). 2.2.0 Pralables

Avant de commencer classer les units de la langue crite, nous dnirons la dmarche de classement adopte (2.2.0.1). Dautre part, le recours aux transcriptions en guise dexemples sera parfois invitable, do la ncessit de soulever le problme que pose la relation entre la dmarche pratique de transcription et la dmarche thorique de classication (2.2.0.2). 2.2.0.1 Orientation de la dmarche de classement

Le modle conceptuel de la langue crite tant pos, nous avons notre disposition le cadre ncessaire la dnition des units de la langue crite. Voyons prsent ce quimpose lempirisme de notre approche. Il y a, nous semble-t-il, deux manires de procder: 1/ soit on essaye, dun point de vue thorique, de prendre en compte toutes les units de toutes les langues crites (cest--dire tous les objets qui peuvent tre considrs comme des instances du concept langue crite tel que nous venons de le dnir), de manire baucher une thorie gnrale du langage crit, pour ensuite dgager les principes qui nous serviront pour notre question; 2/ soit on part des donnes quoffre une de ces instances et on essaye de raisonner partir de celles-l pour construire une terminologie juge sufsante son seul gard, quitte avouer explicitement son caractre provisoire face une thorie plus gnrale de la langue crite. Notre approche implique la seconde solution. Une raison supplmentaire qui nous incite conserver ce choix est notre incomptence face au domaine vaste et compliqu des critures dans leur multiplicit, qui nous mnerait bien loin de notre objectif de description de la ponctuation des chartes. Nanmoins, nous pensons que se focaliser sur cette seule langue crite peut dj mener un classement n des units du langage crit. 2.2.0.2 Lactivit pratique de transcription

Dans la dmarche de taxinomie, il sagira de classer tout dabord des formes dexpressions, cest--dire des signiants. Ne sachant pas exactement ce que signient les signes que nous classons, puisquil sagit du but ultime de notre dmarche, nous ne pouvons approfondir le classement des units en fonction de leur valeur10 au del de lopposition signicatif/distinctif (double articulation, 2.2.2). Procder en cherchant
10 Terme quon prfrera contenu, qui a linconvnient dvoquer une valeur dordre sman-

tique.

25

F IG . 2.3 Exemple de ralisation (Document 12720708, 1)

retrouver des conceptions actuelles dans les pratiques anciennes fausserait lanalyse (Boutier 2001, 431). Cette description de la forme doit prcder celle de la substance pour deux raisons: 1/ la substance nest intressante que parce quelle sert la construction de la forme; 2/ la forme nous est intuitivement accessible parce que, dans notre corpus, nous comprenons en grande partie le message vhicul, sa pertinence. Voil une dmarche qui implique invitablement le danger de catgoriser a priori et parfois de se tromper devant une criture inconnue. Il importe donc de ne jamais oublier que lon raisonne sur des reprsentations, qui, en tant que telles, peuvent tre revues en fonction de remises en question thoriques. Prenons par exemple la ralisation visible dans la gure 2.3. Pour tre utilisable, cette ralit a d tre transcrite, cest--dire rduite une reprsentation de sa forme. Cette rduction se fonde sur un principe de ressemblance: il y a dans les documents des ralisations graphiques qui se ressemblent et que nous pouvons considrer comme tant identiques, parce que leur trac est similaire (ressemblance sur le plan de lexpression), et parfois parce quelles ont clairement la mme valeur. Dans le premier cas, le plus frquent face un matriau inconnu, la transcription est impressionniste. Ainsi, on transcrira limage donne ci-dessus11 :
a tous cheaus qu ces preens letres veront nos li homme de cie deu [. . .]

Si lon peut rapidement par simple commutation avec teus, par exemple prouver que o12 est bel et bien une forme dexpression exprimant une valeur, en loccurrence distinctive (2.2.2.1), lcriture mdivale comporte par contre des quon identie comme tels avec un il moderne, mais dont on ne peut valuer la pertinence: lalternance entre la prsence ou non de laccent pourrait tout fait tre libre dans lensemble de la langue crite que nous analysons, ou simplement dans un idiolecte particulier. Par ailleurs, nous avons transcrit au milieu de la ligne; de mme, on aurait transcrit les puncti quon retrouve dans la photographie 2.3 ci-dessus et dans la gure 2.4 au milieu de la ligne, sans aucune distinction. Avant davoir tudi le phnomne en dtail, il nest pas possible dafrmer avec certitude que lon a bien affaire plusieurs occurrences dune mme unit. On voit donc qu ct de transcriptions ne faisant pas
11 Les exemples cits dans ce chapitre sont des transcriptions diplomatiques qui conservent les

faits suivants: accents; oppositions entre s et , et j ainsi que u et v; ponctuation; opposition entre lespace et la petite espace Les lettres plus grasses ou plus grandes que les autres sont transcrites en gras. Les chevrons entourent les portions de texte ayant d tre restitues parce quelles taient endommages, les crochets marquent les portions volontairement grattes et les demi crochets signalent que le texte a t ajout au-dessus de la ligne. Pour tre rdiges de manire rigoureuse, ces conventions ncessiteraient normalement que soient dnies les principales units transcrire. On voudra bien nous pardonner cette invitable circularit. Voir la section Transcriptions des annexes pour une tentative allant dans ce sens. 12 Nous transcrivons les units graphiques entre chevrons.

26

F IG . 2.4 Exemples de puncti (Document 12720708, 2)

F IG . 2.5 Exemple daccent dcal (Document 12770203, 27)

lombre dun doute, certaines sont de lordre du pari: il se peut quon conserve dans notre transcription des variantes libres, in-signiantes dun point de vue linguistique, ou, ce qui est certainement plus grave, quon passe sous silence des oppositions pertinentes. Il peut galement arriver que lopposition soit fonctionnellement prsente, mais que nous ne puissions en comprendre la valeur.13 Tout cela est invitable. Enn, les cas de tlescopages (jugs) accidentels dunits sont formaliss de la mme manire: ainsi, un accent dtach du au-dessus duquel il devrait tre est transcrit au-dessus de ce dernier, mme sil se trouve en ralit au-dessus dun r situ plus droite, comme dans la gure 2.5: notare. Cependant, pour risqu quil soit, ce pari est pleinement justi par le fait que nous cherchons quelque chose, mais que nous ne savons pas ce que nous allons trouver. Nous ne savons pas sil y a des rai sons valables pour opposer les deux signes et /, mais lopposition est maintenue au cas o ces raisons existeraient; en outre, la frquence et la constance dune alternance de ce type donnent dj penser quil est utile de procder ainsi. Le systme terminologique devrait idalement permettre de tenir compte de la diffrence entre matire, substance, forme et reprsentation. Nanmoins, pour des raisons pratiques, nous ferons comme si nous avions devant nous des formes et nous hirarchiserons les diffrents types rencontrs pour aboutir au tableau hirarchique (2.2.5). 2.2.1 Unit de base et premire dichotomie

Tirons parti immdiatement du fait que la langue crite ait un mdium de nature spatiale pour poser une premire dichotomie. Ayant admis dans un premier temps que nous navons transcrit que des formes dexpression qui expriment une valeur, nous pouvons, par commodit, transcrire ces formes entre petits chevrons (p. ex.: i, ou ). Considrons lensemble des units dune langue pourvues dune forme dexpression. Ces units linguistiques, en vertu de la double articulation, peuvent tre minimales ou non. Les units de la langue crite qui pourront tre considres comme minimales dune faon ou dune autre, seront nommes scriptmes (gure 2.6).14

13 Voir en loccurrence le cas insoluble de lopposition de et / dans Document (127203),

voir notre tude (Mazziotta paratre).


14 Lat. scriptio action dcrire, scriptura criture; terme qui remplace ici le graphme de

certaines thories prenant en compte la mise en page (2.3.2.2).

27

scriptme @unit linguistique minimale @ mdium spatial


F IG . 2.6 Concept de scriptme scriptme @minimal @spatial grammme @non organisateur spatial topme @organisateur spatial

F IG . 2.7 Types de scriptmes

Par commutation, on isole assez facilement des units discrtes vhiculant le sens, jusqu aboutir des segments minimaux:
conute choe oit a chacon et a tos ke [. . .] (Document 12800504, 2).

Par ailleurs, nous pouvons constater que la manire dont sorganisent les units constitue galement un vhicule de sens. Observons nouveau la ralisation prsente en gure 2.3, p. 26. On voit clairement que le texte se prsente sous la forme dune suite de blocs espacs: il y a une espace plus large entre cheaus et qu quentre le c et le h du premier de ces blocs. De plus, ces derniers sont positionns les uns par rapport aux autres de manire ce que leur ordre soit signicatif. Nous distinguons de la sorte deux types dunits signicatives en fonction de leur forme dexpression. Nous proposons de nommer topmes les units non discrtes qui structurent et organisent lespace.15 Dans ce cadre, nous dnissons donc le topme positivement, comme un scriptme organisant lespace graphique, le distinguant des units qui ne sont pas des topmes, que nous nommerons grammmes.16 Dun point de vue perceptuel, les occurrences de grammmes sont en effet organises les unes par rapport aux autres: elles peuvent se suivre de haut en bas, de gauche droite, etc., elles peuvent tre espaces les unes des autres, ou au contraire se superposer. Le terme topme recouvre ainsi lensemble des procds de disposition relative des grammmes. Un scriptme sera donc soit un grammme, soit un topme (gure 2.7). On peut ds prsent faire remarquer que le couple organiseur/organis entretient une relation de prsupposition mutuelle interdpendance sur le plan syntagmatique, ou solidarit, disait Louis Hjelmslev (1968, 5152). Ds lors quil est question doccurrence de scriptmes, tout agencement de grammmes est un topme17 , et tout grammme est forcment positionn par rapport aux autres, nature spatiale de la substance oblige.
15 Gr.

lieu, endroit. La notion de topme convient galement pour dsigner lorganisation particulire de la page imprime, quon nomme habituellement mise en page. 16 Le terme est propos par Swiggers/Van Hoecke (1991). 17 Nous reviendrons ci-dessous (2.2.2.2) sur les difcults pratiques que pose cette dnition.

28

grammme @non organisateur spatial plrgramme @signicatif cngramme @distinctif

F IG . 2.8 Types de grammmes: critre fonctionnel

2.2.2

Critre fonctionnel de double articulation

Cette premire distinction pose, nous pouvons prsent nous servir de la double articulation, qui caractrise toute langue, pour distinguer plusieurs types de grammmes et plusieurs types de topmes. 2.2.2.1 Types de grammmes

Les grammmes peuvent tre diviss en deux groupes distincts. En observant la chane page 28, nous constatons que toutes les units ne sont pas similaires: les units minimales qui vhiculent le sens se diffrencient de celles qui nont de valeur que distinctive principe de la double articulation. Ainsi, mme sans faire rfrence loral, conute se dcoupe en trois units signicatives (cp. conurent, conut, etc.): con (sens lexical) + u (catgories verbales18 ) + t (catgories verbales) + e (genre). Par contre, conu est form de quatre units exclusivement distinctives. Nous dirons donc, suivant ici Nina Catach,19 que conu est plrmique et quil est constitu de quatre units cnmiques.20 . En tant que scriptme non organisateur, minimal au point de la signication, conu est un plrgramme constitu de scriptmes non organisateurs galement, mais limits une valeur distinctive: des cngrammes. On peut regrouper cet ensemble sous lhyperonyme grammmes (gure 2.8). ce stade, la relation dhypo-hyperonymie entre grammme et les co-hyponymes plrgramme et cngramme implique que le grammme ne soit pas forcment minimal sur tous les niveaux darticulation la fois: il sera plrgramme ou cngramme suivant quil est minimal au point de vue de la premire ou de la seconde articulation. Dans conute, conu comme c sont des grammmes, le premier un plrgramme, le second un cngramme; de mme, e y est un plrgramme compos dun seul cngramme e.

18 Nous passons ici sur les difcults de lanalyse morphmatique et nous permettons quelque

imprcision.
19 Qui reprend (cf. Catach 1979, 22) le terme de Haas (1976), lequel sinspirait directement de 20 Gr.

Hjelmslev. Voir cependant la note 20 ci-dessous. plein, rempli, gr. vide, gr. caractre, dcriture Il nous semble cependant que la manire dont Nina Catach reprend le rapprochement de Haas nest pas en accord total avec la terminologie de Hjelmslev, pour qui les plrmatmes sont des glossmes du contenu et non de contenu, cest--dire des units linguistiques entirement situes sur le plan du contenu, alors que ladjectif plrmique de Nina Catach sapplique des signes part entire; voir Hjelmslev 1939, 143, Hjelmslev 1954, 4849. Nous adoptons malgr tout le terme.

29

topme @organisateur spatial plrtope @signicatif cntope @distinctif

F IG . 2.9 Types de topmes: critre fonctionnel

2.2.2.2

Types de topmes

Quelle que soit la sorte de valeur quon peut y voir, les grammmes sont organiss par les topmes. En poussant le concept de topme ses limites, on peut considrer que les groupements de plrgrammes ainsi que les groupements de cngrammes sont construits laide de topmes. Ainsi, la gure 2.3 montre des sparations entre plrgrammes concatns, eux-mmes forms de cngrammes qui senchanent. Les topmes ont donc un rle jouer aux deux niveaux de la langue crite ce qui est une consquence directe de linterdpendance entre grammmes et topmes: tout grammme actualis, mme cnmique, prsuppose un topme. Nanmoins, il y a une diffrence fondamentale entre ce quon voudra bien ds lors considrer comme deux types de topmes: les topmes qui organisent les plrgrammes sont susceptibles de comporter un surcrot de sens on les nommera donc plrtopes , alors que ceux qui organisent les cngrammes sont de simples formes distinctives, que nous nommerons cntopes (gure 2.9). Dans lexemple de la page 28, il y a un plrtope qui organise conute par rapport aux mots qui lentourent, de mme que les units qui le composent (cngrammes) sont organises par des cntopes. 2.2.3 Critre spatial

Prendre en compte le caractre @spatial repose la question de lautonomie au niveau des plrgrammes et invite dterminer sur quel axe les units discrtes sont construites et combines. La dmarche permet par ailleurs de se passer compltement de loralit, vitant lcueil dnonc par Roy Harris:
Du ct des autonomistes, le problme est plus grave, parce que, sils posent comme postulat lindpendance smiologique de lcriture, dans la pratique, ils sont bien embarrasss pour commencer ailleurs que par une correspondance dj tablie entre telle langue parle et tel systme dcriture. Les prtendues analyses autonomes commencent toujours par considrer les structures graphmiques par rapport une fonction phonographique ou logographique qui est sous-entendue. On se demande si ce nest pas refuser la primaut de la parole en tant que doctrine thorique, quitte la rinstaller comme prsuppos mthodologique. (1993, 364).

2.2.3.1

Autonomie des plrgrammes

La question de lautonomie pose au niveau des plrgrammes nous invite afner le classement de ceux-ci. Examinons la substance des plrgrammes de la gure 2.10. Les chanes sont composes de cngrammes, dont le premier est plus imposant que les autres. Ce cngramme est considr comme une littera notabilior (Parkes 1992, 30

F IG . 2.10 Exemple de 12820201, 2)

cngramme

marqu

(Document

plrgramme @signicatif htrogramme @dpendant autogramme @autonome

F IG . 2.11 Types de plrgrammes: critre dautonomie

305) par les mdivaux: il porte une marque qui permet lil de le distinguer des autres cngrammes. Il peut donc tre dit marqu; il y a entre la substance de ce cngramme et celle du c qui suit une diffrence qui nest pas dordre segmental, mais qui ncessite des units de ce type pour se manifester. Ce rapport de dpendance est similaire celui quentretiennent les topmes et les grammmes. Nanmoins, puisque les grammmes se dnissent par le fait quils norganisent pas lespace, ces marques supplmentaires sont une sorte de grammme. La question de la valeur de ces grammmes non autonomes que constituent ces marques est particulirement complexe. Dans certains cas, ces marques semblent clairement correspondre une segmentation du texte en phrases: dans lexemple qui suit, conute commence une nouvelle phrase21 (les grammmes marqus sont transcrits en gras):
a to ceas ki ce preens lettres veront et ouront li home delle chiee deu font conoi [2] tre veriteit conute choe oit a chacon et a tos ken lan de grace m cc eitante et onc [. . .] vienrent pardeuant nos entre sante [4] marie et sain lamber a liege me dame kathelne [. . .] dune part et i troi enfans [. . .] dautre part deour dtte (Document 12710725, 1).

Nous pouvons estimer que la valeur de la marque est signicative: le grammme est donc plrmique. Il pourrait arriver que la prsence de la marque soit non signicative, voire non distinctive, ce dont on ne peut prjuger. Dans ce second cas, il sagirait dun problme que gnre notre transcription a priori des matriaux tudis (comme discut sous 2.2.0.2): nous aurions maintenu un caractre pour rien, eu gard la forme dexpression. Par contre, dans le premier cas, il faudrait considrer que la marque est dun niveau darticulation (v. supra) suprieur au cngramme et que cest lensemble form par cette marque et dautres units de mme niveau darticulation qui construit un cngramme distinct. Dans ce cas, la question de la marque se pose au niveau de la construction du cngramme (2.2.3.2). Pour ces raisons, nous nous dispensons dafner la hirarchie des cngrammes, approfondissant uniquement celle des plrgrammes (gure 2.11).

21 Nous dnissons ce terme, qui est loin de trouver une acception qui convienne tous, dans

la section 3.4.1.2 du chapitre o nous dcrivons notre modle linguistique.

31

F IG . 2.12 Exemple de t (Document 12820201, 2)

2.2.3.2

Axes de construction et de combinaison des grammmes

Le problme de la construction des grammmes pose en premier lieu la question fondamentale de la limite du cngramme: quest-ce qui empche de considrer que la substance souligne dans la gure 2.12 ne puisse tre analyse en une composition de et de , puisquon retrouve ces composants par ailleurs? Quest-ce qui nous permet de dire que la transcription t est acceptable et que napporterait rien de plus? Comparons les plrgrammes (autogrammes): et et z .22 Lobservation de la distribution des occurrences de ces deux signes rvle quils sont quivalents du point de vue du sens: on trouve indiffremment lun ou lautre dans des positions tout fait similaires; par exemple dans la formule _ tous prsents et venir_.23 Sur le plan de lexpression, et est constitu de plusieurs cngrammes concatns, alors que la mme analyse ne pourrait tre faite de z : soit ce dernier est indcomposable, soit, si lon devait considrer quil est constitu de cngrammes.24 , on y dclerait z et Dans le cas de et, laxe sur lequel sorganisent les cngrammes pour former les plrgrammes est le mme que celui sur lequel senchanent ces plrgrammes, mais pas dans le cas de z . Cela devient particulirement clair quand ces plrgammes sont observs en contexte:
present et avenir. . . vs present z avenir. . .

Si nous estimions que e ou t sont galement dcomposables, nous constaterions que le discernement de leurs formants est impossible sans oprer le mme changement daxe. Le cngramme se laisse donc dnir par le caractre @indcomposable sur le mme axe que celui sur lequel sont forms les plrgrammes.25 Rationalisons la notion daxe en tirant parti du concept de topme. Dans les faits, les topmes sont des units difciles dnombrer, mais la proximit relative des gram22 Le second grammme est lune des abrviations usuelles quon trouve pour et dans les ma-

nuscrits mdivaux.
23 Formule dadresse frquente. Ladresse est la partie de la charte qui exprime le destinataire

du message de lacte crit (Guyotjeannin et al. 1993, 75). En loccurrence, toute personne amene lire le document. 24 En se fondant, par exemple, sur largument matriel du ductus: le signe est trac en plusieurs tapes. 25 Sans vouloir entrer dans un dbat dont la complexit dpasse le cadre de notre tude autant que celui de nos comptences, il nous semble que la dnition reste valable pour analyser les critures dites idographiques (gyptien, chinois), o les plrgrammes sont organiss en chanes, et construits suivant un autre principe (le chinois inscrit ses plrgrammes dans un carr avant de les enchaner). Il y a de la mme faon un moment de rupture situ entre la construction et la combinaison des grammmes. Les critures dites idographiques construisent les plrgrammes sur un axe diffrent de celui de leur combinaison; les critures dites alphabtiques construisent les cngrammes sur un axe diffrent de celui de leur combinaison. La prsence dun axe constant sur lequel sorganisent les plrgrammes est une condition sine qua non une syntagmatique de type linguistique.

32

mmes peut tre, du point de vue de la substance, purement et simplement mesure: certains grammmes sont plus proches les uns des autres et constituent des blocs plus ou moins distants dautres blocs forms de la mme faon (voir p. 28). Pour commencer, on peut faire lconomie de la description des relations entre les units qui appartiennent des blocs diffrents: elles peuvent tre dcrites de manire mdiate, dans la mesure o les relations entre les diffrentes units de ces groupements et les relations entre ces derniers sont dnies de manire satisfaisante. Les topmes organisent et orientent la chane, o chaque unit peut tre simplement dnie par son rang dans la succession des autres units du mme ordre sur cet axe. Dun point de vue pratique, la description est satisfaisante si lon se limite dnir la position dune unit par rapport celle qui la prcde et celle qui la suit directement. On peut dire quil y a rupture de laxe partir du niveau o la position relative des grammmes ne peut plus tre dcrite de la sorte, mais o il faut admettre que leur conguration ne se laisse apprhender que dans son ensemble. Ainsi, pour et, le topme se laisse dnir comme une concatnation relative: e est suivi de t; par contre, si z est vu comme une composition de z et , ces deux units ne sont pas simplement enchanes. Ceci appelle deux conclusions: (a) il convient de distinguer deux types de plrgrammes et deux types de cngrammes sur base de ce critre; (b) une fois laxe de construction dtermin, tout changement daxe implique une rupture et il ny a plus lieu de parler des mmes units. a. Deux types de plr/cngrammes. Les plrgrammes du type et doivent ainsi tre distingus des plrgrammes comme z . Les premiers sont forms de cngrammes ordonns sur un seul axe de combinaison, lequel correspond celui sur lequel se combinent leur tour les plrgrammes; nous nommerons catnogrammes26 ces autogrammes dont les cngrammes constitutifs sont aligns sur un axe par des topmes orients. Les seconds, quoique salignant sur un axe unique, sont forms de cngrammes qui ne sont pas organiss suivant un axe particulier; nous les nommerons nbulogrammes.27 Cela nous permet de proposer la reprsentation de la gure 2.13. En ce qui concerne les cngrammes, nous distinguerons, dune part, ceux qui se combinent sur un seul axe, comme e ou a, pour construire les plrgrammes et dautre part, les cngrammes qui, comme le trait dans labrviation de et, ne sont pas combins suivant un unique axe, mais prennent une conguration qui ne peut tre prvue sans connatre lunit forme. Nous nommons les premiers linogrammes,28 les seconds prigrammes.29 Cette reprsentation doit tre considre comme provisoire: nous verrons (2.2.4.2) que les faits sont en ralit plus complexes (gure 2.14). b. La rupture comme indice de changement de niveau. Revenons la question qui a engendr notre discussion: pourquoi ne pas diviser e ou tout autre linogramme
26 Lat. catena chane. 27 Lat. nebula brouillard.

Cette analyse reste valable dans le cas daccidents: en japonais, le kanji signiant deux a beau tre compos de deux traits superposs, aligns exactement sur le mme axe que celui dans lequel senchanent les plrgrammes, il reste un nbulogramme, parce quil commute avec des units qui sont sans conteste des nbulogrammes (comme le kanji pour dix). 28 Lat. linea ligne. 29 Gr.  autour de.

33

plrgramme @signicatif htrogramme @dpendant autogramme @autonome nbulogramme @topmes de construction non oriente

catnogramme @topmes de construction oriente

F IG . 2.13 Types de plrgrammes: axe de construction cngramme @distinctif linogramme @axe de combinaison unique prigramme @axe de combinaison multiple

F IG . 2.14 Types de cngrammes: axe de construction (provisoire)

en plus petits cngrammes? Rien nempche de le faire. Cependant, ds lors quon change daxe de combinaison/construction, on na plus affaire aux mmes units: il y a entre c et e une diffrence quon pourrait isoler, par commutation, dans la boucle ajoute pour former e partir de c, mais cette valeur distinctive ne sert pas distinguer deux units dont la valeur est signicative. Contrairement aux modles phontiques articulatoires,30 permettant de distinguer des traits non discrets dans les sons, il est possible de diviser les cngrammes en units discrtes plus petites, ce qui fonde toute la lgitimit de la question. Cela signierait donc que la langue crite serait au moins triplement articule. . . Pour considrer un objet au potentiel expressif inni et dont les signes sont arbitraires comme une langue, le regard du linguiste tel que nous lavons dni a besoin de trouver deux articulations, mais peut ignorer les niveaux darticulation suprieurs (subordonns) au deuxime. Cette prise de position est ainsi applique au problme voqu ci-dessus au sujet des htrogrammes: si lhtrogramme a une valeur distinctive entre deux cngrammes, il nest pas plus ncessaire pour nous de lanalyser que de considrer comme une unit la boucle ajoute c pour construire e. 2.2.4 Paraphrasabilit et plurisystme

La paraphrasabilit se dnit comme la capacit, pour une unit, tre exprime par une unit diffrente. Abordons successivement ce caractre (2.2.4.1) et les implications quil a sur le systme de la langue crite (2.2.4.2).

30 nouveau, la comparaison avec la phontique est ici purement didactique et nimplique

aucune corrlation entre loral et lcrit.

34

2.2.4.1

Paraphrasabilit

Nous avons mentionn ci-dessus le problme des axes de construction/combinaison des grammmes (2.2.3.2), opposant le catnogramme et au nbulogramme z , mais spciant quils taient smantiquement quivalents. En dautres termes, il est possible de paraphraser le plrgramme et par z et vice-versa.31 Il est par ailleurs remarquable que cette quivalence concerne galement le plan syntaxique: gloser une unit par une autre ne perturbe pas les relations entre les constituants. Ce caractre de @paraphrasabilit par des units dun autre ordre semble commun aux deux types dautogrammes; et bien que certains mots ne puissent tre abrgs par un signe spcial, cette potentialit nest jamais exclue (cest le cas des notes tironiennes, par exemple). De plus, le caractre peut sappliquer galement aux cngrammes, puisque certains prigrammes sont paraphrasables en un ou plusieurs linogrammes (cest le cas du tilde abrviatif). Il faut cependant remarquer: (a) que le nombre de scriptmes nest pas pour autant constant, de mme que le nombre de plrgrammes; (b) que certains nbulogrammes rsistent la conversion. a. Altration du nombre de scriptmes. Entre et et z , le nombre de morphmes est constant, de mme que le nombre de plrgrammes. Quon examine prsent labrviation 9, quon paraphrase par con, com, qui peuvent avoir la valeur de con suivant le contexte. Dans ce cas, la paraphrase comporte deux catnogrammes: c (pronom relatif) et on (pronom personnel): la paraphrase rsout lamalgame que prsentait 9, o il ntait pas possible de discerner deux formes dexpression correspondant ces deux contenus. Ces considrations, quil ne faut pas perdre de vue, ninvalident en rien lemploi du caractre de paraphrasabilit. b. Nbulogrammes non paraphrasables. Il convient en outre de distinguer les nbulogrammes qui sont paraphrasables de ceux qui ne le sont pas. Ainsi, dans
se il raportoient sor leur seremens ke om nos fesist tort / leueskes nos doit aidier (Document 12420502, 13).

le nbulogramme / ne pourrait pas tre paraphras par un ou plusieurs catnogrammes sans au moins modier la structure syntaxique de la phrase:32
*se il raportoient sor leur seremens ke om nos fesist tort alors leueskes nos doit aidier

En consquence, on distinguera deux types de nbulogrammes: ceux qui sont paraphrasables, nous les nommerons logogrammes, ceux qui ne le seront pas prendront le nom de ponctogrammes (gure 2.15).

31 Pareillement, et avec les mmes prcautions que ci-dessus (note 25), il nous semble que le

critre est oprationnel pour les langues crites dites idographiques, o les units peuvent Gelb (1973, 121) mentionne des syllabaires divers tirs des valeurs phontiques des logogrammes pour le sumrien, lgyptien, le chinois, etc. tre gloses par des nbulogrammes dsmantiss, cest--dire convertis en cngrammes, par le principe du rbus. Ce point mriterait un approfondissement. 32 Le mot cens paraphraser le nbulogramme est soulign.

35

nbulogramme @axe de construction indtermin logogramme @paraphrasable ponctogramme @non paraphrasable

F IG . 2.15 Types de nbulogrammes

F IG . 2.16 Exemple dabrviation 12711203a, 11)

par

contraction

(Document

2.2.4.2

Abrviations et plurisystme

Le terme plurisystme, repris de Nina not. Catach (1988a, 248s.) doit ici tre replac dans une optique distributionnelle et dans le systme de termes qui vient dtre prsent. Il est nos yeux une consquence directe du caractre de paraphrasabilit. Lquivalence entre et et z ne correspond qu une petite partie des faits. Les units signicatives ne sont pas, tant sen faut, toutes intgralement composes sur le mme axe ou compltement dsaxes. En nous concentrant sur les problmes poss par ce que les palographes nomment abrviation (a), nous proposerons de nuancer le systme que nous venons dexposer (b). a. Traitement des abrviations. La langue crite des chartes offre plusieurs exemples de mixit. Les phnomnes de ce genre, tudis par les palographes (voir p. ex. Stiennon 1991, 145s.) et dnomms abrviations par ces derniers, ont t classs empiriquement en cinq catgories: labrviation par contraction consiste prlever au sein dun mot une ou plusieurs lettres, [et] saccompagne dhabitude dun signe dabrviation plac au-dessus du mot; labrviation par suspension affecte la n du mot, priv ainsi dune ou plusieurs lettres et muni [le plus souvent] dun point, point-virgule ou dun autre signe qui marque larrt; labrviation par lettres suscrites consiste placer une lettre [souvent] de petit module comme exposant ou coiffe une ou plusieurs lettres principales; les signes spciaux sont des signes dabrviation de valeur prcise ou dtermine; et enn, les graphismes sont des symboles reprsentant un mot (Stiennon 1991, 145147). Ces dnitions pratiques nous permettent davoir une ide de ce quon peut rencontrer dans les chartes. Voyons prsent comment ces formulations peuvent tre traduites en termes qui sintgrent notre systme, partant nouveau des faits observs. Par exemple, le premier mot de la gure 2.16 peut tre paraphras par cheualiers. On voit clairement quune partie des grammmes (c, h, e, u, a, l, s) senchanent sur le mme axe, mais quun autre () vient se superposer la construction. Si lon applique notre classication de manire rigide, on ne peut que conclure que la ralisation que nous avons sous les yeux est un nbulogramme. Par ailleurs, le deuxime mot de la gure 2.17 peut tre paraphras par autre, ce qui remet en question notre classement des cngrammes: le e que nous y lisons

36

F IG . 2.17 Exemple dabrviation par lettre suscrite (Document 123607, 6)

logogramme @au moins partiellement paraphrasable par un ou plusieurs linogrammes


F IG . 2.18 Concept de logogramme

est incontestablement une unit qui ressemble au premier e que lon retrouve dans cheualiers, cest--dire, selon les principes noncs ci-dessus, un linogramme (qui senchane sur un axe unique avec dautres linogrammes). Or, dans aute , laxe est rompu: nous avons affaire un plrgramme de type nbulogramme. Il ny a ds lors que deux solutions: 1/ soit considrer que ce e est une unit diffrente dans aute et dans chevaliers, et dans ce cas, notre classement reste valable; 2/ soit, ce qui rencontre une intuition, considrer quon a bien affaire la mme unit, et dans ce cas, le classement des cngrammes est revoir. Raisonnons par labsurde. La seule diffrence entre les e des deux mots qui servent de bases notre rexion est leur position par rapport aux autres cngrammes. Or, puisque les positions relatives des grammmes sont galement des units, non discrtes, certes, mais conceptuellement isolables (units que nous avons nommes topmes), il nest pas cohrent de voir en e et e deux units minimales diffrentes. La premire solution nest pas valable: e en exposant est constitu du cngramme e et du topme qui le met en exposant par rapport aux autres cngrammes. Dans ces deux cas, subsiste le problme de la paraphrasabilit: les nbulogrammes cheual s et aute peuvent tre paraphrass, ce sont donc des logogrammes. . . mais si lon y regarde de prs, une partie seulement est paraphrasable. Or, cette partie nest pas un plrgramme, mais elle entre dans la composition de lun deux. Dans un cas, cest la combinaison du topme et du cngramme qui est intgralement paraphrase. Ainsi, le tilde est compltement absent de cheualiers; dans lautre cas, seul le topme est paraphras, puisque lunit place en exposant se retrouve dans la forme non abrge. Ce mme cas de paraphrasabilit partielle apparat dans des formes comme 9uiers mis pour conuiers ou t7 re mis pour terre. Il faut donc distinguer les abrviations par graphisme des autres types dabrviations: seul le graphisme est un logogramme pur, puisque lui seul est intgralement paraphrasable. Les autres moyens dabrger un mot se servent dune combinaison de grammmes catnogrammiques et nbulogrammiques pour former des units qui ne sont ni tout fait lune ni tout fait lautre de ces catgories. b. Rvision du systme Tous ces problmes noncs, il faut donc au minimum revoir les caractres des logogrammes comme indiqu dans la gure 2.18.

37

2.2.5

Synthse: hirarchie des scriptmes

On trouvera p. 39 larbre de hirarchie de ces concepts, reprenant les caractres dnitoires correspondants (voir les conventions exposes sous 1).

2.3

La ponctuation comme objet dtude

Lanalyse qui prcde a permis dtablir un systme cohrent, et, partant, de nommer exactement les units dont nous voulons parler. Cest lintrieur de ce systme que nous situons la ponctuation, que nous avons dnie jusqu prsent de manire intuitive. Nous exposerons les principales dnitions quon a pu donner du terme et nous analyserons leur construction ainsi que leurs implications. Cela nous mnera forger notre propre dnition (2.3.1). La valeur des signes fera lobjet de la seconde partie de cette section (2.3.2). 2.3.1 Recherche dune dnition

Il est clair que [l]es tudes qui sattaquent de front la question de la ponctuation sont en gnral restituer dans des analyses qui abordent lcrit dune faon globale et sintgrent une approche thorique de la linguistique (Jaffr 1991, 64). Nanmoins, nous nentreprendrons pas ici un tour dhorizon du mme type que ceux que proposent Jean-Pierre Jaffr (1991) et Jacques Anis (2004) et nous viterons dentrer dans les mandres de la littrature concernant toutes les tentatives de dnition de la langue crite. Nous donnerons tout dabord un bref aperu critique des dnitions que les spcialistes ont pu donner de notre objet la manire dont ils lont conceptualis. Il ne sagira pas pour nous de critiquer leur point de vue en disant quils se trompent et quils oublient tel ou tel signe, quils donnent la ponctuation un sens trop large ou trop restreint: il sagira plutt de critiquer leur mthode de dnition. Avant de prsenter (sans conclure par une dnition qui lui serait propre), les essais de Nina Catach, Jacques Anis et Claude Tournier en la matire, Vronique Dahlet souligne toute la difcult quil y a vouloir dlimiter clairement le concept de ponctuation:
Dnir la ponctuation est un exercice retors et difcile puisque, comme on le verra lanalyse, il sagit tout la fois de doter la ponctuation de son statut linguistique, de la dmarquer du matriau alphabtique et enn, dindiquer le principe directeur de sa fonction. (Dahlet 2003, 17).

Comment les chercheurs se sont-ils affranchis de ce programme? 2.3.1.1 Dnitions existantes

a. Ludmilla Vdnina. Au point de dpart de toute dmarche de dnition de la ponctuation, il y a, croyons-nous, un ensemble dunits reconnues intuitivement comme des signes de ponctuation. Le degr zro de la dnition consiste numrer les 38

scriptme (2.2.1) @minimal @spatial grammme (2.2.1) @non organisateur spatial

topme (2.2.1) @organisateur spatial


cngramme (2.2.2.1) @distinctif

plrgramme (2.2.2.1) @signicatif

plrtope (2.2.2.2) @organisateur de plrgrammes

cntope (2.2.2.2) @organisateur de cngrammes

htrogramme (2.2.3.1) @dpendant

autogramme (2.2.3.1) @indpendant @axe de combinaison unique

linogramme (2.2.3.2) @axe de combinaison unique

prigramme (2.2.3.2) @axe de combinaison multiple

catnogramme (2.2.3.2) @topmes de construction oriente

nbulogramme (2.2.3.2) @topmes de construction non oriente

logogramme (2.2.4) @paraphrasable

ponctogramme (2.2.4) @non paraphrasable

F IG . 2.19 Types de scriptmes (classement complet)

39

signes en question, ou simplement les voquer, comme le fait Ludmilla Vdnina, dont les travaux bauchent une dnition en extension qui tmoigne dune vision large de la ponctuation (2.3.2.2):
Par ponctuation, nous entendons non seulement les signes comme le point, la virgule, etc., mais galement certains procds typographiques comme lemploi des caractres, lespace blanc entre les signes, etc. (Vdnina 1989, 1).

La principale difcult que pose cette approche est que, constituant un inventaire ou (etc.), elle ne permet pas de sortir de lintuition. b. Le Bon usage. Pour prtendre la scienticit, la dnition doit ncessairement tre rdige en intension, comme lest dj celle du Bon usage:33
La ponctuation est lensemble des signes conventionnels servant indiquer, dans lcrit, des faits de la langue orale comme les pauses et lintonation, ou marquer certaines coupures et certains liens logiques. (Grevisse/Goosse 2007, 116).

Ds quelle sefforce de trouver ce qui fdre les units runies intuitivement, la dnition manifeste un point de vue sur lobjet ponctuation, et, plus gnralement, sur lobjet langue crite. Il est donc prvisible quon retrouve des dnitions de type phonographique et des dnitions de type autonomiste (2.1.2.2). La dnition du Bon usage correspond tout fait la perspective phonographique, puisquelle considre que le trait dnitoire de la ponctuation est dtre un transcodage. Cest cette fonction elle-mme qui rassemble les diffrentes units regroupes sous le terme. Nanmoins, la dnition de Maurice Grevisse ne se limite pas mettre en relation lcriture et loralit: elle est complte par lvocation dautres fonctions, sous une forme restant abstraite et intuitive. Cette tentative est reprsentative de lattitude qui consiste essayer de dnir la langue crite par le biais de la langue orale, puis se rendre compte des limites de la dmarche. c. Nina Catach. Prenant le parti de ne pas immdiatement rduire la ponctuation un transcodage, Nina Catach forme la proposition suivante:
Ensemble des signes visuels dorganisation et de reprsentation accompagnant le texte crit, intrieurs au texte et communs au manuscrit et limprim; la ponctuation comprend plusieurs classes de signes graphiques discrets et formant systme, compltant ou supplant linformation alphabtique. (Catach 1980, 21, repris textuellement dans Catach 1996, 9).

Ici, la dnition se dtache de la fonction des signes pour rendre compte de leur distribution et de la relation quils entretiennent avec les autres units de la langue crite. Elle reste cependant oue (plusieurs) et centre sur les modes dcriture traditionnellement dits alphabtiques. Bien quinsufsante pour permettre de rpondre la question Ceci est-il un signe de ponctuation?, face un signe choisi au hasard dans nimporte quelle langue crite, la tentative se rapproche de notre perspective autonomiste. Nanmoins, labandon de lide de transcodage nest quapparente: la dnition est complte dans lexpos de lauteur, qui ajoute:
33 Tout comme celles de la plupart des grammaires et dictionnaires layant prcd. Voir lin-

ventaire constitu par Claude Tournier (1980, 3133).

40

Nous parlerons, pour tre clairs [sic], dintonmes loral et de ponctmes pour les signes crits. (Catach 1996, 105).

mais aussi:
Il sagit dunits fondamentalement suprasegmentales et syntaxiques. (Catach 1996, 105).

La perspective relve ds lors du phonocentrisme et mne Nina Catach confondre les proprits distributionnelles de la ponctuation et celles de lintonation sur la base dune ressemblance fonctionnelle. Il nous parat difcilement dfendable quun fait de ponctuation puisse tre reconnu comme suprasegmental.34 d. Jacques Anis. Soucieux de doter la perspective autonomiste (2.1.2.2) dun ensemble de concepts organiss en systme, Jacques Anis abandonne le concept de ponctuation au prot dune opposition entre trois types dunits, regroupes sous lhyperonyme graphme unit minimale de la forme graphique, dnie par sa fonction dans la communication crite (Anis et al. 1988, 245): les alphagrammes, les logogrammes et les topogrammes, dnis comme suit:
alphagramme: graphme alphabtique, unit purement distinctive. logogramme: graphme unique correspondant une unit signicative (ex. &, $) ou groupement tendant un fonctionnement synthtique (sigles, logos). topogramme: graphme ponctuo-typographique, qui contribue la production du sens, en tant quorganisateur de la squentialit et indicateur syntagmatique et nonciatif. (Anis et al. 1988, 245246).

Nous ne critiquerons pas ici les dnitions des termes alphagramme et logogramme, qui recouvrent approximativement les units que nous avons rassembles respectivement sous les notions de linogramme et de nbulogramme (2.2.3.2). La dnition de topogramme nous intresse plus, parce quelle intgre intuitivement la notion de ponctuation. Elle a lavantage de spcier exactement la fonction des signes. Malheureusement, chacun des formants du terme ponctuo-typographique drange: 1/ la ralit oue de ponctuation est employe comme sil sagissait dun acquis bien dni, alors que cest prcisment ce concept quil faut dlimiter; 2/ il mle la forme des considrations sur la substance (typographie). Il est difcile dadmettre cette conception sans amnagement, dautant quelle pose nouveau explicitement la question de lextension du champ de la ponctuation (2.3.2.2). e. Claude Tournier. Saffranchissant presque compltement de la fonction des signes pour crire sa dnition de la ponctuation, Claude Tournier dlimite pralablement les notions de graphme la plus petite unit de la chane crite ayant un correspondant phonique et/ou smique susceptible dune analyse linguistique35 (Tournier 1980, 35) et reprend de Nina Catach lemprunt Louis Hjelmslev de lopposition entre cnme et plrme36 (Tournier 1980, 35). Il explique enn que les signes de ponctuation ont
34 Dans ses premiers travaux sur la question, lauteur parle de fonction suprasegmentale

(Catach 1980, 22).


35 Lapproche dans son ensemble nest pas purement autonomiste. 36 Voir note 20.

41

ponctuation @ensemble des ponctogrammes @propre une langue crite


F IG . 2.20 Concept de ponctuation

un contenu smantique et sont indcomposables (Tournier 1980, 36) avant de conclure comme suit:
La ponctuation est lensemble des graphmes purement plrmiques, non dcomposables en units de rang infrieur, et caractre discret. (Tournier 1980, 36).

Cette dnition est obtenue par calibrage du concept par rapport dautres concepts prdnis, par hritage de classe et par spcication de caractres supplmentaires par rapport lhyperonyme; chacun des termes employs peut tre critiqu indpendamment. Cette dmarche correspond exactement celle que nous avons nous-mme adopte. Ensuite, le caractre gnral de la formulation, rendu possible par labsence da priori quant la fonction des signes, la rend utilisable dans un cadre o nous ne savons pas quelle sera la forme des units rencontres. La dnition de Claude Tournier nous convient donc particulirement. Nous la prendrons comme modle. 2.3.1.2 Dnition adopte

Si nous nous fondons sur la dmarche de Claude Tournier et continuons dans le chemin que nous avons trac, il nous suft de slectionner, parmi les scriptmes dnis tout au long de la section 2.2, ceux qui recouvrent lextension traditionnelle des signes de ponctuation. En loccurrence, les ponctogrammes, cest--dire les plrgrammes autonomes non paraphrasables (2.2.4). Pour une langue crite particulire, nous dnirons simplement ponctuation en ces termes: ensemble des ponctogrammes dune langue crite spcique (gure 2.20). Par extension, nous nommerons galement ponctuation la simple prsence des ponctogrammes. 2.3.2 Valeur des ponctogrammes

Nous avons vu ds lintroduction que les tudes sur la ponctuation mdivale sefforaient de catgoriser les diffrentes fonctions de la ponctuation (0.1.1.1). Les ponctogrammes tant des signes part entire, il parat en effet ncessaire de dcrire leur valeur, tributaire de la fonction de la ponctuation dans la langue crite. Nous pourrions passer en revue les conceptions des diffrents chercheurs quant leur valeur de la ponctuation,37 . Pour lheure, nous prfrons adopter lattitude
37 Voir les conceptions de Lidya Hirschberg 1965 qui considre les ponctogrammes de la

mme manire que les constituants des structures syntaxiques; Ivan Fnagy 1980, qui attribue aux ponctogrammes une valeur smantique permettant de distinguer des synonymes, homonymes et signes polysmiques; Ludmilla Vdnina 1980, Nina Catach 1980, 2125 et Claude Tournier 1980, 3738, qui distinguent de multiples fonctions, dans une optique similaire celle prsente dans lintroduction (0.1.1.1); ou Jacques Anis et al. 1988, 122, qui insistent sur le caractre organisateur de la ponctuation.

42

pratique suivante: les ponctogrammes apparaissent devant ou derrire dautres grammmes, qui contribuent eux-mmes la construction dunits syntaxiques. Il nous semble protable dadopter nouveau un point de vue gnral sur la question. 2.3.2.1 Multiplicit des fonctions

Dun point de vue smiotique, les scriptmes sont capables de remplir simultanment de nombreuses fonctions38 relevant, dune part, de la langue et de la relation entre langue crite et oralit et, dautre part, de ce que rend possible la spatialit qui caractrise la langue crite. Nous focalisant sur les ponctogrammes, nous choisissons den dcrire la fonction dmarcative (Klinkenberg 2005, 179180), qui suppose que les ponctogrammes sont avant tout des index, des signes ayant pour fonction gnrale dattirer lattention sur un objet dtermin et pour fonction particulire de donner un certain statut cet objet (Klinkenberg 2005, 187). Pour traiter notre problme, disons que la ponctuation dlimite des structures syntaxiques, mais que nous ne pouvons accder au surcrot de sens quelle confrerait au segment dlimit. Dterminer exactement quel constituant est dlimit est en soi problmatique, puisque, dans la majorit des cas observs, les ponctogrammes apparaissent au moins entre deux constituants. Il semble que la plus raisonnable des positions adopter est de considrer tout dabord que les ponctogrammes marquent simplement les structures aux bornes desquelles ils apparaissent. Tout le travail danalyse des chapitres 5 7 consistera dpasser progressivement la simple notion de marquage pour identier quelles constructions sont effectivement dlimites et quelles formes dexpression prennent les ponctogrammes. Anticiper sur les dveloppements qui suivront nous permet dexemplier la dmarche. Soit le ponctogramme soulign dans:
et le remana defalot enz hor nt [7] prent hl en fez de la gle en tel manre ke e de luj de on cor ke la terre reuenrot a le glse az le humer a femme (Document 123605, 6).

Adoptant un dcoupage traditionnel, on peut dire que le ponctogramme est la fois: la n de on cor, la n de cor, la n de la subordonne conditionnelle e de luj defalot enz hor de on cor, au dbut de lapodose, etc. Le ponctogramme marque simultanment toutes ces structures. Ce nest quau bout dune longue analyse que nous serions en mesure de dire que la marque dlimite essentiellement la protase (6.1.4.6), et que la forme dexpression du ponctogramme est partiellement spcique cette fonction (7.3). 2.3.2.2 Largeur du champ

a. Ponctuation au sens tendu. La tentative de dnition de Ludmilla Vdnina a la particularit dtendre explicitement le champ de la ponctuation un ensemble dunits qui nentrent pas dans la notion traditionnelle. Reprenons:
Par ponctuation, nous entendons non seulement les signes comme le point, la virgule, etc.,
38 Voir Klinkenberg 2005, 168169.

43

mais galement certains procds typographiques comme lemploi des caractres, lespace blanc entre les signes, etc. (Vdnina 1989, 1, nous soulignons).

Cela pris en compte, on constate que les dnitions des topogrammes de Jacques Anis et de la ponctuation de Nina Catach recouvrent galement ces procds. Cette dernire nous livre son point de vue dans son Que sais-je? sur la ponctuation (1996, 78):
Ltude de la ponctuation peut se comprendre au sens large ou au sens troit. Au sens large, la mise en page (MEP) comportera les signes,39 mais aussi tous les procds typographiques de mise en valeur du texte, titres, marges, choix des espaces et des caractres, et[,] au-del[,] agencement gnral des chapitres et faonnement du livre. Au sens troit, on lui accorde en gnral une quinzaine dlments graphiques troitement lis au texte alphabtique: essentiellement sparateurs (virgule, point-virgule, point nal, dexclamation, dinterrogation, de suspension); et signes de communication ou de message (deux points, guillemets, tirets simples ou doubles, parenthses, crochets). Il est ncessaire dy ajouter lusage des blancs et des majuscules, piliers, avec le point, les plus anciens de la ponctuation, plus que jamais indispensables. (italiques dans le texte).

Traduit dans notre systme conceptuel, la ponctuation ainsi largie (le sens restreint dpasse dj notre propre dnition en intgrant les blancs et les majuscules) comprend lemploi des topmes et celui des htrogrammes, ce qui revient regrouper dans une catgorie unique deux ou trois types de scriptmes fondamentalement diffrents selon le point de vue adopt pour la conceptualisation au moins quatre caractres diffrencient ces units. Il y a ds lors lieu de justier ce regroupement: quels caractres ces units auraient-elles en commun? b. Prsuppos fonctionnel. La plupart des tudes actuelles, dont celles qui ont port sur la ponctuation mdivale (0.1.1), admettent demble que les htrogrammes et les topmes fonctionnent souvent ensemble (en se compltant ou en se remplaant) (Lavrentiev 2000, 26) pour remplir des fonctions spciques. Il est certes envisageable de se fonder sur cette complmentarit comme hypothse de travail, mais nous ne le ferons pas. Le terme ponctuation continuera dtre appliqu ici aux seuls ponctogrammes. Ltude des relations entre les ponctogrammes et le reste du systme graphique ne sera pas aborde dans les pages qui suivent. Le statut des blancs, qui relvent des topmes de notre systme, mrite nanmoins quon sy intresse. Nina Catach (1980, 18) le justie pleinement dans les termes suivants:
Cependant, on ne peut se satisfaire longtemps dune dlimitation aussi troite (dix onze signes) du secteur considr. [. . .] En labsence de ponctuation, que reste-t-il? Un blanc, lequel est dj un signe, le plus primitif de tous, un signe en ngatif.

Nous adhrons cette ide moyennant de petits ajustements. Il nous semble quil ny a pas de blanc en labsence de ponctogramme, mais une absence: les plrtopes mobiliss najoutent pas un blanc, ils structurent lespace en fonction des grammmes en prsence. Il reste toutefois vident que la valeur de la ponctuation ne peut tre envi-

39 Cest--dire, les signes de ponctuation au sens troit, que lauteur dnit plus loin voir plus

bas dans cette mme citation.

44

Forme / // / ; : /

Nom latin le cas chant punctus virgula virgula plana punctus elevatus punctus elevatus punctus versus colon paraphus

Description simple point deux points enchans barre oblique deux barres obliques enchanes trait horizontal point surmont dun trait incurv point surmont dune barre oblique point surmontant un trait incurv superposition de deux points signe au trac complexe point suivi dune barre oblique paraphus prcd et suivi dun point

TAB . 2.1 Inventaire des ponctogrammes relevs

sage que si nous considrons simultanment lensemble des endroits o elle apparat et lensemble des endroits o elle napparat pas. 2.3.3 Inventaire des formes

Suivant la dnition choisie, la ponctuation releve dans les documents de notre corpus prend les formes reprises dans la table 2.1.40 Remarquons que nous avons considr comme un seul ponctogramme ce qui pourrait galement tre interprt comme une squence.

2.4

Conclusions

a. Ncessit de llaboration de bases thoriques. Au terme de ce chapitre, nous avons notre disposition une dnition que nous croyons solide du concept de ponctuation. Pour en arriver l, il a t capital de passer en revue lensemble des units de la langue crite. En effet, dun point de vue thorique, on ne peut dnir ces signes sans comprendre la manire dont ils sintgrent au systme dans son ensemble. On a vu que ce nest que par une slection progressive de proprits trs prcises que nous sommes arriv dlimiter clairement les concepts. Dun point de vue pratique, faire lconomie de laspect gnraliste de notre tude naurait pas men bien loin sans quil ne soit ncessaire de faire appel lintuition pour justier la catgorisation de telle ou telle unit. b. Consensualit du classement obtenu. Par ailleurs, sil est question dintuition, on remarquera que le classement des units correspond gnralement la perception intuitive quon en a. La correspondance est nette: lettre correspond linogramme; idogramme correspond logogramme;
40 Nous donnons chaque forme le nom latin correspondant, cf. Parkes 1992. Voir la section

Transcription des annexes pour un exemple de ralisation de chacun de ces ponctogrammes.

45

signe de ponctuation correspond ponctogramme. Peut-tre notre analyse est-elle, en n de compte, tributaire de reprsentations traditionnelles. Cela importe peu, puisque notre dmarche est valuable indpendamment de ces modles aux contours ous. Ainsi, revenons sur les termes: quest-ce quune lettre? quest-ce quun idogramme? quest-ce quun signe de ponctuation? ces questions, il ntait pas possible de rpondre clairement. Les termes taient disparates, les notions oues. Les relations entre celles-ci apparaissent dsormais trs clairement, et lon peut par exemple apprcier la fois la diffrence et les points communs entre les ponctogrammes et les idogrammes. c. Autonomie de la description. Fait capital pour le bon droulement de la suite de notre tude, les units de la langue crite ont t dnies laide de concepts qui saventurent le moins loin possible dans la description de leur valeur. Ainsi, la seule considration concernant cette dernire a t de poser la distinction entre les plrgrammes et les cngrammes. Nous navons pas dpass la simple opposition il y a un sens vs il ny en a pas. Cette autonomie de la description des units de la langue crite par rapport au plan du contenu fonde la possibilit de comparaisons ultrieures. d. Importance de la terminologie. Nous nous sommes permis ce que daucuns pourraient juger comme tant une dbauche de nouveaux termes. Il faut cependant admettre que nous navions pas le choix. Les mots disponibles taient trop peu nombreux et trop spciques des conceptions auxquelles nous nadhrons pas pour permettre la nomination de toutes les units que nous avons pu dgager. Sans ces innovations, les concepts nauraient pas pu tre manipuls efcacement.

46

Modle danalyse linguistique

Lobjectif de ce chapitre est de dcrire lensemble des rgles qui ont t suivies pour identier, analyser et classer les units linguistiques contenues dans les textes du corpus. Il sagit donc de donner une description sommaire de lancien franais des chartes ligeoises du treizime sicle tel que nous concevons son fonctionnement. Nous avons d construire un modle personnel pour mener bien la description. Celui-ci, labor sur la base des donnes que livrent les textes, prend la forme de dnitions de concepts par slection des caractres que nous avons jugs sufsants pour forger une dnition approprie (1). Quant aux exemples quon lira dans les lignes qui suivent, nous les avons voulus avant tout illustratifs: notre modle pose des hypothses avec lesquelles les extraits relevs, que nous esprons sufsamment reprsentatifs, saccordent gnralement. Nous ne discutons que les cas douteux qui mritent au moins un commentaire. Lanalyse exhaustive du corpus qui permettra au lecteur de critiquer le dtail de notre travail se trouve en annexe, sous la forme dditions lectroniques annots.1 Enn, la description ne tient pas compte de la ponctuation originale, laquelle elle sera compare dans la deuxime partie de notre tude. Dans cette optique, il nous a paru plus commode de prsenter les extraits dans une transcription modernise: cela les rend plus lisibles et cela vite de rapprocher a priori la morphosyntaxe et le systme graphique. Aprs avoir pos quelques pralables mthodologiques (3.1), nous opposerons ensuite les concepts de morphologie et de syntaxe, distinction sans laquelle il naurait pas t possible de travailler (3.2). Cela permettra de dnir trois classes de mots fondamentales (3.3). Enn, lessentiel de lexpos sera consacr aux relations syntaxiques que ces mots entretiennent en discours, que nous prsenterons suivant un principe analytique, partant des plus grandes units pour aboutir aux plus petites (3.4).

3.1

Pralables mthodologiques

Avant dentrer dans la description, nous voudrions en voquer les bases mthodologiques. Dans une premire partie, il sagira dexpliciter la position que nous adoptons par rapport la terminologie linguistique, problme incontournable que nous ne pourrions ignorer sans entraner lensemble de lexpos dans le ou le plus absolu (3.1.1). Nous verrons que les choix oprs dans ce chapitre diffrent de ceux qui ont t poss dans le cadre du chapitre 2. Nous prsenterons ensuite les units qui
1

Voir la section Analyses syntaxiques des annexes.

47

peuvent tre considres comme des donnes fournies par les documents (3.1.2). La section sachvera sur les implications de la dmarche de description de lancien franais et les obstacles quelle rencontre (3.1.3). 3.1.1 Concepts et terminologie linguistique

Il parat opportun dexposer demble la manire dont nous allons nous comporter vis--vis de la terminologie.2 On sait quel point la description linguistique est tributaire dune longue tradition, sappuyant trop souvent sur des notions vagues et sur un cadre thorique htroclite. Nous nous efforcerons dviter ces cueils, en proposant lintgration de termes traditionnels un systme de dnitions plus rigoureux, suivant le modle expos au chapitre 1. Nous ne rviserons donc pas intgralement la terminologie linguistique. En premier lieu, nous prendrons garde dviter un des piges dnoncs par Georges Mounin dans lintroduction de son Dictionnaire de la linguistique (1974, X - XI).
Il y a certainement une psychologie du chercheur, et mme une psychopathologie, dont il faut prendre [XI] conscience. La conviction quon a dcouvert quelque chose parce quon a rebaptis un concept dj bien labor par quelquun dautre doit tre une maladie professionnelle du savant, du jeune savant, du candidat-savant.

Il serait bien outrecuidant de chercher donner un nouveau nom des concepts dj clairement dlimits, ce qui mnerait en outre tomber dans un autre pige, qui na pas manqu dattraper certains des plus gniaux thoriciens (Mounin 1974, XIII - XIV):
[I]l parat bien imprudent de croire comme, en 1928, Hjelmslev lequel a largement appliqu son axiome que la terminologie est une question de got. Elle ne touche pas aux ralits, poursuit-il, oubliant que la science est une uvre collective, quune langue, mme une langue scientique, est un instrument de communication, et que le nologisme impnitent, si gnial soit-il, est presque toujours sanctionn sur ce point par lchec: on napprend pas sa langue, on ne le lit pas, on le lit mal, on ne le comprend pas, on labandonne sur le bord de la route. Lhistoire de la linguistique, comme celle de beaucoup dautres sciences, est un immense cimetire de voitures termino-[XIV]-logiques. . . qui nont jamais roul ou presque. Cimetire peu visit, dont la visite serait pourtant trs instructive. Des 106 termes crs par Hjelmslev il en survit 5% dans lusage commun.

Par ailleurs, moins de rester un degr dabstraction qui rendrait la lecture laborieuse, il est trs difcile de dnir progressivement les concepts employs sans avoir besoin pour ce faire de concepts qui nont pas encore t dcrits, mais dont on a au moins une reprsentation intuitive. Cette difcult est lie au phnomne de circularit, inhrent de nombreuses terminologies. En outre, pour tre compris, nous devons partir de bases connues. An que lexpos reste accessible et puisse tre situ dans la rexion linguistique sur lancienne langue, il est invitable de partir parfois de ces notions oues quoffre la description traditionnelle, mais en guise dapproche intuitive exclusivement; une fois le concept cadr, nous essayerons den donner une dnition

Sur la problmatique du lien entre la conceptualisation et la terminologie (1).

48

plus stricte, dans les limites donnes par le modle employ.3 Cette approche nous permettra de rcuprer les termes traditionnels.4 Par exemple, on emploiera la notion de conjonction de coordination pour arriver dlimiter lnonc (3.4.1), alors que le concept ne sera redni que bien plus loin dans le chapitre (3.4.7.2). 3.1.2 Les units de base

Dans un cadre trs abstrait, il est souvent possible de refuser tout lment le statut de donne: tout phnomne est effectivement catgoris et formalis par le cerveau humain, dans une dynamique cognitive complexe qui dpasse le cadre de notre travail et de nos comptences. Pour une tude empirique comme celle-ci, il nous semble cependant que nous pouvons simplier le problme et admettre que le corpus nous livre directement des informations, pralablement toute analyse. Nous considrons que les documents dlimitent les contours des units que sont les textes (3.1.2.1) et les mots (3.1.2.2). 3.1.2.1 Unit maximale: le texte

Lunit la plus large, le texte, a lavantage dtre la moins articielle (a). Nous dcrirons brivement ici comment le texte doit tre mis en relation avec le contexte de son utilisation (b) avant de proposer une dnition de lunit (c). a. Le texte comme donne. Le segment maximal, celui dont part lanalyse linguistique, est relativement simple dlimiter pour qui travaille partir dun corpus:
Si lon peut parler de donnes (nous laissons cela comme une condition dans le sens pistmologique), ces donnes sont, pour le linguiste, le texte, dans sa totalit absolue et non analyse. (Hjelmslev 1968, 21).

Les bons philologues (qui, dans le meilleur des mondes, travaillent avec les linguistes ltablissement des textes), savent que le texte est dj le rsultat dune analyse qui implique un regard linguistique. Nanmoins, au point de vue de la hirarchisation des shirarchisation des structures, qui est lobjet de la section 3.4, le texte est bien la seule structure linguistique dont on ne puisse dire quelle est intgre dans une autre plus large. Au del du texte, il ny a rien qui soit linguistiquement structur. b. Document et texte. Malgr tout, il se pourrait que les limites suprieures du texte ne coulent pas de source. Par exemple, pour Knud Togeby (1965, 6), la langue est considre comme un texte inni dont il faut dcrire la structure. Pour que les choses soient claires, il est ncessaire darticuler la dnition du texte avec celle du document que constitue la charte. Les dnitions quon rencontre dans les manuels crits par les historiens tentent den rendre compte:
3 4

De ce point de vue, la dmarche est similaire celle suivie au chapitre 2. De ce point de vue, par contre, la dmarche est compltement diffrente de celle suivie au chapitre 2, o nous devions construire une nouvelle terminologie. Nous rcuprons les termes dune manire assez similaire celle de Denis Creissels (1995) dans ses lments de syntaxe gnrale, si ce nest que le prsent modle est focalis sur une langue particulire.

49

[authentication [crit [parole [action]]]]

F IG . 3.1 Schmatisation du type de texte charte selon Marie-Guy Boutier La charte nest pas proprement parler un terme technique, mais plutt un terme gnrique, recouvrant une varit confuse de documents. Ntant pas technique, le mot est assez ou. On lemploie gnralement pour dsigner un acte crit, manant le plus souvent dune autorit royale, religieuse ou seigneuriale, mais jamais une poque o lauteur multiplie les documents dans le cadre dadministration ad hoc. Une charte contient soit une concession de biens, de droits,. . . soit une dcision judiciaire. (Guyotjeannin et al. 1993, 25, italiques en grasses dans le texte). Une charte est un acte par lequel se manifeste au Moyen ge la volont de lauteur de lacte crit et qui constitue normalement un titre entre les mains de son bnciaire. (Crcel Ort 1994, 385).

Comme lavouent les auteurs, ces dnitions sont approximatives, mais elles replacent cependant le document dans un cadre pragmatique clair: lobjet charte est construit par un ou plusieurs individus pour servir communiquer un message dautres individus dans une situation qui justie ce transfert dinformation, dont le texte est le vhicule. Cette description externe situe le document dans le monde (pourquoi il est crit, par qui, pour qui, etc.) et place en consquence le texte dans un contexte. Selon JeanMichel Adam (1999, spc. 3740), cette insertion dune structure linguistique dans une situation dnonciation dnit de manire gnrale le discours. Le contexte ainsi que les contraintes sociales et pragmatiques inuencent la manire dont le texte est structur en squences ordonnes (ce que Jean-Michel Adam nomme texture). Le fait est extrmement prgnant dans le cas des chartes, et MarieGuy Boutier (2003) a pu montrer que la structure nonciative du document est entirement pense dans le sens de son utilisation. Une charte, crit-elle, est un crit adress authentique faisant connatre une parole crant ou attestant une action juridique (41). Aprs avoir expos que la charte publiait par crit la parole performative dun acte juridique (exprim par un verbe) schmatiquement: gure 3.1. Tous ces lments de dnition trouvent un cho dans les chartes, qui suivent pratiquement toujours la progression suivante: 1/ lauteur de lacte, qui profre la parole performative sidentie; 2/ la parole en question est recense et laction juridique est identie par un verbe spcique; 3/ les autorits comptentes corroborent la vridicit de cet crit (cest-dire la conformit entre la parole et sa reprsentation crite). Les contraintes que le texte subit contribuent donc en grande partie le dnir. Cette spcicit du type de texte implique que, quelles que soient les conclusions tires des analyses bases sur ces textes, nous devrons tre conscient quelles ne valent que pour la famille des chartes appartenant au corpus tudi. c. Dnition. Nous pouvons donc, dans le cadre de notre tude, nous satisfaire de la dnition formalise de la gure 3.2. 3.1.2.2 Unit minimale: le mot

Nous pouvons admettre que les mots nous sont donns comme le texte, mais dans une moindre mesure (a). Cela justie nos yeux que nous prenions le mot comme 50

texte @unit linguistique en prsence @non intgr une unit linguistique plus vaste @vhiculant une information @suivant une stratgie de communication lie la situation
F IG . 3.2 Concept de texte

unit de base. Il nous faudra peser ce choix (b). On distinguera ensuite les occurrences des mots et des lexmes en opposant les niveaux dabstraction (c), puis les notions seront clairement dnies (d). a. Le mot comme donne. Bien que cela soit plus discutable, et devra tre nuanc, les scribes ont ressenti le besoin de sparer les chanes de linogrammes par des blancs.5 . Ce faisant, ils nous livrent un texte partiellement analys. Le mot, conu alors comme une unit graphique, est galement donn. Cependant, les textes analyss tant pralablement transcrits,6 le mot doit tre conu comme une graphie homognise. Le mot est ainsi pos comme une unit de base de la description.7 b. Besoin imprieux dune dnition. Il est vrai que le mot se laisse quant lui difcilement dnir avec rigueur, si bien quil est volontiers banni au prot de la recherche dunits signicatives minimales, chaque linguiste ayant alors sa terminologie propre: lexie, synapsie,8 lexme, unit signicative, etc. (Dubois et al. 2002, 313). Ainsi, dans son Dictionnaire de la linguistique, Georges Mounin va jusqu crire que le mot nest pas une ralit de linguistique gnrale (1974, 223). Pourtant, aussi douteux que paraisse ce terme depuis larrive du structuralisme, force est de constater quil correspond une ralit intuitive qui simpose beaucoup comme une vidence. mile Benveniste, dans son article sur les Structures de lanalyse linguistique (1964, 123) dclare le terme irremplaable. Il est nanmoins vrai que cette vidence doit tre nuance et quil serait effectivement ncessaire de dnir prcisment ce quon entend par mot.9

5 6 7 8 9

Les topmes organisant les linogrammes crent des espaces quon peut appeler blancs Voir 2.2.3.2 a concernant les linogrammes. Voir la section Transcriptions des annexes. Exception faite des phnomnes damalgame, quil serait absurde de ngliger (Feuillet 1988, 72). Il nous semble que le terme (Benveniste 1974, 171176) ne sinsre pas bien dans la liste: la synapsie est une forme de composition lexicale. Il faut mentionner ici le livre de Maurice Pergnier (1986), qui, dcrivant lhistoire de la notion, et surtout son rejet par la linguistique structuraliste et ses descendants, propose de rhabiliter le terme sans laide de critres smantiques, se basant sur les travaux de Jean Gagnepain (1982), qui se fonde sur une analyse distributionnelle. Malheureusement, il considre que la prposition fait partie de mots comme les noms, ce qui lamne poser des marques l o la prposition napparat pas. En plus dtre critiquable dans son principe (voir Lemarchal 1997), cette hypothse a le dfaut de ne pas tre dun caractre assez gnral pour tre transpose facilement lancien franais. Elle demande en outre tre dmontre pour chaque langue, et nous ne voyons pas comment cela pourrait tre possible ici.

51

c. Occurrences, mots et lexmes. Enn, nous voudrions poser ici une importante distinction, dont nous aurons constamment besoin. Dans son excellent Comprendre la linguistique (2002), Robert Martin oppose trois niveaux dabstraction. Reprenons ses termes:
Les noncs sont construits, selon les besoins, au moyen dun instrument qui permet de les gnrer (et, inversement, de les comprendre). Constitu de signes et de rgles combinatoires, cet instrument nest autre que la langue. F. de Saussure (Cours de linguistique gnrale, 1916) a oppos nettement la langue et la parole: la langue est un systme inscrit dans la mmoire commune, qui permet de produire et de comprendre linnit des noncs; la parole est lensemble des noncs effectivement produits. Depuis, on a ajout (notamment le linguiste franais G. Guillaume) un troisime terme, celui de discours: le discours est lensemble inni des noncs possibles, dont la parole est un sous-ensemble ralis. La langue est alors le systme capable dengendrer (et de dcoder) le discours. (55, italiques emphatiques en grasses dans le texte).

chacun de ces trois niveaux dabstraction (langue, parole et discours10 ), nous ferons correspondre trois concepts diffrents. Au niveau le plus concret, celui des formes attestes, nous rencontrons des occurrences spares les unes des autres par des blancs (que ces blancs soient reconstruits par la dmarche ditoriale ou non). Nous pouvons regrouper un ensemble doccurrences en vertu de leur quivalence de forme dexpression et de contenu, et les reprsenter par une seule unit, plus abstraite, laquelle nous rserverons le nom de mot. Par exemple, dans lextrait
cilh ki sont et ki a_venir sont (Document 12740531b, 2).

il y a deux occurrences du mot sont. Ainsi loccurrence relve de la parole (elle est atteste dans un nonc effectivement ralis), alors que le mot fait plutt partie du discours. Mais nous savons que le mot sont entretient une relation particulire avec dautres mots, comme estre, est, estoient, etc. Toutes ces formes sont des formes chies relevant, dira-t-on en termes traditionnels, du mme paradigme. On atteint ici le niveau de la langue: celui de linventaire des signes et des rgles qui permettent de les employer. Cet ensemble de formes chies peut son tour tre reprsent par une unit, plus abstraite encore, que nous nommerons lexme, la considrant comme une unit de la langue. Par commodit, nous emploierons les conventions traditionnelles pour donner une forme dexpression cette unit trs abstraite, reprsentant les verbes par leur innitif (estre, dans notre exemple) et les noms par leur forme neutralise. Par ailleurs, nous emploierons le terme lexme indiffremment pour les mots lexicaux comme chevalier, afaitier, etc. et pour les mots grammaticaux, comme il, de, etc. Nous donnons ainsi au terme le sens pratique dunit du dictionnaire. d. Dnitions. Nous devons donc dnir prcisment les concepts de mot, occurrence et lexme. Pour cette tude, il nous semble que les dnitions formalises suivantes peuvent convenir:11 au niveau de la parole se trouve loccurrence (gure 3.3); au niveau du discours se trouve le mot (gure 3.4); au niveau de la langue se trouve le lexme (gure 3.5).
10 Lacception du terme est donc ici diffrente de celle que lui donne Jean-Michel Adam et que

nous avons mentionne ci-dessus (3.1.2.1 b).


11 Elles se rvleraient sans doute insufsantes pour mener une rexion plus approfondie.

52

occurrence @graphie @relevant de la parole @homognise par la dmarche ditoriale


F IG . 3.3 Concept doccurrence

mot @abstraction de la forme et du sens communs un ensemble doccurrences @relevant du discours


F IG . 3.4 Concept de mot

lexme @abstraction du signe commun un ensemble de mots @relevant de la langue


F IG . 3.5 Concept de lexme

3.1.3

Dcrire lancien franais

Le texte et les mots ne constituent que le point de dpart: si lon veut comprendre comment ces units sont construites et comment les mots se combinent, il faut entamer une dmarche danalyse. Nous partirons du modle gnral de la triple organisation de lnonc, qui servira de base lensemble de lanalyse (3.1.3.1). Cela mnera envisager le sens des noncs du corpus. Nous verrons alors comment la question de la comprhension de textes crits dans un tat de langue ancien a t aborde (3.1.3.2). Le dlicat problme de lvaluation des analyses linguistiques poursuivra la rexion (3.1.3.3). Enn, nous synthtiserons nos remarques en soulignant les limites inhrentes la dmarche choisie (3.1.3.4). 3.1.3.1 Dcrire la langue: triple organisation de lnonc

Du fait de son aspect trs gnral, le modle de la triple organisation de lnonc ou thorie des trois points de vue est vu par ses crateurs comme le cadre pralable lanalyse de tout nonc linguistique (phrase-nonc). Nous commencerons par exposer succinctement en quoi consiste ce modle, qui postule quun nonc peut tre analys de trois manires idalement indpendantes (a), avant de montrer en quoi ces diffrentes analyses sont ncessairement entrelaces (b). a. Expos synthtique. La thorie des trois points de vue, labore partir des travaux de Frantiek Dane (1964) par Claude Hagge (notamment 1984 et 1999, en particulier 2731) et Gilbert Lazard (cf. Feuillet 1988, 36), fournit un cadre strict lanalyse de lnonc,12 dni comme une production linguistique accepte par les locuteurs
12 Lorigine de la thorie est donne par Lazard 1998, 80. Dans le monde anglo-saxon, on

retrouve les mmes conceptions chez Michael Alexander Kirkwood Halliday (1985).

53

nonc @unit linguistique complte @transmet un message @suit une stratgie nonciative
F IG . 3.6 Concept dnonc

natifs comme complte et possdant une intonation reconnue comme lie ce fait (Hagge 1999, 27). Ainsi, tel que la exprim Claude Hagge:
Le premier [point de vue sur la phrase-nonc] lenvisage en relation avec les systmes de la langue. On tudie donc, selon cette perspective, les rapports entre les termes, ainsi que lexpression de ces rapports. Cest le point de vue morphosyntaxique ou point de vue 1. Le deuxime relie les phrases au monde extrieur dont elles parlent. Ce ne sont pas, cette fois, des formes que lon retient, mais les sens transmis par elles, do le nom de smanticorfrentiel qui est ici propos pour dsigner le point de vue 2. Enn, le point de vue 3, la phrase est considre dans ses rapports avec celui qui la profre, reli lui-mme un auditeur. Le locuteur choisit une certaine stratgie ou mode de reprsentation, introduisant une hirarchie entre ce quil nonce et ce propos de quoi il lnonce. De l le nom dnonciatifhirarchique que lon proposera pour ce point de vue. (1986, 276).

Lacte de communication linguistique (nonciation) se manifeste par lexpression dun message (ou contenu smantique) en rapport avec le monde. Cette expression mobilise le potentiel morphosyntaxique de la langue et est nonce suivant une vise communicationnelle spcique la situation discursive et aux intentions du locuteur. Nous transposons cette thorie dans notre systme de conceptualisation (1), ce qui nous mne formuler la dnition formalise du concept dnonc laide de trois caractres correspondant aux points de vue (gure 3.6).13 Cette dnition rapproche lnonc du texte (3.1.2.1). Toutefois, le fait de constater quun texte est constitu dnoncs distincts relve dj de lanalyse, et la subdivision du texte en noncs14 est loin dtre tout fait vidente. Ignorons temporairement cet aspect, auquel nous reviendrons.15 Chacun des trois points de vue permet de poser un regard diffrent sur lnonc et mne une analyse spcique. Claude Hagge (1986, 276) insiste galement sur le fait que la thorie de la triple organisation ne postule aucune hirarchie entre les points de vue: il ne sagit pas de niveaux, mais de plans qui ne sont pas hirarchiss.16 On ne soulignera jamais assez la ncessit dviter les confusions entre les plans, ce qui nest possible que si ces derniers sont bien dnis, mission quaccomplit la thorie de manire trs satisfaisante.

13 On verra ci-dessous (3.4.1.1) que lapplication de cette dnition au corpus mrite une

discussion approfondie.
14 Il est tout fait possible quun texte ne soit constitu que dun seul nonc. 15 Voir les choix poss pour le corpus (3.4.1). 16 Ce qui est un postulat assez complexe maintenir en pratique: tant donn que les donnes

des points de vue 2 et 3 ne sont accessibles que par le biais du point de vue 1.

54

b. Interfrences entre les points de vue. Claude Hagge prcise galement quil est vident que ces diffrents points de vue entrent naturellement en relation et sont loin dtre toujours clairement descriptibles indpendamment les uns des autres.
Toute tude dun seul point de vue isol des deux autres est un artice ignorant la ralit des liens indissolubles entre les trois. (Hagge 1986, 277).

Par exemple, les phnomnes dambigut ne peuvent tre dcrits efcacement sans recourir la fois aux points de vue morphosyntaxique et smantico-rfrentiel.17 Admettons que la question de la comprhension des noncs soit rsolue et considrons lextrait suivant:
La afaitat [transfrer (un droit rel immobilier) (un bnciaire) devant la juridiction comptente et selon les formes prescrites18 ] ilh frere Marsille [. . .] lalut ke freres Wa-[8]-tirs [. . .] aportat a la maison de_le Vas Benoiete. (Document 12600221a, 6).

Lexemple montre que, dun point de vue strictement morphosyntaxique, la principale diffrence entre lalut. . . et frere Marsille se situe sur laxe paradigmatique: frere Marsille commute avec li et lalut. . . avec le,19 mais aussi par le fait que frere Marsille est en variation libre avec a frere Marsille, qui ne prsente pas la mme ambigut, comme latteste
La afaitarent elles a [5] frere Libier de Frelus, a owez de la maison de la Vas Benoiete dels Liege, delle ordene de [6] Citeaz, xvii verges de terre (Document 12630720, 4).

Cependant, ces proprits paradigmatiques ne sont pas videntes si lon ne connat pas les compatibilits syntaxiques du verbe afaitier dans ses relations avec le nom aleu. Cette connaissance, qui est dordre lexical, est lie la connaissance du sens du verbe, laquelle valide linterprtation qui fait de frere Marsille le bnciaire du procs et de aleu le patient. Il nest pas raisonnable de se priver des informations livres par le point de vue smantico-rfrentiel pour dcrire efcacement la structuration syntaxique,20 mme si le sens est inapte dnir lui seul cette structuration. Il est donc, de manire gnrale, impossible de commencer la description dune langue par une analyse qui soit exclusivement morphosyntaxique. Pour le linguiste, il faut tenter de reconstituer ce plan, par le biais dune dialectique permanente entre les trois points de vue (en particulier entre le premier et le deuxime). Nanmoins, nous devons prendre garde de bien identier le point de vue dont relvent les lments mis en relation. De ce fait, il est dune importance capitale que la terminologie employe rete cette distinction des points de vue. Nous suivrons ainsi lexemple de Gilbert Lazard (1999b), qui propose de parler de procs, participants et circonstances au point de vue smantique et de verbe, actants et circonstants au point de vue morphosyntaxique nous formaliserons plus loin cette terminologie (3.4.2), qui sera adopte grosso modo.
17 Voir galement Soutet 1998, 7, qui montre que la distinction entre grammaticalit et inter-

prtabilit nest pas aussi franche quon laurait voulu.


18 Cf. Boutier 2003, 44. 19 Voir sous 3.4.2.2 comment tirer prot de cette commutation. 20 Cet exemple sera nouveau discut (3.4.2.1).

55

3.1.3.2

Comprendre un tat de langue pass

La constante interfrence entre les points de vue nest malheureusement pas la seule difcult dont il faut tenir compte. Comme nous travaillons sur lancien franais, nous sommes immdiatement confront un problme mthodologique majeur: la langue que nous tudions nest plus la langue daucun locuteur vivant. a. La reconstruction du sens. Christiane Marchello-Nizia (1985, 483484) lexplique trs clairement: il faut tre locuteur natif pour pouvoir dire si un nonc possde ou non du sens ou si plusieurs noncs ont le mme sens. Pour le descripteur, seule la reconstruction du sens est envisageable, laquelle peut parfois se faire simplement laide des grammaires et des dictionnaires disponibles. . . et aboutit une traduction. Lauteur souligne quil ne faut jamais oublier que cette reconstruction, souvent perfectible et parfois franchement insufsante, est avant tout une hypothse, qui peut tre renforce ou affaiblie par des recherches ultrieures. Nous pensons que les chartes constituent un terrain denqute privilgi.21 Grce aux historiens et aux diplomatistes, notamment, nous sommes mme de cerner lenjeu pragmatique des textes, et leur mise en srie conrme gnralement les hypothses que nous pouvons formuler concernant leur sens. b. Stabilit de la description morphologique. Pour lancien franais en gnral, il semble que nous puissions compter sur une srie dhypothses stables. Ainsi, on admet gnralement que la morphologie de lancien franais est relativement bien dcrite et consensuelle:
[L]a morphologie du nom et celle du verbe (qui englobent lensemble des prdterminants du substantif et des pronoms) congurent un domaine privilgi o le descripteur se sent laise. Il nencourt l aucun risque de commettre des anachronismes. Lidentication, lanalyse des morphmes, leur attribution tel ou tel dialecte requirent des comptences tendues mais qui excluent, ce niveau, une interprtation de rendement expressif de ces traits. Il nest donc pas surprenant que la morphologie soit la partie la plus solide de la grammaire de lancien franais. (Wagner 1974, 56).

Mme sil faut relativiser cette prtendue absence de risque,22 les grammairiens et linguistes de lancien franais mettent notre disposition un systme qui marche, et qui est bas sur la comprhension. Cest parce que nous comprenons les phrases
Et nos, maire et eskeviens devant dit, par jugement, si ke drois et lois [17] porte, afaitames cest hyretage a la maison del Vauz Saint Lambert (Document 12700324, 16). me sires Wilhames afaiterat a le glise totes ces choses devant dittes (Document 12780801, 10). Et la afaitat
[4]

et werpit et quittat chi Libiers desur_dis a me dame labbesse et a frere

21 On ne peut pas en dire autant de lensemble des textes en ancien franais (Wagner 1974, 70). 22 Jean-Pierre Chambon 2003 a ainsi pu proposer une rvision de la description morphologique

de la exion substantivale en lancien occitan allant dans le sens dune trs importante simplication. Il conclut par ailleurs son tude en disant: Il est connu que la exion substantivale en ancien occitan diffre peu de ce quon observe en ancien franais et en ancien provenal. On peut donc sattendre ce que ce type danalyse que nous avons prconis ci-dessus puisse convenir aux deux autres langues mdivales de la Galloromania [. . .].

56

Lambier, a ows deas et de_lur maison desur ditte, tos les alus quilh [5] tenoit et avoit ens el choir et ens elle vilhe dOire (Document 12800720, 3).

que nous pouvons comparer afaitames, afaiterat et afaitat et y dceler: 1/ dune part un radical verbal afait-, portant le sens lexical du verbe; 2/ dautre part la srie de dsinences -ames, -erat, -at, qui expriment des catgories grammaticales et peuvent se retrouver la suite du radical de tous les verbes qui ont un innitif en -er. Le lecteur comprenant ces extraits est mme de compartimenter le sens, didentier les segments qui le vhiculent, et darriver la conclusion que certains mots sont analysables en segments exprimant des types de sens diffrents: le radical portant un sens lexical, la dsinence exprimant des catgories. Nous verrons que cette analyse des catgories grammaticales se rvle utile pour classer les mots en fonction de leur potentiel morphologique (3.3). 3.1.3.3 Juger et prvoir la structure

Malheureusement, cette simple interprtation ne suft pas aboutir une description des relations qui construisent les noncs. Or, pour dcrire synchroniquement un systme linguistique, il faut pouvoir poser, au moins de manire relative, des jugements dacceptabilit. a. Rle opratoire de la paraphrase. Le descripteur ne peut faire appel sa propre comptence pour valider ses analyses. Robert-Lon Wagner (1974, 70) rsume de manire efcace le problme:
Faute dintuition, quel moderne saventurerait dans les dmarches que les gnrativistes ont mises au point? Ces va-et-vient de ladmis, du tolr limpossible do se dgagent peu peu les conditions latentes qui assurent lintelligibilit dun syntagme et font varier les niveaux de grammaticalit? chaque instant ltude de lancien franais conduit mesurer lcart de la connaissance la puissance comme les limites de la connaissance elle-mme.

On ne peut donc valuer intuitivement la grammaticalit des constructions, ce qui complique la description morphosyntaxique. Faut-il pour autant baisser les bras? Non, si lon en croit Christiane Marchello-Nizia. Pour rsoudre le problme, elle prconise une dmarche qui prend appui sur la paraphrase et la comprhension (1985, 488, italiques dans le texte):
cest le recours aux noncs paraphrastiques qui compense, en quelque sorte, labsence de locuteur tmoin. Ainsi, lorsquune rgle propose produit, entre autres, un nonc quon ne trouve jamais attest, lon ne dispose daucun critre, de personne, pour juger de son acceptabilit: a priori, ce nest pas parce quune phrase ne se trouve pas dans les textes qui nous sont parvenus quelle nexistait pas ou quelle tait impossible. Mais lon peut faire le raisonnement suivant: lon ne peut certes prouver que lnonc en question nappartient pas ltat de langue dont on veut faire la grammaire labsence dun nonc ne fait pas preuve; mais si lon constate quun autre nonc qui le paraphrase est, lui, attest, on peut faire lhypothse que le premier nonc tait agrammatical.

La paraphrase met en effet en vidence des faits de gement et des blocages transformationnels lis certaines formules ou certaines units du lexique.23
23 Voir Marchello-Nizia 1985, 488490.

57

b. valuer les commutations. En ce qui nous concerne, nous aurons surtout besoin de valider des commutations. La paraphrase est particulirement efcace pour valuer le gement et les combinaisons de mots. Elle peut galement servir valuer les commutations, quoique de manire un peu diffrente. Comment procder concrtement? Raisonnons partir dun exemple. Nous dnirons plus loin (3.4.2.2) deux fonctions rgimes, distingues par la forme du pronom (le ou li) avec laquelle commutent les constituants immdiats de la proposition. Imaginons que nous posions que les formes soulignes dans les phrases suivantes commutent toutes avec le (sans tenir compte des contraintes de position), ce qui les rangerait dans la classe des rgimes du premier type:24
reportarent el main nostre [6] maior, en tesmong de nos eskeviens, lyretage deseur nomeit tot entierement (Document 12680310, 5). [. . .] Johans [. . .] ki astoit venuz a ses jors aprs la mort [3] de son pere [= avait atteint sa majorit. . .], vient par devant moi [. . .] (Document 12701126, 2). [. . .] ne molesterons mon [12] signor Humbier Corbea, chevalier desoir dit [. . .] (Document 12870908, 11). [. . .] ne molesterons mon [12] signor Humbier Corbea, chevalier desoir dit [. . .] (Document 12870908, 11).

Pour chacune de ces quatre commutations, nous posons deux hypothses: premirement, la substitution dune forme lautre ne modie pas le sens du contexte (au sens linguistique du terme) et les noncs se traduiront de la mme manire, sauf lendroit de la commutation; deuximement, lnonc obtenu aprs commutation est acceptable. Si lune de ces deux conditions nest pas remplie, on peut dire que la commutation nest pas valable. Il y a ds lors trois cas envisageables: 1/ les commutations postules sont confortes par des attestations; 2/ les commutations ne sont pas attestes et sont incompatibles avec le sens ou avec le reste du systme dcrit; 3/ les commutations ne sont pas attestes et paraissent compatibles avec le sens et avec le reste du systme. La seule chose qui puisse valider une commutation est de rencontrer dans le corpus (ou dans un corpus proche) un contexte qui montre quelle est probable; par exemple, la premire commutation est valide par lexistence de
Et cis [17] dans Anthones desor dis entre Sainte Marie et Saint Lambert a Liege le reportat en mes maens [. . .] (Document 12701126, 16).

Lextrait montre quil est possible davoir le comme rgime du verbe reporter. Nanmoins, comme les commutations impliquent laxe paradigmatique (les units ne sont donc pas prsentes), la dmonstration ne peut aboutir une preuve: on constate simplement que, dans lentourage du mme verbe et sans en changer le sens, on peut rencontrer le la place de lyretage. . . pour dsigner le patient. Il est galement envisageable dinvalider certaines hypothses de commutation. La traduction le permet parfois. Par exemple, la reconstruction o le est cens commuter avec venuz a ses jors aprs la mort de son pere,
24 Que nous noterons R2 (et non R1) plus loin.

58

*Johans, [. . .] ki lastoit, vient par devant moi.

dstructure les catgories de temps et daspect vhicules par le verbe. Le sens de astoit change: avec le pronom, le procs est statif et le verbe dnote un tat; avec le participe pass et son complment, le procs est dynamique et le verbe dnote un changement dtat. Si la commutation propose ne fait pas que modier le sens de ce qui est remplac et altre profondment la valeur du contexte, on peut raisonnablement la rejeter. Pareillement, nous carterons toute commutation rendant lnonc ininterprtable, comme celle qui remplace ne par le et aboutit :
**le molesterons mon signor Humbier Corbea.

En dehors de ces cas, on ne peut pas prouver quune commutation est possible. Ainsi, lhypothse de commutation de mon signor. . . avec le dans lentourage de molester ci-dessus ne peut pas tre conforte par dautres attestations du verbe dans le corpus (o il sagit dun hapax), mais ne semble pas poser de problme au point de vue du sens et de la conformit avec le reste du systme. Il faut alors ladmettre provisoirement (pour ventuellement la rejeter plus tard): sans cette souplesse, aucune description ne serait possible. 3.1.3.4 Relativit des modles

Le modle qui sera prsent dans les pages qui suivent a t construit sur des bases empiriques: nous avons fait correspondre les concepts aux donnes par le biais dun aller-retour permanent entre la thorisation et les faits. En consquence, la dmarche na t ni hypothtico-dductive, ni compltement inductive: la stabilit relative des thories na t atteinte que par une dialectique de tous instants, que nous ne pourrons prsenter dans les moindres dtails, mais dont nous donnerons le rsultat. Le modle dni est ainsi limit par le corpus, qui circonscrit les faits observs, et lon se gardera donc de le gnraliser aveuglment dautres varits de lancien franais, fussent-elles de la mme poque. Par ailleurs, lanalyse tant fonde sur lhypothse que nous comprenons les documents, il est possible que lamlioration de la comprhension mne rviser les fondements du modle propos ou certaines de ses parties. Il est en effet toujours possible de mieux comprendre les textes. Enn, la modlisation est galement limite par des contraintes pratiques: il ne nous a pas paru envisageable, vu les milliers dunits et de relations impliques dans le corpus, de justier toutes les analyses, par exemple en recherchant les commutations attestes et en les dnombrant, ou en valuant la probabilit quune commutation non atteste soit correcte.25 En n de compte, puisque le corpus peut souvrir et que les analyses sont perfectibles, il est possible que le modle qui en dcoule volue ou soit mme radicalement rvis. De ce fait, nous avons dcid de toujours privilgier lhypothse la plus simple en cas de doute.
25 Lensemble des analyses fournies dans la section Analyses syntaxiques des annexes devrait

fournir une base solide une entreprise de ce type.

59

3.2

Morphologie et syntaxe

Sachant prsent sur quelles units nous allons travailler et les difcults que nous allons rencontrer, nous voudrions expliquer sous quel angle il est possible danalyser les units. Nous dlimiterons ici les domaines respectifs de la morphologie et de la syntaxe. Cette dernire sera envisage comme un systme de relations entre les constituants (3.2.1), alors que la morphologie sera considre comme relevant du plan de lexpression (3.2.2). Nous verrons enn que les constituants peuvent tre des groupes de mots, des mots isols ou des morphmes, ce qui nous a amen distinguer plusieurs niveaux dans la syntaxe (3.2.3). 3.2.1 La syntaxe comme un systme de relations

Dnir la notion recouverte par le terme syntaxe nest pas chose aise: comme tous les concepts hritiers dune longue tradition en linguistique et comme la linguistique ellemme, la dnition du concept de syntaxe est loin dtre compltement consensuelle. Lacception que reoit le terme doit tre prcise. En loccurrence, la syntaxe est vue ici comme un systme de relations fondes sur le concept de dpendance (3.2.1.1). La caractrisation des relations entre constituants se fait sur la base de la relation minimale pose par Alain Lemarchal (3.2.1.2). 3.2.1.1 Un systme de dpendances

Quon compare les approches diffrentes de Louis Hjelmslev (1968), Lucien Tesnire (1965), Andr Martinet (1979) ou de Claude Hagge (1999), on sera frapp par un prsuppos commun: la syntaxe est labore partir dlments irrductibles, qui prennent la forme de structures ou de relations. Linventaire des fonctions possibles entre deux units de la langue que donne Louis Hjelmslev est sans doute le plus gnral dun point de vue pistmologique. Il systmatise ces fonctions en trois types (1968, ch. 11): la dtermination, linterdpendance et la constellation. La taxinomie des fonctions est tablie sur la base du critre exclusif de la condition dexistence des units mises en rapport (en termes hjelmslviens, des fonctifs qui contractent la fonction). Les units peuvent en effet tre de deux types: soit elles sont la condition ncessaire doccurrence dune autre unit, et dans ce cas on les nomme constantes (c), soit elles ne le sont pas, et elles sont nommes variables (v). Ces dnitions impliquent quune unit ne se dnit que par son comportement vis--vis dautres units. En vertu de cette distinction, les fonctions sont dnies comme suit: une dtermination met en rapport une variable et une constante; une interdpendance met en rapport deux constantes; une constellation met en rapport deux variables. Ces fonctions interviennent tant sur le plan paradigmatique (units en absence, qui entretiennent des rapports dsigns sous le nom gnrique de corrlations) que sur le plan syntagmatique (units en prsence, qui entretiennent des rapports dsigns sous le nom gnrique de relations). Sur ce dernier plan, les relations sont:

60

la slection, qui est une dtermination; la solidarit, une interdpendance; la combinaison, une constellation. Par exemple, pour un hritier de Louis Hjelmslev comme Knud Togeby (1965, 74), il y a solidarit entre une conjonction de subordination et une subordonne en franais moderne: la prsence simultane des deux constantes est la condition de la subordination. Telle quelle est conue par Lucien Tesnire (1965, ch. 2 et 3) dans ses lments de syntaxe structurale, la syntaxe de dpendance afrme que [l]ensemble des mots dune phrase constitue [. . .] une vritable hirarchie (ch. 2, 5), o certains mots, dits rgissants commandent un ou plusieurs subordonns. Ensemble, rgissant et subordonn forment un nud. Lauteur prcise:
[T]out subordonn suit le sort de son rgissant. Soit par exemple la phrase: mon vieil ami chante cette jolie chanson [. . .], si jen renverse les lments pour dire: cette jolie chanson charme mon vieil ami [. . .], le substantif ami, en passant de la fonction de sujet celle de complment dobjet, entrane avec lui les adjectifs mon et vieil qui dpendent de lui. (ch 3, 4, italiques en grasses dans le texte).

Cette remarque exprime le principe de dpendance, que Lucien Tesnire ne dnit pas, mais que Paul Garde formule ainsi:
[T]oute relation syntaxique (entre morphmes dans le mot, entre mots dans la phrase) stablit entre deux termes dont lun, subordonn, dpend de lautre, principal. Le terme principal (sil sagit de mots, le mot principal) est celui qui contient linformation [160] sur les rapports syntaxiques entre lensemble constitu par le principal et son subordonn et lenvironnement de cet ensemble. (Garde 1981, 159160).

Termes principal et subordonn sunissent pour, selon les termes de Lucien Tesnire, former un nud. Le plus important des nuds est appel nud des nuds et commande tous les subordonns, ce qui le place au centre de la phrase, dont il assure lunit structurale en en nouant les divers lments en un seul faisceau. Il sidentie avec la phrase. (ch. 3, 15). La relation qui unit un rgissant ses subordonns est dite relation de connexion (ch. 1); cest cette relation de dpendance qui permet la phrase dexister en tant que telle, puisque toute la hirarchie est fonde sur elle. Compar linventaire de Louis Hjelmslev, ce principe de dpendance est transposable en termes de variable et de constante. La connexion doit ds lors tre comprise comme une relation entre deux termes et lon peut la qualier de slection, allant du mot rgi au mot rgissant. Dans sa Grammaire fonctionnelle du franais, Andr Martinet exprime cette conception:
On peut galement exprimer le rapport entre un lment, le noyau, conditionnant lapparition dun autre, le dterminant, en disant que le dterminant est une expansion du noyau. Lorsquon dsire seulement marquer le rapport de dpendance, on peut parler du noyau et de ses satellites. (1979, 10, italiques en gras dans le texte).

On reconnat, exprimes dans un cadre formel moins sophistiqu, les mmes ides que celles de Louis Hjelmslev: il y a des constituants (les noyaux) qui sont la condi61

syntaxe @rgles de dpendance et de coocurrence des units en prsence


F IG . 3.7 Concept de syntaxe

tion ncessaire lexistence dautres constituants (les satellites), dans un rapport fort proche de celui existant entre variables et constantes hjelmslviennes. La classication que Claude Hagge donne dans La structure des langues, fonde sur une induction partir des structures observes dans de nombreuses langues du monde, est galement dordre trs gnral:
Il nexiste que trois relations possibles, universellement, au sein de lnonc: la prdication, la dtermination (et ses cas particuliers, la subordination et la complmentation), la coordination [. . . ] (Hagge 1999, 34).

Claude Hagge ne donne cependant pas de dnition explicite de chacune de ces fonctions on aurait aim que sa synthse comprenne une dnition rigoureuse de la notion de dtermination. Nanmoins, nous avancerons (sans toutefois pouvoir en tre tout fait certain) que ce quil nomme prdication, condition dexistence de la phrase-nonc, met en relation de dpendance rciproque les termes qui la contractent (fonction de solidarit chez Hjelmslev), alors que la dtermination correspond une slection et la coordination une combinaison. Nous ne pensons pas trahir la pense de ces auteurs en afrmant que la syntaxe est gnralement conue comme un monde de relations hirarchises entre les units en prsence, o la hirarchie se traduit par le fait que lapparition de certains segments est conditionne par celle dautres segments dont on peut dire que les premiers dpendent (schmatiquement: gure 3.7). Dans la mesure o seules les units en prsence sont abordes, limiter le domaine de la syntaxe celui des dpendances26 des segments les uns par rapport aux autres permet de la distinguer clairement de la morphologie (3.2.2), mais aussi dvacuer de sa description toute considration smantique. Par exemple, en franais moderne, la prposition est syntaxiquement dnie par le fait quelle dpend dune autre unit. De mme, on peut dire sans risque de se tromper que le sujet et le prdicat dpendent lun de lautre, en ce sens que la relation qui les lie, la prdication, est la condition dexistence de la phrase-nonc. 3.2.1.2 Relation minimale

En ancien franais, la question de la dpendance ne saborde pas aussi facilement (3.1.3.3) et il faut limiter linterprtation. On peut, pour ce faire, tirer parti de la relation minimale, telle quelle a t dnie par Alain Lemarchal (1997, 3): une relation dont le signiant est la simple coocurrence et le signi un simple il y a de la relation. Cette relation, qui joue la fois sur le plan smantique et sur le plan syntaxique, est, nous dit lauteur, reprable laide de marques intgratives:
Comment cela peut-il fonctionner? La premire condition est quil y ait une indication des frontires aussi bien du segment englobant que des segments englobs, ce qui relve des marques dmarcatives/intgratives dj rencontres. Il est indispensable quil y ait des
26 Nous incluons galement dans ce terme le sens dinterdpendance de la glossmatique.

62

instructions indiquant o nit et commence un mot, un syntagme, etc.; du coup, on voit que la syntaxe ne peut faire limpasse sur des questions daccent, dharmonie vocalique (et consonantique), de sandhi, de tempo, de registre de hauteur, etc., tous phnomnes qui ont, de ce fait, les caractristiques du signe, et constituent de vritables marques; de mme que les questions dordre des mots, xe ou non, etc. (Lemarchal 1997, 103).

Cette thorie nous sduit beaucoup, et nous la ferons ntre au prix de modications mineures. Tout dabord, nous prfrerons constituant segment, terme qui sous-entend la continuit des lments qui le composent ce qui nest pas ncessairement le cas. Ensuite, ce qui est certainement beaucoup plus important, le medium employ dans nos chartes (voir ch. 2) nest pas adquat lexpression de phnomnes prosodiques. Nous limiterons en consquence les marques intgratives lindice donn par le fait que les constituants fonctionnent ensemble dans un constituant plus large, ce qui nous oblige faire appel au sens. Pratiquement, nous commencerons par constater, sur la base de critres smantiques,27 que certains mots fonctionnent ensemble. Par exemple, dans
[. . .] damoiselle Sybille, lhe mon saingnor Leone [. . .], vint par devant [3] nos et par devant les hommes de le Chiese Deu (Document 12600203, 2).

damoiselle Sybille, lhe mon saingnor Leone exprime lagent du procs venir. Il y a une relation entre les contenus des constituants et il est raisonnable de dire que, puisque cette relation smantique existe, il y a l une relation syntaxique potentielle. Il est tout aussi plausible de se baser sur cette relation pour dire que chacun des mots du constituant qui exprime lagent entretient une relation un niveau dintgration infrieur celle qui le relie au procs. Mais de ces relations syntaxiques, on ne peut encore rien dire dautre ce stade. Il faut donc permettre au descripteur dindiquer quil existe une relation entre les mots sans statuer sur le statut hirarchique rciproque de ces mots. Au bout du compte, la syntaxe est dnissable comme lensemble des relations de dpendance qui existent entre les constituants, mais il nest pas ncessaire de qualier le type de dpendance pour afrmer quil y a dpendance. Face une structure quon peut analyser en constituants immdiats, au sens traditionnel,28 sans postuler de hirarchie a priori, nous pouvons dire, en suivant Alain Lemarchal, que la structure est forme de ses constituants immdiats et dune relation minimale qui les lie; ce qui peut tre reprsent comme dans la gure 3.8.29 Cela nous permet de formaliser le concept de constituant immdiat (dsormais CI, gure 3.9) et, rciproquement, celui de relation (gure 3.10).

27 Voir 3.4.2.1 pour les principes suivis au niveau de lorganisation des constituants autour du

verbe (syntaxe argumentale, 3.2.3.1). Le niveau de la construction des syntagmes (quon dira immdiat, 3.2.3.1) est singulirement plus compliqu (3.4.7.3 et 3.4.7.4). 28 Cest--dire celui propos par Leonard Bloomeld (1970, 153), que Henry-Allan Gleason (1969, 109) formule de manire limpide: Un constituant immdiat (abrviation courante C. I.) est un des deux (ou plus de deux) constituants qui forment directement une construction donne. 29 Cette schmatisation correspond celle quen fait Alain Lemarchal (1997, 126); nous ne nous sommes permis que des modications dordre esthtique.

63

[constituant immdiat]

relation

[constituant immdiat]

F IG . 3.8 Reprsentation de la relation minimale

constituant immdiat (CI) @unit linguistique en prsence @contenue dans une structure plus large quil sert construire directement @contractant une relation avec un autre CI de mme niveau
F IG . 3.9 Concept de constituant immdiat

relation @dpendance ou coocurrence lintrieur dune structure englobante @implique au moins deux constituants immdiats
F IG . 3.10 Concept de relation

3.2.2

La morphologie et le systme de marques

Nous voyons donc la syntaxe comme un systme de dpendances et de coocurrences entre constituants. La question qui se pose ds lors est de savoir comment ces relations sont exprimes. Lopposition saussurienne entre expression et contenu distingue la syntaxe de la morphologie, relgant cette dernire au domaine des marques (3.2.2.1). Mises en rapport avec la relation minimale, les marques lui apportent un surcrot dinformation, quAlain Lemarchal nomme spcication (3.2.2.2). 3.2.2.1 Expression et contenu

Depuis ses dbuts en tant que science30 autonome, la linguistique distingue les plans du contenu et de lexpression. Le signe saussurien en est la premire application explicite (Saussure 1967, 97 sqq.). La reformulation de Louis Hjelmslev (1968, ch. 13) formalise ensuite la distinction: il est prsent fort commun de dire quil faut viter de confondre le plan de lexpression et le plan du contenu (qui ne peut tre atteint que de manire mdiate). On naura donc aucune peine bien distinguer les deux plans fondamentaux: celui du contenu et celui de lexpression de ce contenu. Dans ce second plan, on trouve par consquent toutes les marques qui servent exprimer un contenu syntaxique. Ces marques ne sont ainsi pas des relations (des faits de syntaxe), mais un des moyens de les projeter sur le plan de lexpression. Dans le cadre du syntagme verbal, Gilbert Lazard (1994, 1) numre ces marques:31
Les relations entre le verbe et les termes nominaux sont indiques par plusieurs procds, souvent employs simultanment. Les uns sont des morphmes relateurs, ordinairement afxs au nom ou situs dans leur voisinage. Dautres, indices actanciels gnralement intgrs la forme verbale, sont en corfrence avec certains termes nominaux. En outre, dans
30 Ou proto-science dirait Gilles-Gaston Granger, cf. Lazard 1999a, 68. 31 Voir aussi Lemarchal 1997, 123.

64

beaucoup de langues lordre des termes joue un rle fondamental. Certaines connaissent des formes plus ou moins pousses de coalescence entre terme nominal et verbe.

Les marques dexpression sont au moins de trois ordres: morphologique (exion, emploi dadpositions, phnomne daccord et de rection), squentiel (ordre des constituants) et lexical (phnomnes de gement, qui impliquent une modication des proprits transformationnelles32 ). cela, on ajoutera lintonation, qui sert galement exprimer les relations, mais aussi lintgration du constituant une construction plus large (Lemarchal 1997, notamment 123). Il ny a bien entendu aucune raison que ces types de procds soient employs exclusivement pour marquer les relations entre le noyau verbal et les termes nominaux. Ds lors, traiter les marques dexpression segmentales et leur contenu sans les distinguer nettement est dautant plus absurde que ces procds segmentaux sont en concurrence, ou plutt en superposition, avec les autres procds.33 3.2.2.2 Marques et spcication

Les relations syntaxiques sont donc exprimes par des marques. Voyons comment ces dernires sarticulent autour de la relation minimale. Si lon reprend les vues quAlain Lemarchal a exposes dans Zro(s) (1997), les marques sont des contraintes qui sajoutent la relation minimale pour la spcier, cest--dire en prciser la valeur smantique;34 par exemple, dans:
li abbesse [4] et li covens [. . .] ont doneit a trecens a Ja-[5]-kemin le Rotial [. . .] . (Document 12600221b, 3).

la marque segmentale facultative a spcie la relation entre ont doneit et Jakemin et fait de ce dernier le bnciaire.35 Selon Alain Lemarchal, les marques sont hirarchises (122123): en particulier, il considre que les marques intgratives ou dmarcatives sont toujours prsentes et que les marques squentielles et catgorielles sy superposent. Dans cette vision des choses, les marques segmentales viennent se greffer, en dernier lieu, aux marques catgorielles. Ce qui importe surtout, cest que ce sont les marques intgratives qui rvlent la relation minimale et que les autres types de marques ne font que sy ajouter. La spcication est une surimpression des marques. La prexistence de la relation minimale suppose que toute contrainte supplmentaire se superpose ce bruit de fond cosmologique (Lemarchal 1997, 107). Par consquent, celui qui repre une spcication repre forcment une relation minimale du mme coup. On peut ainsi relativiser ce qui a t dit plus haut (3.2.1.2): il ny a pas que la smantique qui permette de reprer une relation minimale. On peut se servir

32 Voir notamment Gross 1996, 1213. 33 Voir Lemarchal 1983, o lauteur montre que cest la superposition de ces marques qui

permet de lever lambigut pose par les marques segmentales homonymes.


34 Cf. Lemarchal 1997, en particulier 107114. 35 Nous tudions le phnomne ci-dessous (3.4.4.2).

65

spcication

[constituant]

relation

mot spciant reste du constituant

F IG . 3.11 Reprsentation de la spcication

[ont doneit]

[a] Jakemin. . .

F IG . 3.12 Structure de ont doneit a Jakemin. . . fonctions syntaxiques @au moins un terme est un constituant relation @les termes sont des constituants spcication @un terme est une relation

F IG . 3.13 Types de fonctions syntaxiques suivant les termes relis

des catgories vhicules par les segments (phnomnes daccord) pour la mettre en vidence.36 Lorsquelle est segmentale, nous reprsenterons la spcication par une che grise pointant non vers un constituant, mais vers une relation (gure 3.11). Dans notre exemple, la relation est spcie par a, qui reste un constituant de a Jakemin (3.4.6.3), comme reprsent dans la gure 3.12. Ce que le schma montre bien, cest que le mot a, qui spcie la complmentation, na de valeur quen prsence de cette dernire. La spcication est ainsi une fonction seconde, contracte par un constituant (si la marque est segmentale) et une autre fonction. Il serait utile de rserver le terme relation aux fonctions premires, qui relient par contre deux constituants. On schmatisera cela par la gure 3.13. 3.2.2.3 Des marques qui nexpriment pas que des relations

Dautre part, lanalyse est lgrement complique par le fait que les marques, lorsquelles sont segmentales, indiquent non seulement les relations entre les mots, mais aussi les catgories grammaticales et les types nonciatifs (Feuillet 1988, 72). La phrase
li veskes et li cuens i [= la charte] ont pendut lors sayaus. (Document 12361215, 12).

est analysable facilement grce aux dsinences casuelles, qui indiquent en mme temps la catgorie du nombre. En termes traditionnels, li veskes et li cuens sont tous
36 Dans les cas de discontinuit, cela est mme fondamental. Les langues comme le latin ou

le sanscrit ne requirent pas la continuit des constituants du syntagme: pour y retrouver les relations minimales, on est oblig de passer par une analyse des marques synthtiques (donc segmentales).

66

deux des sujets au singulier, alors que lors sayaus est un complment dobjet direct au pluriel. On sait quen ancien franais, la prsence dun -s la n dun nom masculin indique conjointement son nombre (catgorie) et la relation quil entretient avec les autres units (ici, le verbe). Lamalgame des marqueurs segmentaux fusionne indications de relations et de catgories et oblige poser marqu + marqueurs morphologiques comme analyse du mot, puis distinguer les marques en fonction du type de contenu quelles vhiculent (catgories ou relations). 3.2.3 Niveaux danalyse syntaxique

Intuitivement, on voit bien que toutes les relations de dpendance ne sont pas du mme ordre: certaines relations semblent fondamentales et permettent lnonc dexister, dautres jouent un niveau infrieur. Nous verrons tout dabord comment Gilbert Lazard prsente cette distinction entre les niveaux danalyse syntaxique sous la forme dune tripartition (3.2.3.1). Nous mettrons ensuite la question des marques en rapport avec cette division en trois niveaux (3.2.3.2). 3.2.3.1 Tripartition de la syntaxe selon Gilbert Lazard

Les dpendances ne jouent pas toutes au mme niveau. Dans un article nomm La distinction entre nom et verbe en morphologie et en syntaxe (1984), Gilbert Lazard disait:
On peut donc se reprsenter la morphosyntaxe comme un continuum dont lune des extrmits couvre les squences les plus courtes, lautre, disons, la proposition bien entendu, cette dernire limite est arbitraire: on peut considrer des squences plus longues, phrase complexe et mme ensembles suprieurs la phrase, mais ce nest pas ncessaire pour notre propos. Par dnition, ce continuum ne se divise pas en parties bien distinctes. Il est cependant pratiquement ncessaire dy dnir approximativement des zones. Il est commode den distinguer trois: 1) la morphologie: ce terme entendu ici dans son sens traditionnel, comme ltude des units et de leurs combinaisons lintrieur du mot; ce dernier terme est lui-mme bien difcile dnir prcisment, mais il reprsente dans beaucoup de langues une ralit indniable, mme si ses contours restent un peu ous; 2) la syntaxe immdiate: cest celle du syntagme, au sens ordinaire du terme, cest--dire celle qui tudie les combinaisons du mot avec ses satellites; 3) la syntaxe de proposition ou phrastique: elle dcrit la nature et les rapports du prdicat et des actants (et des circonstants).

Cette partition dlimite les domaines respectifs dune syntaxe dite de mot (que Gilbert Lazard nomme, non sans une invitable ambigut, morphologie), une syntaxe immdiate et une syntaxe de phrase, que nous prfrons dire argumentale.37 La premire concerne les relations entre les formants des mots, la deuxime celles entre les constituants immdiats du syntagme, la troisime les relations entre les constituants immdiats des propositions.38 Cette dernire est fondamentale, puisquelle permet lex37 Voir la distinction entre phrase et nonc (3.4.1.2). 38 Voir 3.4.2 sur la distinction entre phrase-nonc et proposition.

67

syntaxe @rgles de dpendance et de cooccurrence des units en prsence s. de mot @entre les CI du mot s. immdiate @entre les CI du syntagme s. argumentale @entre les CI de la proposition

F IG . 3.14 Types de syntaxe

pression dun procs et de ses participants au travers du prdicat et de ses arguments; elle fonde lnonc, lui pourvoyant simultanment les caractres @unit linguistique complte et @transmet un message. Adoptant cette tripartition, nous pensons que le concept de syntaxe que nous avons dni plus haut doit tre subdivis (gure 3.14). De cette faon, la formation de droiture (Document 123607, 7) ou tresfons (Document 123607, 3) par afxation dune base est un fait relevant de la syntaxe de mot, alors que la combinaison de ces units avec un mot comme lor est un fait de syntaxe immdiate:
[N]os aiderons le vesque et leglise de lor droitures a maintenir [. . .] (Document 12420502, 10).

Les relations qui unissent nos et le vesque aiderons relvent quant elles de la syntaxe argumentale. 3.2.3.2 Des marques tous les niveaux

Considrons exclusivement les marques de relations: si la partition de la syntaxe en trois zones est lgitime, la langue doit fournir les moyens dexprimer les relations dans ces trois zones. Nous nous attendons donc trouver des marques: 1/ qui explicitent la formation des mots; 2/ qui indiquent les relations immdiates; 3/ qui indiquent les relations argumentales. a. Syntaxes argumentale et immdiate. Le fait quune unit soit accorde une autre peut relever de la syntaxe immdiate, comme cest le cas dans lors sayaus ci-dessus , ou de la syntaxe argumentale comme dans nos aiderons. . . dans lexemple abord. Toute marque est susceptible de jouer simultanment ces deux niveaux de syntaxe. Il faudra donc tre attentif ces superpositions. Ainsi, dans la phrase suivante,
[N]os volons ke ces choses soient estaules [. . .] (Document 12420502, 18).

la marque du pluriel prsente dans choses est implique dans la relation immdiate qui lie ce mot ces et contribue galement exprimer la relation (de syntaxe phrastique) qui existe entre choses et soient: le fait que ces deux mots saccordent indique quils fonctionnent ensemble. b. Syntaxe de mot. Au niveau de la syntaxe de mot, le phnomne est diffrent. Comme cest le cas pour le franais moderne (Soutet 1998, 5), il nous semble quen ancien franais, les constituants du mot nentretiennent de relation syntaxique directe quavec le reste du mot quils servent former. En consquence, la seule cooccurrence dune base (ou dun radical, ou dun thme) avec une dsinence qui lui est compatible 68

suft marquer la relation syntaxique qui les unit pour former le mot. On ne trouve ce niveau que des relations minimales. Cette dsinence marque parfois dautres relations syntaxiques que le mot entier entretient avec dautres constituants, mais ces considrations ne relvent plus des procds de combinaison des constituants: si on value une marque du point de vue de sa valeur, on cesse de la voir comme un constituant. Ainsi, dans lexemple ci-dessus, la marque segmentale -s la n de choses entretient une relation avec chose (syntaxe de mot), mais ce niveau, elle ne fait que fonctionner avec le reste du mot, rien de plus.

3.3

Parties du discours

La section prcdente a montr quil tait possible de sparer dun ct, les considrations sur la construction des mots et la manire dont les marqueurs vhiculent les catgories qui leur sont inhrentes; de lautre, la manire dont les mots entrent en relation sur laxe syntagmatique, ainsi que les moyens formels employs pour marquer ces relations. Nous considrerons comme rsolues les difcults poses par le fait que les marqueurs fonctionnent ces deux niveaux et dcrirons ici la manire dont nous concevons la construction du mot. De lavis de Jack Feuillet,39 la littrature sur les parties du discours est abondante et les tentatives de dnition sont dans lensemble toujours inabouties, si bien que lon songerait abandonner un concept aussi ou, qui amalgame des considrations morphosyntaxiques et smantiques sans rellement les distinguer nettement: on schine tant bien que mal classer des mots. Les critiques ainsi adresses aux principaux essais de classement paraissent tout fait fondes. Toutefois, bien que Jack Feuillet propose de renoncer classer les mots et de se focaliser plutt sur les grands constituants,40 nous devons classer les mots avant dentamer (3.4) lanalyse dductive: il apparatra ultrieurement que certains dentre eux constituent de vritables pivots pour la description de la syntaxe immdiate et de la syntaxe argumentale. En premier lieu, nous verrons succinctement ce quon peut reprocher aux dmarches de classement qui mlangent les points de vue exposs prcdemment (3.3.1) et pourquoi un classement exclusivement syntaxique, la base duquel on trouve les conceptions de Lucien Tesnire, nest pas ralisable (3.3.2). Enn, nous montrerons comment nous avons tir parti de la manire dont la syntaxe de mot et la smantique (au niveau des catgories exprimes) sarticulent pour laborer le classement retenu (3.3.3). 3.3.1 Limpasse de la voie traditionnelle

Si lon se borne suivre les critres de la grammaire traditionnelle, la dnition des parties du discours se fait sur une base clectique, qui mlange sans uniformit les critres de points de vue htrognes principalement les points de vue morphosyn-

39 Voir entre autres sa conclusion (1988, 7175). 40 Cest la position quil dfend dans Feuillet 1983; Feuillet 1988.

69

taxique et smantico-rfrentiel (voir p. 53). Le fait est bien connu et lon reprendra simplement les observations de Jack Feuillet:
Un des traits les plus remarquables de cette analyse est lutilisation de critres diffrents pour dnir les constituants: le nom est le mot qui sert dsigner, nommer les tres anims et les choses [. . .], non seulement les objets, mais encore les actions, les sentiments [etc.] (Grevisse 1969, 172), le verbe est le mot qui exprime soit laction faite ou subie par le sujet, soit lexistence ou ltat du sujet, soit lunion de lattribut au sujet (Grevisse 1969, 533) [. . .] On a affaire ici des dnitions de type notionnel, alors que pour le pronom (qui remplace le nom), ladjectif (qui accompagne le substantif) [etc.], on a des dnitions de type fonctionnel qui se distinguent des dnitions de type positionnel utilises pour la prposition (place devant le substantif) [. . .]. (Feuillet 1988, 61, typographie modie).

Un tel classement ne peut servir de base des dpouillements systmatiques, parce quil ne permet pas de dterminer avec exactitude en quelle proportion les phnomnes observs au niveau du verbe ou du nom, par exemple, sont comparables. De plus, dun point de vue plus pratique, il laisse une grande latitude lintuition de lanalyste (un nom peut galement exprimer une action. . .) et se rvle trs difcile mettre en uvre dans le cadre dun balisage exhaustif. Faute de cadre rigoureusement dni, le point de vue smantico-rfrentiel mne des rsultats peu ables. 3.3.2 Limpasse de la voie syntaxique

Il est donc essentiel de choisir un critre et de sy tenir pour arriver un classement consistant. Le critre qui parat le plus rigoureux est dordre syntaxique. Pour les linguistes qui ladoptent, les lexmes peuvent tre classs en fonction de linformation stocke dans le lexique qui concerne leurs compatibilits syntaxiques (Feuillet 1988, 6768). Cest la perspective de Lucien Tesnire (1965) et, sa suite, de Paul Garde (1981) et dAlain en particulier Lemarchal (1989). Lucien Tesnire et les partisans de son modle considrent que les lexmes possdent intrinsquement des compatibilits avec dautres lexmes, qui leur permettent de fonctionner automatiquement avec ces derniers (principe de connexion, 3.2.1); par exemple, un adjectif et un substantif mis en prsence lun de lautre contracteraient automatiquement une connexion. Cette thorie de la connexion va de pair avec celle de la translation, qui permet, laide dautres mots ou morphmes que Lucien Tesnire nomme translatifs, des mots qui ne sont pas compatibles41 de contracter nanmoins une connexion.42 Il afrme que dans le livre dAlfred, si le substantif Alfred est capable de se connecter livre, cest parce quil a t transfr en adjectif.43 Suivant le modle tesnirien, Paul Garde classe ainsi les parties du discours du russe par rapport aux relations de dpendance quelles peuvent entretenir.44 tablir
41 Il y a changement de nature syntaxique (Tesnire 1965, ch. 151, 19). 42 Lucien Tesnire ne limite pas la translation un phnomne marqu par un segment. Il peut

y avoir translation sans translatif (1965, ch. 162, 1). Cela pose le problme mthodologique des marques , sur lequel on ne sattardera pas ici. 43 Voir cependant Lemarchal 1989, 129138 pour une rvision de cette analyse, prsente synthtiquement p. 126 ci-dessous. 44 Voir supra (3.2.1.1) la dnition de la dpendance dans la conception de Lucien Tesnire et de ses continuateurs.

70

le classement sur ce principe implique cependant quon puisse toujours se prononcer sur le statut des constituants (principal ou subordonn) et quon ait connaissance de cette information sur les rapports syntaxiques contenue dans le principal. Or, le discernement est loin dtre vident pour lancien franais (3.1.3.3). La voie syntaxique, surtout si elle fait appel la thorie des translations, nest pas adquate pour traiter le corpus pralablement une analyse des relations. Elle suppose en effet une vue densemble des rapports entre les mots en prsence, vue qui nest pas accessible ce stade. Nous devons donc renoncer cette voie pour viter la circularit du raisonnement. 3.3.3 Catgories smantiques grammaticalises et syntaxe de mot

Pour disposer dune base de travail qui serve construire un modle des relations syntaxiques entre les mots sans faire appel ces dernires, le seul moyen de procder est de dcrire les mots du point de vue de leur formation, et selon les morphmes qui les composent. Si lon se rsout ne faire usage que des informations livres par les lexmes en dehors de toute intgration syntaxique, il faut, dans la mesure du possible, faire abstraction des contextes dans lesquels ils sont rencontrs pour se focaliser sur le contenu smantique de leurs formants. La description se limite ici la manire dont certains contenus smantiques abstraits sont exprims de manire systmatique (cest-dire les catgories grammaticales). Nous exploiterons donc le critre morphologique. Le plus gros reproche qui pourrait lui tre fait est quil mne une taxinomie qui ne saurait prtendre luniversalit:45
Le principe morphologique, consistant grouper ensemble les mots ayant un mme type de exion, est incompatible avec luniversalit, puisquil ne peut sappliquer aux langues qui ont une exion peu dveloppe ou inexistante. (Garde 1981, 158).

Nanmoins, cet gard, quel que soit le point de rfrence choisi, aucun classement ne pourrait tre valable pour toutes les langues. Andr Martinet (1979, 1.12) le confesse propos de sa tentative distributionnelle, mais cette limite pourrait galement tre valable pour un classement syntaxique:
Les classes de monmes ressemblent ce quon dsignait traditionnellement comme les parties du discours. En renonant ce terme, nous marquons simplement quil ny a pas de parties du discours valables pour toutes les langues, et quil faut, pour chacune delles, distinguer les classes en fonction de leurs compatibilits particulires.

La classique dnition diffrentielle de la valeur des membres du systme46 rend impossible toute tentative de classement universel. Quelle que soit loptique choisie, seuls les critres de description peuvent revtir un caractre gnral: li au point de vue morphosyntaxique, le classement en parties du discours est forcment propre la langue dcrite ce qui nexclut pas que certaines langues puissent avoir des inventaires de parties du discours assez proches.
45 Comme le dit Jack Feuillet 1988, 64, qui mentionne lavis de Paul Garde, cit ici. 46 Cf. Saussure 1967, 158162.

71

Sur les bases choisies, nous rangeons les mots en trois grandes classes distinctes: celle des verbes (3.3.3.1), celle des noms (3.3.3.2) et celle des adverbes (3.3.3.3). 3.3.3.1 Verbes

Daprs Jack Feuillet (1988, 84), les catgories que sont le temps, le mode et laspect doivent, dun point de vue gnral, tre considres comme portant sur lensemble de la phrase-nonc plutt que sur un de ses constituants en particulier dans une optique de description dductive. Pour lancien franais, ces catgories sont toujours morphologiquement rattaches un mot qui en supporte obligatoirement les marques.47 Par commodit, on dsignera ce mot du nom de verbe.48 Par exemple, dans la phrase:
La afaita Werris [. . .] a sangor Arnult [. . .] ii verges 12671029, 6).
[7]

et demie daluez (Document

le mot afaita supporte les marques morphologiques (amalgames dans sa dsinence) qui situent dans le pass le procs exprim, et permettent galement de dire quil sagit dune action ponctuelle assume comme relle par lnonciateur. Aucune autre unit de lnonc ne le permet: mme si certains mots comportent des informations similaires (le mot la linitiale pose le cadre temporel autant que le cadre spatial), ces mots nexpriment pas ces contenus au moyen de marques morphologiques systmatiques. Par consquent, le verbe soppose au non-verbe par la prsence obligatoire dune dsinence exprimant ces catgories de temps, mode et aspect, les catgories verbales. Suivant ce modle, il nest pas possible de rencontrer un verbe sans quil soit porteur de ces informations. Quon ait affaire des modes personnels ou des formes dites nominales du verbe (participe et innitif), on constate quil vhicule ces mmes catgories. Il est vrai que lopposition entre le prsent et le pass ne doit pas tre applique sans prcaution aux autres modes que lindicatif,49 mais quel que soit le mode, les catgories verbales expriment toujours une position temporelle par rapport un repre du mme ordre, ainsi que la manire dont le procs est ou non actualis. Par ailleurs, ces modes nominaux sopposent aux dverbaux par leur caractre systmatique: tous les verbes peuvent tre mis au participe ou linnitif, alors que les drivations par des sufxes comme -able, -tion ne sont pas prvisibles (elles relvent du lexique). Cela oblige poser une distinction fondamentale entre des formes comme paiable
47 Nous ignorons ici les cas de coordination, qui impliquent que plusieurs mots comportent des

morphmes grammaticaux corfrents ces mmes catgories (3.4.7.2).


48 Le fait semble fort rpandu, si lon en croit David Cohen (1989, 264), qui nhsite pas

proposer, dun point de vue gnral: Le verbe, conjonction de phrase, en tant quil est le lieu o se manifeste la relation prdicative, tend tre charg des morphmes gnraux de la phrase et se manifester ainsi, ventuellement, dans des formes marques comme aspectives, temporelles, diathtiques, personnelles, etc. Voir en outre Cohen 1989, 53. 49 Voir Wilmet 2003, 374s., spc. 374 et 377.

72

(Document 125905, 4) et paier (Document 12590116, 6), la premire ne comportant pas de morphmes exprimant des catgories verbales. Le modle ne se prononce pas sur le statut des morphmes constitutifs pris isolment. Lquivalence des environnements les deux formes peuvent avoir un complment qui commence par le mot a et qui prcise la valeur smantique du complment comme celui du bnciaire, voir sous 3.4.4.2 , est un phnomne touchant le lexique et la syntaxe quil nest pas du ressort du prsent classement dexpliquer.50 Cette premire classe correspond donc exactement la classe traditionnelle des verbes, dont les grammairiens dcrivent la exion (conjugaison).51 Nous aurons loccasion de constater que cette proprit morphologique du verbe, qui le place au centre de la proposition, est une base opratoire trs utile pour commencer lanalyse des relations (3.4.1.2). 3.3.3.2 Noms

Parmi les non-verbes, certains lexmes sont capables de vhiculer les marqueurs exprimant les catgories du genre et du nombre. Ces catgories sont plus faciles rattacher aux mots que les catgories verbales. Mme chez les plus rticents partir des units les plus petites, on constate que le genre est une proprit de la base (Feuillet 1988, 96),52 alors que le nombre est une catgorie qui se manifeste souvent de manire discontinue, sur plusieurs mots. Ces catgories sont dites catgories nominales et les non-verbes qui sont susceptibles de les vhiculer sont des noms. Notons que le fait de supporter pareilles catgories nest pas lapanage de ces derniers, et que les formes dites participiales des verbes peuvent galement les exprimer. Nous poserons trois questions importantes au sujet de la classe des noms: (a) quen est-il de la exion casuelle? (b) peut-on parler de pronoms? (c) peut-on distinguer le substantif de ladjectif? a. Flexion casuelle. Le cas nest pas une catgorie (Feuillet 1988, 97). En effet, la variation morphologique casuelle nindique pas un contenu smantique descriptible en dehors de toute relation contracte sur le plan syntagmatique. Par exemple les occurrences de homme dans les phrases suivantes
[. . . ] je Lowis Naveaz, [. . .] et li autre homme de_le Cize Deu faisons kenoiestre verit (Document 12600221a, 1). Johans, archeprestres de Liege, a la requeste des hommes [. . .] de_le Chize De u [. . .] avons pendut a ces lettres presentes nostre saial (Document 12600221a, 18).

sont toutes deux des masculins pluriels, la diffrence de contenu ne senvisage que par rapport aux relations que le mot entretient avec son entourage.53 Nanmoins, mme
50 Voir les rexions sur le paralllisme entre le niveau argumental et le niveau immdiat, la

n de 3.4.6.1 a et 3.4.6.1 b. Pour les problmes que ce paralllisme pose, 3.4.7.1.


51 Voir, par exemple, Moignet 1988, 5281. 52 Comme les catgories que lauteur dit despce, comme anim/inanim, humain/non hu-

main, qui ont peu dimplication pour lancien franais.


53 Dans la mesure o la syntaxe est la forme linguistique dexpression de ce procs, on pourra

tirer prot de la exion casuelle pour caractriser les relations, voir lexpos sous 3.4.2.2.

73

sil nest pas une catgorie, le cas reste une proprit morphologique et peut tre mis contribution pour afner le classement. b. Statut du pronom. De fait, les mots qui acceptent la exion casuelle sont de plusieurs sortes: ils peuvent suivre des paradigmes diffrents (dclinaisons), que les grammaires de lancienne langue distinguent et numrent.54 Ce nest pas le lieu de se prononcer sur les ventuelles lacunes ou faiblesses du systme casuel en ancien franais et sur son htrognit. Il est plus utile de constater simplement que les noms ont, de ce point de vue, un potentiel expressif plus ou moins riche; certains noms permettent lexpression de plus de deux cas: les pronoms personnels de la troisime personne et les pronoms relatifs. On rservera ici le terme pronom (Pn) ces noms dont le paradigme permet la distinction de plus de deux cas ce qui exclut je, tu, nos et vos.55 Nous tirerons parti de cette richesse exionnelle pour analyser la construction de la proposition autour du verbe (3.4.2.2 a). c. Distinction substantif vs adjectif. Dautre part, nous prfrons ne pas distinguer ici une ventuelle classe des adjectifs et une classe de substantifs par rapport leurs compatibilits syntaxiques (avec le mot intensieur trs, par exemple, qui obligent parler dadjectifs substantivs56 ) ou smantiques. En ce qui concerne la taxinomie prsente, la distinction de classe ne serait justie que si elle tait fonde sur un critre morphologique: les adjectifs seraient des noms acceptant deux genres, alors que les substantifs nen accepteraient quun seul. On serait alors forc dadmettre que les quelques substantifs qui possdent ce potentiel, comme la paire marchise et marchis sont des adjectifs, comme le montre lextrait suivant:
Je, Ermesens, contesse de Lucemborg et de_La Roche et marchise dErlons, et je, Hanris, ses z, cuens [2] de Lucemborg et marchis dErlons, fasons conissant [. . .] (Document 12430709, 1).

Mieux vaudrait, dans ces conditions, opter pour une autre terminologie, qui mettrait en vidence la distinction.57 Nous trouvons raisonnable de distinguer les pronoms des autres noms, mais il ne nous a pas paru ncessaire dafner davantage le classement. 3.3.3.3 Adverbes

Ce classement laisse un groupe qui se caractrise ngativement par le fait quil nest porteur ni de catgories verbales, ni de catgories nominales; les units de ce groupe seront nommes adverbes. On conviendra quil ne faut pas traiter ici le problme des units que lon dsigne sous les noms de prpositions et conjonctions: en vertu de la dnition choisie,
54 Voir, par exemple, Wagner 1974, 91107 ou Moignet 1988, 1727. 55 Cela exclut les pronoms au sens dmile Benveniste (1946), qui les classe suivant un critre

smantique.
56 Ou mme linverse. . . voir Buridant 2000, 70 pour un exemple agrant. 57 Par exemple, noms monogenres (comme homme), picnes (comme afr. tel ou grand ) et

bigenres (comme afr. petit ou marchis).

74

partie du discours @lexme @dnie par des marques exionnelles verbe @catgorie verbale non-verbe @sans catgorie verbale

nom @catgorie nominale

adverbe @sans catgorie nominale

non-pronom @paradigme pauvre

pronom @paradigme riche

F IG . 3.15 Types de parties du discours

il sagit bien dadverbes,58 puisquils nexpriment ni des catgories verbales, ni des catgories nominales. Or, les distinguer des autres adverbes ne pourrait se faire que sur des bases syntaxiques et distributionnelles, ce qui nest pas le propos dun classement morphologique. Il va sans dire que le foisonnement des valeurs smantiques vhicules par les adverbes ne sera pas abord ici.59 3.3.4 Synthse

a. Hirarchie des concepts. Nous avons donc dni les classes morphologiques de lancien franais des chartes, que nous nommons parties du discours, par la hirarchie conceptuelle de la gure 3.15. b. Reclassement des parties du discours traditionnelles. En accord avec ce classement, nous rangeons les parties du discours traditionnelles (mentionnes entre guillemets) comme suit. La classe des verbes contient les verbes traditionnels, ce qui exclut les dverbaux par drivation. La classe des pronoms rassemble les pronoms personnels de la troisime personne et les relatifs, ce qui exclut tous les autres pronoms, quils soient personnels (je, tu,. . .), possessifs (mien, tien, sien,. . .), dmonstratifs, (cest, cel, etc.) ou indnis (autre, certain, etc.). Parmi les noms qui ne sont pas des pronoms, nous trouvons les substantifs et adjectifs (en ce compris les dverbaux comme paiable), ainsi que tous les pro58 ce propos, Jack Feuillet (1983, 25) dclare: le critre morphologique nest pas non plus

satisfaisant: certaines langues isolantes nauraient plus quune seule partie du discours; le franais runirait dans une classe unique adverbes, conjonctions, prpositions et interjections. Mais quel problme y a-t-il cela? On peut trs bien classer les units dun point de vue morphologique, puis dun point de vue syntaxique. Il est normal que les descriptions ainsi focalises regroupent en une seule classe des units dont on peroit intuitivement la disparit. Lerreur serait de vouloir demble mlanger les critres. 59 Voir 3.4.4.4 et 3.4.6.3. Dun point de vue syntaxique, les prpositions et conjonctions sont lies des fonctions particulires.

75

noms qui nentrent pas dans la classe prcdente, mais comportent des marques de genre et de nombre (ce qui exclut en, ici, la, etc.). Quant aux adverbes, ils regroupent les traditionnels adverbes (alors, pourtant, etc.), mais aussi les prpositions (de, a, etc.) et conjonctions (se, quand, ou, etc.) qui nentrent pas dans la classe des pronoms (comme le relatif qui). La classe comprend galement les adverbes pronominaux, auxquels nous avons refus le statut morphologique de pronom. c. Ncessit de la mise en contexte. La classication des lexmes en langue reste cependant impossible raliser sans observer les faits de discours et sans oprer des commutations. Ce sont les phnomnes daccord qui, cet gard, sont les plus rvlateurs. Ainsi, les catgories supportes par un mot ne portant pas de dsinence peuvent tre dceles quand il est accord avec dautres mots. Par exemple, le mot pais est indclinable, mais une attestation du type
le60 pais ki est faite entre mon signor le veske de Liege [. . .] et Waleran (Document 12370916, 2).

permet de constater (par laccord du participe pass de faire) que pais supporte en loccurrence les catgories du fminin et du singulier et est donc un nom et non un adverbe.

3.4

Description analytique de lancien franais des chartes

Poursuivons notre analyse partir des units donnes (3.1.2). Aprs avoir class les mots et la manire dont ils sont construits, essayons de comprendre comment les textes fonctionnent, en descendant progressivement dans la hirarchie des structures pour revenir au mot. Nous aurons ainsi, par une dmarche dductive, examin les relations tous les niveaux entre nos deux units de base, qui constituent les bornes de lanalyse prsente dans cette section. Cest Louis Hjelmslev que lon doit la formulation limpide du principe danalyse dductive (ou analytique) en linguistique:
Le seul procd possible pour dgager le systme qui sous-tend ce texte61 est une analyse qui considre le texte comme une classe analysable en composantes; ces composantes sont leur tour considres comme des classes analysables en composantes, et ainsi de suite, jusqu exhaustion des possibilits de lanalyse. [. . .] La linguistique contemporaine [. . .] a dsign ce procd, et dautres plus [22] ou moins analogues, du terme de dduction. (Hjelmslev 1968, 2122).

La premire subdivision du texte, ainsi que toutes les divisions ultrieures, consistent en linventaire des units de niveau hirarchique directement subordonn. Les units rsultant de chaque division ont un statut similaire par rapport cette dernire. Si le dcoupage du texte isole des noncs, tout segment rsultant de cette division devra tre considr comme un nonc. Pratiquement, cela signie quil nest
60 En dialecte ligeois, dont la scripta laisse parfois paratre des traits (Remacle 1948), larticle

dni est picne.


61 Cest--dire celui qui est donn au linguiste (3.1.2.1).

76

pas possible disoler des segments qui, bien que ntant pas des noncs (comme des syntagmes, par exemple), soient de mme niveau que des noncs. Pour des raisons qui apparatront dans lexpos, nous ne pourrons appliquer rigoureusement la dmarche dductive notre corpus. Notre recherche de solutions pratiques sera parfois incompatible avec cette position thorique. Du point de vue de llgance de lanalyse, cela est bien dcevant, mais il ne peut en tre autrement. Nanmoins, il nous a sembl pertinent dorganiser notre expos de manire analytique. La description analytique de la langue des chartes met en vidence quatre types dlments signicatifs, jouant quatre niveaux dintgration diffrents. En premier lieu, nous analysons la manire dont le texte est dcomposable en noncs. Ce niveau dintgration ne relve pas de la syntaxe, mais permet den dnir les limites. Il fera lobjet du premier dveloppement, qui sera loccasion de dnir la phrase par rapport lnonc (3.4.1). Au niveau dintgration situ directement endessous de la combinaison des noncs intervient la constitution de la phrase-nonc, organisant les termes autour dun noyau verbal, organisation qui relve de la syntaxe de la phrase,62 que nous avons qualie dargumentale (3.4.2). Vient ensuite le niveau de la construction du noyau verbal (3.4.3) et de ses grands constituants arguments, o des moyens morphosyntaxiques sont mis en uvre pour clarier ou spcier la relation quils entretiennent avec le verbe (3.4.4). Les noncs qui ne sont pas des phrases ne pourront tre analyss de la mme manire (3.4.5). Enn, lagencement de constituants dans un cadre indpendant du procs exprim cest-dire les faits de syntaxe proprement immdiate (voir galement 3.2.3.1) constitue le dernier type de niveau dintgration (3.4.6). Une fois cette hirarchie prsente, il restera aborder les phnomnes et problmes danalyse gnraux quon peut rencontrer tous ces niveaux (3.4.7). 3.4.1 Du texte la phrase, en passant par lnonc

En guise de premire approche, nous dirons que le texte se compose dune succession dnoncs et que la premire tape de lanalyse consiste distinguer ces derniers les uns des autres. Pour commencer, voyons en quoi il est impossible de procder de manire purement analytique pour faire ce premier dcoupage. Nous opposerons lnonc la phrase, ce que nous naurions pu faire jusqu prsent (3.4.1.1). En dnissant la phrase de manire empirique, nous distinguerons les noncs qui sont des phrases de ceux qui nen sont pas (3.4.1.2). Enn, viendra le dtail des rgles suivies pour rsoudre les problmes que pose cette premire tape dans la segmentation (3.4.1.3). 3.4.1.1 Dlimiter lnonc et la phrase: limites de la dmarche analytique

Avant daborder lanalyse syntaxique de la phrase-nonc, il faut trouver le moyen de segmenter le corpus de manire systmatique, laide de critres qui ne relvent idalement pas de lorganisation syntaxique de la phrase. Lintrt de lapproche est vident: exclure les faits syntaxiques du processus de segmentation permettrait dviter la circularit. Il parat donc logique de dire:
62 Voir 3.2.3.1.

77

[L]a dcomposition du texte en phrases ne saurait se faire sur le modle de la dcomposition de la phrase en ses units infrieures. (Soutet 1998, 8).

La question qui se pose videmment demble est de savoir comment dlimiter les units intgres pour former le texte, sans se servir de ce quelles contiennent pour procder.63 Les tenants de la glossmatique prconisent ainsi le recours la prosodie pour dterminer les contours de la phrase:
Le point de dpart dune procdure analytique est la phrase du contenu, dnie par son rapport avec la modulation [cest--dire la prosodie]. La matire premire de la syntaxe est donc un inventaire de toutes les units de la langue qui peuvent jouer le rle de phrase. (Togeby 1965, 62).

Mais cette faon de faire pose problme. En effet, si lon nhsite pas faire de lintonation une proprit de lobjet recouvert par le concept dnonc,
[. . .] une production linguistique accepte par les locuteurs natifs comme complte et possdant une intonation reconnue comme lie ce fait. (Hagge 1999, 27).

de manire gnrale, lnonc ne correspond toutefois pas forcment la phrase. Prenons un exemple moderne (pour viter de compliquer lexpos): les segments La porte! ou Magnique! prononcs dans des situations adquates sont considrs comme des noncs suivant la dnition donne prcdemment (3.1.3.1 a) , mais ils obissent des rgles de formation diffrentes de celles mobilises pour construire Ferme la porte, il fait froid! ou Cette plante est magnique!, quon considre gnralement comme des phrases.64 Lintonation peut donc se rvler impropre dlimiter les phrases. Comme le dit Andr Martinet (1979, 1.25),65
Il sy ajoute souvent une courbe de la mlodie du discours avec monte initiale et descente nale, par exemple, dans la phrase deux prdicats coordonnes Il est venu, puis il est reparti. Il peut y avoir contradiction entre lunit assure par les relations internes et celle que suggre la mlodie du discours; dans Il pleut. . . Je ne sors pas, par exemple, avec la monte initiale de la courbe et descente sur la nale, la mlodie suggre une seule phrase. Mais labsence de marque de liaison entre les deux parties de lnonc nous amne interprter cet nonc comme compos de deux phrases.

Cependant, cette prosodie est inaccessible; et se servir de la ponctuation pour dlimiter les phrases serait une faute de mthode agrante dans une recherche qui vise prcisment tablir les conditions et modalits dune telle corrlation. Le regard autonomiste sur la langue crite rend utopique la dmarche proprement dductive. Il nest pas possible de dlimiter les noncs laide dindices qui leur seraient tous ext63 La dmarche analytique linterdit en effet: [Des] linguistes amricains, comme Bloch et

Haas, emploient apparemment la dmarche analytique, mais en ralit la procdure inverse, toute unit tant dnie par ses parties: major sentence, par exemple, par le fait de contenir nal clause, clause par predicate, predicate par inected expression. (Togeby 1965, 61). 64 Ces noncs syntaxiquement achevs [les phrases] se distinguent par l dnoncs qui le cas chant savrent peu prs quivalents en tant que vhicules dun message donn dans une situation de communication donne, mais ne se prtent pas aux mmes transformations. (Creissels 1995, 33). 65 Et, pareillement, Leonard Bloomeld (1970, 161).

78

rieurs. Nous sommes forc de les situer par rapport aux constituants quils contiennent ou ceux qui sont intgrs dautres phrases: pour dterminer ltendue dune unit syntaxique, on a le plus souvent besoin de connatre les limites de ses constituants et de comprendre les relations que ces constituants entretiennent. Nous devons nous rsoudre dlimiter lnonc et la phrase de manire empirique, laide des constatations des grammairiens de lancien franais. 3.4.1.2 Phrases-noncs et noncs non phrastiques

Devant cette difcult, nous dnirons la phrase de manire empirique comme lnonc correspondant la phrase verbale traditionnelle (a), lopposant ainsi aux constructions qui nont pas cette particularit (b). a. Dnition empirique. Pratiquement, dlimiter les noncs ne serait pas chose aise si lon ntait aid par une observation empirique essentielle. Les philologues et linguistes de lancien franais ont en effet remarqu que, pour reprendre les termes traditionnels, la phrase tait le plus souvent verbale, cest--dire fonde sur un verbe conjugu un mode personnel (quon nommera prdicat par commodit), ce qui correspond un verbe portant des marques de la catgorie de la personne (3.3.3):
La phrase sans verbe est rare en AF dans la langue littraire. On la trouve surtout dans la langue parle66 (ordres, exclamations) et dans le style concis des maximes et des proverbes. (Mnard 1994, 203).

Au vu des exemples relevs dans les grammaires, les phrases non verbales sont employes dans des situations dnonciation trs spciques, ou sont insres dans des discours o elles ont une place prdtermine. Grard Moignet (1988, 97), qui ne donne comme exemple de phrase non verbale que la phrase nominale, cite deux exemples de proverbes:67
Les mors as mors, les vis as vis. (Perceval, 3630). de bien fait col frait [=rompu]. (Renart, 9518).

ainsi que quatre exemples dexclamation


quel mal, quel duel, quel felonie quen tel guise estes perie! (Pir. Tisb, 722). Le vin afor [= mis en perce] de nouvel. . .! (S. Nic., 642). Hareu! le leu! le leu! le leu! (Robin et Mar., 603). Escaper, li l a putain! (S. Nic., 442).68

On sattend ce que limmense majorit des phrases rencontres soient verbales. Il est donc lgitime de partir de la phrase verbale pour commencer segmenter le
66 Cest--dire dans la reprsentation crite que les textes livrent de la langue parle. 67 Nous modions la typographie. Claude Buridant (2000, 69) cite une partie de ces mmes

exemples et des suivants.


68 Grard Moignet souligne quil sagit ici dun cas sujet.

79

texte, pour peu quon ne lui assigne pas une structure a priori qui fausserait lanalyse.69 Dune certaine manire, la dmarche, contrainte par la difcult inhrente aux matriaux, se rapproche de celle dAndr Martinet (1979, 1.25, nous soulignons):70
On appelle phrase lensemble des monmes qui sont relis par des rapports de dtermination ou de coordination71 un mme prdicat ou plusieurs prdicats coordonns.

Pareille approche nest pas si loigne de celle de Lucien Tesnire, qui faisait du verbe le nud des nuds (3.2.1). Si lon conserve la dnition de lnonc telle quelle a t donne ci-dessus (3.1.3.1 a), ce nest pas la prsence ou non dun verbe chi un mode personnel qui dtermine si un segment linguistique employ dans une certaine situation signie quelque chose et est profr selon une vise communicative particulire: seul le point de vue morphosyntaxique se doit de rendre compte de cette diffrence avec une phrase verbale. Par souci dconomie, les phrases verbales tant majoritaires, nous rserverons dsormais lemploi du terme phrase ces dernires. Nous distinguerons ds lors: des noncs qui sont des phrases (phrases-noncs); des noncs qui ne sont pas des phrases (noncs non phrastiques). Le mot phrase renverra donc une certaine forme dorganisation morphosyntaxique, o le procs est exprim laide dun lexme de nature verbale (3.3.3.1) conjugu un mode personnel et o le reste des constituants sorganisent autour de lui. La proprit fond sur un verbe conjugu un mode personnel permet de dlimiter lintension de la phrase lintrieur de celle de lnonc. La consquence pratique de cette conception est que nous considrons quaucun nonc nest constitu de plusieurs phrases. En vertu des principes exposs, le texte suivant72 est aisment divis en noncs distincts (que nous avons, selon lusage moderne, spars par des points):
*Nos fasons connissance de veriteit. Sacent tuit cilh qui sunt et qui a_venir sunt que, par devant nos, vinrent Elyas com dist li Coens, dame Lyse, sa feme, Frankes Brebenchons et Lowis, dune part, et freres Pieres, dautre. La conurent ilh, Elyas, dame Lyse, sa feme, Frankes et Lowis desoure nomeis, que de la quarte partie des wendes noves com dist de la Costerie, avoient fait don et vesture a frere Piron devant nomeit. Si orent en_covent par devant nos Elyas, dame Lyse, sa feme, Frankes et Lowis que jamais nen iroient encontre cele vesture que ilh avoient fait. Par ce que ce soit plus ferme cose et plus estable avons a ceste presens letres pendut nos saieaus en tesmongage de veriteit. Ce fu fait lan del Incarnation Nostre Saingnor m cc lx et set, le joedi aprs le Grant Quareme. (texte articiel construit en simpliant Document 12680301)

Seule une dmarche synthtique (et le recours aux structures examines dans les sections suivantes) permettrait de pallier le manque dune connaissance intuitive de la langue et laisserait juger de la compltude dune structure. Dans les constructions

69 Comme le schme de rcriture gnrativiste P SN + SV (Feuillet 1988, 7781). 70 La question de la coordination sera aborde ci-dessous, 3.4.7.2. 71 Voir 3.4.1.3 et 3.4.7.2 ce sujet. 72 Lexemple a t fortement simpli pour les besoins de lexpos. Aucun texte du corpus ne

pourrait tre aussi facilement segment.

80

suivantes, qui constituent des phrases-noncs, on voit que chaque n dnonc est marque par le dbut du suivant, et vice versa:73 1. Nos fasons connissance de veriteit. 2. Sacent tuit cilh qui sunt et qui a_venir sunt que, par devant nos, vinrent Elyas com dist li Coens, [3] dame Lyse, sa feme, Frankes Brebenchons et Lowis, dune part, et freres Pieres, dautre. 3. La conurent ilh, Elyas, dame Lyse, sa feme, Frankes et Lowis desoure nomeis, que de la quarte [6] partie des wendes noves com dist de la Costerie, avoient fait don et vesture a frere Piron devant nomeit. etc. Intuitivement, on remarque dj que les propositions subordonnes de la grammaire traditionnelle sont structures de manire similaire aux phrases.74 b. noncs non phrastiques. Le cas des noncs non phrastiques ne complique pas vraiment les choses. la suite dune division du type de celle qui vient dtre expose, les segments quon ne peut voir comme des phrases pour des raisons morphologiques font forcment partie de la deuxime catgorie dnoncs, puisque chaque segmentation isole des units de mme niveau.75 Le protocole76 prend souvent la forme dun nonc non phrastique, comme:
A_tos ceas qui ces presens letres veront, li homme delle Cise Deu, salus et conoiestre verit. (Document 12671022, 1).
[2]

Celui-ci reste inanalys quand les phrases ont toutes t identies. En outre, les chartes sont des documents fortement formaliss, et on remarque vite que les noncs non phrastiques sont quasi toujours localiss au dbut (protocole) ou la n du texte (seing notarial). De plus, le contenu informatif limit de ces noncs concorde tout fait avec les observations des grammairiens: lnonc non phrastique est limit en ancien franais des situations nonciatives ou textuelles spciques. Seules les anacoluthes, exceptionnelles, nentrent pas dans le canevas. La tradition juge gnralement quil sagit derreurs. Elles pourraient tre problmatiques, parce que, contrairement aux noncs non phrastiques normaux, il ne serait pas possible den prvoir lapparition. Il y a parfois lieu de relativiser ce point de vue. Le corpus ne livre que trois cas:77
A toz cheaz et a totes celes a cui ces amoines ki en ceste chartre sunt escrit nunt ilh soulement fours ke lor vie en recherrunt [26] totes en Robermont (Document 124706, 25).
73 Voir nanmoins le problme des incidentes, sous 3.4.4.5 b. 74 Voir 3.4.4.5 et 3.4.6.4 pour les diffrents emplois de ces subordonnes. 75 Cf. p. 76. 76 Dbut du texte dune charte, reprenant de manire strotype une ou plusieurs des informa-

tions et formules suivantes: invocation (formule par laquelle lacte est mis sous la protection divine), suscription (mention de lautorit de qui la charte est mane), adresse (public vis), salut (formule de salut). On parle galement de protocole initial (Guyotjeannin et al. 1993, 7276). 77 Il est ncessaire de citer intgralement le contexte qui prcde. Le dbut de la phrase qui suit la construction interrompue est soulign.

81

Saicent trestuit cilh ki sunt et ki a_venir sunt ke de [3] conten ki astoiet entre la maison de_le Vas Benoite dels Liege, del ordene de Citea, dune part, et Facin [4] de Ceris, datre part, endroiet dune terre ke cilh Facin clamoiet devant le maor et les enskevins de [5] Ceris, de cui cille terre devoiet movoier, encontre la maison de la Valz Benoiete devant dite; la quele [6] maison de la Valz Benoiete et cilh Facins se misent en nos, Lowi et Tiri, devant le maor et les enskevins [7] de Ceris quilh tenroiet de hat et de bas che ke nos dirins [. . .] (Document 12600509, 2). Nos faison a savoir ke nos, arbitre enliut de_le contraversion ki estoit entre me damme labesse de Robert-mont et le co-[4]-ven, dune part, et le saignor Gerar de Hermees, chevalier, dautre part, sor chu ke mes sires Gerars de Hermeeis deman-[5]-doit sor les masuiers labesse devant ditte et le covent, mainent a Hermeeis sor laluez labesse et le covent devant_dit, [6] forche et resteal et corrueie. Et nos, li arbitre desor nomeit, presiens en_nos le fais del arbitre [. . .] (Document 12630331, 3).

Le premier cas est effectivement peu orthodoxe, puisque deux pronoms relatifs sont employs pour un seul verbe personnel. Commentons les deux autres, qui sont fort semblables. Tout dabord, on pourrait penser que lerreur consisterait en ce que ces propositions sachvent toutes brutalement aprs un trs long constituant complexe contenant une ou plusieurs subordonnes. Nanmoins, le constituant en question exprime le thme, et toutes ces anacoluthes ont lieu dans une proposition qui a fonction de complment par rapport au verbe de la notication (savoir ou conoistre). Or, cette position particulire correspond lendroit o dbute la partie du discours diplomatique quon nomme expos.78 Il est remarquable que la limite entre la notication et lexpos soit un point de rupture important dans la structure du document diplomatique. Nanmoins, dun point de vue morphosyntaxique, cette rupture nest pas marque par le dbut dune nouvelle phrase.79 Le nombre dattestations trs rduit ne permet pas davancer de conclusion gnrale, mais nous ne serions pas tonn de rencontrer dautres cas danacoluthes cet endroit particulier du texte. Dans ce cas, la structure ne devrait plus tre considre comme irrgulire, puisquelle serait prvue par la texture (3.1.2.1 b). 3.4.1.3 Enchanement des noncs phrastiques

Devant un segment qui contient plusieurs verbes conjugus un mode personnel, il nest pas toujours facile de dcider si lon a affaire une seule ou de plusieurs phrases. Les phnomnes de subordination (au sens traditionnel), abords plus loin (3.4.4.5 et 3.4.6.4), sont gnralement en dehors du problme.80 Les phnomnes de coordination interfrent bien plus au niveau qui nous occupe.81 La sparation dnoncs
78 Lexpos est un rcit [. . .], soit de type historique, relatant par exemple les origines et les

dbuts dune abbaye, ou exposant les origines et les motivations dune donation, soit de type judiciaire, racontant les raisons dtre dun procs ou les diffrentes tapes dj effectues. (Guyotjeannin et al. 1993, 79). 79 Voir Mazziotta 2007b. 80 On admet gnralement que la subordination implique une hirarchisation; il ny a alors quune seule phrase. 81 Ces phnomnes jouent tous les niveaux dintgration syntaxique suprieurs au mot. Nous les approfondirons aprs avoir dtaill lorganisation de ces environnements argumental et

82

qui paraissent coordonns par et est expliqu en premier lieu (a). Dautres cas difciles sont abords ensuite: les constructions paratactiques (b) et les incidentes (c), sans toutefois les dtailler car lexpos de leur traitement mobilise de nombreuses notions quil faudra dnir exactement. a. Le mot et et la coordination des noncs. Les cas dnoncs phrastiques discuts ci-dessus ne sont cependant pas les plus frquents; on pourrait mme dire quils reprsentent une vision des choses tellement simplie quelle ne correspond absolument pas la ralit. En effet, la plupart du temps, les chartes enchanent des segments qui commencent (ou sont prcds, suivant le point de vue) par le mot et, que les grammairiens classent parmi les conjonctions de coordination. Cette citation de Grard Moignet (1988, 330331) permet dentrer dans le problme:
Et, qui peut coordonner les phrases entre elles, peut aussi gurer en tte dune phrase sans constituer une coordination syntaxique [331] avec lnonc prcdent, ni appeler une phrase suivante coordonne. Il traduit alors un mouvement affectif, un enchanement vif [. . . ].

Les exemples que Grard Moignet donne du dernier emploi ne posent pas de problme car le et quils contiennent gurent en tte dun nonc qui se caractrise par un changement dnonciateur; par exemple, (cf. 1988, 331):
[. . .] Et il respont que nenil. Non? fet ele; et ge le vos dirai en tel maniere que ja ne vos mentirai de mot (Mort Artu, 77, 13).

Lnonciateur de lincise fet ele (le narrateur) nest pas le mme que celui de et ge le vos dirai. . . (un des personnages). Malheureusement, les choses sont loin dtre toujours aussi claires. Si lon essaye de relever toutes les valeurs que peuvent avoir ces occurrences initiales de et, on obtient rapidement une liste longue, abrge ici (cf. Mnard 1994, 194 et 196):82
a) Et reliant des principales ou des indpendantes. 194. [. . .] 1. [La conjonction et] semploie avec valeur temporelle ou conscutive au sens de et alors, et ensuite, et donc. [. . .] 2. Elle marque une addition insistante, avec la valeur argumentative de et qui plus est, et de surcrot. [. . .] 3. Elle introduit une opposition au sens de et pourtant, mais. [. . .] c) Et initial de phrase [. . .] 196. [. . .] 1. Et nest pas rare, notamment dans les textes en prose, pour indiquer un enchanement temporel, amorcer un nouvel pisode, ou bien servir de transition en ouvrant une digression ou en revenant au sujet. Certains crivains abusent parfois de cet et initial de phrase. [. . . ] 2. Chez les bons crivains, et est une attaque de phrase charge de vivacit qui introduit des propos au style direct ou qui dtache de manire expressive lintervention dun nouveau personnage dans le rcit.

immdiat (3.4.7.2), mais il nest pas possible de travailler sur la proposition sans rgler pralablement le problme ce niveau, en raison de la frquence importante du phnomne. 82 Les passages lids contiennent une partie de la numrotation.

83

On pourrait se demander si les valeurs accordes et ne sont pas extrapoles du rapport qui unirait les noncs entre lesquels il se trouve mme sil ntait pas prsente. Par ailleurs, les emplois du type relev par Philippe Mnard au 196, 1 correspondent la diversit des emplois dans les chartes, cest--dire une sorte de catgorie fourretout.83 Et ne ferait ds lors quexpliciter une limite, et non une valeur. Cette coordination des noncs est extrmement frquente. Le texte qui suit, choisi pour sa brivet, est reprsentatif de la forme que prennent habituellement les textes (les et impliqus sont souligns):
Je, Ermesens, contesse de Lucemborg, faz savoir a touz ceaus qui ces lettres [2] verront que de sis_cent mars de ligois, que messires Robers, par la grace de [3] Deu eveskes de Liege, dovoit a moi et a mon l Hanri, a il fait bon [4] paement et entier, et nos en tenons a pai, et en aquittons touz nos [5] pleges. En tesmongnage de ce, li doing je mes lettres saelees de mon sael, [6] que furent faites le jor del Assumption Nostre Damme, quant li miliares coroit par [7] m et cc et xl trois ans. (Document 12430815).

Prenons position: tout dabord, en suivant un principe de simplicit, il nous a paru raisonnable de considrer quil ny a jamais de coordination syntaxique de deux noncs. La construction Je, Ermesens, contesse de Lucemborg, faz savoir a touz ceaus qui ces lettres [2] verront que [. . .] (Document 12430815) cite ci-dessus est trs courante. Aucune marque grammaticale ne permet de se prononcer quant lventuelle coordination de toutes les propositions introduites par et dans la suite du texte, qui seraient dans ce cas toutes des subordonnes. Lambigut ne peut tre leve et il parat tout aussi difcile de trancher dans un sens ou dans lautre. Pour simplier lanalyse, il nous a paru intressant de considrer quil sagissait de principales. Dans cette optique, lanalyse de la charte Document 12430815 se fait comme suit (la double barre spare les noncs):
Je, Ermesens, contesse de Lucemborg, faz savoir a touz ceaus qui ces lettres [2] verront que de sis_cent mars de ligois, que messires Robers, par la grace de [3] Deu eveskes de Liege, dovoit a moi et a mon l Hanri, a il fait bon [4] paement et entier, || et nos en tenons a pai, || et en aquittons touz nos [5] pleges. || En tesmongnage de ce, li doing je mes lettres saelees de mon sael, [6] que furent faites le jor del Assumption Nostre Damme, quant li miliares coroit par [7] m et cc et xl trois ans. (Document 12430815).

Compte tenu de cela, et sachant que lancien franais est une langue dans laquelle une phrase est correcte sans quaucun constituant autre que la exion verbale nexprime le sujet (voir p. ex. Mnard 1994, 55), nous avons spar en deux phrases ce segment (la sparation est marque par deux barres verticales):
Et por ce [12] ke ce soit ferme et stable, avo_nos a ce letres pendut nostre saeal. || Et avons priet mom le veke ke ihl i_metit le sin. (Document 123605, 11). [. . .] se ihl vendre le voloit ne sez hoirs aprs, li_glise laurat dev ant t oz achators. || Et si en_donroit tant com ele varoit [9] solon ce ke un_vent terres en ce-lui pais. (Document 123605, 8).
83 On pourrait faire les mmes remarques au sujet de la liste fournie par Claude Buridant, que

ce soit dans son tude sur les rapports de et et la ponctuation (Buridant 1980) ou dans sa grammaire (Buridant 2000, 449451).

84

nonc @unit linguistique complte @transmet un message @suit une stratgie nonciative nonc phrastique (= phrase) @fond sur un verbe un mode personnel nonc non phrastique @non fond sur un verbe un mode personnel

F IG . 3.16 Types dnoncs en fonction de leur structure morphosyntaxique

On y voit clairement que la prsence ou non du sujet84 na rien voir avec la division en noncs. Il se peut nanmoins quun indice grammatical soppose de manire premptoire ce type de dcoupage, comme le mode du verbe ce qui narrive pratiquement que pour les subordonnes, (3.4.4.5 et 3.4.6.4). Ainsi, on conviendra quil nest pas judicieux de sparer les subordonnes que li ez fust si petis [. . .] et point de terre nen tenist dans la phrase:
et silh truvent par [9] vert que li ez fust si petis quil ne fust m ie honoirs le conte quilh le tenist del [10] veske u point de terre nen tenist, li veskes li doit amender [. . .] (Document 12361215, 8).

Le mode de leur verbe principal indique leur dpendance par rapport la prdication principale. Pour viter toute incohrence, les rapports smantiques qui justieraient la subordination ont t ignors. Pareillement, le rapport unissant certains complments circonstanciels deux principales coordonnes nest pas li des marques grammaticales (3.4.7.4 a). b. Parataxe. La parataxe (au sens traditionnel) est une subordination qui nest pas exprime par une marque segmentale. Nanmoins, lenchssement de la structure et les informations vhicules par la valence du lexme verbal aident toujours dceler une subordination. On ne rencontre ces parataxes quen syntaxe immdiate (3.4.6.4 c). c. Incidentes. Les discussions terminologiques autour du terme incidente85 obligent en prciser lacception: un nonc complet enchss dans un autre sans quaucune marque segmentale nexprime de rapport de dpendance. Contrairement aux structures paratactiques, les incidentes sont des noncs qui pourraient tre autonomes, et non des propositions (3.4.4.5 b). 3.4.1.4 Synthse de la segmentation du texte en noncs

Dans cette premire tape de lanalyse, nous avons t amen distinguer deux types dnoncs, suivant quils obissent aux rgles de construction des phrases ou non (gure 3.16). Mme si la base de lanalyse repose sur des choix pratiques, au terme de lexpos, nous pouvons formuler des rgles de dcoupage qui sappliquent facile84 Voir 3.4.2.2 ci-dessous pour une dnition du terme. 85 Pour la distinguer notamment de lincise; voir les diffrentes options recueillies par Marc

Wilmet (2003, 693).

85

ment de manire systmatique. Lanalyse prend appui sur la dnition de la phrase et sur les deux principes empiriques suivants: 1/ chaque verbe principal implique la prsence dune phrase; 2/ la coordination de phrases nexiste pas. Ces principes sont poss comme pralables tout le reste de lanalyse; nous nen changerons plus dans la suite de lexpos. Toutes les structures laisses inanalyses par cette tape du dcoupage, qui correspondent des squences particulires prvues par le type de texte (protocole, seing notarial), sont des noncs non phrastiques. Dun point de vue morphosyntaxique, les deux types dnoncs sont profondment diffrents. Nous les tudierons donc dans des sections spares: nous verrons dabord comment la phrase est construite (3.4.2 et s.) et de quoi se composent ses constituants immdiats avant de nous pencher plus brivement sur les noncs non phrastiques (3.4.5). 3.4.2 Subdivision de la phrase et structure argumentale

De notre point de vue, lexpression du procs par un verbe conjugu un mode personnel est la condition dexistence de la phrase-nonc et en constitue la part irrductible. Nous pensons quil est possible denvisager la description du reste des constituants de mme niveau dintgration syntaxique en caractrisant le rapport qui les unit ce verbe. Nous nommerons ainsi arguments les constituants immdiats de la phrase lorsque nous les considrons au travers de ce rapport avec le verbe principal, auquel nous donnerons le nom de prdicat (que nous dsignons par le sigle P0).86 Cette conception est similaire celle de Lucien Tesnire, o le verbe est vu comme le nud par excellence, le centre vers lequel convergent toutes les relations de la phrase (3.2.1). La prsence dun prdicat et de ses arguments (point de vue syntaxique), exprimant ensemble un procs, ses participants et son cadre (point de vue smantique) lintrieur dune structure syntaxique, est la condition pour quon puisse parler de proposition. Celle-ci est donc une construction centre sur un prdicat, un constituant de nature verbale, capable dexprimer de manire grammaticalise les catgories de temps, mode et aspect (3.3.3.1). Partant, la phrase nest donc quune proposition qui fonctionne comme un nonc. Aprs avoir montr comment, dun point de vue gnral, le prdicat organise les relations argumentales (3.4.2.1), on verra comment employer cette proprit gnrale pour classer les arguments des propositions rencontres dans les chartes (3.4.2.2 3.4.2.4). Les diffrents types de relation que le classement des constituants a mobiliss seront abords en guise de synthse de ces principes de description (3.4.2.5). 3.4.2.1 Relations argumentales: gnralits

Dans un premier temps, nous aborderons les relations entre les arguments et le prdicat de la proposition qui constitue la phrase. Ces relations grammaticales expriment des relations smantiques dune manire conventionnelle (a). Cette convention qui, pour un lexme verbal donn, lie une certaine organisation smantique des partici86 Voir la note 96, p. 89, sur le choix de ces termes.

86

pants une certaine forme dexpression morphosyntaxique (domaine des marques, b) permet de dire que les relations smantiques constituent un premier indice de lorganisation purement morphosyntaxique (c). a. Le schma argumental comme reprsentation grammaticale de phnomnes. La langue offre ses locuteurs la possibilit de communiquer propos du monde qui les entoure: il existe une relation entre les points de vue morphosyntaxique et smanticorfrentiel. Cette constatation se rsume ainsi:
La phrase exprimant un certain tat des choses, [l]es relations grammaticales expriment, et retent dans une certaine mesure, les relations perues entre les choses ou les tres participant cet tat des choses. (Lazard 1994, X).

Il existe une cohrence entre les deux organisations. Dune part, certains marqueurs expriment les relations smantiques qui unissent le procs (entendu ici au sens le plus gnral87 ) et les participants; dautre part, le prdicat une forme morphologiquement spcique, puisquil sagit dun verbe exprime le procs. Or, nous avons dj constat (en n de 3.2.3.1) que la exion nominale (dclinaison) vhiculait des informations dont la teneur ne pouvait tre dcrite sans mettre en relation les units en prsence. Ainsi, les marqueurs morphologiques permettent dinterprter correctement un nonc comme:
La afaita Werris devant diz a sangor Arnult devant nomet ii verges (Document 12671029, 6).
[7]

et demie daluez

pour peu quon connaisse les conventions qui unissent la structuration grammaticale au sens.88 Bien sr, ces relations ne sont pas naturelles:
Si les relations syntaxiques au sein de la phrase ne sont pas sans rapport avec les relations perues dans le monde rel, il sen faut de beaucoup pour quelles en soient le reet pur et simple. Elles font partie du rseau complexe que constitue la structure grammaticale de chaque langue [. . .] (Lazard 1994, X).

Pour cette raison, il parat beaucoup plus rigoureux de dnir les arguments en fonction de leur forme dexpression spcique au systme de la langue et non de leur contenu.89 b. Classement morphosyntaxique des actants et notion dorientation. Gilbert Lazard dnit dun point de vue gnral les diffrents types darguments. Il se sert pour cela de critres purement morphosyntaxiques et aboutit un classement n. Il distingue en effet une srie darguments, quil nomme actants, lis au prdicat par des contraintes formelles (1994, 6880): lactant obligatoire,90 pour lequel la contrainte est la plus forte et dont la prsence est la condition ncessaire toute prdication; les actants
87 Nous reprenons la position de Claude Hagge (1999, 46, note 8): Ce terme recouvre donc

ici, par convention, la totalit des situations, y compris celles quon pourrait juger trop peu dynamiques pour tre appeles des procs. 88 Ce que Robert-Lon Wagner souligne au dbut de ses conclusions sur les limites dune grammaire de lancien franais (1974, 55). 89 Voir les problmes exposs dans Lazard 1994, 6468 et dans Creissels 1995, 203210. 90 Gnralement unique daprs lauteur.

87

la fois requis et rgis, dont le verbe requiert la prsence et impose la forme (p. ex., verbes ncessitant un objet indirect introduit par de); les actants seulement rgis, dont la prsence nest pas ncessaire, mais dont la forme est xe par le verbe (du type sa dulcine dans penser sa dulcine); et enn les adjets,91 requis, mais non rgis (donc, de forme libre) et en outre cumulables. Il y a donc des marques morphologiques (exion) et segmentales (adpositions) qui permettent dvaluer la distance syntaxique des actants par rapport au verbe. Ces contraintes de marquage sajoutent la contrainte de prsence, qui ne suft pas pour aboutir un classement comprhensif des arguments.92 Outre ces actants, Gilbert Lazard parle de circonstants, qui nont dautre lien avec le prdicat verbal que celui sans lequel ils ne feraient pas partie de la phrase (1994, 81). Ces arguments ont comme particularit dtre de forme libre par rapport au prdicat et dtre suppressibles sans nuire la grammaticalit de la phrase. Comme nous travaillons sur lancienne langue, nous ne pouvons caractriser les arguments en fonction du fait quils sont requis ou non par le prdicat (3.1.3.3). Nanmoins, puisque la taxinomie propose par Gilbert Lazard est fonde sur la comparaison de nombreuses langues dans une optique de linguistique gnrale, il ny a pas de raison quelle ne trouve pas un cho dans le fonctionnement de lancien franais. Nous ne transposerons pas les concepts dnis par Gilbert Lazard dans notre systme de notation, mais nous emploierons son classement comme hypothse de travail. Si lon essaye de mettre explicitement en relation les contraintes formelles (point de vue morphosyntaxique) et les participants et circonstances quelles expriment (point de vue smantico-rfrentiel), on constate assez vite que la connaissance du verbe et de son sens donne une ide prcise de la manire dont les informations smantiques sont vhicules par une forme dexpression spcique. Ainsi, en franais, pour les verbes pouvant avoir deux actants, en phrase active biactancielle, lactant obligatoire exprime lagent, alors que lautre actant exprime le patient. Cette association est nomme orientation par Alain Lemarchal (1989, 102):
Pour un verbe appartenant une sous-classe donne et une voix donne, des rles prcis dans la situation (agent, patient, destinataire, causateur) sont associs aux diffrents actants: en franais, un verbe transitif, donc au moins bivalent, lactif a un premier actant agent et un second actant patient: Bernard renverse Alfred. Lorientation dun verbe est cette caractristique qui associe aux diffrents participants en rapport avec lui la fois un rang dans la hirarchie [cest--dire une fonction syntaxique spcique] et un rle dans la situation, sachant que cette association est caractristique de la sous-classe et de la voix de la forme verbale. Ds quun verbe est bivalent, trivalent, etc., une forme verbale appartenant ce verbe associe des rles prcis la fois aux premier, second, tiers actant [. . .].

Lauteur poursuit en disant que le prdicat des propositions biactancielles a une orientation primaire vers lagent et une orientation secondaire vers le patient. Lorientation est gre par le systme de la langue, qui pose une srie de contraintes sur les diffrents actants. Ces contraintes spcient les relations unissant les arguments au prdicat.
91 Terme que Gilbert Lazard emprunte Jack Feuillet 1988, 147; voir Lazard 1994, 84. 92 Cest pourtant loption que suit Claude Hagge dans La structure des langues (1999, 37), en

ne posant que la distinction entre arguments nuclaires (requis) ou non.

88

Lorientation associe ainsi, dans le cadre dni par le verbe, une correspondance entre les rles smantiques et les marques, excluant donc les circonstants. Alain Lemarchal tend la notion toutes les parties du discours (entendues chez lui du point de vue de la smantique de la syntaxe). Voici lanalyse quil propose pour les noms en franais moderne:
On peut dnir une orientation primaire des nominaux par le seul jeu des propositions nominales, avec ou sans copule, et des procdures dapposition ou autres constructions pithtiques [. . .] ce mdecin est chef de clinique ce livre est un cadeau ce mdecin, un chef de clinique un mdecin chef de clinique ce livre, un cadeau un livre-cadeau

Dans tous ces exemples, les nominaux, substantivs ou non,93 sont coorients. Il y a coorientation entre mdecin et chef de clinique, livre et cadeau, aussi bien dans ce mdecin est chef de clinique ou ce livre est un cadeau (proposition nominale), que dans ce mdecin[,] un chef de clinique, un mdecin chef de clinique, ce livre[,] un cadeau ou un livre-cadeau (apposition). En rgle gnrale, lorientation primaire dun nominal se [110] dnit comme une dsignation de cet objet. (Lemarchal 1989, 109110).

Dans ce cadre tendu, la notion dorientation revt une valeur plus smantique. De lorientation des nominaux, nous retiendrons surtout la notion de coorientation, qui se dnit comme lorientation commune de plusieurs constituants vers la dsignation dun mme objet.94 c. La smantique comme indice des relations syntaxiques. On ne peut laborer toute la description syntaxique sur la base de critres smantiques. Cependant, lexistence de la correspondance entre la forme et le rle autorise faire usage de la smantique pour isoler les arguments, cest--dire segmenter la phrase en arguments. Pour lancien franais, il ny a de toute faon pas le choix (3.1.3.1). La relation qui existe entre un participant et le procs est, dans une certaine mesure, transposable sur le plan syntaxique.95 Cest le sens que nous donnons ici argument et prdicat:96 . Ainsi, le prdicat implique une srie de relations minimales (gure 3.17). En guise de premire valuation de la structure syntaxique, on peut simplement afrmer que chaque argument fonctionne avec le prdicat, quil y a entre eux une relation syntaxique minimale (3.2.1.2). Lanalyse rvlera peut-tre si cette relation est spcie (sur le principe de la spcication, 3.2.2.2).
La afaita Werris [. . .] a sangor Arnult devant nomet ii verges (Document 12671029, 6).
[7]

et demie daluez

93 Voir Lemarchal 1989, 4454, o lauteur expose ses vues sur la distinction entre les noms

et les substantifs.
94 Voir galement Lemarchal 1997, 128129. 95 En prsence de structures complexes, avec plusieurs prdicats hirarchiss, il est parfois

insufsant de se servir de la smantique, ne ft-ce que pour dtecter la relation minimale; voir le cas des innitives (3.4.4.6). 96 Et cest pour cette raison que le choix des termes semble dfendable: il y a une valeur logique sous-jacente lorganisation des constituants syntaxiques les uns par rapport aux autres.

89

relation
argument. . . argument. . . argument. . .

relation

prdicat

relation
F IG . 3.17 Relations smantiques marquant des relations syntaxiques constituant immdiat de la phrase @constituant immdiat @compris dans la phrase prdicat @verbe conjugu un mode personnel @dnote un procs

argument @dnote un participant ou le cadre du procs

F IG . 3.18 Principaux constituants immdiats de la phrase

Si afaita exprime le procs et Werris lagent, il y a de fortes chances pour que la relation smantique qui les unit soit rendue par une relation syntaxique. Par ailleurs, dun point de vue morphosyntaxique, la coocurrence dlments nominaux et verbaux dans la mme structure indique galement quil y a relation. Au niveau argumental, le concept de constituant immdiat97 est donc subdivis comme indiqu dans la gure 3.18. La qualication ultrieure des relations qui lient prdicat et arguments ne relve que du plan morphosyntaxique. Les units qui transportent le sens sont organises dun point de vue strictement interne au systme de la langue. Ce nest quune fois cette relation repre quon cherchera dterminer quelles marques morphosyntaxiques la spcient. 3.4.2.2 Actants et marques morphologiques

Nous venons de voir que, dun point de vue gnral, les types darguments se distinguaient les uns des autres en fonction des contraintes morphosyntaxiques auxquelles ils sont soumis. Nous dnirons ici une premire classe darguments, auxquels nous donnerons le nom dactants. La contrainte qui dnit ces actants est davoir une des formes du pronom personnel de la troisime personne ou de commuter avec lune delles. Cette analyse est inspire de ce que Gilbert Lazard expose propos de lemploi du pronom en franais moderne. Il considre: 1/ que les pronoms personnels gravitant autour du verbe sont des indices actanciels (que nous comprenons comme des marques grammaticalises de fonctions au niveau argumental); 2/ que la corrlation
97 Dni ci-dessus, voir 3.2.1.

90

avec des indices actanciels intra- ou paraverbaux est un critre de premier ordre pour la dnition des actants (Lazard 1994, 68). Voici son analyse:
Le franais, lui, a quatre sries [dindices actanciels],98 , dont trois sont illustres par (8a et b). (8a) Nobel a lgu ses biens lAcadmie sudoise (8b) Il les lui a lgus Dans (8b), la premire srie est reprsente par le morphme de la 3e personne du singulier dans le verbe (a) et le pronom conjoint [72] il; la deuxime srie lest par le pronom les et la marque de pluriel dans le participe (lgus); la troisime lest par le pronom lui. Dans (8a), la fonction actancielle de chacun des termes nominaux se laisse identier par la srie dindices actanciels avec laquelle ils sont en corrlation: Nobel est en corfrence avec le morphme verbal de la 3e personne du singulier et en distribution complmentaire avec il (1re srie); ses biens est en distribution complmentaire avec les (2e srie); lAcadmie sudoise est en distribution complmentaire avec lui (3e srie). (Lazard 1994, 7172).

Or, le paradigme de ce pronom na que peu vari depuis lancien franais. Il est possible que lanalyse propose par Gilbert Lazard convienne cet tat de langue. Tentons de le montrer progressivement. Nous verrons en premier lieu que le pronom personnel de la troisime personne associe un rle spcique chacune des formes de son paradigme (a), ce qui peut tre employ pour dnir les relations syntaxiques liant ce pronom au prdicat (b). Nous tendrons ensuite ces conclusions aux constituants qui commutent avec ces formes pronominales (c), avant daborder des cas particuliers (d et e). a. Formes du pronom et rles smantiques. Lancien franais est dj une langue en grande partie analytique, et la dclinaison y exprime un nombre relativement restreint de relations. De plus, le foisonnement des paradigmes limite son efcacit. Toutefois, le pronom personnel de la troisime personne (il ou elle) offre encore un potentiel exionnel riche et apte exprimer un certain nombre de rles de manire univoque. Les grammairiens saccordent pour reconnatre trois formes au masculin singulier: il, le, li, qui sont les formes de base du pronom.99 Les formes le et li alternent avec une forme dite forte (lui), en fonction de contraintes squentielles par rapport au prdicat100 ou aux prpositions. Comment lancien franais met-il en relation ces formes de base avec les rles smantiques jous par les participants? La forme il correspond gnralement lagent de la phrase active bi ou triactancielle; de mme, on la retrouve comme actant de la phrase uniactantielle:
nos avons fait homages [3] a no signeur Robert [. . .] des ez de Natoie, ensi cum [4] il est (Document 12420502, 2). il recevra et prendra les fruis et les rentes et tenra toutes les seigno-[7]-ries entierement, ensi com il les a tenues tous jors (Document 126404, 6).
98 Note dans le texte: Je laisse ici de ct y et en qui remplissent des fonctions diverses,

actancielles ou non [. . .].


99 Les formes dites rchies du pronom ne sont pas utiles largumentation qui suit; elles

ne seront pas prises en considration ici.


100 Voir le premier chapitre de la thse de Povl Skrup (1975), dans lequel il explique que la

distinction entre les formes fortes et faibles du pronom personnel nest pas lie laccentuation, mais la place quil occupe par rapport au prdicat.

91

la denat ilh [. . .] a frere [6] Libier de Frelus [. . .] vesture de quatre bonirs [. . .] (Document 12630719, 5).

La forme le correspond au patient de la phrase active bi ou triactancielle:


se ihl vendre le voloit ne sez hoirs aprs, li_glise laurat dev ant t oz achators (Document 123605, 8). damoiselle Sybille le reportat sus la meismes a oelz de la mai-[8]-son de Robermont (Document 12600514, 7).

La forme li exprime le bnciaire de la phrase triactancielle:


et pais li fu commandee sor ce par le jugement des homes, et plainement li fu afaitiez ciz z (Document 12660613, 13). [. . .] nos lettres overtes ke nos li avons doneis (Document 12520301a, 21)

Au vu des phrases observes, chaque forme du pronom est associe un rle smantique particulier.101 b. Du rle smantique la fonction syntaxique. Puisque les correspondances entre une srie casuelle et un rle smantique particulier sont stables, et qu une forme donne est assign un rle smantique, on peut catgoriser du point de vue morphosyntaxique la relation que les occurrences releves pour chacune de ces trois formes entretient avec le prdicat qui exprime ce procs. Il sagit donc darguments du prdicat de forme contrainte. Si on les numrote de manire arbitraire: 1. il (correspondant lagent de la phrase active); 2. le (patient de la phrase active); 3. li (bnciaire de la phrase active). Ces trois arguments jouent la fonction syntaxique dactant par rapport au prdicat. Par ailleurs, les catgories de nombre et de personne vhicules par la forme 1 se retrouvent galement exprimes dans le prdicat; le mme contenu est donc exprim deux endroits de lnonc. Dun point de vue smantique, ce phnomne daccord peut tre vu comme la marque dune relation particulire entre les units qui le contractent. Le transfert de catgories correspond lexpression dune relation smantique stable. Lorientation primaire du verbe se fait ainsi simultanment vers la forme 1 et luimme: les formes du premier type sont coorientes par rapport au prdicat. Le terme de combinaison102 qualiera la relation entre le sujet et le prdicat, cause de cette coorientation. Plus prcisment, sur le plan des marques, cette coorientation concerne exclusivement les morphmes de la personne et du nombre, et non le prdicat dans son ensemble. Par contre, sur le plan des relations, elle implique les mots entiers. Il nous parat cohrent de dire que la numrotation propose ci-dessus nest pas arbitraire pour ce qui concerne lactant 1, puisquon le distingue des autres actants
101 On constate du reste que lancien franais est une langue accusative: la forme de lactant

qui exprime lagent de la phrase active biactancielle est la mme que celle de lactant unique de la phrase uniactantielle (en suivant Lazard 1994, 30s. et 1999, 122s.). 102 Le sens est ici diffrent de celui que lui prte Louis Hjelmslev, voir 3.2.1.

92

[le]

relation R2

[P0]

F IG . 3.19 Reprsentation de R2

[il]

relation S1

[P0]

F IG . 3.20 Reprsentation de S1 actant @a une forme de la srie il, le, li sujet @accord avec P0 rgime @non-accord avec P0

actant 1 (S1) @forme il

actant 2 (R2) @forme le

actant 3 (R3) @forme li

F IG . 3.21 Types dactants en fonction de leur forme

rgis, en vertu de sa relation privilgie avec le prdicat: il est plus proche de ce dernier que ne le sont les deux autres. Lappellation de sujet (dsormais S1), que nous reprenons la grammaire traditionnelle, sera rserve cet actant; les deux autres seront dits rgimes, (dsormais respectivement R2 et R3). Par extension, on pourra dire quun S1 entretient une relation S1 avec le prdicat et quil est, dans ce cadre, de fonction S1. Il semble quil ny a aucun inconvnient procder de la sorte, puisquon peut classer les constituants en fonction des relations syntaxiques entretenues. Pour le (de fonction R2), par exemple, on a pu prciser la relation en annotant la che, comme dans le schma 3.19, o la che indique la dpendance les arguments ncessitent la prsence du prdicat.103 On peut dire la mme chose pour R3 et classer ainsi ces arguments en fonction de leur forme. La nature particulire de S1 ncessite une reprsentation qui exprime galement la combinaison (par une double ligne), comme nous lutilisons dans la gure 3.20. Tout cela se rsume dans larbre conceptuel de la gure 3.21. La relation qui existe entre un argument pronominal et le prdicat est donc spcie par des moyens synthtiques (marques morphologiques). c. Commutations: principe gnral. Ce premier bilan est trs utile pour caractriser les constituants autres que les pronoms. Dun point de vue gnral, David Creissels (1995, 211) afrme en effet:
[p]armi les proprits non immdiatement apparentes permettant de caractriser les contrastes entre constituants nominaux en fonction darguments dun mme prdicat,104 il est souvent utile de prendre en considration la relation entre les constituants nominaux et les morphmes dsigns ici comme indices pronominaux.

103 Voir cependant les cas dnoncs non phrastiques, sous 3.4.5. 104 On peut donner aux termes le mme sens que celui expos ici-mme.

93

La relation dont il est question est dordre paradigmatique: les actants se dnissent morphosyntaxiquement par la forme du pronom avec laquelle ils commutent,105
S1: cel meime droit ke [10] mes sires et mes peres devant dis lor at quitteit et doneit en almoine [. . .] (Document 12680310, 9); R2: reportarent [. . .] lyretage deseur nomeit tot entierement (Document 12680310, 5); R3: nos avons donet Warnier le bolengier con dist de Rumezees une mason [. . .] (Document 12520301b, 3).

Dans ces conditions, les segments nominaux qui commutent avec un pronom de fonction S1 sont galement S1, et similairement pour R2 et R3. De ce fait, la faiblesse de certains paradigmes eu gard lexpression des relations smantiques (comme cest le cas du fminin, o la dclinaison nexiste plus pour un grand nombre de noms) nest pas dterminante: mme sil manque certains noms la forme chie qui spcierait exactement la relation, cest le potentiel commutatoire du constituant en contexte qui importe. Par ailleurs, la coorientation entre le sujet et le prdicat semble stable, en juger par les phnomnes daccord observs.106 d. Commutations: cas de lattribut du sujet. Le primat de laxe paradigmatique dans cette analyse le seul dont on puisse avoir une vision complte pousse aller jusquau bout du raisonnement. Nous dirons que la fonction R2 convient galement la plupart des constituants quon dit traditionnellement attributs du sujet, o S1 et R2 qualient le mme rfrent, posant une quivalence ou une caractrisation,107 cest--dire quils sont orients vers le mme objet, ce quAlain Lemarchal (1997, 128129) nomme galement coorientation.108 La commutation nest pas atteste dans le corpus, mais la continuit semble fermement assure entre les formes plus anciennes et le franais moderne, o la commutation est possible (attestations tires des ressources du site internet Laboratoire de franais ancien):
Mes cil ert pruz jeo lameroie. Allas, qe doel, il ne lest mie! (Ipomdon, 93). [. . .] il sanble mialz tornoieor que marcheant ne changeor. Il est chevaliers, ce me sanble. Et les dameiseles ansanble
105 Nous ngligeons compltement les contraintes de position modies par la substitution du

pronom au syntagme nominal. Ces contraintes sont en effet diffrentes pour le nom et le pronom (cf. Marchello-Nizia 1995, 107s.). 106 Voir nanmoins les problmes que pose le phnomne de coordination (3.4.7.2). 107 Voir cependant p. 99, o sont abords les attributs qui ne sont pas quatifs ou caractrisants. 108 Voir 3.4.2.1 b. En ralit, lauteur considre que les traditionnels attributs du sujet sont transfrs en verbes au moyen de la copule (Lemarchal 1989, 123) et sont ainsi orients vers le participant exprim par S1 (Alain Lemarchal parle dagent, terme quon pourrait juger inadquat, parce quil suppose un contrle du procs, absent de la relation entre le sujet et la copule). Prcisons, mme si cette conception nest pas mobilise dans ce travail, que la proprit principale du substantif en matire dorientation est dtre auto-orient, cest--dire orient vers lobjet quil dsigne (Lemarchal 1989, 109110).

94

[x]

relation S1

[P0]

relation R2

relation attributive
F IG . 3.22 Reprsentation de la relation attributive impliquant S1 et R2 li dent: Bele dolce amie, sil le sanble, ne lest il mie; [. . .] (Cgraal, 380a.5015).

Nous admettons donc le statut de R2 pour:


xv verges de terre sor bonir ki est alus (Document 12690223, 4).

Et nous posons, par extension, ce statut pour les constituants du mme type, qui apparaissent dans lenvironnement dun verbe dnotant un tat ou un changement dtat:
li autre, ki vive [10] demorat, tenrat tote sa vie ceste tenore (Document 12641129, 9).

Nous parlerons ds lors dune relation attributive (ou attribution) entre un R2 et un S1 coorients. Cette relation lie S1 et R2 par le biais de lemploi dun prdicat dont le schma actanciel et la valeur smantique sont compatibles avec cette coorientation (estre, demorer dans les exemples qui prcdent109 ). La relation attributive ne senvisage pas sans un sujet et un prdicat. Les attestations tires de Laboratoire de franais ancien ci-dessus montrent bien que R2 na pas la mme fonction syntaxique que S1 par rapport au prdicat. R2 et S1 sont donc unis par une relation mdiate, reprsente dans la gure 3.22 par un trait discontinu. e. Commutations: distinction entre R2 et R3. Dautre part, la distinction entre R2 et R3 ncessite un commentaire. En effet, seule une srie limite de noms110 offrent des sries de trois formes. Pratiquement, si lon examine lentourage du verbe doner, on constate que le statut de R3 du mot lor ci-dessous est dtermin morphologiquement (un R2 aurait certainement eu la forme les):
Et je cel meime droit [. . .] lor (Document 12680802a, 9).
[11]

quitte ausi et lor done en almoine se nul droit i ai

Ds lors, les syntagmes souligns ci-dessous sont tous deux des R3, en dpit de la diffrence formelle qui les oppose (prsence ou non dune prposition), puisquils commutent avec un pronom R3:
nos avons donet Warnier le bolengier con dist de Rumezees une mason [4] en hiretage lui et ses oirs (Document 12520301b, 3). li abbesse [4] et li covens de_la maison de Robermont deleiz Liege ont doneit a trecens a Ja-[5]-kemin le Rotial et a dame Evelette, sa femme, une curt et une maison [. . .] (Document 12600221b, 3).

109 Ce quon pourrait envisager en termes de translation si le terrain explor le permettait

(3.3.2), cf. note 108.


110 Les pronoms, cf. p. 74.

95

actant @commute avec il, le ou li sujet @accord avec P0 rgime @non-accord avec P0

actant 1 (S1) @commute avec il

R2 @commute avec le

R3 @commute avec li

F IG . 3.23 Types dactants en fonction de leur potentiel commutatoire

Cest en premier chef la forme du pronom avec laquelle ils commutent qui distingue R3 de R2. Nanmoins, cela nexclut pas la possibilit dune variation libre entre la prsence et labsence de ladverbe a au dbut de largument, comme on le voit cidessus.111 Le schma 3.21 (p. 93) doit tre revu, en soulignant que cest le potentiel paradigmatique qui permet de reconnatre les actants: nous le faisons dans la gure 3.23. De notre point de vue, les relations actancielles sont des relations spcies par des moyens morphologiques. Soit ces marques sont en prsence, cest le cas du pronom de la troisime personne; soit ces marques sont en absence, et ne peuvent tre apprhendes que si lon a conscience des commutations possibles. 3.4.2.3 Circonstants

Le modle expos dans la section prcdente ne suft pas classer tous les arguments. Si lon fait commuter les constituants immdiats de cette phrase (except le prdicat) avec les pronoms, lopration choue pour deux constituants immdiats de la phrase:
La afaitarent elles a [5] frere Libier de Frelus, a owez de la maison de la Vas Benoiete dels Liege, delle ordene de [6] Citeaz, xvii verges de terre. (Document 12630720, 4)

Ces constituants souligns sont ainsi le reliquat de lanalyse, puisquils ne commutent avec aucune forme du pronom. Si lon dsirait les faire commuter, lopration ne russirait quavec un adverbe: la commuterait avec i et a owez. . . avec si. Pour cette raison, ces constituants nentrent pas dans les classes S1, R2 et R3 qui viennent dtre dnies. Il est cependant indubitable que ces constituants ont un sens qui ne se conoit quen relation avec celui dnot par le prdicat (ici, afaitarent) ou lensemble de la phrase quil fonde. Cette relation smantique suppose une relation syntaxique, et cet gard, ces constituants sont galement des arguments du prdicat. Pour marquer la diffrence avec S1, R2 et R3, quon a groups sous le terme dactant, on parlera de circonstants (dsormais C5). On obtient ainsi la hirarchie prsente dans la gure 3.24.112

111 Ce fait relve de la construction des arguments et on verra ci-dessous comment interprter la

prsence de ce a (3.4.4.2).
112 Ce schma sera revu (3.4.2.4).

96

argument @en relation avec P0 actant @commute avec il, le ou li circonstant @ne commute pas avec il, le, li

F IG . 3.24 Types darguments en fonction de leur potentiel commutatoire

Vue de cette manire, la spcication se fait ici de manire ngative, ce qui a pour consquence de regrouper dans la mme classe les arguments non-actants dont la forme est indpendante du choix lexical du prdicat ou de la diathse et ceux dont la forme est associe un rle spcique compte tenu de la diathse. Par exemple, le complment dit dagent est class dans les circonstants.113 Voyons prsent sil est possible de distinguer plusieurs catgories de circonstants. a. Expression du cadre du procs. On peroit intuitivement que les circonstants peuvent tre classs en sous-groupes, mais aucune marque morphosyntaxique ne permet de procder ce classement: on ne peut se er qu la manire dont ces constituants interfrent smantiquement avec le reste du procs et de ses participants. De ce fait, certains des circonstants en question interagissent avec la phrase-nonc de manire interne au procs, en posant un cadre spatio-temporel, logique, nal, conscutif, etc. La seule diffrence smantique ne sufrait cependant pas caractriser les circonstants par rapport aux actants. Cest pourquoi le classement smantique se fait obligatoirement la suite du classement syntaxique, de manire proter du gardefou que constitue la grammaire le plus longtemps possible. Ainsi, le bnciaire peut tre exprim par un actant ou un circonstant:114
R3: li abbesse [4] et li covens de_la maison de Robermont deleiz Liege ont doneit a trecens a Ja-[5]-kemin le Rotial et a dame Eveltte, sa femme, une curt et une maison [. . .] (Document 12600221b, 3); circonstant: Les queiz set boniere de terre et les dous curs [10] Houduins devant dis reportat sus en la main del maior par devant eas a os de_la maison de [11] Robermont devant dite (Document 12600530a, 9); circonstant: nos en donames don et vesture par devant les homes de_le Chiese Deu [13] a frere Henri de Robermont, a os de_la maison devant dite (Document 12600514, 12).

La coexistence de R3 et du circonstant dans le dernier exemple ne laisse aucun doute au sujet de lanalyse de ce dernier.
113 Il est possible denvisager les choses autrement. On peut considrer que la relation est sp-

cie par des marques beaucoup plus prcises et contraignantes que les autres circonstants: non seulement la diathse, mais galement les adverbes de, par (seuls ou combins), ainsi que limpossibilit de commuter avec un adverbe. Elle est par ailleurs lie une certaine classe de verbe. 114 Cette analyse nest pas celle de Denis Creissels (1995, 245247), qui afrme que la distinction entre R3 et les circonstants nest pas assure, de mme, dit-il, que la distinction des attributs. Le test de commutation nous parat pourtant sans appel: R3 commute avec le pronom li (et en fr. mod. lui), ce qui nest pas le cas des circonstants.

97

circonstant @ne commute pas avec il, le, li C5 @exprime le cadre du procs C6 @lie lnonc au prcdent

F IG . 3.25 Types de circonstants

Par contre, cette approche smantique permet de distinguer ces circonstants qui expriment le cadre du procs et certains participants (dsormais C5), dautres constituants qui ont plutt pour rle dorganiser les noncs les uns par rapport aux autres. b. Expression de lorganisation des noncs. Au point de vue du sens quils vhiculent, certains circonstants agissent effectivement un autre niveau: ils se comprennent plutt par rapport lnonc entier, en mettant en relation ce dernier avec celui qui prcde et construisant ainsi ce quon appelle la cohsion du texte.115 Cette analyse convient au fameux et initial de phrase (3.4.1.3) et tous les adverbes commutant avec lui (ne, ou, ains, car), mais galement ladverbe si.
[Des dispositions sont prises. . .] Et par-mi ceste pais at quite clam li glise mon saingnor Oston totes convenances kilh a eu a lui de ci a ore; ne ne li doit emcombrer de [19] son achat de Lovierval ne de le vowerie; ains li doit aidier en bone foi , sain le sin doner (Document 12440119, 18). [ la n dune charte] Et por ce que ce soit fermement tenut, li veskes et li cuens i ont pendut lors sayaus (Document 12361215, 12). nos avons changiet a le maizon del Va_Benoite et frere [5] Warnier [. . .] [6] dois boniers de terre et un jornal [. . .] et-contre atre terre [. . .]; sen gisent de ces dois bonier desor nomms v jornal entre Ans et Hanbru [. . .] (Document 12601002, 4).

Pour les distinguer des C5 et pour indiquer leur distance plus grande par rapport au prdicat, ces circonstants ont le sigle C6 (gure 3.25). Ne disposant que de critres smantiques pour distinguer C5 et C6, nous reconnaissons la fragilit de cette sparation. 3.4.2.4 Cas intermdiaires

Aux actants et circonstants sajoute un troisime type dargument, qui pose un problme de description. Certains participants au procs ont une forme qui semble lie au lexme verbal employ comme prdicat, mais ne commutent pas avec un pronom. Dans ce cas, labsence de marque segmentale nous laisse un peu dsarm pour traiter le problme. Il y a tout lieu de croire mais le fait mriterait dtre vri que la forme de ces arguments est limite des schmas trs spciques qui semblent dpendre du lexme verbal. Par exemple, le verbe defalir est toujours attest avec un argument introduit par de, comme dans lextrait suivant:
115 Voir lexpos dtaill des procds de cohsion dans Halliday 1985, ch. 9.

98

argument @en relation avec P0 actant @commute avec il, le ou li non-actant @ne commute pas avec il, le, li circonstant @forme indpendante du lexme de rle P0

A4 @forme dpendante du lexme de rle P0

F IG . 3.26 Types darguments se watiers u sei hoir auchun an [6] defaloient de_paiement de ces iiii muis, de cens et de la rente, si ke dit est, Johans poroit alar a ces lendemain sens demener (Document 12711209, 5).

Certaines sries de verbes au smantisme proche acceptent galement des complments relativement gs. Par exemple, les terres transmises une institution religieuse par simple don, quon appelle aumones, peuvent tre lassiees, werpies116 ou donees:
i bonier de quartal terre [. . .] (Document 12760224, 9).
[10]

ke Thomas Batas desour dis avoit lassis en amoine

et werpit por Dieu et en amoine (Document 12840511, 6). Et je [. . .] donai en amoene, [. . .] al abbeit et a covent del Vaus Saint Lambert desor dis [. . .] tel alu ki astoit en ma maen (Document 12701126, 21).

La distinction entre ce type dargument et ceux qui posent un cadre spatiotemporel parat parfois bien mince et ne saurait tre pose catgoriquement. Il semble que ces arguments servent en particulier marquer un complment proche du prdicat, alors que la position R2 est dj occupe par un autre argument (il y a en quelque sorte saturation dune des cases prvues par le schma argumental) ou que la fonction R2 est incompatible avec le lexme qui est prdicat (comme aler ou venir). Il est difcile de trouver dans la tradition un terme adquat pour dsigner ces arguments de type intermdiaire. Nous emploierons simplement le sigle A4 pour les dsigner, soulignant le fait quils ne sont pas soumis aux mmes contraintes de forme que les actants, mais sont moins libres que les circonstants par rapport linformation stocke dans le lexme qui a fonction de prdicat. Le numro 4 est destin reter cette position intermdiaire. On doit ainsi ajouter une branche au schma 3.24 de la page 97 en intercalant le concept opratoire de non-actant dans la hirarchie (gure 3.26). La conceptualisation est moins premptoire quil ny parat: on pourrait galement envisager un schma mettant en vidence le caractre qui regroupe les actants aux A4 et les oppose aux circonstants (leur dpendance par rapport au lexme de rle P0). Larbre ci-dessus est prfrable parce que les commutations avec les pronoms sont des moyens daccs plus rigoureux la distinction des relations syntaxiques. En suivant ce principe, les traditionnels attributs de S1 qui ne sont pas corf116 Cest--dire dguerpies.

99

rents ce dernier et qui ne commutent pas avec un pronom doivent galement tre dcrits comme des A4. Ils dnotent gnralement une situation, un contexte ou un possesseur. Par exemple:
canones ki seront en_la vilhe (Document 123605, 6). El nom de Deu soit (Document 12650704, 1). Sachent tuit cilh ki sunt et ki a_venir sont ke [. . .] (Document 12680310, 2). le huge ki fu se pere (Document 127203, 31).

o lon constate bien quaucune commutation avec il, le ou li nest possible. En comparaison, les traditionnels attributs du complment direct peuvent tre dnis comme mettant en corfrence R2 et A4.
Do quelh testament ju enlis et fais foumains [. . .] sangnor Thirri de Dynant, [. . .] dame Anns [. . .] (Document 12890112, 31).

Il est remarquable que, du point de vue smantique, lorsque R2 et A4 sont coexistants, il est trs souvent possible denvisager quils expriment tous deux une dsignation du mme objet.117 Ainsi, dun point de vue smantique, le procs exprim par la phrase cite fait des patients (sangnor Thirri. . .), excuteurs testamentaires (foumains) du locuteur (ju). De mme, dans
sires Giles et sa mere reconoisent a le glise et claiment quitte le quarte part de tote la dime de Nodus [. . .] (Document 123605, 4).

le nom quite exprime des proprits de la ralit dsigne par le quarte part de la dime de Nodus. La transformation traditionnelle qui fait de lattribut du complment dobjet direct un attribut du sujet est possible.118 Puisque le corpus contient,
[. . .] li vi mars de cens, les queis jai lassis en me testament sor ma maison de_le Fosse [. . .] soient quittes et paisueles [7] a Johan [. . .] (Document 12830213a, 6).

il nest pas draisonnable de postuler quon peut former:


*Giles et sa mere claiment que le quarte part. . . est quite

ce qui rend plausible lanalyse parallle celle de lattribut de S1 (gure 3.27). Mme si elles rentrent dans ce moule, les structures de ce type impliquant des innitifs
117 premire vue, certaines constructions semblent sopposer cette analyse: [. . .] ai priet

lofcial de Liege quilh pende le seal de lofcialit de Liege por [14] mi a ches presens letres (Document 12711203b, 13); si on analyse lofcial de Liege comme un R2 (ce quon fait intuitivement en tant que locuteur du franais moderne), lhypothse de la coorientation ne tient pas. Lobservation du corpus rvle quil sagit en fait dun R3: [. . .] et se prie et requier ausi a manbor [. . .] quil donent [. . .] lettres de recognisance [. . .] (Document 12830213b, 18). La spcication par a nest pas atteste pour R2. 118 Dans les termes de notre modle, nous disons que cette transformation transpose respectivement R2 et A4 en S1 et R2 attributif dun P0 copule.

100

[x]

A4

[P0]

R2

relation attributive
F IG . 3.27 Relation attributive impliquant R2 et A4

ncessitent un commentaire et seront abordes de manire plus dtaille ci-dessous (3.4.4.6). 3.4.2.5 Synthse des relations argumentales

Nous ferons suivre le tableau des constituants immdiats de la phrase (a) avant de le gnraliser la proposition (b). Ensuite, nous dresserons un premier inventaire des conventions de schmatisation des relations rencontres (c). a. Taxinomie des constituants immdiats de la phrase. Nous considrons que tout constituant immdiat de la phrase est forcment soit prdicat, soit argument, cest-dire que toutes les relations sont organises autour du prdicat. Ainsi, aucune relation de niveau argumental nexiste en labsence du prdicat. Le classement propos distingue les arguments et les hirarchise en fonction de la distance qui les spare du prdicat.119 Les arborescences conceptuelles prsentes dans les paragraphes ci-dessus se regroupent en un seul schma, o la distance par rapport au prdicat augmente au fur et mesure quon se dplace vers la droite de larbre (voir la gure page 102). b. Notion de proposition. ce stade du dcoupage, le fait que le prdicat exprime ou non des catgories personnelles (aux modes dits personnels: indicatif et subjonctif) na pas dincidence sur la dnition obtenue. Dailleurs, et cela nous a servi de base pour dcouper le texte en noncs (3.4.1), le verbe se caractrise par son potentiel assumer la fonction de prdicat et imprimer la proposition entire une structure syntaxique particulire. Quelle que soit la dsinence que prenne le verbe, il conditionne le mme environnement syntaxique (changements de diathse mis part). lexception de S1, tous les arguments se comportent de la mme manire par rapport au prdicat, quil soit conjugu un mode personnel ou non. Nous avons donc tout intrt adopter une terminologie qui mette en vidence cette persistance tout en permettant de parler de la dsinence du verbe. Nous distinguerons simplement les propositions personnelles, participiales et innitives, rservant le nom de phrase aux propositions personnelles employes comme noncs (3.4.1.2). Dans un souci de cohrence, comme nous avons refus le statut de verbe aux dverbaux comme paiable (3.3.4), nous nanalysons pas le syntagme dont il est le centre comme une proposition.120 c. Relations fondamentales: classement et schmatisation. Comme prcis en jetant les bases du modle dlaboration de concepts (1.1), la slection des proprits
119 Mme si tous les arguments dun certain type ne sont pas forcment quivalents de ce point

de vue; par exemple, parmi les C5, le complment dagent peut tre considr comme plus proche du prdicat que les autres, puisquil est li la diathse (3.4.2.3). 120 Du reste, il semblerait que les dverbaux de ce type bloquent les possibilits de commutation des arguments (on ne peut plus proprement parler les qualier comme tels) avec un pronom.

101

102
constituant immdiat de la phrase @intgr la phrase

prdicat = P0 (3.4.2) @exprime la temporalit de la phrase

argument (3.4.2) @lien syntaxique P0

actant (3.4.2.2) @commute avec il, le ou li

non-actant @ne commute pas avec il, le, li

sujet @accord avec P0

rgime @non-accord avec P0

A4 (3.4.2.4) @forme dpendante de P0

circonstant (3.4.2.3) @forme indpendante de P0

S1 @commute avec il

R2 @commute avec le

R3 @commute avec li

C5 (3.4.2.3 a) @cadre le procs

C6 (3.4.2.3 b) @cadre lnonc

F IG . 3.28 Types de constituants immdiats de la phrase (classement complet)

relation @dpendance ou cooccurrence @les termes sont des constituants relation vers P0 @P0 est slectionn combinaison @coorientation de largument et P0 relation entre arguments @aucun terme nest P0

complmentation @non-coorientation

attribution @coorientation

F IG . 3.29 Reprsentation des relations syntaxiques impliquant des arguments

[P0]

[x]

F IG . 3.30 Reprsentation des relations argumentales simples

[P0]

[x]

F IG . 3.31 Reprsentation de la dpendance

abstraire en caractres faite durant le raisonnement dpend du descripteur, mais aussi du point de vue adopt durant lanalyse. Il serait possible de construire un autre arbre, qui mette en vidence dautres oppositions caractristiques. Il nest pas ici question de proposer un classement parallle celui qui vient dtre synthtis, mais plutt de souligner une opposition importante qui sera utile ultrieurement et qui ne resterait que sous-jacente si lon se contentait de larbre de la page 102. Tout dabord, nous avons fond la distinction entre deux classes dactants principales sur la base du comportement quils ont par rapport laccord avec le prdicat. Le sujet saccorde de manire directe avec le prdicat, ce qui nest pas le cas des rgimes laccord dun R2 en relation attributive avec un sujet est indirect (voir p. 94). La relation qui unit le sujet au prdicat a t nomme combinaison (voir p. 92). En ancien franais de mme quen franais moderne et dans toutes les langues romanes , cette relation est tout fait particulire et soppose toutes les autres relations que les arguments peuvent entretenir avec le prdicat. Nous reprendrons le terme gnralement reu pour dsigner ces autres relations et nous dirons quil sagit de relations de complmentation, et que ces arguments (R2, R3, A4, C5 et C6) sont les complments du prdicat. Le concept de relation se subdivise comme dans la gure 3.29. Les relations peuvent tre reprsentes laide dun petit nombre de principes de schmatisation. Pour indiquer une relation sans prcision supplmentaire, on procde comme dans la gure 3.30. Pour montrer que la relation implique une hirarchisation des constituants, nous utilisons une che, dirige vers le constituant dont dpend lautre constituant; par exemple, le prdicat (gure 3.31). Pour indiquer une combinaison, nous faisons usage dune double ligne, comme dans la gure 3.32 le cas chant, la che indique la hirarchie121 . Enn, la relation peut tre caractrise en
121 On verra plus loin (3.4.6.1 a) des cas o la hirarchisation ne doit pas tre faite.

103

[P0]

[x]

F IG . 3.32 Reprsentation de la combinaison avec dpendance

[P0]

R2

[x]

F IG . 3.33 Convention dannotation des relations

[x]

S1

[P0] attribution

R2

F IG . 3.34 Reprsentation de la relation attributive

indiquant son type sur la ligne qui la reprsente; par exemple, cest la relation R2 qui est reprsente dans la gure 3.33. Toutes les relations prsentes ci-dessus ont deux particularits: 1/ elles sont directes; 2/ elles impliquent toujours le prdicat. Si une relation est mdiate (elle ne porte pas sur le prdicat, mais a besoin de sa prsence pour stablir), elle est reprsente par un trait discontinu (gure 3.34). 3.4.3 Construction du prdicat

Le prdicat, tout comme les arguments (3.4.4), est parfois une unit complexe dont il faut analyser la structure. Il sera ici question des temps composs et de la position adopte leur gard. 3.4.3.1 Problme des temps composs

Traditionnellement, les grammairiens de lancien franais opposent les formes verbales simples aux formes verbales composes, construites laide des verbes estre ou avoir (qui servent dauxiliaires) et du lexme verbal chi au participe pass (lauxili). Sous certaines conditions, les catgories verbales doivent donc tre exprimes par des moyens analytiques. De la mme manire, la diathse passive, qui consiste en un changement dorientation (voir p. 87), est galement forme laide de lauxiliaire estre. Les exemples abondent:
nos avons donet Warnier [. . .] une mason (Document 12520301b, 3). [. . .] Johans [. . .] ki astoit venuz a ses jors aprs la mort [3] de son pere, vient par devant moi [. . .] (Document 12701126, 2). [. . .] ensi com ilh est contenut plus esclairiement en faites. (Document 126505a, 42).
[43]

lettres nostre frere ki de ce sunt

La question qui se pose est celle du statut accorder lauxili: est-il un argument de lauxiliaire (lequel est assimil au prdicat dans ce cas) et possde-t-il son propre schma argumental? ou est-il au contraire indissociable de lauxiliaire (les deux 104

argument

[P0 (auxiliaire)]

[P0 (auxili)]

F IG . 3.35 Structure de P0 complexe (lauxili est argumental)

[P0 (auxiliaire)]

R2

[auxili]

argument

F IG . 3.36 Structure de P0 complexe (lauxili nest pas argumental)

formes construisent ensemble le prdicat)? La hirarchie serait soit celle reprsente dans la gure 3.35, soit celle reprsente dans la gure 3.36. 3.4.3.2 Position adopte

Il est vrai que lon rencontre des cas de coordination (3.4.7.2) qui montrent bien que les auxilis peuvent tre multiplis sans quil y ait besoin de rpter lauxiliaire. Ces auxilis peuvent mme avoir chacun leur schma argumental propre, comme en tmoignent:
La u li amone devant dite fut afaiti ma [17] damme labbeesse [. . .] et li conisance de iii bonirs dalu devant dis faiete, furent hommes de Cize [18] Deus [. . .] (Document 12650415, 16). la lettre ki faite en est et saieleie de saial de la citeil de Liege et del Jehan. (Document 127312, 6).
[7]

hospitaal de San

Certaines coordinations mettent sur le mme pied deux schmas diffrents: le premier avec un R2 attributif (voir p. 94), le second avec un auxili:
tot li arrerage et tot li besten ki unt est entreaus sunt quite et totes les males amors par-[15]-donees (Document 12700510, 14).

Cependant, du point de vue smantique, forme auxilie et auxiliaire fonctionnent de concert: la suppression de lune ou lautre des deux formes modie radicalement les catgories aspectuelles et temporelles exprimes dans lnonc. Or, le prdicat est vu comme le sige exclusif de ces catgories. Paralllement, du point de vue morphosyntaxique, le statut de la construction change si on retire lauxiliaire, puisque la phrase se dnit notamment par la prsence dun morphme personnel dans le lexme verbal. Dautre part, la commutation quon pourrait faire entre lauxili accompagn de ses arguments et une forme du pronom, si elle est envisageable, nest pas atteste dans le corpus, mais on peut aisment construire:
*Johans, [. . .] ki lastoit, vient par devant moi.

On voit ici que les commutations opacient compltement le sens du procs dnot et lorientation. Pareillement, les formes passives se caractrisent par une orientation primaire (vers S1) du prdicat vers le patient, mais cette orientation ne subsiste pas quand la phrase 105

persones ki sont escrit el testament Godefroit (Document 12740531b, 8).

est transforme par commutation en:


*persones ki le sont el testament Godefroit.

Sans toutefois rejeter formellement lautre analyse possible il faudrait une tude plus approfondie pour trancher , il semble que ces raisons autorisent considrer les temps composs comme des prdicats forme complexe. 3.4.4 Construction des arguments

La notion de spcication synthtique sert caractriser les relations simples entre les units qui constituent les arguments (3.4.4.1) de nature nominale. La spcication analytique segmentale (3.4.4.2) et la spcication analytique squentielle (3.4.4.3) sont ensuite introduites pour traiter les cas complexes. Une fois ces mcanismes observs, lanalyse est tendue aux arguments de natures adverbiale (3.4.4.4) et propositionnelle (3.4.4.5 et 3.4.4.6). 3.4.4.1 Noms: spcication synthtique additionnelle

La spcication de la relation liant les arguments nominaux qui ne sont pas des pronoms au prdicat est dtecte en utilisant la procdure commutative. Ce sont des marques synthtiques qui permettent aux pronoms de spcier la relation sans laide dautres mots. La dclinaison des autres noms constitue parfois une marque synthtique supplmentaire qui se superpose la spcication que comporte le potentiel paradigmatique. Ainsi, dans:122
le queil alu Wilheames [. . .] (Document 12700929, 11).
[12]

kenut par devan les homes kilh en astoit bin vestis

la fonction S1 est marque par le fait que Wilheames commute avec il, mais galement par une dsinence spcique (-s). La coordination perturbe parfois ces marques (3.4.7.2) bien que dans lensemble, les formes restent stables. Cest le cas dans:
La afaitarent Wilheames et Agns [. . .] et Werris [. . .], a maistre Amel, doin de Saint Donis, en nom de maistre Conrar, maison, curs, terres, [7] preis, cens, chapons, bleis et bois [. . .] (Document 12760610a, 5).

o le marquage rend reconnaissables deux cas sujets S1 masculins singuliers (Wilheames et Werris), sans livrer aucune information propos de Agns. Toutefois, ces marques synthtiques ne sont apparemment pas primordiales. Il faudrait une tude approfondie pour lafrmer avec certitude, mais la spcication analytique, par emploi de prpositions et gement de lordre des mots, parat dj jouer un rle bien plus
122 Pour simplier lexpos, le constituant intressant a t rduit un seul mot (un nom propre).

Il est vident que dans les faits, les syntagmes sont beaucoup plus complexes, mais la construction de ces syntagmes est un fait de syntaxe immdiate (3.4.6).

106

important dans les documents. En effet, une grande partie des mots nont dj plus de dclinaison (notamment les fminins et les mots se terminant par -s). Par ailleurs, mme pour le peu de noms pour lesquels la dclinaison est encore efcace, les grammaires de lancienne langue numrent une multitude demplois divers (voir p. ex. Mnard 1994, 34) du cas rgime. Ce dernier correspond donc une forme nominale morphologiquement sous-spcie, cest--dire une forme qui nimprime pas une valeur smantique prcise la relation quelle entretient avec dautres constituants ce qui est tout le contraire du cas sujet. La langue autorise lemploi de contraintes supplmentaires pour que ce cas serve exprimer des rles smantiques prcis; la marque est alors analytique et segmentale. Ce qui est certain, cest que le marquage synthtique est possible parce quune relation particulire est contracte.123 3.4.4.2 Noms: spcication analytique segmentale

Lancien franais ne peut compter sur son systme casuel pour exprimer de manire univoque toutes les relations smantiques possibles entre le prdicat et ses arguments. Une partie de la nature syntaxique des relations est marque par dautres moyens que des moyens exionnels. a. Relation R3. Rappelons lexemple
nos avons donet Warnier [. . .] une mason (Document 12520301b, 3).

Si lon ignore les contraintes dordre squentiel (3.4.4.3), la phrase est ambigu: aucune marque ne distingue le bnciaire du patient. Nanmoins, nul ne penserait quun btiment puisse tre le bnciaire de laction dnote par le prdicat. Mais ce cas nest pas le plus frquent. Lemploi dun adverbe comme a124 permet souvent de lever lambigut. Ladverbe explicite la relation qui unit R3 au prdicat. Par exemple:
li abbesse [4] et li covens de_la maison de Robermont deleiz Liege ont doneit a trecens a Ja-[5]-kemin le Rotial et a dame Eveltte, sa femme, une curt et une maison [. . .] (Document 12600221b, 3).

Et pour lexemple tudi:


*nos avons donet a Warnier [. . .] une mason.

La prsence ou non de ladverbe a ne change rien lexistence de la relation syntaxique, mais explicite ou clarie le sens de cette dernire. Ladverbe en question peut tre considr comme un relateur, dont la valeur smantique senvisage par rapport au rle smantique que largument dont il est le constituant immdiat exprime, et donc au travers de la relation qui lie cet argument au prdicat. On dnira relateur comme indiqu dans la gure 3.37. Cette marque de spcication soppose dune part aux segments spciants synthtiques (exion) par le fait quil est un mot, dautre part aux constituants impliqus dans la relation quil spcie par le fait quil ne contracte
123 Dans une perspective diachronique, il est clair que cest la coexistence de marques faculta-

tives qui permet la variation et, partant, le changement.


124 Selon la dnition morphologique de ladverbe (3.3.3.3).

107

relateur @mot @spciant une relation quil nentretient pas directement


F IG . 3.37 Concept de relateur

pas directement cette relation. Quand une structure qui comprend un relateur voit sa relation avec une autre structure spcie par ce mme relateur, nous dirons quelle est relate. Par ailleurs, lorsquil est prsent, le relateur a galement la fonction de dlimiteur: il se rencontre le plus souvent lextrme gauche du syntagme. Au point de vue de la rception, la prsence de tels dlimiteurs indique quon na plus affaire au mme argument ou que la relation entre le constituant qui suit le relateur et ce qui le prcde est dun autre ordre (3.4.6.3). Comme les relateurs sont le plus souvent employs avec des noms ou des verbes conjugus un mode nominal, on peut parler de marque catgorielle. Ainsi analyse, la diffrence qui existe entre R3 relat et R3 non relat implique que la construction o le relateur est absent nest pas plus remarquable que celle o il est prsent. En ralit, cest plutt linverse. Ce qui correspond exactement ce quAlain Lemarchal a fait remarquer en ce qui concerne lemploi ou non de that pour introduire une compltive en anglais, et quil gnralise comme suit (Lemarchal 1997, 73):
[D]ans tous les cas o il y a, comme en anglais, variation (libre?) entre marque et absence de marque, on doit considrer la construction avec marque comme seconde par rapport la construction sans marque, pour la simple raison que, sil existe une construction sans marque qui soit interprtable et qui ne prsente pas de changement profond de valeur par rapport la construction avec marque, cest quon peut se passer de la marque; il faut donc dabord rendre compte de la construction sans marque, puisque a marche, et expliquer ce qui lui permet de fonctionner efcacement, et ensuite seulement dgager ce que la marque segmentale ajoute, si elle ajoute quelque chose.

Le a nest ainsi quune marque supplmentaire, qui se superpose linformation dj contenue dans le lexme verbal qui prvoit un actant R3. En conclusion, au moins trois marques se superposent: 1/ cas rgime; 2/ orientation contenue dans les lexmes (verbe et argument) et compatibilit des lexmes; 3/ facultativement, le relateur a. Cette superposition permet une spcication progressive de la relation en R3. Lajout de a est rserv la relation R3, en contraste avec la relation R2, qui rejette cette marque.125 b. Relations C5. On trouve galement des cas de C5 sans relateur, comme
Ce fut fait le lundi [. . .] a Enchastres [. . .] (Document 12361215, 13). Ce fu fait lan del Incarnation Nostre Saignor [. . .] (Document 126505a, 49).

o labsence et la prsence de relateurs alternent parfois librement. Comparons notre dernier exemple
125 Ce qui ne veut pas dire que tout argument autre que R3 la rejette: on trouve des A4 et des C5

relats avec a.

108

Che fut fait en lan del Incarnation Nostre Saingnour Jhesu_Crist [. . .] (Document 12630331, 30).

ct de ces alternances libres, certains C5 ne sont jamais accompagns de relateurs (le lundi ci-dessus), alors que dautres le sont toujours. Mais trs souvent, tous les C5 relevant dun smantisme particulier sont spcis par un relateur; par exemple:
hypothse: Se uns hom dist lait a autre, v sous doit (Document 124109, 4); but: xl souz de ligeois qui sunt [11] assenees por faire lanniversaire mun sangiur mun pere perpetuement (Document 127312, 10).

Il serait difcile de dmontrer que, par un mcanisme du genre de la translation.126 , les relateurs permettent aux constituants de contracter les fonctions argumentales en fonction du smantisme exprim. Les grammaires relvent dailleurs de nombreux cas de gure o le syntagme au cas rgime sans relateur a fonction de C5 exprimant le temps, mais aussi la manire, la condition, la concession ou la cause. Ainsi, Genevive Joly (1998, 2313) cite entre autres:
manire: Sire, fet li rois Baudemagus, salve vostre grace, il nel fera mie premiers (Queste, 23, 11). concession: se vos la damoisele ne pos desfendre encontre moi, lemmenera mau gr vostre (Trist., prose, 127, 18).

On pourrait se demander si ce nest pas le gement, li certains lexmes, qui autorise lemploi dun cas rgime sans relateur, mais de l dire que cest la prsence de ce dernier qui rend possibles certaines relations. . . on ne savancera pas. Ce qui est en revanche indubitable, cest que les relateurs participent la construction du smantisme exprim. Ils spcient en effet une relation en se combinant un constituant et prcisent la relation qui unit ce dernier un autre constituant de mme niveau dintgration. Le relateur ne fonctionne pas en autarcie. De plus, la spcication quil apporte est souvent lie dautres informations, en particulier celles stockes dans le lexme verbal. Par exemple, on voit bien que la valeur de en dans les A4 suivants dpend du lexme:127
[. . .] quant je men_dui aleir en Pulhe por la besongne de Sainte Eglise [. . . ] (Document 12670828, 2). [. . .] freres Giles desor dis fut em_pais comandeis en che iii denirs (Document 12850704, 11).

3.4.4.3

Noms: spcication squentielle

La spcication squentielle est malheureusement un phnomne dont lanalyse est trop complexe pour que nous ayons pu en rendre compte de manire satisfaisante dans notre tude. Nous nous bornerons mentionner sa prsence.
126 Voir lexpos succinct page 70. Voir en outre la note 156. 127 Plus le relateur est frquent et vide, plus sa charge spcicative dpend de lenvironnement

les cas de a et de sont les plus extrmes.

109

La spcication par des moyens segmentaux (quils soient synthtiques ou analytiques) est la plus facile dtecter. Elle nest nanmoins pas le seul type de marque dont la langue dispose pour spcier les relations. Revenons encore une fois lexemple
nos avons donet Warnier [. . .] une mason (Document 12520301b, 3).

et comparons-le dautres phrases triactancielles simples:128


[. . .] je lai damme Ans, [3] me femme, ses humiers, tant com elle vivrat [. . .] (Document 12890112, 2). La afaitat ilh frere Marsille [. . .] lalut ke freres Wa-[8]-tirs [. . .] aportat a la maison de_le Vas Benoiete (Document 12600221a, 6).

Dans ces trois phrases, le constituant exprimant le patient est post-pos au constituant exprimant le bnciaire, de sorte que le R3 non relat se trouve plus proche (en surface) du prdicat que le R2. On peut donc considrer quune spcication squentielle sajoute aux indices donns par la smantique du lexme verbal voque dans le paragraphe ci-dessus. Parmi les nombreux cas du corpus o le R3 non pronominal nest pas accompagn dun relateur, un seul place les constituants dans lordre inverse (le R3 est nouveau soulign):
Et si lait xa l quatre deniers ki sont dekanges de_le maison Ottelet (dont Garsilhes li Bresseres doit xxii deniers et Gerars de Ty-[20]-loit doit ausi xxii deniers) Juten, le lhe Johan le Hongre (Document 124706, 19).

Ainsi, bien que peu frquente, la structure nexploitant pas la spcication squentielle (R3 devant R2) ne doit pas non plus tre juge plus remarquable que celle qui lexploite. 3.4.4.4 Adverbes

Daprs le classement en parties du discours, les adverbes ne peuvent comporter de marques morphologiques de catgories. Ils ignorent la exion casuelle et donc tout phnomne daccord. La nature morphologique des arguments conditionne les moyens mis en uvre pour spcier la fonction qui les relie au prdicat. Voici quelques exemples de C5 adverbiaux:
li maisons [22] de la Valz Benoiete devoiet demorer paisulement en son bon hiretage (Document 12600509, 21) nos deviens enquerre droiturierement entre lune parole et lautre (Document 12630331, 7). La afaitarent elles a 12630720, 4).
[5]

frere Libier de Frelus, [. . .] xvii verges de terre (Document

128 Cest--dire ne prsentant pas de phnomnes de subordination ou de thmatisation qui vien-

draient troubler leur structure.

110

En outre, nous avons restreint la fonction C6 un inventaire restreint (et, ou, ne, etc.) de mots de nature adverbiale:
ains li doit aidier en bone foi (Document 12440119, 19). Ne ne_le_porons [. . .] metre hors de no main (Document 12630527a, 4).

Labsence de exion casuelle concorde avec le fait que ladverbe ne commute jamais avec le pronom personnel et ne comporte aucune marque qui permettrait dopposer S1 R2 et R3. De ce fait, ladverbe ressort de ces observations comme une partie du discours oriente et spcie en langue: une unit du lexique qui sactualise dans une orientation lie aux fonctions C5 ou C6 et qui donne delle-mme une spcication particulire au lien qui stablit avec le prdicat. Les arguments de relation prspcie (spcication en langue, lexicale) sopposent ainsi aux arguments de relation post-spcie (spcication en discours, grammaticale). Employs comme relateurs, nombre dadverbes impliquent une spcication prexistante par rapport la relation. Certes, cette spcication reste oue pour certains dentre eux (a et de ont une charge spcicative trs faible du fait de leur importante polysmie), qui ne sont efcaces quen cas de superposition de marques, mais la plupart dnotent des relations prcises (devant, deriere, avant, aprs, por, contre, etc.). 3.4.4.5 Propositions avec prdicat personnel

La nature des constituants nest pas limite aux membres de la triade verbe, nom, adverbe: les cas frquents de compltives et les rares relatives sans antcdent du corpus abondent dans ce sens. Certaines propositions o le prdicat est conjugu un mode personnel sont attestes dans les fonctions argumentales. Reprenant le terme traditionnel, nous dirons que ces propositions sont subordonnes. La subordination place une proposition prdicat personnel en position de dpendance par rapport un autre constituant;129 au niveau argumental, ce constituant est le prdicat.130 La particularit de la proposition subordonne est que son analyse se fait exactement de la mme faon que celle de la phrase: le prdicat de la subordonne organise de la mme manire les arguments. Gnralement, les subordonnes sont relates laide dun adverbe ou dun pronom (a); plus rarement, il peut ne pas y avoir de relateur (b). Nous naborderons pas les contraintes portant sur le mode du prdicat dans la subordonne, lesquelles dpendent souvent du prdicat principal et pourraient ce titre tre galement considres comme des marques de subordination (voir le deuxime exemple ci-dessous).131 a. Prsence dun relateur. Les subordonnes sont le plus souvent introduites par un relateur:
129 En termes dorientation, la subordonne est oriente vers le procs quelle exprime,

cf. Lemarchal 1989, 153160.


130 Pour la subordination en syntaxe immdiate, 3.4.6.4. 131 Voir, dun point de vue smantique, lexcellent expos de Grard Moignet (1988, en particu-

lier sur les compltives 213226).

111

S1: Conute chose soit a_chascun et a_tos ke [3] nos avons donet Warnier le bolengier con dist de Rumezees, une mason [. . .] (Document 12520301b, 2); R2: [. . .] je wel que cil a cui je laisse le spiaute pren-[13]-dent de tel an ki dont commencera (Document 127203, 12); C5: Se uns hom dist lait a autre, v sous doit. (Document 124109, 4); C5: Ce fust fait et donnei en lan del Incarnation Nostre Seignor, quant li [15] milliaire corroit par mil dous cens sexante et onse [. . .] (Document 12710917, 14).

Les exemples de circonstants montrent bien que le relateur suft parfois lui seul dterminer la nature du cadre pos: se exprime la condition, quand le temps. Ne gnralisons cependant pas: on trouve des subordonnes C5 en que (trs peu spcies).132
[. . .] latre partie auroit pooir [12] del abatre et del destruire, ke ja nen devroit requerre la partie ki i edeeroit. (Document 123712, 11). quilh orent oi lire lor dit, ilh nos cargarent par [13] jugement [. . .] ke Facins navoiet rins a ce quil clamoiet encontre la maison [. . .] (Document 12600509, 11). Et je tel ez ki reporteis mastoit [14] en amoene de Johan, le u Thomas devant dit, rendi entierement, ke je bien pou faere par droit et [15] par loi, [. . .] a dant Anthone de Termong [. . .] (Document 12701126, 13).

Il est trs rare de rencontrer une subordonne relate par un pronom qui joue elle seule un rle argumental. Ce circonstant thmatique en est la seule attestation dans notre corpus:133
Ki tout menbre u ochiit home, [. . .] cors et avoirs est [7] a la volentei le signeur (Document 124109, 6).

Nanmoins, lemploi de la relative en fonction argumentale est bien attest en ancien franais, au cas sujet (extraits tirs de Moignet 1988, 156157, nous soulignons):
Ki lui portat suef le st nurrir. (Alexis 32). Or voi je bien qui vos a destorn a garir tant longuement[.] (Tristan pr. 315, 2).

Mais aussi au cas rgime, que nous avons quali de sous-spci (extraits tirs de Moignet 1988, 159):
Artus sot que Frolles feisoit. (Wace, Brut 9971). Donc vos dirai je, dist Josephes, que vos feroiz. (Queste 35, 3).

Il reste cependant extrmement frquent que la subordonne relate soit appose un nom ou un adverbe il sagit alors dun fait de syntaxe immdiate (3.4.6.4).
132 La plupart du temps, cependant, la subordonne est appose un adverbe. Dans ce cas, la

relation contracte par la subordonne est en syntaxe immdiate, voir p. 135.


133 Autres attestations en afr., voir Moignet 1988, 157.

112

Enn, les relateurs qui spcient la relation impliquant une subordonne de la sorte se trouvent, dans limmense majorit des cas, au dbut de la proposition en question.134 On observe donc un fonctionnement similaire celui observ dans le cadre darguments nominaux (3.4.4.2). b. Absence de relateur. En labsence de relateur, nous estimerons sauf si lenchssement ou le mode du prdicat sy oppose quil ny a pas subordination, mais juxtaposition, et quon a affaire deux phrases diffrentes. Il est assez exceptionnel quune proposition fonctionne comme un argument sans quaucun relateur ne laccompagne. Nous reprendrons dans ce cas les termes traditionnels et distinguerons les incidentes des constructions paratactiques ces dernires ne sont pas attestes en contexte argumental (3.4.6.4 c). Les incidentes sont des propositions personnelles sans marque segmentale de subordination, mais dont lintgration (enchssement) trahit la position hirarchique: elles ont fonction de C5. Parmi les incidentes, on distingue deux groupes principaux: celles qui utilisent le nom quel et celles qui utilisent la formule (c)est a savoir/dire (voir les exemples analyss ci-dessous). Dans tous ces cas, il y a une dpendance discursive entre la principale et lincidente. En dehors des marques intgratives, seules des raisons smantiques ou discursives peuvent tre allgues pour asseoir la dpendance de la proposition en quel par rapport la principale: si lon nglige lenchssement, la proposition est une phrase part entire. Gnralement, le et quel sont apposs un autre nom (3.4.6.1 a). Il y a donc prcision smantique importante apporte par ce nom, qui contribue renforcer lautonomie de la proposition sur ce plan.
[. . .] nos veimes et oimes ke sires Godefrois [9] desor noms avoit laisis trois bonirs de alut, li qus alus gisoit a Musin, [10] a poveres begines del paroche de Sain Cristoe [. . .] (Document 12700606, 8).

Le corpus ne livre que deux attestations o ce nest pas le cas:


Je weilh et ordene [. . .] que [5] li vi mars de cens, les queis jai lassis en me testament sor ma maison de_le Fosse, [. . .] soient quittes et paisueles (Document 12830213a, 3) Et se tient Jakemins devant dis [17] et damme Evelette, sa femme, delle maison de Robermont hiretablement une curt ki siet [18] desoz la ville de Robermont devers Jupilhe, la quele fut de_le parchon ki fut faite [. . .], par teilh condition ke [. . . ] (Document 12600221b, 16).

En ce qui concerne les incidentes contenant la formule ge (c)est a savoir ou (c)est a dire, par exemple,
[. . .] avons vendu az homes de religion (cest a savoir: al abbeit et a covent de la maison de la Val [3] Saint Lambert, del ordene de Cysteaz, del esveschiet de Liege) la grosse et la menue dime de la ville et del terrois de Peres [. . .] (Document 126505a, 2).

134 Il est exceptionnel que cela ne soit pas le cas. Cela narrive que pour quelques concessives,

qui sont par ailleurs difciles analyser et mriteraient une tude: Et nos [. . .] avons au[14]-tresi en_covent [. . .] ken quilh avenge de nos wendes, lor [15] stiut a warandir [. . .] (Document 12590116, 14). On dirait que le pronom relatif ken est rejet devant le relateur qu lanalyse qui consiste faire de ce relateur un pronom relatif dont lantcdent serait ken (Moignet 1988, 166) est ici rejete.

113

on voit clairement comment ces incidentes sinsrent dans la phrase.135 Les attestations dautres types dincidentes sont sporadiques, mais leur intgration rend lanalyse vidente:
Et se tient Jakemins devant dis [17] et damme Evelette, sa femme, delle maison de Robermont hiretablement une curt ki siet [18] desoz la ville de Robermont devers Jupilhe [. . .] (se moet li curs devant dite de la maison de [20] Robermont par desore nommee; sen rent Jakemins et sei hoir chascun an a la maison de [21] Robermont par desore nommee cink solz de_ligois et dous capons) [. . .], par teilh condition ke [. . . ] (Document 12600221b, 16). [. . .] me sires Libiers Butores prist le dit sor lui et si [14] le_dist en ce manire entre Sainte Marie et Saint Lambier a Liege (devant nos si ke devant les hommes de Chize Deu ): ke li en-[15]-fant de Corwaremme devant dit navoient droiet a lalu devant nom quilh clamoient a la maison de_la Vas Benoiete (me [16] sires Libiers Butores demandat auz enfans de Corwaremme devant dis silh nient clamoient a lalu devant nom; li enfant [17] de Corwaremme respondirent chascuns por li kilh nient navoient a lalu devant nom; chis dis et ces covenances devant [18] enscrites furent faietes et recordeez par_devant nos et mises en nos wardes et en nos retenances entre Sainte Marie et Saint [19] Lambier a Liege); et ke 136 li maisons de la Vas Benoiete devant dite devoiet demorer quitte et en paiz ens el alu devant nom, [20] si ken lor bon iretage (Document 12640907, 13). Et li hyretages [16] ki devant est dis est teiz: trois boniers de terre, une quarte moins, ki gist sor le streie en la Mute_rue (en dois pieches), un jornal [17] de preit ki gist a le Herchonoir, [. . .] (et tot che muet del eveske), [21] et un jornal de terre ki muet de la maison et sa curt et sa maison. (Document 12711222, 15).

3.4.4.6

Propositions avec prdicat non personnel

Le seul cas envisager est celui des propositions innitives contractant une fonction argumentale nous navons en effet pas trouv de proposition participiale argumentale.137 Il est malais de dcrire de manire cohrente toutes les structures o une proposition dont le prdicat est linnitif est employe comme argument dun prdicat de niveau dintgration suprieur.138 Devant ce phnomne complexe, nous avons choisi la solution qui paraissait la plus raisonnable et la plus conforme au modle. Une srie de cas relevs sont relativement simples (a), dautres requirent une discussion. La question essentielle tant de savoir quel prdicat (linnitif ou le verbe quil complmente) se rapportent les arguments, nous analyserons dune part les relations attributives (b) et, dautre part, la construction factitive et les verbes de perception (c). a. Cas simples. Il y a tout dabord une srie de cas simples o linnitif constitue le prdicat dune proposition innitive qui peut tre analyse comme le R2 du prdicat
135 Par contre, lanalyse de linnitif et du constituant qui le suit est nettement moins vidente

(3.4.4.6).
136 Coordonn la subordonne dbutant la n de la ligne 14. 137 Nous avons pos plus haut lextension de la notion de proposition aux syntagmes dont le

centre est un participe (3.4.2).


138 Le niveau dintgration de linnitif nest pas toujours vident dterminer: est-il impliqu

dans une relation argumentale ou immdiate (3.4.7.1)?

114

principal: mme si linnitif, invariable, bloque toute possibilit daccord et nous prive de cet indice pour valuer lorientation, la commutation avec le reste plausible. Dans certains cas, la proposition innitive ne comporte aucun argument:
se il avenoit ke nobles [2] hom, nos chiers foiables Guis, cuens de Flandres, geust a ost [. . .], si com il puet faire (Document 12630527b, 1).

mais il est plus courant quelle comprenne un argument ou plus


sautres [13] ke nos i clamoit droiture et voloit faire estal [. . .] (Document 123712, 12). leveskes doit envoier deus de ses hommes la u om nos froit tort (Document 12420502, 12).

o estal nest pas R2 de voloit, ni deux de ses hommes. . . R2 de doit pour des raisons smantiques. Cette analyse vaut pour tous les semi-auxiliaires (voloir, povoir, devoir). La construction factitive sans agent sanalyse pareillement:
je, Lowis Naveaz [. . .] et li autre homme de_le Cise Deu, faisons kenoiestre verit (Document 12600609, 1). Nos faisons savoir [. . .] ke nos a damme Agns Hubine de Hoy avons en doniers conteis rechies quarante set mars de lie-[4]-gois (Document 128802a, 3).

verit et ke nos a damme. . . sont respectivement les rgimes de kenoiestre et savoir. Linnitive joue parfois le rle de A4 ou de C5, mais elle est alors relate. nouveau, les constructions sanalysent facilement:
A4139 : cilh ki sont et ki a venir sont ke [. . .] (Document 12650704, 2); C5: la maisons poroit aler a hyretage [. . .] sens deminer (Document 12711222, 10).

b. Relations attributives. Examinons prsent ce qui se passe quand, dun point de vue smantique, un constituant qui exprime un participant du procs dnot par le prdicat linnitif est galement interprtable comme un participant du procs du prdicat principal. Ainsi, dans
Et ce prometons nos a_faire (Document 12430709, 16). Nos faisons savoir a tous ke nos a damme Agns Hubine de Hoy avons en donirs conteis rechies quarante set mars [4] de liegois [. . . ] (Document 128802b, 3).

le ce du premier exemple est-il R2 de prometons ou de faire? La subordonne du second exemple est-elle argument de faisons ou de savoir? En comparant la construction
Et si est a savoir ke [. . . ] li dis et le taxations des deus de ces trois seroit tenus. (Document 12630527b, 12).
139 Le fait que le prdicat rgissant linnitif soit lui-mme le prdicat dune subordonne na pas

dimplication de ce point de vue. Voir 3.4.6.4 pour un dveloppement sur les subordonnes en syntaxe immdiate.

115

[a savoir]

A4

[est]

S1

que. . .

relation attributive
F IG . 3.38 Structure de a savoir est que. . .

[a savoir]

A4

faisons

R2

que. . .

relation attributive
F IG . 3.39 Structure de a savoir faisons que. . .

o estre a savoir que. . . pose la coorientation (3.4.2.1 b) entre a savoir et la subordonne, on peut, en se souvenant de la construction de lattribution entre R2 et A4140 , dduire que faire a savoir que. . . exprime la mme relation smantique entre les deux arguments (soit lanalyse donne dans la gure 3.38). Similairement, on en dduit donc lanalyse donne dans la gure 3.39. Cette hypothse est conforte par la possibilit de coordonner (3.4.7.2) linnitif relat un autre constituant qui sanalyse comme un A4 (3.4.2.4):
ju [. . .] fai a_savoir et connissance [2] ke jen, a la rente et a lamoine [. . .] meet Henri Polarde[. . .] (Document 127312, 1).

Largument connissance est coorient par rapport au R2 (la subordonne). c. Factitifs et verbes de perception. Les constructions factitives et lemploi de verbes de perception comme prdicat permettent la construction dintgrer un argument supplmentaire, exprimant lagent du procs dnot par linnitif. Examinons trois extraits:
loerai et fera loer me femme [. . .] le pais ki est faite (Document 12371012, 4). [. . .] ge ai priiet a mon [13] seignor levesque devant dit quil [. . .] me face [14] tenir toutes les covenances [. . .] (Document 126404, 12). si ke je o tesmonghier [5] mon frere devant dit (Document 12670828, 4).

Dans le deuxime et le troisime exemples, le marquage casuel ne laisse aucun doute sur le statut des constituants: les formes me et mon sont limpides et la forme frere prend un -s au singulier partout o il est employ comme S1 dans le mme texte. Largument supplmentaire est donc un rgime et non un sujet: voir un S1 dans cet argument serait incompatible avec le modle. Deux questions subsistent cependant: de quel type de rgime sagit-il (R2 ou R3)? quel est le prdicat quil complmente? Pour la construction factitive, il ny a pas dattestation o cette fonction est remplie par un membre du paradigme il, le, li, mais largument est souvent prcd dun relateur (spcication analytique):
Nos faisons savoir a tous ke nos [. . .] avons [. . .] rechies quarante set mars [. . .] (Document 128802a, 3).
140 Cest--dire le traditionnel attribut du complment dobjet direct, cf. la transformation

prsente p. 100.

116

me femme

R3

fera (1re pers. sg.)

R2

[loer. . . ]

F IG . 3.40 Structure de fera loer me femme

R2 [ke. . .] attribution [vos. . .] [a savoir. . .] A4 R3 faisons

F IG . 3.41 Structure de a savoir vos faisons ke. . .

mon frere

R2

[o ]

A4

tesmonghier. . .

relation attributive
F IG . 3.42 Structure de o mon frere tesmonghier

Sil sagissait dun R2, il faudrait admettre que ces cas seraient les seules attestations de R2 relats dans le corpus.141 Il sagit donc dun R3. Or, le fait daccepter ou non un rgime dans son schma argumental est une proprit lie au lexme verbal. Comme lactant R3 est limit une petite catgorie de verbes, alors que la transformation factitive ne lest pas, il est plus conomique et cohrent de considrer que ce R3 est rgi par lauxiliaire factitif, et quil est prvu dans le schma argumental de faire ainsi employ (schmatiquement: voir gure 3.40). Dans certains cas, linnitif est relat:
Nos vos faisons a_savoir ke nos avons vendut a maistre Conrar, chanone de Saint Donis en Liege, le nostre part [3] delle dime de Melen grosse et graile et menue [. . .] (Document 12760610b, 2).

Lanalyse ne change pas, si ce nest que linnitif doit tre considr comme un A4 et que la structure attributive expose supra sy combine (gure 3.41). Ce sont donc les informations stockes dans le verbe qui rendent possible linterprtation des relations. Par contre, la situation des verbes de perception est toute diffrente. La seule attestation du corpus142 (cite ci-dessus) permet dj de tirer des conclusions. Le lexme tesmonghier ne prvoit pas de place pour un rgime dans son schma argumental. En consquence, largument est forcment R2 du verbe de perception. Nous conclurons schmatiquement par la gure 3.42: R2 et A4 contractent une relation attributive,
141 Comme on la vu ci-dessus, R2 rejette le relateur (3.4.4.2). 142 Mais le tour est frquent en ancien franais (cf. Mnard 1994, 165).

117

[me]

R2

[constraindre]

A4

[a tenir. . . ]

relation attributive
F IG . 3.43 Structure de me constraindre a tenir. . .

fonde sur le fait quils sont des dsignations de la mme ralit (ils sont donc coorients). Cette similarit smantique se retrouve dans le lien qui unit le sujet et le prdicat (combinaison, 3.4.2.2 b). La relation attributive et la combinaison du sujet et du prdicat sont donc deux moyens morphosyntaxiques diffrents dexprimer le mme contenu smantique.143 Il parat cohrent dexpliquer de la mme manire les rgimes de prdicats qui sont dj complments par un innitif relat (A4). On fera abstraction des semi-auxiliaires dans les attestations suivantes:
me puissent constraindre par lor force a te-[11]-nir ces covenances devant dites (Document 126404, 10). elle le poroit [9] destraindre a pair (Document 12490625, 8).

Malgr la proximit smantique de la tournure factitive et de ces constructions, il nest pas possible de soutenir que les rgimes de me et le sont des R3 (gure 3.43). 3.4.4.7 Synthse de la construction des arguments

Trois faits ressortent de manire particulirement prgnante de ce qui prcde. a. Importance de la sous-spcication. Lancien franais ne possdant quun systme de dclinaison relativement pauvre, la spcication synthtique est souvent trs lche, et des moyens analytiques se superposent pour lever les ambiguts. En prsence dune forme ambigu, nous parlons, comme le fait Alain Lemarchal, de sous-spcication. La manire dont les relations argumentales sont spcies est assez claire. Le plus frappant est que lomniprsence de la sous-spcication et la facultativit de certaines marques (3.4.4.2) nempchent pas que les rles des arguments soient exprims sans ambigut. Cest un faisceau dindices qui permet la comprhension. Le systme donne une grande latitude et, dun point de vue diachronique, prpare le changement. Les moyens mis en uvre pour spcier les relations peuvent tre de niveau infrieur au mot (synthtiques, 3.4.4.1). Paralllement, certaines spcications sont faites par lemploi de relateurs (mots indpendants). b. Dlimitation des constituants. Quel que soit le moyen employ pour spcier les relations, on constate quil joue galement un rle dmarcatif: laccord marque toutes les units impliques,144 les relateurs se rencontrent au dbut des structures quils intgrent. Partant, il est tout fait possible sans comprendre les structures, de les
143 Cela revient dire que le traditionnel sujet de la proposition innitive est une sorte

dapposition linnitif; cette position est celle que dfend Marc Wilmet (2003, 642) pour le franais moderne. 144 Le fait sera plus clair encore ci-dessous, quand il sera question de dcrire les relations immdiates 3.4.6.1.

118

dlimiter en se servant des segments dont on connat au moins partiellement la valeur spcicative. c. Lien entre natures et fonctions. Le systme, souple, autorise les mots des classes du verbe et du nom assumer toutes les fonctions argumentales (Dcrites dans la section 3.4.2). Apparemment, ladverbe est par nature limit certaines fonctions (3.4.4.4). Ces diffrentes fonctions peuvent galement tre contractes par des structures complexes: des propositions entires. Ces propositions, si elles sont personnelles, sont le plus souvent relates; cest--dire que la relation quelles contractent est gnralement spcie (3.4.4.5). Les moyens mis en uvre pour spcier les relations entretenues par ce genre de constituant sont gnralement segmentaux et analytiques. 3.4.5 Construction des noncs non phrastiques

Laisss en marge de lanalyse cause de leur caractre exceptionnel, les noncs non phrastiques se divisent en deux catgories: les structures qui expriment un procs et celles qui nen expriment pas. 3.4.5.1 Structure exprimant un procs

Lanalyse est diffrente suivant que le procs est exprim par un verbe linnitif ou au participe pass. a. Verbe linnitif. Certains noncs non phrastiques contiennent un verbe linnitif:
Jakemes, li provost, Johans, li dons, li archiakene et toz li capitelez de Sain Lamber de Liege, a toz ceaz ki verrunt ce letres, conoistre veriteit. (Document 123605, 1). Nos, suer Ode, par la Deu pacience humele abbeesse de la Valz Benoite delez Liege, del ordene de Ci-[2]-teaz, et trestoz li covens de cel liu meismes, a trestoz ceauz ki ces lettres veront, conoistre ve-[3]-riteit. (Document 12590116, 1) .

Dans ces exemples, les arguments comportent les mmes marques que les arguments de prdicats personnels, si ce nest quaucun constituant immdiat ne commute avec il. Nanmoins, les constituants Jakemes . . . et toz li capitelez de Sain Lamber de Liege et nos, suer Ode . . . et trestoz li covens. . . portent les marques morphologiques spciant habituellement S1. La structure avec un prdicat linnitif est trs proche de la structure proprement phrastique, mais il ne nous semble pas cohrent de la reprsenter de la mme manire (schmatiquement, voir gure 3.44). Le marquage du prtendu S1 correspond celui du constituant qui exprime lagent de la phrase active. Cependant, dun point de vue smantique, ce S1 nest manifestement pas lagent du procs de conoistre, qui ne serait pas attest avec un bnciaire (exprim par R3) ailleurs que dans ce type de contexte. Pour viter les erreurs, mieux vaut partir de constructions exprimant un procs, mais ne comportant pas de verbe.
Henris, par le grase de Deu evekes de Liege, a_tos cias ki ces presens lettres veront, salut en Nostre Signeur. (Document 126311, 1).

119

S1
[Jakemes. . .] [veriteit] [a toz ceaz. . .]

R2

[conoistre]

R3
F IG . 3.44 Structure rejete de Jakemes. . . conoistre veriteit

[S1 Henris. . .] R2 salut en Nostre Signeur [R3 a tos cias. . .]


F IG . 3.45 Structure de Henri. . . salut en Nostre Signeur

A totes justices seculees ki ces presenz letres verunt et oront, nos, Gerars, che-[2]-valiers de Berloz, Baduins, prevoz de Sain Gilhe, executor de testament jadis da_me_ [3] Jehanne, feme Johan dOhai, saluz et conisance de veritei. (Document 12841004, 1).

Smantiquement, lnonc exprime les procs connatre et saluer. Au point de vue morphosyntaxique, on remarquera: 1/ la spcication marquant lagent de la phrase biactancielle (marque casuelle) reste prsente; 2/ ces constructions sans prdicat verbal commutent parfois librement avec une phrase dont la structure est trs ressemblante:
Michiez, par le Deu pascience abbs delle glise mon sainor sain Jakeme de Liege, delle [2] ordene saint Benoit, a tos ceaz ki ces letres veront fait conisance de verit. (Document 12630719, 1).

Lutilisation ou non du verbe faire ne change rien lemploi des marques casuelles: les relations restent spcies. Faute de mieux, et pour rendre compte de la proximit des structures, nous avons identi les grands constituants de lnonc non phrastique laide des mmes tiquettes que celles qui ont servi pour dsigner les arguments, mais ce ne sont plus les relations qui sont caractrises (gure 3.45).145 La coordination (3.4.7.2) de salut une proposition innitive, telle quatteste dans

145 Cela revient malheureusement poser une sorte de prdicat zro.

120

[S1 Jakemes. . .] R2 [conoistre]

R2

[veriteit]

[R3 a toz ceaz. . .]


F IG . 3.46 Structure de Jakemes. . . conoistre veriteit

A tos ceas qui ces presens letres veront, nos, li homme delle Cise Deu, salus et conoiestre verit. (Document 12690223, 1).

nous autorise reporter lanalyse sur la structure comprenant un innitif (gure 3.46). Il faudra nanmoins toujours garder lesprit que les relations dcrites dans un cadre phrastique ne sont pas du mme ordre que celles dcrites dans un cadre non phrastique: en labsence de prdicat, on ne peut plus parler darguments. b. Verbe au participe pass. Dans deux cas, le verbe nest pas linnitif, mais au participe pass:
Ce fait lan del Incarnation [27] de Nostre Saingnor milh et cc quarante set, ens elle mois de junii (Document 124706, 26). Che fait et doneit en lan de grasse milhe deus_cens quatre viens et set, en mois de fevrier (Document 128802b).

Nous pensons que ce genre de construction est d une erreur du scribe et ne mrite pas ici une description approfondie. La deuxime des deux occurrences releves se trouve dans un document dont nous possdons par ailleurs une deuxime expdition effectue par la mme main et ne prsentant pas la mme structure:
Che fut fait et doneit en lan de grasse milhe dues cens quatre_vins et set, en mois de fevrier (Document 128802a).

Si lon se rsigne admettre que la seconde attestation est peu orthodoxe, il ny aurait quun seul nonc non phrastique exprimant un procs laide dun participe pass dans lensemble du corpus. 3.4.5.2 Structure nexprimant pas un procs

Dans certains cas, lnonc non phrastique nexprime aucun procs; cest le cas pour les invocations du protocole initial et les signatures:
En non dou Pere, dou Fil et dou Saint Esperite, Amen. (Document 127203, 1). G. de Salud[illisible] (Document 12890112, 38).

121

[En nom du Pere. . .] [Amen. . .]


F IG . 3.47 Structure de En nom du Pere. . . Amen

Ici, lanalyse du premier niveau dintgration doit se limiter une simple segmentation (gure 3.47). 3.4.6 Relations immdiates

Les fonctions que les mots de la phrase-nonc contractent ne sont pas toujours lies directement au prdicat (relation ou spcication de celle-ci). Certes, la condition ncessaire et sufsante pour pouvoir parler de phrase est la prsence dun prdicat et de ses arguments; de ce fait, si un constituant immdiat de la phrase autre que le prdicat est prsent, il est forcment impliqu dans une des relations argumentales possibles avec ce dernier. Toutes les relations qui ne sont pas proprement argumentales sont forcment subordonnes celles-ci. Elles sont donc contractes par des constituants qui ne jouent pas le rle darguments, mais sont intgres une unit plus large. Toutefois, cela ne les empche pas davoir une inuence plus ou moins importante sur le rle que le constituant intgrant peut jouer. Par exemple, dans
A toz ceaz ki cez letres veront et oront, li home de_le Chize Deu font conoistre verit (Document 12671029, 1).

il y a bien un prdicat (font), un sujet (li home. . .), un R2 (conoistre. . .) et un R3 (a toz ceaz. . .), mais dcrire ces relations ne suft pas donner une analyse complte de la phrase: il y a une relation qui unit, dans R3, le a au reste de largument, de mme que li et home sont organiss dune certaine manire lun par rapport lautre, etc. Par consquent, les marqueurs ont des fonctions syntaxiques diffrentes:146 1/ au niveau de la syntaxe phrastique, ils expriment la relation entre largument et le prdicat; 2/ au niveau de la syntaxe immdiate, ils indiquent quels mots fonctionnent ensemble (dmarcation des constituants). Pour dcrire les relations immdiates, nous prendrons nouveau appui sur la morphologie. Les constituants nominaux, qui comportent des marques morphologiques (3.4.6.1 et 3.4.6.2) sont distincts de ceux qui nen comportent pas (constituants adverbiaux, 3.4.6.3). Les propositions peuvent galement contracter des rapports ce niveau (3.4.6.4 et 3.4.6.5). 3.4.6.1 Apposition et dtermination

Du fait quils sont porteurs de plus de marques, les constituants nominaux permettent de classer facilement les relations impliques dans leur construction. Nous dnirons dabord la relation dapposition, en transposant la notion de combinaison au niveau immdiat (a). Nous aborderons ensuite la relation de dtermination, qui place un constituant en situation de dpendance par rapport la partie la plus centrale du syntagme (b).
146 Voir la distinction entre les trois niveaux de la syntaxe selon Gilbert Lazard (3.2.3).

122

[sires]

apposition

[Gerars]

S1

[aroit]

F IG . 3.48 Structure de sires Gerars aroit. . .

a. Apposition. Le type de relation qui unit le sujet au prdicat aide comprendre la manire dont sorganise le marquage des fonctions. Comme on la vu, la relation entre largument S1 et le prdicat est exprime par des moyens exionnels (3.4.4.1). Or, les units qui servent former lactant 1 sont galement unies par un phnomne daccord: elles partagent non seulement des marques de genre et de nombre semblables, mais aussi les marques de lappartenance la premire srie casuelle. En dautres termes, la mme marque exprime la fois la cohsion du syntagme et la fonction que celui-ci contracte avec le prdicat. Le fait est limpide dans:147
[. . . ] sires Gerars, par le poine et le travailh, aroit quatre mars de ligiois (Document 12630331, 17).

En plus du choix dune forme correspondant au cas sujet, la combinaison entre le sujet et le prdicat implique une contrainte daccord entre les constituants du sujet. Cet accord interne largument nest pas le fait exclusif de S1: on observe un comportement similaire pour R2, R3 et C5:148
R2: ilh ara receut le conte devant dit a home (Document 12630715, 8); R3: nos avons donet Warnier le bolengier [. . .] une mason [4] en hiretage lui et ses oirs (Document 12520301b, 3); C5: Ce fut fait le lundi [. . .] a Enchastres [. . .] (Document 12361215, 13).

Nous voyons une relation du mme ordre entre sires et Gerars, le et comte, le et lundi quentre un sujet et un prdicat: une combinaison; ceci prs que la dpendance qui affecte le sujet ne se retrouve pas ce niveau. Il y a coorientation entre chacun des constituants de ces arguments: nouveau, dun point de vue smantique, ces mots dnotent des caractristiques dun mme objet (3.4.2.1 b). En ce qui concerne la hirarchie des constituants et des relations, cette combinaison a une porte qui natteint pas le niveau des relations argumentales: la relation qui lie sires et Gerars est distincte de celle qui existe entre sires Gerars et aroit. Le terme dapposition sera rserv ces combinaisons qui ne lient pas le sujet et le prdicat (gure 3.48). Dautre part, lindice morphologique dapposition que constitue laccord permet de dterminer parfois de manire trs prcise les bornes des arguments, cest--dire lendroit o ils commencent et celui o ils nissent. Cette observation contribue relativiser lintgrit de la dmarche analytique (3.4.1.1): il est bien clair quon a besoin de ces marques pour isoler les arguments. En syntaxe immdiate, laccord est
147 Il est peu dexemples aussi simples: le contexte ci-dessous livre en effet mes sires Gerars et

non sires Gerars. Le possessif est retranch parce quil implique un niveau supplmentaire de hirarchie. Voir 3.4.7.3. 148 C6 nest pas attest sous forme nominale, et A4 nominal est toujours relat. Par ailleurs, ces exemples prsentent galement une hirarchisation des appositions, phnomne trait plus bas (3.4.7.3).

123

combinaison @coorientation @cointgration S1 @syntaxe argumentale apposition @syntaxe immdiate

F IG . 3.49 Types de combinaisons

lhe

Dt

mon saingnor. . .

F IG . 3.50 Structure de lhe mon saingnor. . .

un moyen relativement sr dvaluer que les constituants fonctionnent ensemble. Le classement des relations se prcise (gure 3.49). b. Dtermination. Nanmoins, toutes les units lintrieur dun argument ne sont pas forcment apposes; souvent, laccord ne rassemble pas toutes les units:
[. . .] damoiselle Sybille, lhe mon saingnor Leone [. . .], vint par devant [3] nos et par devant les hommes de le Chiese Deu (Document 12600203, 2). [. . .] lan-[5]-demain des aposteles saint Piere et saint Pol, vint par devant nos, entre Sainte [6] Marie et Saint Lambiert a Liege, sires Henris, ls Ernu Baise-aine, prestres et [7] vestis adont del auteit saint Lorent (Document 12740630, 4).

Dans le premier exemple, au niveau argumental, le constituant damoiselle Sybille, lhe mon saingnor Leone est le sujet de vint. Mais la forme de mon saingnor Leone ne correspond pas elle seule un sujet on aurait certainement observ la forme *mes sires Leones dans ce cas. Cette rupture morphosyntaxique saccompagne, sur le plan smantique, dune rupture rfrentielle: alors quentre les deux mots damoiselle et Sybille il ny a pas de diffrence de rfrent (cest de la mme personne quon parle), lhe et Leone ne dsignent pas la mme personne. Nous concluons quun ensemble de mots qui nest pas accord avec le reste dun syntagme dont la forme implique une fonction particulire (p. ex.: S1) est en situation de dpendance. Dans lexemple, leffacement du reste du syntagme aurait pour consquence de changer la fonction de ce groupe par rapport au prdicat (et au surplus de produire un nonc irrgulier149 ):
**mon saingnor Leone [. . .] vint par devant Deu.
[3]

nos et par devant les hommes de le Chiese

Le constituant qui se trouve dans une telle position de rupture par rapport au syntagme est un dterminant (Dt). Il contracte une relation de dtermination avec les autres membres syntaxiques de mme niveau, quon nommera noyau. Ainsi, mon saingnor. . . dtermine le mot lhe dans la gure 3.50.150 Les choses sont trs claires dans le cadre dun S1. Quant aux complments (R2 en dehors de la relation attributive, R3, A4, C5), la rupture daccord est parfois visible
149 Par rapport au systme linguistique du texte, qui respecte la dclinaison. 150 Tout problme concernant la hirarchie des appositions mis part (3.4.7.3).

124

en dehors de tout marquage de type casuel, simplement en se servant des marques du genre et du nombre:
[. . .] ches chozes sont [13] contenues plus plainement es letres le eveske devant dit ki de che sont faites. (Document 12630715, 12).

Cependant, la rupture nest pas toujours directement perceptible, puisque ce sont les mmes marques casuelles qui indiquent toutes ces fonctions autres que S1 (et R2 attributif) le cas rgime.151 Ainsi, il ny a toujours pas de diffrence de marquage casuel ou de marque de genre ou de nombre dans les constituants de
[le] testament Godefroit (Document 12740531b, 4).

et lon ne peut tirer les mmes conclusions que ci-dessus. Ces ambiguts sont impossibles lever sans oprer de transformation: cest nouveau les connaissances lexicosmantiques qui permettent de dire que, si le R2 ou R3 quon cherche valuer tait transpos en position de S1, les ruptures daccord similaires celles observes pour S1 seraient mises jour. Nous reconstituons
*Li testamens Godefroit est acomplis.

partir de
Et por chu ke [24] men arme soit acuitee et chis testamens del tot acomplis, je mes en le main de mes foimains [. . .]. (Document 12890112, 23).

pour aboutir aux mmes conclusions. La spcication se fait ainsi de manire synthtique, non grce un marquage particulier, mais grce un contraste entre les marquages de constituants cointgrs. La dtermination a parfois un pronom comme noyau:
[. . .] il [sont] tenut de faere cescun an troes anniversaeres : le signeur Asson, me pere, le damme Mahaut, me mere, et le Sapiente, me sereur [. . .]. (Document 127203, 11).

Le mcanisme de dtermination est fondamentalement identique celui de la complmentation dans le cadre actanciel. En consquence, il nous semble intressant denvisager les relations entre les constituants qui ne sont pas argumentaux comme similaires celles qui lient les arguments au prdicat. Nous nommerons slection lextension comprenant les relations de complmentation et de dtermination voir gure 3.51.152 Le point commun de la complmentation et de la dtermination est quil sagit de relations qui mettent un constituant en situation de dpendance par rapport un autre. Ce modle ne postule pas dautre hirarchie entre les constituants que celle qui oppose les combinaisons aux slections: sauf phnomnes complexes de hirarchie (3.4.7.3 et 3.4.7.4), tous les dterminants slectionnent en bloc tous les constituants apposs:
151 Dont on a soulign la sous-spcication (3.4.4.2). 152 Le terme slection vient de Louis Hjelmslev (3.2.1).

125

slection @non-coorientation @ou non-cointgration complmentation @syntaxe argumentale dtermination @syntaxe immdiate

F IG . 3.51 Types de slections

[le]

[decs]

Dt

[dame]

Magon

F IG . 3.52 Structure de le decs dame Magon possesseur

lhes

Dt

[a] mon sainor. . .

F IG . 3.53 Structure de lhes a mon sainor. . . le decs dame Magon [. . .] (Document 12830213b, 8).

est analys comme indiqu dans la gure 3.52. Nous ne discuterons pas ici des problmes spciques que posent lanalyse de larticle (considr ici comme un nom).

3.4.6.2

Spcication de la dtermination

Les exemples qui prcdent se caractrisent par labsence de relateur: bien souvent, la rupture nest marque que par des moyens morphologiques. Pour exprimer la notion dappartenance une personne, la relation de dtermination nest marque par aucun adverbe. De la mme faon que pour la complmentation (3.4.4.2), la langue a les moyens dexpliciter ou de spcier la relation syntaxique entre un noyau et ses dterminants par lemploi dadverbes relateurs, lesquels peuvent simplement expliciter la relation dj existante. Ainsi, les Dt avec ou sans relateurs sont en concurrence:153
damoiselle Sybille, lhe mon saingnor Leone [. . .] vint par devant [3] nos et par devant les hommes de le Chiese Deu (Document 12600203, 2). Mahot et Aielit, lhes a mon sainor Robiert de Corwaremme (Document 12640907, 3).

Soit, si on devait reprsenter schmatiquement la deuxime structure, la gure 3.53. Ce schma montre bien que le fonctionnement de la spcication est identique celui quon rencontre pour R3 au niveau argumental (3.4.4.2).
153 Cette concurrence est cependant limite: Le tour [sans prposition, cest--dire, dans la ter-

minologie employe ici, sans relateur] a un emploi restreint en ancien franais. Le dterminatif dsigne presque toujours une personne [. . .] (Moignet 1988, 92). Lauteur mentionne nanmoins quelques (rares) attestations qui font exception cette rgle.

126

En ce sens, lanalyse est assez proche de celle quAlain Lemarchal (1989, 129 138) propose du de de lexemple tesnirien le livre dAlfred. Daprs lui, le relateur ne permet pas la relation entre livre et Alfred, mais en modie la valeur. tant donn le potentiel morphologique de lancien franais, cest la exion qui permet ici la relation; le de ou le a sy superpose. Dans certains cas, le relateur spcie plus prcisment la relation:
le venre-[18]-di aprs lAscention (Document 12600514, 17). le judi devant la Magdalene (Document 12630719, 16).

Smantiquement, les relateurs avant et aprs positionnent la circonstance exprime par le dterminant par rapport celle exprime par le noyau, ici dans un contexte temporel. Il serait difcile dafner davantage le classement laide de critres morphosyntaxiques.154 Malheureusement, arrter le classement ce stade mne certains problmes pour dterminer quel niveau joue la slection (3.4.7.4). 3.4.6.3 Adverbes

Une grande partie des relateurs sont des adverbes.155 En plus de leur valeur spcicative, il faut rendre compte de leur insertion en syntaxe immdiate (a). Par ailleurs, les relations que les adverbes non-relateurs entretiennent avec dautres constituants rclament un peu dattention pour tre dcrites correctement. En particulier, un nom peut tre dtermin par un adverbe (b) et les adverbes peuvent fonctionner ensemble, soit en se combinant ou se dterminant (c), pour ventuellement former des relateurs complexes (d). a. Relateurs. La fonction qui unit le relateur au reste du syntagme dont il spcie la relation est diffrente de la spcication. En dehors de cette opposition, il ne parat pas ncessaire de pousser plus loin lanalyse: limportant est de constater que le relateur fonctionne avec les termes nominaux, de la mme faon quune dsinence chit le mot (3.1.2.2). Si lon considre la hirarchie des relations et des constituants, les
154 Alain Lemarchal (1989, ch. 12) propose de limiter lorientation primaire des noms en fr.

mod. aux dterminants introduits par de ou , relguant au second rang ceux qui sont relats par dautres adverbes. Nous nadhrons pas cette vision des choses: lextrme variabilit de la charge spcicative des relateurs de et ncessiterait une tude approfondie. Il nest pas envisageable non plus de se servir du point de vue smantique et de distinguer ici les dterminants quantiants des dterminants caractrisants de lanalyse en constituants immdiats (Soutet 2001, 294309), ni de poser un statut hirarchique subordonn ou mme superordonn larticle. Ce modle postule que les dterminants gravitent autour du nom et le prcisent smantiquement: les caractrisants limitent lensemble des objets du monde auxquels le syntagme est applicable (p. ex.: rouge, dans fr. ballon rouge); les quantiants dnombrent les objets dnots (p. ex.: un, le, deux). Malheureusement, en voyant les choses ainsi, il est souvent difcile de justier rigoureusement la position centrale du nom dtermin (pourquoi ballon ne limiterait-il pas lensemble des objets rouges?), en particulier en cas de substantivisation dadjectifs. 155 Voir cependant 3.4.6.4 a au sujet des pronoms relatifs.

127

spcication: BNF

[avons donet (P0)]

complmentation

[a]

[Warnier. . .]

F IG . 3.54 Fonctions du relateur au niveau argumental possesseur

lhes

Dt

[a]

[mon sainor. . .]

F IG . 3.55 Fonctions du relateur au niveau immdiat

relateurs font partie du constituant dont ils spcient la relation, au mme titre que les marques morphologiques de S1. Concrtement, dans lexemple dj abord,
*nos avons donet a Warnier [. . .] une mason.

la relation de complmentation lie a Warnier. . . au prdicat avons donet. Le groupe form par le relateur et le constituant avec lequel il fonctionne forme un bloc, ce qui implique lexistence dune relation entre ces constituants. De ce fait, il faudrait revoir les schmas pour noter explicitement le lien entre le relateur et le reste du syntagme (gures 3.54 et 3.55). Comme le montrent les schmas, la nature exacte de la relation entre le relateur et le reste du syntagme nest pas prcise. Ainsi, la question: Le relateur slectionne-t-il le terme nominal ou est-ce au contraire ce dernier qui dtermine le relateur? restera sans rponse.156 b. Dtermination dun nom par un adverbe. La simple cooccurrence dun adverbe qui ne soit pas un relateur dans un constituant contenant un nom constitue une rupture sur le plan morphologique. La continuit du marquage nominal est ainsi rompue par des marques intgratives et catgorielles. Par ailleurs, comme on va le voir, si le nom porte des marques spcicatives, ces dernires portent sur une relation contracte un niveau suprieur. Par exemple, ladverbe plus nest pas un relateur, il ne spcie pas la relation qui unit le constituant intgrant le nom quil dtermine aux autres constituants de mme niveau, mais apporte une prcision smantique.
Et por chu ki chis testamens soit plus fermes, ju, Bastiens, testamenteres devant dis, [35] lai fait saeler [. . .] (Document 12670828, 34). Et en ai pris Philippe Tabart a home, [34] par teil devise ke ce nest ke un sous homages de ces doze boniers ensemble [. . .] (Document 12670828, 33).
156 premire vue, cest plutt le relateur qui slectionne le terme nominal, puisquil spcie

la relation qui unit ce dernier dautres constituants de niveau suprieur. Nanmoins, dans la mesure o nous acceptons les thories de la translation bien quon ne puisse y faire appel pour des raisons mthodologiques (3.3.2) , la prsence du relateur pourrait tre la condition sine qua non pour que certains mots assument certaines fonctions. Il est mme des cas o le relateur peut tre employ seul (sans rgime) (Lemarchal 1989, 9498); par exemple, devant en fr. mod.

128

[ci]

[devant]

F IG . 3.56 Structure de ci devant

La forme de fermes rsulte de la relation dattribution qui lie plus fermes chis testamens. De mme, la forme homages est due la relation dattribution entre ce et sous homages. c. Relations entre adverbes. Le syntagme adverbial pose nouveau problme du fait quil ne comporte pas de marques morphologiques. Que faire devant des constituants composs seulement dadverbes? Comment dcrire la relation quils contractent? Soit les attestations suivantes:
sa partie des deniers ki ci devant sont nommeit (Document 12440119, 15). la quele dette [. . .] aloit [. . .] trop damajousement (Document 12600203, 4).

Les adverbes groups sont-ils apposs ou lun dtermine-t-il lautre? En labsence de repres morphosyntaxiques, seule la smantique aide y voir clair. Dans le premier des exemples ci-dessus, ci devant permet de comprendre en quoi consiste la coorientation dans le domaine adverbial. On a avanc que ladverbe tait une partie du discours comportant une spcication en langue (3.4.4.4). Si tel est le cas, la valeur de la spcication de deux adverbes coorients doit tre au moins partiellement identique. Dans le cas de ci, la valeur vhicule est celle dune localisation spatiale (au sens propre ou gur), alors que devant dnote une localisation spatio-temporelle. Dans ces conditions, lapposition est envisageable (gure 3.56). On trouve galement dans le corpus des attestations de ci ou devant isols avec un sens similaire:
Et quant ci termines se-[11]-ra passs, totes le fermets ki devant sunt dites cesseront (Document 12490625, 10). Et par [13] ce ke les changes et les convenances ki ci sunt de-visees soient plus fermes et [14] mielz conutes, avons nos fait saeleir ceste lettre del sael les Povres [. . .] (Document 12601002, 12).

Par contre, si largument trop damajousement exprime le cadre du procs dnot par aloit, nous ne pensons pas que les deux mots soient coorients. On admettra que le sens du mot trop na pas chang de manire signicative depuis lancien franais: il faut le voir sur le plan smantique comme un modicateur dintensit; il est dj peu probable quil manifeste la mme spcication que damajousement. De plus, si lon tente deffacer les constituants, on constate que le sens de *la quele dette aloit trop si tant est quune telle construction soit possible scarte plus radicalement du sens du contexte cit que *la quele dete aloit damajousement ne sen carte: aler trop damajousement est une faon daler damajousement. La conclusion de cela est que si trop modie le sens de la phrase, il le fait plus prcisment en modiant le sens du syntagme dans lequel il apparat; par contre, damajousement ne modie pas le sens de largument, mais le fonde. De ce fait, les deux adverbes ne peuvent tre apposs. Cette relation de dpendance sur le plan smantique implique que les relations entre 129

trop

dtermination

damajousement

F IG . 3.57 Structure de trop damajousement

par

dtermination

[deseur]

F IG . 3.58 Structure de par deseur avec dtermination (hors contexte)

par

[desor]

les quatuose. . .

F IG . 3.59 Structure de par deseur avec dtermination (relateur)

par

[desor]

les quatuose. . .

F IG . 3.60 Structure de par deseur sans dtermination (relateur)

par

[desor]

les quatuose. . .

F IG . 3.61 Structure de par desor les quatuose. . .

les mots aient lieu des niveaux dintgration syntaxique diffrents: trop dtermine damajousement de la mme manire quun dterminant dtermine un noyau nominal (gure 3.56). d. Relateurs complexes. Certains relateurs sont composs de plusieurs adverbes. Nous les nommerons relateurs complexes.
La reportat damoiselle Sy-[7]-bylle devant dite ens en la main del maior [. . .] douze boniere de terre errable et un jor-[9]-nal tierchal (Document 12600530b, 6). li abbs et li covens de_la Vals Saint Lambert mon paiet tout entiere-[3]-ment, [. . .] ce ke la grosse dime de Peres pooit plus valoir et [4] monter, par desor les quatuose vins mars ke je avoie ja receus [. . .] (Document 12670706, 2). Sacent thuit ke lan _de_ grase m cc lxx [. . .] vinrent par devant nos [. . .] Hen-[4]-ris li Hardis de Horion [. . .] et de sanior Ge-[6]-rare de Hemricurt [. . .] (Document 12700606, 2). pooir avoit [6] de par labesse et le covent (Document 12781017, 5).

Il est assez difcile de proposer une analyse des relations internes ces relateurs complexes. Par exemple, comme par deseur peut avoir seul la fonction C5, le raisonnement tenu ci-dessus (c) mne au schma 3.58. Faut-il garder cette analyse quand par deseur a une fonction de relateur (gure 3.59)? Dans ce cas, la mme description convient-elle ens en et de par? Ou bien faut-il analyser un enchanement de relateurs comme deux relateurs se succdant ce qui implique une hirarchisation du syntagme , cf. gure 3.60. Sans une tude approprie, il est plus prudent de dcrire ces combinaisons comme des gements lintrieur desquels les relations ne sont pas vraiment analysables (gure 3.61). 130

3.4.6.4

Propositions avec prdicat personnel

La subordination de propositions dont le prdicat est un mode personnel nest pas limite la construction des arguments, mais se retrouve galement tous les niveaux dintgration infrieurs. Le mcanisme de marquage de la relation y est similaire celui employ au niveau actanciel: un relateur exprime gnralement la subordination:
A toz ceaz ki cez letres veront et oront, li home de_le Chize Deu font conoistre verit (Document 12671029, 1). Et ilh recordarent tot en tel maniere ke chi desore est escrit. (Document 12730512, 15). Et la ou che fut fait furent present [. . .] (Document 12740224, 15).

Dans ltat de langue tudi, lemploi dun relateur est quasi systmatique, ce qui est comprhensible. Dans une langue o les changements dorientation sont essentiellement marqus par la exion nominale et les adverbes relateurs, les risques de confusion et dambigut pourraient tre importants en labsence de marque segmentale pour indiquer une relation entre une construction aussi longue et complexe que la proposition et le reste du syntagme qui lenglobe. La langue ne pouvant se servir de la morphologie pour indiquer la subordination, elle emploie des adverbes ddis cet usage. On a donc limpression que du point de vue de la structure de la langue, lemploi du relateur permet la proposition dassumer une fonction quelle ne pourrait contracter sans lui. Examinons les cas de relatives et compltives en relation avec un nom ou un adverbe. a. Relatives en relation avec un nom. Dans un contexte nominal, une subordonne peut entrer en relation avec un nom et tre relate par un mot qui exprime une dsignation de la mme ralit que ce nom:
[. . .] ma damme Beatris, ki ja fut abbesse de la maison devant dite, en_prist don et vesture entre Sainte Marie et Saint Lam-[7]-bert [. . .] (Document 12600514, 6). A toz ceaz ki cez letres veront et oront, li home de_le Chize Deu font conoistre verit. (Document 12671029, 1). [. . .] Facins navoiet rins a ce quil clamoiet encontre la maison de (Document 12600509, 18).
[14]

la Valz Benoite

Et de cest ez Henris devant [10] diz retient un bonier, dont ilh demorat hom de ez le saignor dAstenoit. (Document 12660613, 9). Item, je lai Bastien, mon ann lh, me grande maison de Sain Servais u ju [4] demoure [. . .] (Document 12890112, 3).

Tous ces cas appartiennent la classe de ce que la grammaire traditionnelle dsigne du nom de relative et sont trs proches du franais moderne. La relative entretient une relation particulire avec son antcdent. Le dveloppement que fait Alain Lemarchal (1997, ch. 5 et 6) ce sujet est le suivant: daprs lui, les relatives sont des propositions que le relateur subordonne, mais aussi oriente vers lantcdent. 131

[nom]

coorientation

[relateur]

proposition

F IG . 3.62 Apposition dune relative et dun nom

[nom]

coorientation

[relateur]

[P0]

F IG . 3.63 Apposition dune relative et dun nom: fonctions du relateur

Lantcdent et la relative sont, dun point de vue smantique, des dsignations de la mme ralit (cf. Lemarchal 1997, 175); soit la gure 3.62. Cest peu prs ce que Grard Moignet (1988, 155), qui estime que la relative est une sorte de substantif de discours, a exprim en ces termes:
Ltre que dsigne la proposition relative ainsi constitue est affect dans une autre phrase, dite rgissante,157 des fonctions grammaticales du substantif: sujet, objet, apposition, rgime prpositionnel, rgime absolu ou de ladjectif: pithte, apposition, quand il est rfr un substantif ou a un pronom, dit antcdent.

Pour Alain Lemarchal, tant lantcdent que la relative sont orients vers un participant. De mme, un relateur adverbial supplmentaire orienterait la relative en consquence; ainsi, dans fr. mod.158
hache avec laquelle Paul coupe les arbres

le nom hache et la relative seraient tous deux orients vers linstrument. Cette analyse ne convient que si lon pose que le relateur nominal ne remplit pas de fonction lintrieur de la relative, mais ne fait que lintroduire et la spcier. Nous prfrons considrer que le nom qui joue le rle de relateur est impliqu dans le schma argumental du prdicat de la relative. La relation entre le relateur et le reste du syntagme est donc spcie (gure 3.63). Dans ce cas, autant il est ais dadmettre quil y a bien coorientation entre la relative et lantcdent, autant nous ne voyons pas comment le constituant form par la relative (en ce compris le relateur) pourrait, en dehors de toute relation de slection, tre orient vers autre chose que lui-mme. Il y a semble-til une distinction faire entre la fonction immdiate qui appose antcdent et relative et la fonction (ventuellement argumentale) que le constituant ainsi form contracte. Si lon reprend et que lon dveloppe le dernier exemple, on voit que le constituant en question (la hache avec laquelle Paul coupe les arbres) peut tre orient diffremment:159
patient: Il a vol la hache avec laquelle Paul coupe les arbres. agent: La hache avec laquelle Paul coupe les arbres tranche bien.
157 Nous soulignons lautonyme. 158 Pour simplier, nous commenons lexpos par un exemple en franais moderne, qui ne

diffre pas de lancien franais sur ce point.


159 Larticle, que lauteur considre comme un substantivant du syntagme nominal

(Lemarchal 1989, 4654), pourrait tre considr comme coorient.

132

instrument: Il sest bless avec la hache avec laquelle Paul coupe les arbres.

Cest une contrainte supplmentaire qui spcie lorientation au niveau argumental (marque squentielle ou marque segmentale). Lancien franais fonctionnait dj ainsi. Dans lexemple qui suit, ki est la forme contrainte de S1, mais lensemble a toz ceaz ki cez letres veront et oront est R3:
A toz ceaz ki cez letres veront et oront, li home de_le Chize Deu font conoistre verit. (Document 12671029, 1).

La forme du relateur nest donc pas lie au contexte intgrant, mais la fonction quil a dans la subordonne. Ce cas de coordination le montre particulirement bien:
Alisandres [. . .] werpit le siene part de tot lalu ki gist a Oire et sor cui li cens gist ke Jakemins dOire ki [7] fut lur lassat, lui et Gilet, son frere, en amoine. (Document 12840212, 5).

Dans le cadre des constituants propositionnels comportant ce type de relateur, la exion nominale nest ainsi daucun secours pour apprhender la coorientation par rapport lantcdent, purement smantique.160 Cest cette coorientation qui est lindice dapposition de la subordonne au nom. Puisque la spcication du relateur prend effet lintrieur de la subordonne, la prsence dun adverbe spcicateur joue un niveau syntaxique infrieur la subordination; dans lextrait suivant, par permet dexprimer la cause du procs de la subordonne:
[. . .] me sires Facins, se peres, nen st onkes chose par quen ilh dewiste estre deserits. (Document 12760722, 5).

Les relateurs adverbiaux se comportent de manire identique et leur orientation propre peut diffrer de lorientation de la subordonne considre dans son ensemble:
Et de cest ez Henris devant [10] diz retient un bonier, dont ilh demorat hom de ez le saignor dAstenoit. (Document 12660613, 9). Item, je lai Bastien, mon ann lh, me grande maison de Sain Servais u ju [4] demoure [. . .] (Document 12890112, 3).

On voit bien que dont et ou jouent la fois un rle extrieur et intrieur la proposition, mais la charge spcicative du relateur prend tout son effet dans la subordonne et non dans la relation qui unit celle-ci au constituant en apposition. Quant aux parataxes, elles sont quasi inexistantes en contexte nominal: on ne relve que ces deux extraits:

160 Et de ce point de vue, on peut schiner distinguer relatives appositives et relatives

descriptives, mais force est de constater quelles sont construites de manire absolument identique, et que quel que soit le cas de envisag, il y a toujours une forme de corfrence entre le nom et la subordonne de mme niveau: les deux constituants dsignent le mme objet.

133

[nom]

coorientation

[relateur]

proposition

F IG . 3.64 Apposition dune compltive et dun nom Me sires Godefroiez Valee [. . .] avoit vendut et afaietiet iii bonirs de terre dalu [. . .] ds a_tens li_siges fut devant Aiez. (Document 12650415, 15). Et de quele161 oire li gliese desour ditte [27] en soit en don et en vesture et lour aient quitteit, li quatre bonier daluz desour dis revenront quitte et paisule a devant [28] dit Baduin. (Document 12780406, 26).

Ces attestations sont bien moins prcieuses que celles qui montrent que les slections peuvent fonctionner sans relateur. On constatera simplement que ces propositions paratactiques sont toujours intgres un constituant C5. b. Compltives en relation avec un nom. Une subordonne peut tre appose un nom sans que le relateur ne joue de rle lintrieur de la proposition. Dans ce cas, on parle traditionnellement de compltives. Par exemple
por ce que ce soit fermement tenut, li veskes et li cuens i ont pendut lors sayaus. (Document 12361215, 12).

La structure est galement celle reprsente dans la gure 3.64, mais, contrairement ce qui se passe pour les relatives, le relateur ne contracte ici aucune fonction lintrieur de la proposition.162 c. Relatives en relation avec un adverbe non relateur. La relation entre la subordonne et un adverbe de mme niveau se prsente de faon similaire celle qui unit une relative un nom. Cette fois, la diffrence notable entre le contexte nominal et le contexte adverbial nimplique quune restriction au niveau des corfrences possibles et limpossibilit demployer un relateur nominal.
La ou totes ces choses desoir_escrites furent faites, furent homes de le (Document 12740531b, 23).
[24]

Cise Deu.

Lorientation de ladverbe ou, code en langue, ne joue pas au niveau de la relation que la subordonne entretient avec la, mais lintrieur de la subordonne introduite. Par contre, le fait que la et ou soient prorients entrane forcment que les orientations de la subordonne, de son appos, du relateur et du constituant quils forment soient identiques (3.4.6.3 c). La parataxe est galement trs rare,
[. . .] par ensi se riens faut a mes muebles por paier les lasses de-seur dittes, je weilh que on retrence [53] a_lavenant de cescune lasse que je ai fait en denirs (Document 12830213b, 52).
161 Nous ne considrons pas quel comme un relateur: cela compliquerait inutilement lanalyse

de la construction la plus frquente de quele eure que. . .


162 Il serait envisageable de poser quil ny a pas de diffrence entre ce relateur et le que pronom

relatif. On pourrait, suivant notre modle, considrer le que comme un argument du prdicat de la subordonne. Il aurait alors fonction de C5 ou de C6, avec une valeur smantique qui serait trs limite. Nous navons pas encore pu tester cette vision des choses sur le corpus.

134

but

avons pendu

C5

por

que ceste chose. . . . . .

F IG . 3.65 Structure de avons pendu. . . por que. . .

mais notons quun document fait systmatiquement suivre la de la subordonne (sans relateur):
[. . .] je voilh ke li iretages demoraist la ilh le voroit laisier [. . .] (Document 12890112, 10). [. . .] je voilh ke mei foimains doisent quatre mars de ligois la ilh veront et troveront par bons clers ke men arme soit mis acuiteie [. . .] (Document 12890112, 26). [. . .] je lais un march, le quelh me dame et li foimain donront en aournement dats, la ilh veront kilh serat mis enplois. (Document 12890112, 26).

La particularit reste trop peu atteste pour quon en tire des conclusions intressantes. Comme pour les propositions apposes un nom, ces cas sont limits des C5. d. Compltives en relation avec un adverbe non relateur. Le schma est le suivant: adverbe et subordonne sont galement coorients. On fera simplement remarquer que ladverbe sert en quelque sorte de classicateur la compltive (cf. Lemarchal 1997, 152):
Et [13] li commandons ens em_pais si ke drois et loys porte. (Document 12781203, 12).

e. Compltives et relatives en relation avec un adverbe relateur. La plupart du temps, le rle des subordonnes est spci indirectement: un relateur porte sur un ensemble form par le nom ce et une proposition appose; par exemple:
Et por ce que ce soit fermement tenut, li veskes et li cuens i ont pendut lors sayaus. (Document 12361215, 12).

Dans ce cas, on ne peut pas vraiment dire que la relation contracte par la subordonne soit spcie: cest la fonction du constituant ce que. . . qui est spcie. Par contre, il arrive quun relateur prcde directement une subordonne compltive:163
Et por que ceste [15] chose soit plus ferme, nos avons pendu a cest present escrit nos saias propres en tesmonghage de [16] verit. (Document 128710, 14). Ne ne_le_porons, [5] nos [. . .], metre hors de no main ne desevreir, por quoi nos [. . .] ne tengnons [6] a perpetuit ces chozes des eveskes de Liege. (Document 12630527a, 4).

Dans ce cas, puisque que ne joue aucun rle dans la compltive, nous considrons que le relateur spcie forcment la relation qui implique la subordonne (gure 3.65).

163 On remarque que le mot ce, qui impose un environnement nominal, est absent.

135

[P0]

[nom]

S1

participe (P0)

autre argument

F IG . 3.66 Structure rejete de la relation entre nom et participe coorients

[P0]

[nom]

participe (P0)

autre argument

F IG . 3.67 Structure de la relation entre nom et participe coorients

3.4.6.5

Propositions avec prdicat non personnel

a. Propositions participiales. Les propositions participiales pour rappel, nous nommons ainsi les propositions dont le prdicat est conjugu au participe pass ou au participe prsent (3.4.2.5 b) , qui entrent en relation avec des constituants nominaux de mme niveau sont coorientes par rapport ce dernier: le prdicat de la proposition et le terme nominal expriment une proprit de lobjet dnot. Le marquage morphologique (accord en cas, genre, nombre) est en accord avec la coorientation:
Et nos, Giles de Lageri, doiens devant nomeiz, avons pendut a cest present [7] escrit nostre saieal. (Document 12711203, 6). la mai-[8]-son de Robermont devant dite (Document 12600514, 7). vi mars [4] de cens [. . .] bien assis a estimation de preus-dommes (Document 12830213a, 3).

La question principale que soulve lanalyse des participiales est celle de la relation qui unit le nom coorient P0 au schma argumental de la proposition. Les propositions dont le prdicat est un mode personnel comprennent un sujet non obligatoire combin ce prdicat. Somme toute, la relation observe ici est fort ressemblante. Ds lors, pourquoi ne pas dire que le nom constitue un sujet? Lanalyse pourrait donc tre celle de la gure 3.66. Mais il sagit dun fait de syntaxe immdiate, parce que la relation de dpendance nest pas la mme: notre avis, la prsence dun prdicat conjugu un mode personnel est la condition fondatrice de la phrase (3.4.1.2), alors que leffacement dun participe appos un nom ne change rien au rle argumental que ce dernier peut jouer; par exemple, si on enlve devant nomeiz du premier extrait ci-dessus:
*Et nos, Giles de Lageri, doiens, avons pendut a cest present escrit nostre saieal.

Par ailleurs, le nom appos au participe ne commute pas avec il, alors que tous les autres arguments conservent leurs proprits paradigmatiques. On prfrera donc lanalyse prsente dans la gure 3.67. Les marques segmentales de cas correspondent dailleurs la fonction du nom appos dans la phrase, et non son rle par rapport au participe.
Et nos, li home [13] de la Chise Deu, ouwe la veritee et le testament bin regardeet, en feimes don et ve-[14]-sture par le consel de mut de prodomes ki la astoent a sanior Anthone devant dit en [15] nome del amoine de-sor nomee. (Document 12700606, 12).

136

relation @dpendance ou coocurrence @implique deux constituants combinaison @coorientation @cointgration S1 @contexte argumental apposition @contexte immdiat slection @non-coorientation @ou non-cointgration complmentation @contexte argumental dtermination @contexte immdiat

F IG . 3.68 Types de relations

b. Propositions innitives. Linnitif est compatible avec la fonction de dterminant (il est alors relat).
Et les xxiiii sols de [10] cens a_paier a termines [. . .] werpirent cilh Lambers Vennisons et se femme (Document 12550521, 9).

[11]

[. . .] me_sires Wilheames devant dis avoit [6] pooir et mandement special de prendre vestures de tos les yretages [. . .] (Document 12740531b, 5).

Cette relation ne pose absolument aucun problme, mme sil nest pas toujours vident de la distinguer dune relation attributive (de niveau argumental). Cette distinction fera lobjet dune section ultrieure (3.4.7.1 b). 3.4.6.6 Synthse des relations immdiates

Le paralllisme des fonctionnements des niveaux argumental et immdiat est clair. Tout dabord, on retrouve le mme type de relations (gure 3.68). Ce sont les mmes marques qui sont employes aux deux niveaux pour exprimer les spcications: les moyens casuels et les relateurs. Et du point de vue de leur nature, les constituants impliqus sont les mmes. La seule diffrence, qui fonde la disjonction des niveaux argumental et immdiat, est qu ce dernier niveau, il ny a que trs rarement un prdicat central. En consquence, une structure de niveau immdiat ne peut pas constituer un nonc phrastique et est forcment dpendante, moins que certaines conventions externes, lies au type de texte ou la situation, ne lui permettent de jouer le rle dnonc (3.4.1.2 b). Chacun de ces phnomnes mriterait une monographie. On se limitera ici quelques observations gnrales et lexpos des choix qui ont d tre faits. 3.4.7 Problmes gnraux

Tout dabord, il est frquemment problmatique de dterminer avec exactitude quel niveau de syntaxe se situent les relations observes: jouent-elles au niveau argumental ou au niveau immdiat (3.4.7.1)? Une fois le niveau dtermin, il peut subsister des hsitations quant la hirarchie des structures les plus complexes. La coordination accrot le nombre de constituants de mme fonction (3.4.7.2). Dautre part, plusieurs 137

combinaisons et slections peuvent tre prsentes sans quil soit toujours possible de dterminer exactement quels constituants elles impliquent prcisment (3.4.7.3 et 3.4.7.4). Enn, les quelques apparitions de structures en mention et dnoncs en latin se placent naturellement en dehors du systme qui a t prsent ci-dessus (3.4.7.6). 3.4.7.1 Relations argumentales ou relations immdiates?

Complments et dterminants agissent de manire similaire, si ce nest que les premiers slectionnent un prdicat, mais non les autres. Cette proprit commune complique la description (a). Les cas les plus particuliers: lintgration des innitifs (b) et les phnomnes de thmatisation (c) mritent un commentaire appropri. a. Gnralits. Il est assez frquent que les dterminants prennent une forme trs proche des C5, mais quil soit impossible de les interprter comme tels, parce quils sont visiblement intgrs en syntaxe immdiate:
ilh ont enluis [3] quatre hommes: le prevost de Tret, mon saingor Henemant dOtoncur, de par le Conte, [4] mon saingor Gilion de Barbenchon et maistre Lambert de Halos, de par le veske [. . .] (Document 12361215, 2).

Puisque quatre hommes et le prevost de Tret. . . de par le veske sont en relation dapposition et constituent ensemble un R2, il nest pas possible daccorder un statut de C5 aux constituants commenant par de par. . . . Nous expliquons ainsi les constructions impliquant la formule dune part. . . dautre part: en fonction de lintgration syntaxique, on analysera dune part et dautre part comme des C5 ou comme des Dt:
C5: Conute choise soit a tos ke lan de grasce m cc quatre_vins [3] et on, le semedi devant le Chandeloir, vinrent par devant nos [. . .] Jehans, li s le maoir de Horpale, dune part, et me sires Jehans [5] con_dist delle Savenire [. . . ], datre part. (Document 12820201, 2); Dt: [. . .] le pais ki est faite entre mon signor le veske de Liege, dune part, et Waleran, mon [3] frere, datre, [. . .] sue_je tenes a faire garder [. . .] (Document 12370916, 2).

Lintgration du constituant entre. . . datre comme C5 empche de considrer dune part et datre comme des C5. Parfois, le niveau dintgration ne peut tre repr qu laide de la smantique:
Et la afaitat Gedefrois desor dis a frere Gilon de [7] Hambrut desoir nomeit et a_ows delle maison delle Va Benoite trois denirs [8] ligois de cens par an (Document 12850704, 6).

Dans le contexte, afaitier est une action ponctuelle et unique, et ne peut tre compris comme itratif. Si le prdicat exprime un procs unique, un C5 prsupposant une rptition (comme par an) lui est forcment incompatible. Une grande quantit de cas ne peuvent tre analyss de la mme manire. Il est souvent possible dinterprter le constituant dont on cherche dnir la relation comme un Dt ou un complment de type C5:
Et avuec ces choses devant dites avons nos repris en ez et en homage [6] de li et del eglise de Liege le dieme de Tohongne et de Wirice (Document 12430709, 5).

138

[nom]

[P0]

[relateur]

[innitif]

F IG . 3.69 Relation mdiate entre un nom et un innitif relat

[P0]

[nom]

[relateur]

[innitif]

F IG . 3.70 Structure de la dtermination dun nom par un innitif relat

Le constituant soulign slectionne-t-il ez et homage ou bien avons repris? En rgle gnrale, on doit poser un choix arbitraire. Pour simplier lanalyse, nous dirons que dans tous les cas ambigus (ou pour lesquels nous doutons), le constituant est un C5. Cest--dire quil est plac au niveau dintgration le plus lev possible dans larbre syntaxique. Ne perdons pas de vue que ce choix ne fait pas que dterminer le niveau dintgration de la structure: il implique aussi un changement de statut des relations syntaxiques qui unissent les constituants. Comme indiqu plus haut.164 , si un argument entretient une relation avec un autre argument, cette relation passe par le prdicat: elle est mdiate . b. Innitifs. La description des schmas argumentaux impliquant un innitif mritait dj un expos dtaill (3.4.4.6). un niveau danalyse suprieur, dterminer si le rle dun innitif doit se mesurer au niveau argumental ou immdiat ne se fait pas sans hsitation. En ancien franais, en effet, la squence
nom + adverbe relateur + verbe linnitif

(o le nom exprime le patient du procs de linnitif) est trs frquente. Prenons-en quelques exemples pour servir de cadre la rexion:
[. . .] Henris [2] del Aitre reconut par devant nos en justice ke la_maison del Vauz Saint Lambert at aquis a_li x stiers davaine hyretable-[3]-ment, a paier le jor de_la feste saint Remi [. . .] (Document 12700324, 1). Et ce doze doniers doit_ons a le chachie [12] a refaire chascun an. (Document 12520301a, 11). Et je [. . .] li rendi cest [6] ez a_tenir de mi [. . .]. (Document 12701126, 5). Ceste pais et ceste assens at cre-[11]-anteit lune partie et latre a tenir et a guarder. (Document 123605, 10).

Comment modliser les relations? Lhsitation porte sur le choix entre la structure qui place linnitif au niveau du prdicat (gure 3.69) et celle qui le place en syntaxe immdiate (gure 3.70). En dautres termes, la relation entre le nom et linnitif passet-elle par le prdicat (relation dattribution) ou linnitif dtermine-t-il le nom? Tout dabord, la question ne se pose que si aucun relateur ne sintercale entre le prdicat principal et le nom. Sil y en a un, lanalyse est assez simple: le nom est dtermin par linnitif relat,
164 Voir p. 94.

139

Des siez jornaz. . .

C5

[doit]

R2

[le moiti. . .]

F IG . 3.71 Interprtation argumentale de des siez jornaz. . . doit le moiti. . .

paier

R2

[le moiti ]

[del trechens]

Des siez jornaz. . .

F IG . 3.72 Interprtation immdiate de des siez jornaz. . . doit le moiti. . . Et ce doze doniers doit_ons a le chachie [12] a refaire chascun an. (Document 12520301a, 11).

Quand la question se pose, cest le sens qui apporte une rponse: si, dans le cadre du procs exprim par linnitif, le nom joue un rle sans que le sens du prdicat principal ne conditionne lexistence de ce rle, nous prfrons placer linnitif dans la sphre du nom. Linnitif relat exprime une proprit du nom:
[. . .] Henris [2] del Aitre reconut par devant nos en justice ke la_maison del Vauz Saint Lambert at aquis a_li x stiers davaine hyretable-[3]-ment, a paier le jor de_la feste saint Remi [. . .] (Document 12700324, 1).

Le sens du prdicat at aquis nimplique pas que les dix setiers dont il est question soient paier. Par contre, si le prdicat rgissant conditionne le rle, nous prfrons lanalyse argumentale:
Et je [. . .] li rendi cest [6] ez a_tenir de mi [. . .]. (Document 12701126, 5). Ceste pais et ceste assens at cre-[11]-anteit lune partie et latre a tenir et a guarder. (Document 123605, 10).

On constate que, dans le premier extrait, le procs exprim par rendi change le statut du ef: il devient tenir de quelquun. c. Thmatisations. Il arrive frquemment que la structure nonciative disloque la squence pour mettre en vidence un constituant, qui a alors la fonction nonciative de thme. Par exemple:
Des queis siez jornaz de terre desour dis nostre maisons doit paier le moiti del [14] trechens [. . .] (Document 12800504, 13). Do quelh testament ju enlis et fais foumains [. . .] sangnor Thirri de Dynant, [. . .] dame Anns [. . .]. (Document 12890112, 31).

Il y a deux manires danalyser le rsultat de cette transformation, suivant quon considre que la thmatisation transforme le lien entre le constituant thmatis et le prdicat (gure 3.71) ou non, ce qui implique un phnomne de discontinuit (gure 3.72). Le problme vient du fait que dun point de vue smantique, on a limpression que des siez jornaz. . . est une proprit de la ralit trechens et constitue en outre le cadre du procs et de lnonciation. Ltat actuel du modle ne permet pas de prendre en 140

relation
Jakes. . . li grant eglise li maires. . . de Liege

S1

faisons

S1

R2
[savoir ke. . .]

F IG . 3.73 Structure de Jakes. . ., li maire. . . de Liege faisons savoir ke. . .

compte ces hirarchies multiples et il faut poser un choix. Bien que cette dcision ne soit pas pleinement satisfaisante, la structure a t intgre au niveau le plus lev possible. 3.4.7.2 Coordination

Une srie dadverbes peuvent servir augmenter le nombre de constituants impliqus dans une relation sans changer cette dernire. Cest le cas de et et ou.165 Par exemple:
por ce que ce soit fermement tenut, li veskes et li cuens i ont pendut lors sayaus. (Document 12361215, 12).

Cette construction tant traditionnellement nomme coordination, ce terme servira provisoirement dsigner la relation qui existe entre les constituants ainsi relis par et ou ou, lesquels assument ainsi la fonction de coordonnant (ou Co). On compare traditionnellement la coordination la juxtaposition (pas de Co). La construction sans Co est effectivement atteste; et cest delle quon partira. Ainsi, par exemple,
Jakes, par la graze de Deu prevoz, Jehans, li doiens, li archediakene et toz li chapitres [2] de la grant eglise, li maires, li eschevin, li jureit et toz communs de la citeit de Lie-[3]-ge, faisons savoir [. . .] ke [. . .] (Document 123712, 1).

sanalyse comme dans la gure 3.73. Cette juxtaposition peut tre dcrite en termes dorientation. On voit ici que les deux S1 dsignent des groupes de personnes diffrents. Pris sparment, les S1 en question sont les cibles de lorientation primaire du prdicat. Cependant, on ne peut pas dire quils soient des dsignations de la mme ralit. Il y a en outre une relation oue (minimale) entre les constituants juxtaposs. En cas de coordination, nous analysons le coordonnant comme une marque segmentale supplmentaire, qui spcie la relation entre les constituants (ou les groupes de constituants) coordonns:166
165 Les lexmes ains, donc et mais ont gnralement la fonction de C6 (3.4.2.3 b). 166 Le nos initial a t retir de lattestation qui suit pour simplier lexpos.

141

relation addition [Ermensens. . . marchisse dArlon] [et] [Henri. . . marchis dArlon] S1 S1

faisons R2 [conissiance ke. . .]

F IG . 3.74 Structure de Ermensens. . . et Henri. . . (coordonnant spciant) [. . .] Ermensens, contesse de Luceleborc et de La Roche et marchisse dArlon, et Henris, ses ls, quens de Lucele-[2]-borc et marchis dArlons, faisons conissiance [. . .] ke [. . . ] (Document 12420502, 1).

La relation qui existe entre Ermensens. . . et Henris. . . est spcie par et comme tant additive. Si la conjonction avait t ou, la relation aurait t spcie comme disjonctive (gure 3.74). Comme on le voit, de la mme manire que pour les relations de complmentation et de dtermination, la prsence dun adverbe vient spcier une relation qui na pas besoin de lui pour stablir. En consquence, il nest pas ncessaire davoir deux termes diffrents pour dsigner la relation spcie ou non. Le terme coordination servira donc indiffremment. La coordination se retrouve tous les niveaux dintgration syntaxique. Son fonctionnement au niveau argumental ne diffre pas de son fonctionnement au niveau immdiat. a. Niveau argumental. Au niveau argumental, la coordination touche des P0, des S1, des R2, des R3, des A4 ou des C5. Elle semble incompatible avec C6, certainement en vertu du fait que les lexmes employs en fonction de C6 sont les mmes que ceux qui ont fonction de coordonnants. On se bornera donner quelques exemples:
P0: A toz ceaz ki cez letres veront et oront, li home de_le Chize Deu font conoistre verit. (Document 12671029, 1); S1: por ce que ce soit fermement tenut, li veskes et li cuens i ont pendut lors sayaus. (Document 12361215, 12); R2 attributif: [Pour que les convenances] soient fermes et estables (Document 12520301a, 20); R3: Le vivier a riwe de Hee loe li glize mon 12440119, 7);
[8]

saingnor Oston et son hoir (Document

P0 (auxili): nos, le chapitre, dune part, et les citains, daltre, sumes assenti et concordeit en teil ma-[6]-niere (Document 123712, 5).

142

li glise

S1

[aura]

R2

[li deus]

F IG . 3.75 Dcomposition dune coordination (1)

[li voweiz]

S1

[aura]

R2

[le tierce]

F IG . 3.76 Dcomposition dune coordination (2)

relation addition le glise [le deus] S1 R2 [aura]


F IG . 3.77 Structure de aura li glise le deus et li voweiz le tierce

[et]

[li voweiz] [le tierce] S1 R2

La coordination peut galement lier des ensembles de constituants de niveau argumental, multipliant effectivement les schmas argumentaux autour dun ou de plusieurs prdicats:
le viez fondement ki se joint [7] al mur del viez palais et sestent juc al mur de la maison le prevost (Document 123712, 6). [. . .] nos, li chapitres et li communs de la citeit, communalment [. . .] (Document 123712, 13).
[14]

seriens decontre et le defendriens

[. . .] aura li glise le deus et li voweiz le tierce [. . .] (Document 12440119, 6).

Analysons le troisime exemple: la coordination implique la fois les relations reprsentes dans la gure 3.75 et celles reprsentes dans la gure 3.76. En regroupant cela en un seul schma, nous obtenons la gure 3.77. b. Niveau immdiat. Au niveau immdiat, la coordination est tout aussi courante. Elle permet plusieurs constituants dtre apposs ensemble un autre
Et nos, Ernus, Winans, et Colette [. . .] et nos maistres, Johans, archeprestes [34] de Liege devant nomeit, tesmongnhons ke nos avons pendu nos saeas [. . .] (Document 12701126, 33).

ou encore dtre dtermins simultanment par un seul dterminant:


Le tailhes, le mortemains, les messons et les batons des liu claime quittes li voweiz et ses hoirs (Document 12440119, 9). li degreit portront iuc ka la terre et li murs par derri-[9]-er les degreiz (Document 123712, 8).

143

3.4.7.3

Hirarchie des appositions

Comment se er au seul critre morphologique pour sparer, lintrieur dun syntagme o tous les mots sont corfrents, des groupes dont on peroit nanmoins lautonomie par rapport au reste du syntagme? Lexemple des titres accompagnant un nom de personne, quon rencontre frquemment dans les documents, est particulirement rvlateur:
me sires Gerars (Document 12630331, 17). mes sires Wilheames dAwans (Document 12680310, 8).

On a limpression que le titre forme une unit, alors que le nom de la personne en forme une autre. Pour sen convaincre, il suft dobserver quun phnomne de gement affecte le titre indpendamment du groupe corfrent. On trouve en outre des exemples qui attestent la dtermination dun seul des groupes par un syntagme non corfrent. Dans lexemple qui suit, cest lhe uniquement que dtermine le syntagme Tyri de Jace:
damoiseelhe Lieiars, lhe saingnor Tyri de Jace (Document 124706, 2).

Les mots damoiseelhe et Lieiars sont apposs lhe, qui est dtermin par Tyri de Jace. Le potentiel syntaxique et smantique (g dans le lexique, mais aussi dans le rapport de ce mot avec le monde) de Lieiars ne permettrait pas que Tyri de Jace le dtermine galement. Ce qui lgitime donc la subdivision du syntagme en syntagmes constituants, cest que la dtermination de chacun des groupes est possible sans quelle ne porte ncessairement sur les autres. Il est courant quun constituant ne dtermine ainsi quune partie seulement dun ensemble de mots coorients. Quon repense lorganisation des arguments autour du prdicat pour voir quel point ce phnomne est gnral: ce nest pas parce que R2 complmente le prdicat et que ce dernier est coorient par rapport S1 que R2 complmente S1. Tous les cas ne sont pas aussi transparents. Souvent, seul le rfrent peut aider analyser la hirarchie des appositions:
A tos cheaus ki ces lettres verront et oront, nos, Ustaces li Frans Hons de Holeingnule, Wilheames dA-[2]-wans, chevalier, sires Henris de Nuvis et sires Gerars des Changes, escevien de Liege, salus et conissance de veriteit. (Document 12630331, 1).

Ce nest que parce quon sait par ailleurs que Guillaume dAwans nest pas chevin de Lige (il est chevalier) quon peut dire que escevien de Liege est appos exclusivement sires Henris de Nuvis et sires Gerars des Changes. La plupart du temps, ce genre dinformation nous fait dfaut et il nest pas possible de trancher. Ainsi, dans le mme document, devant
bon plege furent doneit de par mon saingnor Gerar de Hermees: sires Ustaces li Frans Hons de Holeingnule, li sires Wilhe-[11]-ames dAwans, mes sires Wilheames de Waruez, chevalier [. . .] (Document 12630331, 10).

144

ne connaissant pas tous les personnages se portant garants, on admet quil sont tous trois chevaliers, mais le systme morphosyntaxique ne soppose pas ce que seuls les deux derniers le soient. 3.4.7.4 Porte des slections

Rsoudre la question du niveau dintgration (3.4.7.1) des slections ne suft pas carter toute ambigut. Le problme de la hirarchie des appositions en contexte immdiat touche en effet galement les slections, que ce soit au niveau immdiat (dterminations) ou argumental (complmentations). a. Complmentations. Le problme a dj t voqu quand on a abord la segmentation du texte en noncs: il arrive souvent que deux phrases soient relies par et, que nous avons pos comme un C6 et non un Co (3.4.2.3 b et 3.4.7.2), et certains constituants sont des C5 exprimant les circonstances des procs exprims dans les deux phrases (ou parfois plus):
Et [. . .] [26] silh avenoit quilh la volsist sus rendre, Jakemins doit venir a la maison de Robermont [27] et lor doit sus rendre. Et li maisonz li doit rendre al enwart de proudomes ce [28] quilh aurat la curt devant dite enmiedree puis lore quilh la prist. (Document 12600221b, 25).

Le statut priphrique des C5 et leur potentiel de connexion avec nimporte quel verbe167 autorise lanalyse cantonner ce complment la premire des deux phrases ou aux deux en mme temps sans que la structure dcrite ne soit profondment modie. Comme il nest pas toujours possible de prouver que lune des hirarchies possible est meilleure que lautre, C5 a t reli systmatiquement la phrase qui en tait, dun point de vue squentiel, la plus proche. Un problme similaire se pose lorsquun C5 se trouve dans une phrase qui comporte une subordonne (quelle soit de type argumental ou immdiat) et que sa position fait quil pourrait tre complment de la principale, complment de la subordonne, ou encore des deux en mme temps:
le pais [. . .] sue_je tenes a faire garder en tel manniere ke, se [4] mes freres venoit encontre la pais u encontre akun puint de le pais, ke je le feroi amender [. . .] (Document 123712, 2). [. . .] nos devons envoier douz de nos homes la [. . .] por savoir se on li fasoit tort u non. (Document 12430709, 11).

nouveau, on voit mal comment se prononcer avec toute la rigueur quon voudrait: dans le premier exemple, le C5 soulign pourrait aussi bien tre complment de sue tenes que de faire ou garder; dans le second, il pourrait complmenter devons comme envoier. Or, dun point de vue smantique, on admettra sans problme que le cadre dun procs soit projet comme cadre de tout procs qui en dpendrait (ce qui est souvent exprim par une subordination). Il est ds lors lgitime de faire remonter la relation de complmentation le plus haut possible dans larbre, cest--dire au niveau de la principale (gure 3.78).
167 lexception notable des C5 complments dagents, cf. note 113.

145

S1
je. . . a faire. . . [en telle manire. . .]

A4

[sue tenes]

C5
F IG . 3.78 Interprtation des C5 de niveau ambigu

[on bonier]

[dalu]

[de terre. . .]

F IG . 3.79 Structure de on bonier dalu de terre. . . (hirarchie 1)

[on bonier]

[dalu]

[de terre. . .]

F IG . 3.80 Structure de on bonier dalu de terre. . . (hirarchie 2)

Par contre, il est parfois vident que le cadre du procs dnot par le prdicat de la subordonne nest pas compatible avec celui de la principale. Dans ce cas, le sens soppose la remonte du circonstant:
Jo, Jehans de Herierpont, faz savoir [. . .] ke je me sui obligis enver le eglize mon segnor saint Lambert que, quinze jors aprs o que ille me somonra, jo et Ide, ma femme, verons devant le ve_s_que, se nos ne [3] avons loial soigne de nos cors. (Document 12371012, 1).
[2]

Il serait pragmatiquement absurde que la conditionnelle exprime le cadre du procs principal: lobligation implique par ce dernier nest pas soumise la condition. b. Dterminations. Les faits examins ici sont troitement lis la hirarchisation des appositions et la coordination, dont on vient davoir un aperu. Lexemple suivant permet lui seul dexposer une bonne partie des choix que nous avons t forc doprer:
on bonier dalu de terre errile ki giest ens el terroir entre Lantins et Hambru [. . .] (Document 12870624, 6).

Tout dabord, les deux dterminants relats par de (dalu et de terre errile) posent la question de leur hirarchie rciproque. On a le choix entre les trois hirarchies suivantes (en ignorant les relations des relateurs pour simplier les schmas). Soit, schmatiquement, la gure 3.79 ou la gure 3.80, ou encore la gure 3.81. La dernire hirarchie qui suppose le moins de niveaux a t choisie chaque fois que le doute tait prsent, pour les mmes raisons que dans le cadre de la complmentation. Bien entendu, certaines structures sopposent cette analyse. Par exemple, les

146

D
[de terre. . .] [on bonier] [dalu]

D
F IG . 3.81 Structure de on bonier dalu de terre. . . (structure plate)

lhe

Tyri

[de Jace]

F IG . 3.82 Structure de lhe Tyri de Jace

noms de personnes fonction de dterminant et comprenant un dterminant prsentent assurment une hirarchie complexe:
lhe [. . .] Tyri de Jace (Document 124706, 2).

est structur comme dans la 3.82. 3.4.7.5 Structures discontinues

Il arrive que lunit dun constituant ne soit pas rendue explicite par la contigut de ses constituants immdiats. Lunit peut alors tre indique par dautres marques. La discontinuit dune structure correspond une discordance entre son contenu et la manire dont il est exprim. Il sagit dun phnomne de surface.168 a. Niveau argumental. Pour S1, il est frquent que le pronom ce permette la discontinuit:
cest a_savoir : sires Jehans de Restees, doiens de Saint Piere de Liege, et sires Jakemes, sires de Clermont, [4] chevaliers (Document 12780801, 3).

ce est nos grez et volanz ke le douz muis de spiate ke dame Jehane [5] desor dite at laisiet [. . .] om en face don et vesture [8] a frere Loren [. . . ] (Document 12841004, 4).

R2 est souvent discontinu lorsquil consiste en une proposition innitive.


[. . .] le parties desor_nomees le devoient tenir [. . . ] (Document 12630331, 9).

b. Niveau immdiat. Le plus souvent, il sagit de constructions dtaches:


Je weilh et ordene ke [. . .]169 Johans, mes freres, u Lambon, ses ls, weilent et puissent assenner vi mars [4] de cens hiretablement, bien assis a estimation de preus-dommes, a manbors de lamoine de Povres de la citeit de_Liege (Document 12830213a, 3).
168 Peut-tre faut-il interprter la discontinuit comme une sous-spcication au point de vue

squentiel.
169 Dans ce contexte, la subordonne est en fait hypothtique.

147

bon plege furent doneit de par mon saingnor Gerar de Hermees: sires Ustaces li Frans Hons de Holeingnule, li sires Wilhe-[11]-ames dAwans, mes sires Wilheames de Waruez, chevalier [. . .] (Document 12630331, 10).

Pour chacun de ces exemples, les segments souligns font partie du mme constituant, qui commute avec une des formes du pronom. 3.4.7.6 Hors systme

On doit considrer comme hors systme les constituants qui sont, par un mcanisme linguistique gnral, employs en mention, ainsi que les constructions rdiges en latin. a. Autonymes. Les emplois en mention sont trs limits. Nous nous bornons relever:
La subscripton de Clarin nos aprovons (Document 12720708, 18). le pais ki est faite entre le glize et mon [5] segnor Ernol, de que il est fais escris qui ensi encommence : Jo, Ernos (Document 12371012, 4).

Peut-tre faut-il rapprocher la deuxime partie du S1 dans la construction cest a savoir de ces constituants en mention. Il ne sagirait pas proprement parler demploi autonymique, mais dune forme de blocage de la structure morphosyntaxique. Cela expliquerait que la spcication du constituant ne soit pas toujours en accord avec sa fonction de S1. Par exemple, il peut tre relat
et ces vi muis assenat ilh a_prendre [. . .]; cest a savoir: a une pieche de terre [12] ki gist en Favetus, dont ilh est v jornaz, pou plus u pou moins, et sor le cortilh la repiecie [. . .] (Document 12710816, 10).

ou, au contraire, tre sous-spci


[. . .] a_savoir sont: Renel li Forberes de Spees, Gyles de 12830221, 8).
[9]

Graz [etc.] (Document

voire empcher laccord du prdicat:


[. . .] a_savoir est : Martin de Rens, Us-[10]-sur de Sain Lambier [etc.] (Document 12760610b, 9).

b. Latin. Le latin ne se rencontre pratiquement que dans des contextes particuliers correspondant aux endroits de la structure du texte qui permettent lactualisation dnoncs non phrastiques (3.4.1.2 b): comme invocation initiale ou comme signature,
In nomine Patris et Filii et Spiritus Sancti, Amen. (Document 124706, 1). M agister Alardus Pils per homines. (Document 12850721, 15).

Ces noncs ne sont pas non plus construits autour dun prdicat. On sest refus en faire plus quune analyse en surface, limite une simple hirarchisation de relations minimales. Le systme latin est sufsamment diffrent du systme franais pour ncessiter une analyse qui lui serait propre. 148

Nous avons par ailleurs relev un seul emprunt direct au vocabulaire de la liturgie.
Che fut fait lan del In-[19]-carnation Nostre Sangnor Jeshu Crist milh dous cens uitante et ouut, le semedi aprs Inuocauit me (Document 12890305, 20).

3.5

Conclusions

Avant de nous lancer dans lanalyse des rapports entre les relations dgages et la ponctuation, faisons un bilan. a. Ncessit du recours la linguistique gnrale. Par une dmarche positive, nous avons tent de produire le modle qui puisse servir annoter les matriaux pour les interroger. Les grammaires de lancienne langue, si excellentes quelles soient, se sont rvles inadquates ce genre dentreprise. Pour atteindre cet objectif, nous avons d faire usage de concepts et de procdures danalyse gnraux: ce nest que grce aux progrs de la linguistique gnrale que le corpus a pu tre analys. Ce sont les rsultats de la comparaison de nombreuses langues vivantes qui ont servi analyser une langue dont il ne subsiste aucun locuteur; on a ainsi essay dviter autant que possible lethnocentrisme et lanachronisme si prjudiciables en linguistique synchronique. Nous esprons que lenrichissement sera rciproque et que ce travail permettra de dgager des faits qui dpassent la langue tudie. b. Souplesse du modle. Les voies ouvertes par Alain Lemarchal au travers du concept de la relation minimale permettent de procder en deux temps: tout dabord en reprant les relations, ensuite en analysant les spcications. La souplesse de la procdure descriptive rside dans le fait que, si ncessaire, il est possible de se passer de ltape de la recherche des marques spcicatives. Pour une langue qui nest plus parle, lintrt est de taille: loin de contraindre lanalyse, le modle autorise le doute et le ottement. On pourrait mme aller plus loin: fond sur la relation minimale, par essence sous-spcie, le modle sappuie sur le ou. c. Importance de la terminologie. Dans cette dmarche, on ne soulignera jamais assez limportance de la terminologie. Nous avons voulu prserver autant que possible lhritage traditionnel, en ninnovant que l o il tait impratif de le faire. Cet hritage, il a fallu nanmoins le dompter, le soumettre des dnitions quon aura essay de rendre les plus strictes possibles. Texte, mot, nonc, phrase, syntaxe, morphologie, relation, nom, verbe, etc. sont autant de mots auxquels le lecteur est habitu, mais qui ont reu ici une acception dlimite. Les termes ne sont pas dun grand secours si on ne prend pas la peine de les cadrer. . . Ils sont mme dangereux. Bien sr, le refus de la nologite a pour effet pervers que le lecteur pourrait ne pas se rendre immdiatement compte que les termes employs ne le sont pas exactement dans leur acception traditionnelle. d. Description de lancien franais. Le mcanisme de description a mis en vidence la similarit des structures et des relations contractes par les constituants chacun des deux niveaux qui ont occup la majeure partie de la section 3.4 du chapitre: combinaison (sans dpendance) et slection apparaissent ds lors comme omniprsentes. Il en ressort principalement que la souplesse de lancien franais est envisager en termes de sous-spcication dans les relations de slection. Dans beaucoup de cas, les 149

relateurs sont facultatifs, lordre des mots semble libre. Mais on voit dj intuitivement que cette souplesse est limite: certaines structures sont plus ges, plus contraintes (par exemple, la place relative des rgimes). Maintenant que les relations ont reu cette premire description, il est peut-tre temps de faire ressortir le rle des relateurs et le potentiel translatif de ces derniers, de mettre en relation les parties du discours avec les fonctions. . . e. Un modle inabouti? Au bout du compte, le modle reste perfectible: on pourrait pousser plus loin lanalyse des marques mobilises par les circonstants; par exemple, on pourrait analyser mieux le complment dagent, ou les phnomnes de gement, etc. Il y a encore beaucoup de choses faire, et cest un modle incomplet et provisoire qui a t patiemment appliqu au corpus. Mais le corpus annot peut dj servir de terrain de travail pour tudier la ponctuation. Par ailleurs, il est le meilleur outil dont on dispose pour amliorer le modle. Les dpouillements systmatiques et exhaustifs quil permet rendent possibles les tudes qui mneraient une correction approfondie.

150

Mthode danalyse statistique

Les chapitres prcdents ont permis de construire une ide prcise de ce que nous entendons par ponctuation (chapitre 2, en particulier 2.3) et par syntaxe (chapitre 3, en particulier 3.2). Les diffrents constituants et structures syntaxiques sont prsent dnis laide dune slection de caractristiques morphosyntaxiques, de mme quest dlimit le champ exact de la ponctuation (au sens restreint (2.3.1.2). Ces pralables donnent la possibilit dtudier des relations entre les units de ces deux domaines, que nous dbutons ds le chapitre 5. Les rsultats de cette tude mettent jour le fonctionnement de la ponctuation au sens restreint. Avant de commencer lanalyse concrte des donnes, nous exposerons les options mthodologiques choisies: ce qui nous a men employer des outils statistiques, les implications de ce choix sur le traitement des donnes, les rsultats quon peut attendre de ce traitement. La grande majorit de la production scientique en linguistique romane en particulier les tudes sur les tats anciens des langues gallo-romanes na pas recours aux mthodes statistiques pour traiter les problmatiques qui lui sont spciques. Cest la raison pour laquelle nous avons trouv prfrable de faire un expos dtaill justiant lemploi de ces mthodes et leurs fondements. Cela fera lobjet de la section 4.1 ci-dessous. Nous rappellerons les principaux problmes inhrents notre problmatique et valuerons la manire dont les mthodes choisies peuvent tre appliques, sinon pour les rsoudre totalement, du moins pour contourner partiellement certains dentre eux (4.2). Nous synthtiserons cette premire section par un mode opratoire gnral, tape qui sera galement loccasion de prciser sous quelle forme les rsultats apparatront dans les chapitres ultrieurs (4.3).

4.1

Introduction aux principes de statistiques employs

Les notions dindividu, de variable, de distribution statistique et de test dhypothse sont introduites dans cette section.1 Le lecteur qui est dj familier avec ces notions peut sans dommage passer les paragraphes qui suivent et reprendre la lecture au point

Tous les calculs et graphiques de ce chapitre ont t raliss laide du langage et environnement de programmation libre R (R Development Core Team 2005).

151

4.2, p. 158. Nous nous limiterons prsenter les concepts fondamentaux;2 dautres techniques plus particulires seront expliques au moment o nous en ferons usage.3 4.1.1 Individus et variables

Toute tude statistique se doit, aprs avoir pos clairement la question qui la motive, de dnir avec prcision la population qui constituera son champ dinvestigation. Dun point de vue gnral, elle correspond tout simplement
lensemble des vnements (scores des tudiants, revenus des personnes, vitesses de course de rats, etc.) qui [. . .] intressent [le chercheur]. (Howell 1998, 2).

Une population est donc un ensemble dunits distinctes, appeles individus dans la terminologie statistique. Comme il nest pas toujours possible dobserver lensemble dune population, il faut parfois en extraire un chantillon, cest--dire un certain nombre dindividus, dont leffectif est not n. La slection de cet chantillon peut se rvler dlicate, surtout si elle nest pas faite alatoirement (Howell 1998, 23). Par exemple, lensemble des chartes originales crites Lige avant 1292 constitue un ensemble ni de documents dont nous ne connaissons pas leffectif. Cet ensemble peut tre considr comme la population que nous voulons tudier, chaque charte constituant un individu distinct de cette population. Les chartes retenues pour notre tude ne sont ds lors quun chantillon deffectif n = 148 de la population dcrire. Le choix de ces documents a t contraint par des restrictions pratiques et nest donc pas compltement alatoire. Comme nous lavons prcis lorsque nous avons parl de la constitution du corpus (0.2), la manire dont sest labore la collection a dinvitables consquences sur lhomognit des donnes (4.2). Un individu se caractrise par un ensemble de variables, auxquelles sont assignes des valeurs:
Une fois abordes la slection des sujets et leur rpartition dans des groupes de traitement, il est temps de considrer les donnes qui en rsulteront. [. . .] Une variable est une proprit dun objet ou vnement qui peut prendre diffrentes valeurs. Ainsi, la couleur des cheveux est une variable parce quil sagit de la proprit dun objet (les cheveux) et quelle peut prendre diffrentes valeurs (cheveux bruns, blonds, roux, gris, etc.). [. . .] [C]haque lment de la population prend une valeur pour chaque variable. Nous pouvons encore distinguer les variables discrtes, comme le sexe ou la classe de lyce, qui ne prennent quun nombre limit de valeurs, et les variables continues, comme lge [. . .], qui peuvent prendre, au moins en thorie, nimporte quelle valeur entre les points infrieur et [4] suprieur de lchelle. (Howell 1998, 34).

Les dtails de ces concepts pourront tre lus dans le manuel de David Howell (1998): Mthodes statistiques en sciences humaines nous y ferons souvent rfrence, en mentionnant les pages prcises o le lecteur pourra trouver les dveloppements qui servent de base notre expos. Le classique Initiation aux mthodes de la statistique linguistique de Charles Muller (1973) est toujours trs utile. Le premier chapitre du livre de Michael Oakes (1998) est galement riche. Par exemple, le test dit du 2 (p. 177s.).

152

Lorsquune variable est discrte, les diffrentes valeurs quelle peut prendre correspondent autant de modalits, mutuellement exclusives, de cette variable. Les donnes catgorielles sont discrtes sans tre numriques. Par exemple, chaque charte peut tre dnie par le nombre de mots quelle comporte (variable quantitative discrte), ou par linstitution dans les fonds de laquelle le document a t conserv (donne catgorielle), variable dont les modalits sont: Couvent du Val-Benot Lige, Cathdrale Saint-Lambert Lige, Couvent de Robermont, etc. La slection des variables juges utiles pour dnir les individus peut tre intuitive, fonde sur un programme dtude ou encore sur les rsultats danalyses antrieures. Nous ferons bien entendu appel aux acquis dcoulant des chapitres 2 et 3 pour choisir ces variables et dterminer leurs valeurs. Ensemble, la slection prcise des individus et des variables, suivie de la dnition de ceux-l par celles-ci, traduit les donnes dans une forme susceptible dtre soumise une description statistique. 4.1.2 Distribution et reprsentations graphiques

Lexamen individuel dune variable quantitative montre gnralement que cette dernire a un certain nombre de valeurs, chacune des valeurs apparaissant un certain nombre de fois. Lensemble des frquences doccurrence des diffrentes valeurs dans un chantillon donn constitue la distribution de la variable observe. 4.1.2.1 Donnes

Raisonnons partir dun exemple, o les individus sont les 148 chartes de notre chantillon, dcrites chacune par une variable: le rapport entre le nombre de R24 et le nombre de constituants immdiats de la phrase. Nous avons alors notre disposition un ensemble de 148 valeurs variant entre 0 et 1; les voici par ordre croissant:
0.043 0.049 0.059 0.065 0.066 0.069 0.071 0.073 0.074 0.076 0.082 0.083 0.085 0.085 0.086 0.086 0.087 0.087 0.088 0.088 0.089 0.089 0.092 0.095 0.099 0.100 0.100 0.100 0.100 0.100 0.101 0.103 0.103 0.103 0.104 0.104 0.105 0.106 0.106 0.107 0.108 0.109 0.109 0.109 0.109 0.111 0.111 0.111 0.111 0.111 0.113 0.114 0.114 0.115 0.117 0.117 0.118 0.119 0.119 0.119 0.120 0.120 0.120 0.120 0.121 0.122 0.122 0.122 0.123 0.123 0.125 0.125 0.125 0.127 0.128 0.128 0.128 0.129 0.129 0.130 0.131 0.131 0.132 0.132 0.132 0.132 0.133 0.133 0.133 0.134 0.136 0.136 0.137 0.138 0.138 0.138 0.138 0.138 0.140 0.140 0.140 0.141 0.141 0.143 0.143 0.143 0.143 0.143 0.145 0.146 0.147 0.148 0.148 0.149 0.149 0.149 0.150 0.150 0.150 0.152 0.156 0.157 0.157 0.158 0.160 0.167 0.167 0.167 0.167 0.168 0.169 0.171 0.172 0.174 0.179 0.184 0.186 0.186 0.190 0.191 0.192 0.194 0.200 0.200 0.206 0.209 0.212 0.222 (min. = 0.043, max. = 0.22, moyenne = 0.13)

Thoriquement, chacune des valeurs pourrait apparatre entre 1 et 148 fois, mais en pratique, elle est releve entre 1 et 5 fois. Cependant, citer ainsi toutes les valeurs de la distribution nest pas particulirement utile. Lune des premires tches des statistiques est de fournir, laide dautres chiffres ou de graphiques, le meilleur rsum
4

Par exemple, le constituant nos aas propres dans no auons pendu a cet preent ecrt nos aas propres (Document 128710, 15). Voir 3.4.2.2.

153

80 60 40 20 0 0.00 0.05 0.10 0.15 0.20 0.25

Frquence

F IG . 4.1 Histogramme des R2 par phrase, par charte


10 8 6 4 2 0 0.00 0.05 0.10 0.15 0.20 0.25

Densit

F IG . 4.2 Estimateur de densit des R2 par phrases, par charte

possible de ces donnes. Par exemple, la moyenne et lhistogramme sont des rsums de donnes connus de tous. 4.1.2.2 Histogramme

Reprsenter les valeurs sur un histogramme naurait pas grand sens si les frquences ntaient pas regroupes dune manire ou dune autre; par exemple, lhistogramme des frquences de la gure 4.1 groupe les valeurs en classes, lesquelles sont reportes sur laxe des abscisses. Ici, cinq classes de valeurs sont dnies: les valeurs allant de 0 0.05, de 0.05 0.10, etc. Laxe des ordonnes indique quant lui le nombre de documents concerns. Ainsi, pour plus de 80 documents sur 148, entre 10 et 15% des constituants immdiats de la phrase ont la fonction R2. 4.1.2.3 Courbe de densit

Pour simuler la distribution de la population dont est tir lchantillon, on utilise frquemment un estimateur de densit. Celui-ci est gur par une courbe, dont la forme suit approximativement le dnivel de lhistogramme, mais en gomme les angles (gure 4.2). Le graphique est construit en valuant les valeurs de y (nombre de R2 par charte) pour chaque valeur de x (ratio de prsence de ces R2 par rapport aux autres constituants de mme niveau) si un chantillon aux dimensions tendant vers linni tait disponible. La densit (axe des ordonnes) doit tre considre comme la valeur attendue de la courbe pour chaque valeur de x (Howell 1998, 133). La courbe de densit dune distribution value ainsi la probabilit des diffrentes valeurs de x. La totalit de la surface infrieure la courbe reprsente la somme des probabilits pour toutes ces valeurs, soit 100%. Lapproximation de la distribution de la population nest pas tributaire dune quelconque division des valeurs en classes, ce qui donne un

154

0.05

0.10

0.15 Proportion de marquage

0.20

F IG . 4.3 Bote moustache des R2 par phrase, par charte

aperu plus net de la population sous-jacente.5 La courbe est dailleurs nettement plus douce que ne ltait lhistogramme. La distribution dessine une cloche dont la queue de gauche est approximativement gale la queue de droite.6 La distribution est dite gaussienne ou normale (Howell 1998, ch. 3). Une distribution de ce type est adquatement rsume par sa moyenne ( x) et son cart-type (s). Ce dernier correspond la racine carre positive de la variance ( s2 ).7 En loccurrence, x = 0.13 et s = 0.035. Ces paramtres sufsent dessiner la forme de la distribution. 4.1.2.4 Bote moustaches

Une autre manire utile de reprsenter les donnes est le graphique dit de la bote moustaches (gure 4.3).8 Celui-ci prend la forme dune bote grise pourvue dune ou de deux moustaches (ligne discontinue, ici horizontale, sachevant par un trait perpendiculaire).9 La bote montre comment lessentiel des donnes se concentre autour de la mdiane.10 (trait noir). Les moustaches reprsentent la dispersion des donnes Quant aux points extrieurs, il sagit de valeurs adjacentes, quil faut considrer comme atypiques. Lorientation de la bote na aucune signication particulire.
5 6

Par exemple, un histogramme comportant 50 classes, naurait pas prsent une forme particulire. Ceci anticipe sur la suite de lexpos (4.1.3), mais il est possible de se servir de tests spciques et de techniques de reprsentations pour apprhender la normalit des donnes. Nous ne nous tendrons pas sur le sujet. Nous indiquons au lecteur intress que le test de Shapiro-Wilks (Upton/Cook 2006, 388389) sur lchantillon ne permet pas de rejeter H0 (4.1.3.1) et dafrmer lanormalit de la population. Lexamen de la droite de Henry montre quon peut raisonnablement accepter la normalit. Voir annexe 4.1.2.3.shapiro.txt. Voir Howell 1998, 5051. La variance est calcule en faisant la somme des carts au carr de chaque valeur (o x reprsente chaque valeur et n la taille de lchantillon): s2 = ( x x )2 n1 (4.1)

Voir Howell 1998, 2.10. Voir Howell 1998, 6063. 10 Valeur de la distribution qui compte autant de valeurs qui lui sont infrieures que de valeurs qui lui sont suprieures; voir Howell 1998, 39.

155

10 8 6 4 2 0 0.00 0.05 0.10 0.15 0.20 0.25

Densit

F IG . 4.4 Probabilit que R2

5%

4.1.3

Test dhypothse

Les proprits des distributions servent, entre autres, tester des hypothses, cest-dire infrer des informations partir de la structure des donnes. Ces infrences sont fondes sur le concept fondamental dhypothse nulle (4.1.3.1). Nanmoins, lemploi de mthodes mathmatiques pour tudier les donnes naffranchit pas totalement le chercheur du recours son propre jugement (4.1.3.2). 4.1.3.1 Concept dhypothse nulle

Expliquons les principes du test dhypothse partir de la distribution normale prsente ci-dessus11 ( x = 0.13, s = 0.035). Imaginons la situation suivante: nous dcouvrons un nouveau document o laproportion de R2 constituants immdiats de la phrase est de 5%, ce qui est trs faible. Nous voudrions savoir quelle est la probabilit pour ce nouveau document dtre tir de la mme population que lchantillon dj dcrit. Il y a deux possibilits: soit le score est anormalement bas, et le document, de toute vidence, ne provient pas de la mme population; soit le score nest pas anormalement bas, et il ny a pas de raison de considrer que le document vient dune autre population. Dans cette dernire situation, la variation qui existe entre les deux chantillons ou populations compars (dont, en loccurrence, un chantillon dun seul individu) est due au hasard. Lhypothse selon laquelle la variation serait effectivement due au hasard est appele situation dindpendance. Lhypothse nulle consiste considrer cette indpendance comme correspondant la ralit; on la note H0 . Lhypothse oppose, qui consiste dire quil existe une diffrence sufsamment importante pour quelle ne soit pas lie exclusivement des causes alatoires se nomme hypothse alternative (note H1 ). En rgle gnrale, les tests donnent la probabilit que les carts par rapport H0 (appels carts lindpendance) soient en nombre signicativement lev. Nous avons vu que la courbe dune distribution dessinait avec laxe des abscisses une surface correspondant une probabilit de 100%. Nimporte quelle valeur situe entre les valeurs extrmes peut se trouver sous la courbe. La probabilit quune charte dont 5% des constituants immdiats de la phrase soient des R2 correspond la surface de la courbe dont les valeurs de x sont comprises dans lintervalle [0; 0.05] (gure 4.4). Le calcul de la probabilit est ici fait par ordinateur et est dautant plus simple que la distribution en prsence est normale et quon en connat la moyenne et lcart-type.
11 Nous naurons plus recours ce test dans les pages qui suivent, mais il savre quil est le

plus simple comprendre parmi les tests dhypothse et quil met facilement en vidence les principes du calcul des probabilits.

156

La probabilit calcule12 est de 1.2%. Cela signie quil y a1.2% de chances quune charte provenant de lapopulation reprsente par cette courbe contienne peine 5% ou moins de R2 comme constituants immdiats de la phrase. Il nest pas pistmologiquement valide de dmontrer que H0 est vraie.13 Les tests statistiques ont beau calculer la probabilit de cette hypothse, il sont tous orients vers son rejet. Pour cette raison, les statisticiens sont diviss quant la manire dinterprter un rsultat non signicatif: pour certains on ne peut jamais rien conclure dun pareil rsultat; pour dautres, il est prfrable daccepter H0 jusqu preuve du contraire (cf. Howell 1998, 106). Nous adopterons une position pragmatique cet gard, en tenant compte des donnes et de la probabilit de H0 . Lintrt du test se limite indiquer quun phnomne qui nest pas d au hasard organise les donnes. Ces dernires constituent un monde ferm dans le cadre duquel les calculs sont effectus. En consquence, le rejet ou non de H0 se fait sans tenir compte de la relation qui existe entre les variables tudies et dautres variables avec lesquelles elles pourraient tre mises en relation. Par ailleurs, la comparaison des rsultats avec des informations non formalises, comme lintuition ou la connaissance gnrale que le chercheur a des matriaux, fait partie de linterprtation des rsultats. 4.1.3.2 Jugement de lutilisateur

ce stade intervient le jugement de lutilisateur: il peut dcider que ce pourcentage est trop faible et afrmer quil rejette H0 et accepte en consquence H1 . Dans ce cas, il a exactement 1.2% de chances de commettre une erreur dite de la premire espce ou erreur .14 Dans cette erreur, il considrera tort que la nouvelle charte dcouverte fait partie dune autre population que son chantillon de rfrence (148 documents). La liste des valeurs donne au dbut de la section 4.1.2.1 montre quil est possible de se tromper de la sorte, la valeur la plus faible tant effectivement infrieure 0.05. La tolrance de lutilisateur lerreur est dcide pralablement lanalyse. Il est courant den xer le seuil 5%. Lerreur de la seconde espce, ou erreur consiste ne pas rejeter H0 alors que H1 est vraie. On pourrait xer le seuil 1%, 1, ou plus bas encore: tout dpend du degr dexigence de ltude et des consquences quil y a commettre lerreur . En recherche mdicale, un seuil trop lev aurait des consquences dramatiques; par contre, dans une tude de marketing, un seuil trop bas ne mnerait jamais la moindre conclusion utile. Dans ce second cas, commettre lerreur pourrait tre catastrophique. Les tests offrent donc des moyens rigoureux dvaluer le risque quun utilisateur prend en rejetant lhypothse dindpendance. Dans un contexte dexploration comme le ntre, le seuil gnral de 5% est classique et raisonnable. Pour chaque test effectu, la probabilit est dite signicative quand elle est infrieure au seuil choisi. Par extension, les carts lindpendance et les relations entre les variables seront alors dits signicatifs galement.

12 La fonction R employe pour ce faire est pnorm(). 13 Tous les statisticiens saccordent [. . .] sur un point: on ne peut jamais prtendre avoir

prouv lhypothse nulle. (Howell 1998, 106).


14 Voir Howell 1998, 47.

157

4.2

Statistiques et validit des analyses

La problmatique gnrale du travail a x demble lanalyse des relations entre ponctuation et syntaxe comme objectif. La dnition de cet objectif nous a guid pas pas, si bien que nous avons prsent notre disposition une collection de donnes rparties en deux ensembles trs diffrents: des structures syntaxiques et des marques de ponctuation. Toute information que nous livrent ces matriaux est videmment intressante, mais comment dterminer dans quelle mesure il est pertinent de lui consacrer une tude spcique? Ltape suivante consiste ainsi sinterroger: quelles questions voulons-nous poser aux matriaux rassembls? Dans lapproche traditionnelle, on tend vouloir tout expliquer, parfois sans sassurer de la pertinence par rapport la reprsentativit (numrique) des donnes manipules. Or, le bon sens nest daucun secours pour valuer cette reprsentativit. Appliqus une partie ou lensemble du corpus pour en dgager les tendances gnrales, les tests statistiques saffranchissent partiellement du jugement intuitif.15 Choisir demployer les statistiques implique quon rchisse au pralable sur la manire dont ces outils saccommodent de la nature des donnes, en particulier en ce qui concerne leur complexit et leur homognit. Nous rappellerons donc les particularits du corpus (4.2.1), avant de voir comment nous en avons tenu compte (4.2.2 4.2.5). 4.2.1 Nature des donnes

Ds lintroduction (0) nous avons soulign les principales pierres dachoppement que le corpus met sur notre chemin: 1. Le corpus est htrogne, aussi les observations quil permet de faire ne peuvent en aucun cas tre gnralises: elles sont spciques lchantillon dont nous disposons; 2. les donnes sont nombreuses; 3. la constitution du corpus et le travail dannotation sont en cours. ces inconvnients, lanalyse dtaille de la morphosyntaxe et la thorisation du systme graphique nous forcent ajouter que: 3. les structures morphosyntaxiques sont complexes et rcursives (chapitre 3); 4. les donnes sont rparties de manire disproportionne: certaines constructions sont attestes deux ou trois fois, dautres le sont un grand nombre de fois; 5. on ne peut chapper au dlicat problme de la rduction des donnes. Tous ces problmes sont plus ou moins bien grs par des mthodes faisant appel aux dnombrements et aux statistiques. Lhtrognit des types discursifs, la complexit des structures et la rpartition ingale des donnes, lorsquelles sont conjugues une grande quantit de matriaux, donnent une impression de dsordre, si bien quil est parfois malais de savoir sur quoi
15 Nous verrons en effet que certains phnomnes priphriques, comme la ponctuation des

chiffres ou des noms de personne, ont t abords sans que la pertinence de la question ne soit value (5.3.2.1 b).

158

se focaliser. Ce choix fera lobjet de notre premier dveloppement, au point 4.2.2. Dcider quelles questions mritent dtre poses constitue en effet ltape initiale de la dmarche, qui devra au bout du compte dcrire le plus nement possible les informations dcouvertes. Toutefois, lemploi de mthodes statistiques implique que les donnes soient dcrites laide dune slection limite de variables (4.2.3). On verra que toute slection de variables est forcment rductrice par rapport au grand nombre dinformations potentiellement accessibles pour chaque individu. Le choix des questions et la slection des variables sont donc synonymes de rduction de la richesse des matriaux. Pour accrotre la nesse de la description, il nous faudra rintroduire une partie des informations ngliges dans lanalyse. Cette dmarche sera aborde sous 4.2.4. Enn, lenrichissement permanent du corpus et la possibilit dtendre la problmatique dautres corpus rend le contrle de la qualit plus ardu que si lchantillon tait g. Cet tat dynamique a des implications plusieurs niveaux, dont nous parlerons sous 4.2.5. 4.2.2 Pertinence des questions

Par le biais des tests dhypothse (4.1.3.1), les statistiques classiques servent dterminer sil est raisonnable de penser quun phnomne nest pas d au hasard et sil est ventuellement pertinent de chercher une cause un phnomne. Dautre part, les mthodes numriques posent intrinsquement des limites excluant les cas pour lesquels les informations disponibles ne sufsent pas aller plus avant. Par exemple, nous verrons que dans le contexte dni par la phrase, les incidentes se distinguent du reste des constituants immdiats par la prsence signicativement plus frquente dun ponctogramme linitiale (5.3.2.1). Cette observation, base sur la pertinence statistique dune afnit entre une construction et un marquage, rpond la question: Le marquage initial des incidentes est-il spcique par rapport celui dautres constituants galement marqus linitiale? avant quelle ne soit pose. . . Elle permet ensuite de sinterroger sur la diffrence qui existe entre ce marquage et celui des phrases (6.1.4.1). linverse, le lien entre la ponctuation initiale et les appositions lintrieur dun constituant qui na pas une fonction argumentale nest pas signicatif (5.3.2.7). Dans ce cas, vouloir expliquer ce lien serait peu utile, puisque rien ne prouve quil ne soit pas d des causes alatoires. 4.2.3 Formalisation des donnes

La dnition des individus laide dune srie de variables est une tape fondamentale de lanalyse: pour manipuler les donnes, il importe quelles soient dcrites de faon homogne. Cette dnition mne obligatoirement une rduction trs importante. Par exemple, dans le cadre de la mise en vidence des tendances gnrales (chapitre 5) dans les relations entre la ponctuation et la syntaxe, on verra que nous avons ignor purement et simplement la forme des ponctogrammes. De cette manire, lanalyse outille est forcment plus grossire quune tude minutieuse des dtails. La rduction est particulirement importante lorsque les individus sont des units linguistiques:

159

[L]a mta-information, dans les cas de donnes textuelles, est particulirement abondante. Chaque mot utilis, mme si cest un mot grammatical [. . .] a droit plusieurs lignes, ou plusieurs pages dans un dictionnaire encyclopdique.16 Les rgles de grammaire constituent videmment une mta-information fondamentale. [. . .] Le problme principal concerne la pertinence de ces diffrents niveaux de mta-information vis--vis du problme que lon tudie. (Lebart/Salem 1994, 21).

cet gard, la dnition des individus en vue dun traitement statistique est une procdure assez proche de celle qui consistait, un niveau plus abstrait, discerner les caractres parmi les proprits des objets, de manire dnir les concepts (chapitre 1). Chaque occurrence de construction est en rapport avec de nombreuses donnes dordres diffrents. Il serait effectivement possible dintgrer dinnombrables variables au traitement, mais lexigence de pertinence sajoute celle de simplicit. Lorsquil est question de traiter des donnes syntaxiques, qui sont structures suivant un modle hirarchique (chapitre 3), la rcursivit multiplie virtuellement linni les informations quil est possible dintgrer la description de chaque individu. Sagissant de dcrire une proposition dont le prdicat est linnitif, par exemple le constituant soulign dans:
en temong de cete [8] choe aj o fat ce letre aeler de monael lan del jncarnaton jhesu crst ml et cc et xxx vj [9] el mos de jvle (Document 123607, 7)

il pourrait se rvler pertinent de crer une variable enregistrant si ce prdicat est galement complment par un R2 qui lui est propre (ce qui est le cas ici). Si ce R2 est de nature propositionnelle, on pourrait continuer relever les variables et ainsi de suite. Une telle pratique mnerait immanquablement un relev disproportionn et un grand nombre de modalits (les modalits simples) seraient surreprsentes. Il faut donc sacrier une partie de linformation et une partie de lintrt du corpus sen trouve ds lors nglige. On pourrait juger svrement toute rduction des matriaux, arguant que llimination dinformations prcieuses affaiblit les conclusions quon en tire. Le procd est cependant obligatoire: sans lui, chaque individu serait dni par un trs grand nombre de variables aux modalits extrmement varies. La seule conclusion laquelle lanalyse aboutirait alors est que chaque individu est lunique reprsentant dune classe particulire, dont on ne peut rien dire, faute deffectif. . . Les statistiques ntant rellement utilisables que si les effectifs sont sufsants, il faut se rsoudre limiter le nombre de variables et le nombre de modalits de chacune delles. Paradoxalement, le fait de ngliger une partie de linformation permet de dcrire plus efcacement les donnes. On vite de se perdre dans une myriade de variables complexes en slectionnant demble un petit nombre de variables simples. 4.2.4 Finesse de la description

La formalisation des donnes et la slection des questions juges pertinentes sont autant de facteurs qui diminuent la nesse de la description.
16 Sic.

160

Il nous a sembl essentiel de tenter de contrebalancer ce mouvement de rduction par deux dmarches, correspondant aux deux moments o une partie de la richesse des donnes est laisse de ct: rintroduire les proprits des individus qui nont pas t prises en compte pour effectuer des tests gnraux; commenter les donnes insufsantes. 4.2.4.1 Rintroduction des informations

La rintroduction dinformations supplmentaires dans le traitement statistique implique une nouvelle slection de variables pour dnir les individus. Ce choix, comme le premier, est bas sur la thorie pralable lanalyse des relations, mais est li aux rsultats des premires analyses. Certains rafnements vont de soi et sont dans la continuit de la question pose. Ainsi, on verra que nous commencerons la description de la ponctuation des constituants en opposant simplement la prsence labsence de ponctogramme de part et dautre, sans prendre en considration la forme du marquage (5.0). Par exemple, nous montrerons que les circonstants propositionnels ne gurant ni linitiale ni la nale de la structure qui les contient ont tendance tre marqus la nale (5.3.3.3 d) et, concernant le contexte, 6.1.4.6). En dautres termes, la prsence dun signe lendroit indiqu par le symbole dans lexemple qui suit est conforme une habitude gnrale:17
et le remanant [7] prent hl en fez de la gle en tel manre ke e de luj defalot enz hor de on cor ke la terre reuenrot a le glse [. . .] (Document 123605, 6).

La forme du ponctogramme est rintroduite dans lanalyse dans un second temps, une fois ltude centre sur des constructions particulires (chapitre 7). Pour lexemple choisi, on verra que les circonstants marqus la nale ont tendance attirer les signes /, et /, soit des ponctogrammes autres que (7.2.4.2). En loccurrence:
defalot enz hor de et le remana nt [7] prent hl en fez de la gle en tel manre ke e de luj on cor ke la terre reuenrot a le glse [. . .] (Document 123605, 6).

Dautres enrichissements sont quant eux lis la connaissance que le chercheur a des donnes quil analyse. Ainsi, nous ne slectionnerons pas demble une variable enregistrant si les constituants sont coordonns ou non. Ltude du rapport entre la coordination et la ponctuation viendra ensuite et se fondera sur les conclusions de la premire approche.18

17 Les grands chevrons indiquent que le parchemin tait endommag cet endroit et que nous

avons restitu le texte.


18 Voir 6.1.5 sur ltude du marquage dans la coordination.

161

4.2.4.2

Commentaire des donnes insufsantes

Pour les donnes cartes des tests faute deffectifs, nous fournirons un simple commentaire. Ce dernier pourra ventuellement servir de base une nouvelle tude lorsque les matriaux auront t sufsamment enrichis.19 De ce fait, ces simples commentaires peuvent jouer le rle de tremplins, prgurant de nouvelles tudes capables dexploiter les donnes que notre tude a d ngliger. 4.2.5 volution du corpus et de la dmarche danalyse

Lvolution constante du corpus impose que les procdures de dpouillements et les tests appliqus soient reproductibles (4.2.5.1). Il est galement utile demployer des techniques qui mettent en relief les donnes les plus singulires, dans le but de les corriger sil sagit derreurs, ou de les tudier dans les autres cas (4.2.5.2). Enn, lemploi des statistiques rend possible la critique des procdures elles-mmes et donc leur amlioration (4.2.5.3). 4.2.5.1 Reproductibilit

Du fait quelles emploient des formules mathmatiques, les statistiques appliques aux mmes donnes donneront toujours le mme rsultat, quel que soit lexprimentateur pour peu quelles ne fassent pas appel une simulation. Linterprtation du rsultat obtenu ne saurait tre remplace par un procd automatis: elle reste du ressort de lintuition et met en jeu de nombreuses connaissances dpassant largement le cadre du test. Le fait que les tapes sont reproductibles autorise envisager un accroissement itratif des donnes et une comparaison des rsultats obtenus. 4.2.5.2 Recherche de linattendu

Les mthodes statistiques ont souvent la capacit de mettre en vidence la fois la structure gnrale des donnes et linattendu qui y survient. Si lon considre ce quun corpus nous livre par rapport la abilit des donnes et leur apport informatif, il y a quatre types de rsultats auxquels on sattend: 1/ des informations ables, qui mettent en vidence un phnomne particulier; 2/ des informations ables qui ne mettent en vidence que des phnomnes gnraux; 3/ des informations errones, dues des erreurs de traitement ou dencodage, qui mettent en

19 Le corpus tant en construction (4.2.5). Bien que les conclusions soient moins assures

quand nous avanons une interprtation pour ces cas moins documents, elles nous permettent gnralement de mettre en vidence des phnomnes nouveaux, largissant parfois la problmatique. Par exemple, nous verrons que les occurrences du ponctogramme // sont trs rares, mais napparaissent que dans le cas particulier de lajout dun mot ou dun groupe de mots, ce qui montre que les accidents survenant dans le support sont en lien direct avec lemploi de ponctuation (7.4.4) pour le relev exhaustif des occurrences de ce signe et une illustration de sa ralisation.

162

vidence de pseudo-phnomnes particuliers; 4/ des informations errones donnant lillusion quil existe un phnomne gnral correspondant. Scientiquement, lobjectif est de reprer et de dcrire adquatement les informations relevant des deux premiers types.20 Dans un champ dtudes dj bien investigu, les informations correctes mais triviales sont de peu dintrt, et le chercheur centrera ses efforts sur la recherche dinformations particulires. Par contre, dans un cas comme celui qui nous occupe, o il est question dapprocher un champ presque vierge, toute information concernant la structure des relations nous intresse, mme trs gnrale. Dans ce cadre, les statistiques se rvlent trs utiles, dans la mesure o elles permettent lidentication de structures qui mergent dun rassemblement de phnomnes. Revenons la distribution observe ci-dessus (pourcentage de R2 parmi les constituants immdiats de la phrase): la bote moustaches (4.1.2.4) montrait quune partie des documents prsentaient une valeur aberrante. En quoi cela nous intresset-il par rapport notre manire daborder lerreur? Si tout se passe bien si nous choisissons le test ou la reprsentation qui convient et lappliquons correctement , les statistiques mettront en vidence les phnomnes marginaux: elles attireront notre attention sur eux en mme temps quelles permettront la description rigoureuse des phnomnes gnraux. Concrtement, cela signie que: 1/ nous remarquerons les exceptions, mais galement les erreurs particulires; 2/ les phnomnes alatoires seront dcrits de manire synthtique; 3/ les erreurs insigniantes passeront inaperues au milieu des phnomnes alatoires sans perturber outre mesure leur description. Le fait quil existe des valeurs aberrantes dtache certains documents et nous invite vrier si les annotations que nous y avons faites sont correctes (en loccurrence, elles le sont). Le traitement des erreurs ne nous retiendra pas plus longtemps. 4.2.5.3 Perfectibilit des tapes

Nous ne parlerons pas ici de la perfectibilit des tapes antrieures lanalyse (0.5). Il est souvent rappel quune dmarche doit tre falsiable pour tre scientique; nous avons plusieurs fois t amen poser un choix allant dans ce sens. Les statistiques ont lavantage dtre directement critiquables diffrents niveaux. Dune part, leur validit propre peut tre remise en question (cest le but dune partie de la recherche fondamentale en mathmatiques21 ). Dautre part, la justesse de leur application peut tre critique nous verrons plusieurs reprises que le choix du test appliquer nest pas ais: il nexiste pas de test universel. De ce dernier point de vue, il est important de comprendre la faon dont les tests fonctionnent pour critiquer leur
20 moins dadopter une dmarche mthodologique et pistmologique, dans le cadre de la-

quelle les deux derniers types derreur revtent tout leur intrt.
21 Dans ce premier cas, videmment, les utilisateurs des statistiques sont tout bonnement obli-

gs de faire conance aux mathmaticiens dont ils utilisent les tests: vrier que tout est en ordre de marche, sans vice cach, est le travail du mathmaticien et du statisticien. Ce sont eux qui en tant que professionnels contrls par leurs pairs sont mme de nous donner les instruments que nous utiliserons. (Cibois 2003, 3).

163

utilisation. Pour cette raison, nous expliquerons autant que possible nos choix et le fonctionnement des tests employs.22 Par contre, les conclusions fondes sur une perception intuitive de grandes quantits de donnes ne laissent pas dautre choix que celui de croire sur parole celui qui en est responsable. Face de grands ensembles de donnes, il est parfois difcile dviter que la description prsente des contradictions, cest dire des erreurs accidentelles qui ne se conforment pas au modle choisi pour dcrire les structures, ou sont en dsaccord avec les faits. Ces erreurs accidentelles sont susceptibles de perturber nos conclusions.

4.3

Mode opratoire

prsent que les outils et les donnes ont t prsents, nous conclurons cette premire section en synthtisant brivement la manire dont nous allons dpouiller et analyser les matriaux (4.3.1). Nous prciserons galement la manire dont les donnes numriques qui ont servi au travail seront mentionnes dans les sections qui suivent (4.3.2). 4.3.1 Ordre de lanalyse

Nous nous servirons des acquis des chapitres 2 et 3 pour slectionner une srie de traits gnraux dcrivant les constituants (fonction, prsence dun relateur, etc.) et pour observer les interactions de ces traits avec la simple prsence de ponctuation au sens restreint, sans tenir compte de la forme des ponctogrammes. Ltude de ces observations dgagera les tendances gnrales qui gouvernent lemploi de la ponctuation ainsi que les problmes mthodologiques quelle pose. Nous commencerons donc par rechercher des tendances gnrales sur un matriau rduit par slection dun petit ensemble de variables pertinentes. Ces tendances gnrales mettront en vidence quelles structures doivent tre compares du point de vue de leur marquage,23 ce qui fera lobjet dune srie de questions particulires, centres sur les constructions les plus intressantes (chapitre 6). Suite ces tudes spciques, nous rintroduirons une partie des traits dnitoires dont lanalyse gnrale naura pas tenu compte, comme la distribution des tendances observes entre les diffrents documents du corpus.24 Enn, la forme des ponctogrammes sera traite (chapitre 7). Lemploi des tests statistiques adquats nous apprendra sil y a quelque chose dire des donnes: cest--dire sil faut tenter une interprtation aprs un test donn ou sil est intressant deffectuer un nouveau test. Les rsultats non signicatifs laisseront
22 Comme nous ne pouvons faire de ce travail une introduction aux mthodes statistiques em-

ployes, nous renverrons systmatiquement la littrature adquate.


23 Voir le chapitre 5. 24 Voir lanalyse de la ponctuation initiale des R2 non relats non propositionnels ne gurant

aucune des deux bornes de la structure qui les contient: 6.1.3.4. Nous y montrons que la tendance nest pas gnrale, mais quelle est lie la pratique de quelques documents particuliers.

164

ainsi certaines questions en suspens. Quand les donnes ne sufront pas raliser un test en raison de leur faible effectif, nous nous limiterons un commentaire philologique lorsque nous le jugerons opportun. 4.3.2 Prsentation des dpouillements et des rsultats

Les chiffres soumis aux calculs et les rsultats de ces derniers sont ncessaires notre expos, cest pourquoi nous avons choisi de les prsenter systmatiquement dans le texte de notre tude, qui ne serait pas comprhensible sans eux. Le recours constant de volumineuses annexes aurait rendu la lecture particulirement laborieuse nous ne reportons en annexe que les donnes trop nombreuses pour gurer dcemment sur une page ou celles dun intrt trs limit. Le texte de nos interprtations a t allg en commentant les tableaux de manire volontairement humaine: entre 81% et un trs grand nombre, entre 95.91% et quasi tous, la seule diffrence rside dans lintelligibilit. Les chiffres donnent une impression de grande prcision, mais ont besoin dtre replacs dans leur ordre de grandeur relatif pour tre signicatifs. Le lecteur intress par les chiffres exacts retrouvera facilement ces derniers dans le tableau comment. Nous ne rendons pas compte de lensemble des tests et des essais effectus, mais uniquement des tapes qui ont t ncessaires pour aboutir nos conclusions. Lintrt de prsenter lensemble des checs et problmes est somme toute assez limit et demanderait un effort considrable pour tre rdig de manire accessible (et certainement un autre effort considrable pour tre lu).

165

Tendances gnrales

La premire tape de la description consistera rechercher les grandes tendances qui gouvernent lapparition de la ponctuation au sens restreint. Conformment ce que nous avons expos supra (4.1.1), nous commencerons par dnir ltendue de notre chantillon et les individus qui le composent, en prcisant les variables et modalits retenues: celles qui dcrivent les proprits morphosyntaxiques et positionnelles des constituants dune part, et celles qui en dcrivent la ponctuation dautre part (5.0). Un aperu gnral de chacune des variables prise isolment sera donn (5.1), avant denvisager la manire dont elles entrent en relation. Les tris croiss qui servent valuer les liens entre deux variables seront alors dtaills (5.2). Nous verrons en quoi cette dmarche, pour instructive quelle soit, reste insufsante si lon se borne sparer les caractres morphosyntaxiques des constituants et nous prsenterons comment nous avons contourn ce problme (5.3). Que ce soit au point de vue des calculs impliqus ou des variables choisies pour dcrire les donnes, ce chapitre sera relativement abstrait, la recherche de tendances gnrales saccompagnant dune rduction invitable. Nanmoins, dans la mesure o les individus seront dnis partir des donnes empiriques, et comme ces dernires seront rintroduites par la suite (chapitres 6 et 7), nous pensons que ce caractre abstrait nest pas prjudiciable.

5.0

Dnition des donnes

La dnition des donnes est une partie importante de la conversion de notre question dans un langage statistique (4.1). Il sagira de dlimiter lchantillon tudi, en choisissant les individus et leurs variables dnitoires. 5.0.1 Choix des individus et taille de lchantillon

Il semble que pour aborder le problme qui nous intresse, deux alternatives de dnition des individus soffrent nous: ces derniers sont soit les constituants, soit les ponctogrammes. Pour cette premire tape, nous avons considr que les individus taient les constituants. Leffectif total de lchantillon (n) est de 90752 individus. Cet effectif correspond lensemble des mots (64252 individus1 ) et de tous les constituants construits partir de ces mots (rcursivement jusquau niveau directement infrieur celui des noncs,
1

Certains mots double fonction, comme nel (ne et le contracts) sont comptabiliss deux fois dans lchantillon total des constituants, mais pas dans le compte des mots.

167

soit 26497 individus). Lchantillon ne comprend donc ni lesphrases, ni les noncs non phrastiques. Par ailleurs, les noncs en latin2 ont t retirs du corpus. 5.0.2 Dnition des individus

Pour viter davoir dvelopper abondamment chaque rduction et chaque regroupement, nous avons dcid de commencer le travail par une approche globale, puis de rintroduire ultrieurement certaines des informations ngliges et non de partir dun ensemble de variables rduire progressivement. Pour prsenter les diffrentes variables et modalits choisies, nous allons dtailler lindividu soulign dans lexemple suivant:
en temong de cete [8] choe aj o fat ce letre aeler de monael lan del jncarnaton jhesu crst ml et cc et xxx vj [9] el mos de jvle (Document 123607, 7).

Chaque individu soumis notre tude se dnit par trois types de variables, auxquelles nous ferons rfrence par la suite laide dun code alphabtique: 1. les variables dordre morphosyntaxique (quatre variables dont le code commence par M); 2. les variables positionnelles, dcrivant la position de lindividu dans le constituant intgrant (deux variables, dont le code est en LI, pour Localisation par rapport au constituant Intgrant); 3. les variables relevant de la ponctuation (deux variables, dont le code commence par PP, pour Ponctuation: Ponctogramme; 2.2.4.1).

5.0.2.1

Variables morphosyntaxiques

Les variables morphosyntaxiques (M) correspondent au modle danalyse linguistique. Elles ont donc un fondement pistmologique dni dans les limites de notre travail; ces variables sont les suivantes: 1. la nature et la fonction du constituant intgrant, rassembles dans une seule variable (MI): nonc phrastique (MI.phrase), nonc non phrastique (MI.phrase), proposition de mode personnel en syntaxe argumentale (MI.pers-arg), proposition de mode non personnel en syntaxe argumentale (MI.pers-arg), syntagme non propositionnel en syntaxe argumentale (MI.synt-arg) et proposition de mode personnel en syntaxe immdiate (MI.pers), proposition de mode non personnel en syntaxe immdiate (MI.pers) et syntagme non propositionnel en syntaxe immdiate (MI.synt); 2. la fonction du constituant (MF), soit sept modalits correspondant aux fonctions syntaxiques argumentales (3.4.2): MF.P0, MF.S1, MF.R2, MF.R3, MF.A4, MF.C5 et MF.C6; deux modalits correspondant aux fonctions immdiates: MF.Ap

Lesquels ne sont pas dcrits adquatement par notre modle (3.4.7.6 b).

168

(apposition) et MF.Dt (dterminant, 3.4.6.1); ainsi que les fonctions MF.Co (relateur coordonnant, 3.4.7.2) et MF.Rl (relateur non coordonnant3 ); 3. la nature, propositionnelle ou non, du constituant (MN), soit trois modalits: non propositionnelle (MN.0), proposition personnelle (MN.pers), proposition non personnelle (MN.pers, 3.4.2.5 b); 4. la prsence ou labsence de relateur spciant la fonction du constituant, soit deux modalits: relateur prsent (MR.1) ou absent (MR.0). Dans lexemple choisi ici, les modalits sont donc: MI.phrase (la structure est constituant immdiat dun nonc phrastique), MF.C5 (le constituant est un circonstant), MN.0 (il nest pas de nature propositionnelle), MR.1 (il est relat par ladverbe en). 5.0.2.2 Variables positionnelles

Lordre des constituants, tel quil se manifeste en surface na pas t dcrit de manire approfondie dans le chapitre 3. On peut raisonnablement penser quil interfre avec le systme des relations syntaxiques. Les variables lies la position sont: 1. au dbut de la structure intgrante ou non (LID.1 ou LID.0); 2. la n de la structure intgrante ou non (LIF.1 ou LIF.0). Ici, il sagit de LID.1 (le constituant ouvre la phrase) et de LIF.0 (le constituant nest pas le dernier de la phrase). La division de la position en deux variables rend exploitables les cas o une structure ne contient que deux constituants ou un seul. 5.0.2.3 Variables ponctuationnelles

La prsence de la ponctuation de part et dautre du constituant est dcrite par deux variables: 1. prsence ou absence dun ponctogramme au dbut du constituant (respectivement PPD.1 ou PPD.0); 2. prsence ou absence dun ponctogramme la n du constituant (PPF.1 ou PPF.0). Dans lexemple choisi ici, les modalits sont PPD.1 et PPF.1 (le constituant est la fois prcd et suivi dun ponctogramme). On gardera lesprit que la sparation entre ponctuation initiale et ponctuation nale est un artfact, qui permet de considrer un mme ponctogramme par rapport aux constituants qui sachvent sa gauche (par rapport auxquels il est PPF) et par rapport ceux qui dbutent sa droite. Les modalits slectionnes sont dun niveau trs abstrait: dans les faits, les ponctogrammes associs la modalit PPD.1 (de mme qu PPF.1) ne se limitent pas au simple : ils prennent des formes varies, comme /, /, , , etc. La simple opposition entre la prsence et labsence de ponctogramme est une approximation de la richesse des signes rellement employs. Comme annonc, nous reviendrons plus loin sur la forme de ces ponctogrammes.4
3 4

Spar du prcdent en raison de la diffrence importante de fonctionnement. La forme des ponctogrammes est ainsi dcrite au chapitre 7.

169

MI phrase

MF C5

MN 0

MR 1

PPD 1

PPF 1

LID 1

LIF 0

TAB . 5.1 Exemple de dnition dindividu


Texte en temong de cete choe aj fat o ce letre aeler de monael lan [. . .] ml et cc et xxx vj el mos de jvle MI phrase phrase phrase phrase phrase phrase phrase MF C5 P0 P0 S1 R2 C5 C5 MN 0 0 0 0 pers 0 0 MR 1 0 0 0 0 0 1 PPD 1 1 0 0 0 1 1 PPF 1 0 0 0 1 1 1 LID 1 0 0 0 0 0 0 LIF 0 0 0 0 0 0 1

TAB . 5.2 Exemples de dnition dindividu


FAB 1 0 4 3 7 FRE 57.14 42.86 100
1 0

TAB . 5.3 Exemple de tri plat

5.0.2.4

Dnition complte de lexemple

Les diffrentes variables et modalits choisies pourraient dcrire 8 11 3 25 = 8448 types dindividus thoriques. Lindividu est rduit une ligne de cellules contenant chacune la modalit slectionne dune des sept variables (table 5.1). En analysant tous les constituants immdiats de la phrase cite comme exemple (n = 6), on obtient la liste de la table 5.2.5 Le dpouillement de lensemble de lchantillon produit donc 90752 lignes de ce type.6 Dun point de vue mthodologique, ces quelques variables aux modalits abstraites vont nous aider construire un environnement de rfrence certes trs gnral, mais non dpourvu dintrt.

5.1

Tris plat

La premire tape de lanalyse consiste examiner chaque variable indpendamment et vrier la distribution de ses modalits. On reprend, pour chacune de ces dernires, sa frquence absolue (FAB, nombre dindividus possdant la modalit) et sa frquence relative (FRE, proportion dindividus possdant la modalit); pour le petit extrait qui nous sert dexemple, les frquences des deux modalits de PPD gurent dans la table 5.3 (la dernire ligne, en italiques, comporte les totaux). Quatre constituants sont marqus linitiale et trois ne le sont pas, ce qui reprsente respectivement 57.14% et 42.86% de leffectif de lchantillon la valeur duquel correspond le total
5 6

Concernant lencodage de lanalyse du prdicat, voir le paragraphe Problmes de la section Analyses syntaxiques des annexes. Voir annexe 5.0.1.all.txt.

170

FAB synt-arg synt phrase pers pers-arg pers pers-arg phrase 31437 28582 11085 8392 5343 3052 2385 476 90752

FRE 34.64 31.49 12.21 9.25 5.89 3.36 2.63 0.52 99.99
syntarg synt phrase pers persarg pers persarg phrase

5000

10000

15000

20000

25000

30000

TAB . 5.4 Tri plat de MI

de la premire colonne. Normalement, le total de la seconde colonne est toujours 100, mais il arrive que la valeur varie lgrement, en raison des arrondis. Lexamen des tris plat ne nous informe pas sur la structure des relations entre les diffrentes variables, mais nous montre, dune part, si certains effectifs ne sont pas trop rduits et risqueraient de biaiser les dpouillements7 et, dautre part, dattirer notre attention sur des phnomnes priphriques ou singuliers. Nous allons examiner successivement les tris plats des variables non ponctuationnelles (5.1.1 et 5.1.2), puis ceux de PPD et PPF (5.1.3). 5.1.1 Variables morphosyntaxiques

Il nest pas envisageable daborder en dtails ce que nous apprennent les tris plat de ces variables: ltude statistique du systme morphosyntaxique dpasse le cadre de notre tude. Cependant, les phnomnes les plus prgnants que lon pourra mettre jour dans les lignes qui suivent sont susceptibles dinterfrer de manire plus ou moins importante avec la ponctuation; nous devrons donc nous en souvenir quand nous nous engagerons dans ltude des relations. La lecture des tableaux est facilite par la consultation simultane des histogrammes reprsentant les distributions. 5.1.1.1 Variable MI

Le tri plat de MI nous montre que les modalits MI.synt et MI.synt-arg sont surreprsentes (table 5.4). Par contre, la modalit MI.phrase concerne une quantit inme des constituants. Sa prise en considration pourrait compliquer inutilement les donnes. 5.1.1.2 Variable MF

Les fonctions sont logiquement en accord avec ce premier tri (table 5.5). Labondance relative de constituants de fonction Ap tait en effet prvisible: elle dcoule directe7

Si nous avions trait des variables continues, lexamen des tris plat aurait d tre accompagn dune analyse exploratoire univarie (valuation de la forme de la distribution et de ses paramtres), qui aurait permis danalyser la manire dont les donnes sont distribues (Howell 1998, ch. 2).

171

FAB Ap Rl P0 C5 Dt S1 R2 Co A4 C6 R3 42062 11944 8106 6648 6138 4697 3805 3345 1769 1157 1081 90752

FRE 46.35 13.16 8.93 7.33 6.76 5.18 4.19 3.69 1.95 1.27 1.19 100
Ap Rl P0 C5 Dt S1 R2 Co A4 C6 R3

10000

20000

30000

40000

TAB . 5.5 Tri plat de MF


FAB 0 pers pers 85677 2640 2435 90752 FRE 94.41 2.91 2.68 100
0 pers pers

20000

40000

60000

80000

TAB . 5.6 Tri plat de MN

ment de la grande quantit de MI.synt et de MI.synt-arg que le tri plat prcdent nous a laiss voir. Cette profusion soulve deux problmes. Premirement, ltiquette apposition est peu rafne. Elle correspond des units dont on peroit intuitivement la diffrence de statut, mais que notre modle morphosyntaxique ne distingue pas (3.4.6.1), parce que les caractristiques qui servent les discerner relvent dun autre point de vue ou dune autre approche de la langue. Par exemple, dans:
celi ki ces mus tenrat en hyretage (Document 12711209, 8).

les mots ces, et mus sont tous trois considrs comme des appositions, mais nous savons que le second est un chiffre romain; il est possible que ce statut ait une inuence plus ou moins importante sur ses interactions avec le systme de ponctuation. Par ailleurs, le tri mle les fonctions apparaissant en syntaxe immdiate celles que lon rencontre en syntaxe argumentale. 5.1.1.3 Variable MN

Le tri plat effectu sur la nature des constituants est celui de la table 5.6. La grande majorit des constituants ne sont pas de nature propositionnelle. Il faudra considrer les modalits MN.pers et MN.pers comme distinctives. 5.1.1.4 Variable MR

Le tri plat des modalits de MR est dichotomique, puisquil ny a que deux valeurs possibles (table 5.7). Cela nous montre que la prsence dun relateur est un phno172

FAB 0 1 77794 12958 90752

FRE 85.72 14.28 100


0 1

20000

40000

60000

TAB . 5.7 Tri plat de MR


FAB 0 1 62372 28380 90752 FRE 68.73 31.27 100
0 1

10000

20000

30000

40000

50000

60000

TAB . 5.8 Tri plat de LID


FAB 0 1 62372 28380 90752 FRE 68.73 31.27 100
0 1

10000

20000

30000

40000

50000

60000

TAB . 5.9 Tri plat de LIF

mne qui est nettement moins frquent que son absence, mais lest plus que la nature propositionnelle. 5.1.1.5 Synthse des variables morphosyntaxiques

Mlant les observations de tous ces tris, on sattend rencontrer frquemment des appositions, des constituants non propositionnels et des constituants non relats. On extrapole ainsi que la plupart des constituants vrieront simultanment ces trois modalits. Cette distribution des donnes est directement lie leur formalisation. Les variables MN.0 et MR.0 correspondent en effet aux mots pris individuellement. Malgr son caractre articiel, cette description est pistmologiquement justie par lacceptation des principes de lanalyse en constituants immdiats. 5.1.2 Variables positionnelles

On peut faire pour les variables qui dcrivent la localisation des constituants la mme remarque gnrale que pour les variables morphosyntaxiques: elles ne nous intressent pas directement, mais il faudra, le cas chant, tenir compte de toute variation excessive. Dautre part, linstar de la variable MR, les modalits positionnelles sont dichotomiques. Pour commencer, notons que lingalit entre le nombre de constituants initiaux et le nombre de constituants naux est due llimination des constituants dont la ralisation matrielle a t endommage (chancrures, taches).8 Les proportions de LID correspondent celles de LIF (tables 5.8 et 5.9). Malgr la plus grande frquence
8

Voir la section Transcriptions des annexes.

173

FAB 0 1 81655 9097 90752

FRE 89.98 10.02 100


0 1

20000

40000

60000

80000

TAB . 5.10 Tri plat de PPD


FAB 0 1 73986 16766 90752 FRE 81.53 18.47 100
0 1

10000

20000

30000

40000

50000

60000

70000

TAB . 5.11 Tri plat de PPF

des constituants qui ne se trouvent pas aux extrmes, on voit que la diffrence de proportion entre les modalits est ici moindre que dans les tris prcdents. 5.1.3 Ponctuation

Pour commencer, il est essentiel de garder lesprit que les individus ne sont pas envisags de manire linaire, mais dun point de vue hirarchique: il sagit de dire sil y a un signe au dbut ou la n dun constituant ou sil ny en a pas. Ce sont des units syntaxiques intgres une structure qui nous intressent et non simplement des mots enchans les uns la suite des autres. Les ponctogrammes ne sont pas les individus dans le cadre qui nous occupe. Ds lors, un mme ponctogramme peut parfois marquer les limites de plusieurs constituants imbriqus. Ce phnomne a dimportantes rpercussions que nous expliquerons ci-dessous (5.1.3.2). Voyons comment les donnes sont distribues avant daborder, cette fois de manire plus dtaille, les problmes que ces mises plat rendent dj indentiables. 5.1.3.1 Donnes

Le tri plat des modalits de PPD est videmment dichotomique (table 5.10). Les constituants ne sont gnralement pas marqus linitiale: on peut donc se dire que le marquage initial est, dun point de vue smiotique, vritablement saillant. Les constatations sont assez similaires pour les modalits de PPF (table 5.11). Le marquage est un phnomne rare. En comparant les tables, on voit cependant quil y a plus de constituants qui reoivent une marque nale que de constituants qui reoivent une marque initiale. 5.1.3.2 Difcults

Quelles sont les difcults que cette diffrence de proportion met en vidence? La diffrence entre les deux types de marquage ne se comprend quen prenant en considration le principe de rcursivit syntaxique (a); et une rexion sur le contraste entre le non-marquage et le marquage mne distinguer nettement leur fonctionnement propre (b).

174

a. Rcursivit et disproportion entre PPD et PPF. Comment se fait-il que les effectifs de PPD.1 et PPF.1 diffrent, puisque, comme nous lavons signal en dnissant les variables,9 la distinction entre les ponctuations nale et initiale est un artfact? Revenons un instant sur le modle syntaxique. Nous avons indiqu quil permettait la rcursivit (5.0.2.3), option classique qui fonde une partie de lconomie du modle. Du fait de lenchssement, une position dans la chane graphique situe entre deux catnogrammes peut se trouver simultanment aux bornes dun grand nombre de structures imbriques. Ainsi, dans
et lauons en tele manre ms en notre paper et en notre regtre et por que cete [15] choe sot plus ferme no auons pendu a cet preent ecrt nos aas propres en temonghage de / [16] verte (Document 128710, 14) .

la position marque par le symbole 10 est la fois la n dune phrase et de deux constituants: 1. et lauons en tele manre ms en notre paper et en notre regtre 2. en notre regtre 3. regtre et au dbut dun C6 et, partant, dune nouvelle phrase: 4. et por que cete [15] choe sot plus ferme no auons pendu a cet preent ecrt nos aas propres en temonghage de / [16] verte 5. et une seule position dans la chane correspondent cinq positions dans la hirarchie syntaxique sans compter le problme soulev par la coordination. Il sagit dune consquence importante de la rcursivit dans le phnomne dintgration syntaxique. Dans cette optique, si une langue a tendance construire les constituants en plaant les constituants slectionnants (3.4.6.1 b), la suite des constituants slectionns,11 le nombre de constituants la n desquels les sparations entre catnogrammes se trouvent est en moyenne suprieur au nombre de constituants au dbut desquels ils se situent. Il en dcoule que si un constituant est suivi dun ponctogramme, ce nest pas ncessairement sur lui que porte le marquage, mais peut-tre uniquement sur le constituant qui le contient ou sur celui quil contient. Par ailleurs, nous avons vu prcdemment que Claude Tournier, parlant de la ponctuation moderne, a mis en vidence lexistence de lois dabsorption rgissant la manire dont les ponctogrammes se combinent ou refusent la combinaison, en privilgiant souvent lapparition dun seul signe la place de plusieurs signes qui auraient pu se trouver concatns.12 Ainsi, en franais moderne, le point nal de phrase absorbe le point nal abrviatif.

Voir les variables choisies pour dcrire la ponctuation sous 5.0.2.3.

10 Il y a un cet endroit. Nous lavons retir pour simplier la prsentation. 11 Comme cela parat tre le cas en ancien franais, ce que nous pourrions vrier numrique-

ment laide des informations encodes dans le corpus.


12 Voir notre rexion gnrale sur la recherche dune valeur pour les signes (2.3.2).

175

Il ny a aucune raison a priori pour que ce type de loi nexiste pas dans nos documents. Toutefois, dans un systme ancien dont nous ne matrisons plus toute la nesse, il est bien malais dapprhender efcacement les phnomnes dabsorption. Reprenons lexemple ci-dessus: il nest pas raisonnable de dterminer intuitivement le constituant sur lequel le ponctogramme situ lendroit marqu par porte. On estimera donc dans un premier temps quil marque les cinq constituants aux bornes desquels il se trouve. Mieux vaut viter de comparer directement PPD et PPF et tudier le comportement de chacune de ces variables de manire indpendante. b. Diffrence entre marquage et non-marquage. Comparons ce comportement celui dune absence de ponctogramme ( lendroit marqu par ci-dessous):
et por que cete [15] choe sot plus ferme no auons pendu a cet preent ecrt nos aas propres en temonghage de / [16] verte (Document 128710, 14).

Dans ce cas, il est absolument clair que le non-marquage porte simultanment sur chacun des constituants aux limites desquels on le rencontre. La diffrence entre le marquage et le non-marquage est ainsi fondamentale, tout au moins dun point de vue thorique. Considrer que la prsence et labsence de ponctuation fonctionnent de manire quivalente reviendrait surestimer la quantit de marques prsentes. Nanmoins, du point de vue du rcepteur, il y a, somme toute, peu de diffrence entre les deux possibilits. Si lon examine les associations entre la prsence dun ponctogramme et les structures qui le prcdent ou le suivent, on peut observer que les associations fortuites sont moins nombreuses que dautres, plus systmatiques. Ainsi, devant la structure
et lauons en tele manre ms en notre paper et en notre regtre et por que cete [15] choe sot plus ferme no auons pendu a cet preent ecrt nos aas propres en temonghage de / [16] verte (Document 128710, 14).

imaginons que lon interprte le ponctogramme soulign comme marquant globalement toutes limites des cinq constituants cits ci-dessus. Lemploi de mthodes statistiques, combin lexploration dun nombre important de donnes, montrera quun ponctogramme cette position est plus susceptible de sy trouver parce quil est la n dune phrase et au dbut dune autre que parce quil est la n dune apposition comme registre.

5.2

Tris croiss par variable

Pour valuer les liens existant entre les modalits de deux variables, il est courant de procder une tabulation de leurs effectifs. On effectue ainsi ce quon appelle un tri crois. Ce type de tri est soumis des tests statistiques spciques aux donnes qualitatives; ces tests valuent en quelle mesure les frquences sont ou non le fruit du hasard. Nous commencerons par donner un guide de lecture des tris croiss (5.2.1). Ensuite, nous examinerons le croisement de toutes les variables morphosyntaxiques et positionnelles avec les variables ponctuationnelles (5.2.2). Nous synthtiserons nos 176

0 A4 C5 C6 Co P0 R2 R3 S1 0 0 0 0 1 1 0 1 3

1 0 3 0 0 1 0 0 0 4 0 3 0 0 2 1 0 1 7

TAB . 5.12 Exemple de tableau de contingence

dcouvertes par une conclusion prudente, qui mettra en lumire les acquis aussi bien que les dfauts de la dmarche (5.2.3). 5.2.1 Guide de lecture

Cette section commence par une prsentation de ce quest une table de contingence (5.2.1.1), puis aborde les diffrents procds statistiques couramment employs pour tester lhypothse nulle sur ces tabulations (5.2.1.2 5.2.1.5). Dautres procds seront expliqus plus loin, au moment o nous en ferons usage pour la premire fois. 5.2.1.1 Tableau de contingence

Si nous croisons MF au niveau argumental (huit modalits) et PPD (deux modalits), nous obtenons un tableau double entre de seize cases, qui montre combien dindividus possdent une modalit de PPD (colonnes) pour chaque modalit de MF (lignes). Ce genre de tableau est appel tableau de contingence. Pour le petit exemple ci-dessus, on obtient la table 5.12.13 Les totaux ports en marge (en italiques) correspondent aux effectifs des tris plat pour chaque variable. Le total de lensemble du tableau (soit 7, dans le coin infrieur droit) quivaut leffectif de lchantillon tudi. On voit que trois C5 sont marqus par un ponctogramme initial, quun P0 est dans le mme cas, etc. Les effectifs de ce premier tableau sont cependant trop faibles pour quon puisse lexploiter (5.2.1.2). En dpouillant tout le corpus (table 5.13, gauche), nous obtenons sufsamment de donnes pour procder une analyse statistique et valuer la pertinence de la rpartition (table 5.13, droite). La lecture intuitive du tableau de gauche (ou des frquences relatives correspondantes) nest pas recommande et il serait imprudent den tirer quelque conclusion que ce soit. 5.2.1.2 Test du 2 (chi-carr)

Pour interprter ce genre de tableau, il est courant deffectuer un test statistique classique, nomm test du 2 (voir les rsultats dans la ligne sous les deux tableaux).
13 Lexemple est cit quand nous expliquons comment nous avons rduit les donnes (5.0.2).

177

PPD.0 MF.A4 MF.C5 MF.C6 MF.Co MF.P0 MF.R2 MF.R3 MF.S1 577 1976 354 434 2244 1181 506 1259 8531

PPD.1 85 482 789 171 144 287 87 509 2554 662 2458 1143 605 2388 1468 593 1768 11085

PPD.0 8.95 $## 3.76 $$$ 314.11 ### 2.15 $$$ 89.78 ### 2.32 $$$ 5.4 $$# 7.59 $##

PPD.1 29.89 ### 12.56 ### 1049.21 ### 7.17 $## 299.89 ### 7.76 $## 18.03 ### 25.37 ###

2 = 1883.93, ddl = 7, p = 0 ###

TAB . 5.13 Exemple de tri crois


0 A4 C5 C6 Co P0 R2 R3 S1 509.47 1891.67 879.65 465.61 1837.8 1129.77 456.37 1360.65 8530.99 1 152.53 566.33 263.35 139.39 550.2 338.23 136.63 407.35 2554.01 662 2458 1143 605 2388 1468 593 1768 11085

TAB . 5.14 Exemple de tri crois: valeurs attendues

a. Fonctionnement. Pour ce test, on calcule un coefcient mesurant lcart qui existe entre ce tableau et la ventilation quil aurait prsente si les cases avaient t remplies alatoirement, mais en conservant les mmes totaux marginaux (situation H0 ). Si la situation tait due au hasard, chacune des cases aurait eu comme valeur le produit des marges correspondantes divis par le total du tableau (Howell 1998, 165166), soit la table 5.14. On rsume lcart que la ventilation manifeste par rapport H0 sous la forme dun coefcient nomm 2 . Plus ce coefcient est lev,14 plus il est vraisemblable que le tableau de contingence ne soit pas d au hasard, mais un lien existant entre les variables. Il faut donc rejeter H0 au prot de H1 . Ce qui signie, dans le cas dune table de contingence, que la ventilation des donnes nest pas alatoire. On peut ds lors poser des hypothses pour expliquer la manire dont cet cart par rapport la situation dindpendance (on parle dcart lindpendance) est structur. La probabilit de H0 est calcule sur la base dune distribution galement dite du 2 , lie au
14 On calcule le coefcient 2 suivant la formule

2 =

(o e)2 e

(5.1)

qui se lit: Le 2 est gal la somme des carrs des carts H0 diviss par la valeur attendue si H0 tait vraie. Voir Muller 1973, 116127 pour un expos adapt un public de linguistes; voir Howell 1998, ch. 6 pour les dtails. Le calcul est modi par un coefcient (correction de continuit de Yates, cf. Howell 1998, 167168) dans le cas de tables croisant 2 2 modalits. La fonction R effectuant le test est chisq.test(), qui value la probabilit correspondant au coefcient obtenu.

178

nombre de degrs de libert.15 (ddl), qui correspond au produit du nombre de modalits diminu de un de chacune des deux variables, en loccurrence, (7 1) (2 1) = 6. Cette probabilit est ici voisine de zro; elle est infrieure 0.001. On voit dans le tableau 5.13 ci-dessus que le coefcient 2 est trs lev; donc, la probabilit que H0 soit vrie est proche de zro. La ventilation du tableau nest donc certainement pas alatoire. Le nombre dtoiles pleines correspond un seuil de rejet de H0 : ### quivaut p < 0.001, $## signie p < 0.01, $$# signie p < 0.05 et $$$ signie p > 0.05 (H0 ne peut tre rejete). b. Conditions dapplication. Le test a des conditions dapplication peu restrictives, mais quil importe de respecter. Charles Muller (1973, 121) les rsume efcacement:16
1. ce test ne sapplique qu des effectifs absolus, jamais des effectifs relatifs (pourcentages, par exemple), et jamais des grandeurs (caractres17 qualitatifs); 2. il perd de sa prcision quand les carts sont tablis par rapport des effectifs trop faibles; dans la pratique, on sinterdira dinscrire dans les effectifs thoriques des nombres infrieurs 5, et on vitera sil se peut les nombres infrieurs 10; pour les effectifs rels, il ny a pas de limitation;18 3. toute erreur sur le nombre de degrs de libert fausse le rsultat.

ces conditions, il faut ajouter celle de ninclure dans le tableau que des observations indpendantes (Howell 1998, 175). Il faut que la probabilit de loccurrence simultane dun individu A et dun individu B soit gale au produit de la probabilit doccurrence de chacun.19 En pratique, il est donc ncessaire que le total du tableau corresponde au nombre dindividus soumis au tri, pas plus. Ces contraintes sont assez claires et ne requirent pas de commentaire, lexception du problme de lindpendance des observations. c. Rcursivit et indpendance des observations. Nous venons de voir que David Howell dnonait comme une erreur typique le fait de prendre plusieurs fois le mme individu en considration. Or, comme on a pu sen apercevoir en analysant les tris plat, le mme signe est pris plusieurs fois en considration pour dterminer les valeurs de PPD et PPF pour lensemble des individus. En ce sens, ces variables sont demble un indice de la non-indpendance des donnes. Nanmoins, ce sont les valeurs des variables dcrivant les individus qui sont lies. Les individus sont, quant eux, bel et bien indpendants. Les tests restent utilisables, mais les variables nen demeurent pas moins lies a priori. Pour rsoudre ce problme, il faudrait peut-tre considrer chaque niveau dintgration syntaxique indpendamment des autres, puis trouver les mthodes appropries pour tester les relations entre ces diffrents niveaux. Cela ne serait envisageable que si nous avions notre disposition une quantit bien plus importante de matriaux. On ne pourrait pas davantage faire des mots les individus de ltude et les dnir
15 Dans une table de contingence, il sagit du nombre de cases dont leffectif peut varier en

conservant des totaux marginaux xes. Voir par exemple Howell 1998, 59 et 116117.
16 Italiques en gras dans le texte. 17 Synonyme de variable que nous navons pas employ ici, pour viter toute confusion. 18 En pratique, cette limite de 5 nest pas toujours respecte sans pour autant biaiser les rsultats,

cf. Howell 1998, 173174.


19 Soit P(A B) = P(A) P( B), cf. (Upton/Cook 2006, 106).

179

par de nombreuses variables correspondant aux constituants aux extrmes desquels ils se trouvent. Pareille description mnerait obligatoirement assigner un nombre de variables considrable chaque individu on rencontrerait les problmes dcrits sous 4.2.3. 5.2.1.3 Rapport de chances

Si nous effectuons une tabulation entre la variable MR et la variable PPD au niveau de la phrase, nous obtenons une table carre de quatre cases (table 2 2). Pour complter lanalyse dune telle table, il est utile de calculer une statistique nomme rapports de chances (note ci-dessous).20 Les rapports de chances ne sont pas inuencs par lingalit des totaux marginaux (p. ex., le fait que le total de la premire ligne ne soit pas le mme que celui de la seconde) et montrent quel est le degr de liaison dune variable par rapport une autre.21 La tabulation de MR avec PPD donne le premier exemple de calcul du rapport de chances (5.2.2.4). En situation de H0 , ce rapport vaut exactement 1. Plus le nombre scarte de lunit, plus lcart par rapport lindpendance est important nanmoins, les rapports de chances sont purement descriptifs et ne permettent pas de faire des infrences. Pour les tables 2 2 qui suivront dans ce travail, nous avons report le correspondant aux attractions en-dessous du tableau de dcomposition des contributions (5.2.1.4). ce stade, il est important de comprendre que la signicativit du test et le rapport de chances sont deux mesures diffrentes. Il se pourrait quun peu lev soit signicatif, cela voudrait dire quil est pertinent de relever le contraste tudi, bien quil soit difcilement perceptible intuitivement. La situation inverse est tout aussi possible. 5.2.1.4 Structure de lcart

Le coefcient 2 pose une apprciation globale sur lcart H0 : soit la ventilation est due au hasard, soit elle ne lest pas. Il est parfois utile dvaluer dans quelle mesure chaque cellule du tableau scarte de H0 . Pour ce faire, nous avons choisi demployer trois indicateurs distincts, reports synthtiquement dans le sous-tableau de droite du tableau 5.13. Premirement, le sens de lcart est indiqu par un signe moins sil est ngatif (effectif moindre que dans la situation H0 ) et par aucun signe sil est positif.
20 Il est tout fait possible de calculer les rapports de chances pour des tables plus grandes

(Agresti 2002, 5556), mais leur interprtation devient trs complique.


21 Pour une table

B.1 A.1 A.2 a c r

B.2 b d s m n N

la formule du rapport de chances de la case contenant leffectif a (1,1 ) est donne par Agresti (2002, 45): ad 1 1 1,1 = = 2,2 = = (5.2) bc 1,2 2,1

180

Le nombre correspond la part du 2 due la valeur de la case correspondante dans le tableau de contingence (on parle de contribution au 2 ). Nous avons en outre calcul p en considrant le 2 pour chaque cellule du tableau avec ddl = 1 (comme sil sagissait dun tableau de deux lignes et de deux colonnes). Grce cette dcomposition de lcart, on se fait aisment une ide de lindividualit des liens. Pour le tableau 5.13, on voit que les fonctions C6, Co et S1 sont lies positivement (attraction) au marquage, alors que les autres fonctions sont lies ngativement (rpulsion ou opposition). Lessentiel de linformation contenue dans le tableau est apport par la ligne impliquant C6 et la prsence dun ponctogramme est plus discriminante que son absence (les contributions de la colonne de droite sont plus leves que celles de la colonne de gauche). 5.2.1.5 Test exact de Fisher

Dans le cas o les conditions numriques dutilisation du 2 ne sont pas rassembles, on conseille demployer le test dit test exact de Fisher. La probabilit de la ventilation est calcule sur la base de la distribution hypergomtrique qui correspond empiriquement un tirage sans remise dans une urne.22 Pour des raisons techniques,23 il est parfois impossible de calculer une probabilit exacte pour lensemble de la table. Dans ce cas, il faut se contenter des donnes concernant la dcomposition de lcart pour travailler. Nous verrons des exemples o le test exact de Fisher, alternative au 2 , a d tre employ. 5.2.2 Examen des tris croiss

Puisque, comme on vient de le voir, la distinction entre PPF et PPD est articielle, il sagit dtudier ici la manire dont les constituants sont marqus sous deux angles diffrents. Nous ferons donc en parallle deux tudes distinctes de la rpartition de la mme ponctuation. Nous essayerons de synthtiser ensuite les deux sries de rsultats (5.2.3). Pour viter les interfrences avec les phnomnes esthtiques de marquage du
22 Soit la table:

B.1 A.1 A.2 a c r

B.2 b d s m n N

La formule de la probabilit de H0 est donne par m!n!r! s! a!b!c!d!N ! Cf. Upton/Cook 2006, 160161. Le test est effectu par la fonction R sher.test().
23 Dans R, lalgorithme par dfaut du test consomme beaucoup de ressources si certains effec-

(5.3)

tifs sont levs.

181

PPD.0 MI.pers MI.pers-arg MI.pers MI.pers-arg MI.phrase MI.phrase MI.synt MI.synt-arg 8018 4714 2997 2198 8473 256 26886 27866 81408

PPD.1 374 629 55 187 2540 149 1690 3430 9054 8392 5343 3052 2385 11013 405 28576 31296 90462

PPD.0 28.75 ### 1.85 $$$ 22.84 ### 1.25 $$$ 208.57 ### 32.28 ### 53.24 ### 3.15 $$$

PPD.1 258.46 ### 16.61 ### 205.37 ### 11.2 $## 1875.37 ### 290.24 ### 478.68 ### 28.29 ###

2 = 3516.13, ddl = 7, p = 0 ###

TAB . 5.15 Tri crois MI PPD


PPF.0 MI.pers MI.pers-arg MI.pers MI.pers-arg MI.phrase MI.phrase MI.synt MI.synt-arg 7002 4281 2594 1861 8466 264 23611 25749 73828 PPF.1 1385 1062 450 523 2504 206 4855 5594 16579 8387 5343 3044 2384 10970 470 28466 31343 90407 PPF.0 3.42 $$$ 1.55 $$$ 4.71 $$# 3.78 $$$ 27.05 ### 37.4 ### 5.74 $$# 0.92 $$$ PPF.1 15.22 ### 6.89 $## 20.98 ### 16.85 ### 120.48 ### 166.55 ### 25.54 ### 4.11 $$#

2 = 461.19, ddl = 7, p = 1.75e 95 ###

TAB . 5.16 Tri crois MI PPF

dbut et de la n de la charte, nous avons retir les constituants dont le premier mot correspondait au premier mot du document des tests concernant la ponctuation initiale. De mme, nous avons retir les individus qui se trouvaient la n dune charte pour les tests concernant la ponctuation nale. Tabulons donc successivement toutes les variables MI, MF, MN, MR, LID et LIF, dune part avec PPD, dautre part avec PPF. 5.2.2.1 Variable MI

Pour les diffrentes modalits de MI, la tabulation avec la ponctuation initiale donne le rsultat du tableau 5.15. Si lon regarde les contributions, le tri crois montre trs clairement que ce sont les constituants immdiats des structures ayant le statut dnonc (MI.phrase et MI.phrase) qui attirent le plus PPD.1. Les constituants des structures contractant une fonction argumentale (except MI.pers-arg) suivent galement cette tendance, mais de manire mois nette. En dehors dun contexte permettant les relations de type argumental, la rpulsion est trs forte. Lexamen des tris croiss impliquant plutt PPF (table 5.16) montre que la ponctuation nale ne suit pas toujours les mmes tendances quavec PPD: avec MI PPF, il est dj clair que la ponctuation nest pas similaire de part et dautre des constituants. Remarquons tout dabord que le 2 de ce tableau est beaucoup plus bas que celui du tableau qui croisait MI et PPD. On constate une attraction pour tout ce qui est intgr une structure ayant le statut dnonc ou une forme propositionnelle ayant

182

PPD.0 MF.A4 MF.Ap MF.C5 MF.C6 MF.Co MF.Dt MF.P0 MF.Rl MF.R2 MF.R3 MF.S1 1645 38135 5851 356 2488 5982 7867 10957 3341 854 3932 81408

PPD.1 123 3887 797 801 857 156 238 879 464 121 731 9054 1768 42022 6648 1157 3345 6138 8105 11836 3805 975 4663 90462

PPD.0 1.83 $$$ 2.69 $$$ 2.9 $$$ 450.92 ### 90.59 ### 38.03 ### 45.05 ### 8.77 $## 2.02 $$$ 0.62 $$$ 16.65 ###

PPD.1 16.45 ### 24.17 ### 26.04 ### 4054.41 ### 814.56 ### 341.94 ### 405.03 ### 78.85 ### 18.16 ### 5.62 $$# 149.67 ###

2 = 6594.96, ddl = 10, p = 0 ###

TAB . 5.17 Tri crois MF PPD

une fonction argumentale. Tout comme pour la ponctuation initiale, les constituants de la phrase se caractrisent par lattraction du marquage, mais leur contribution est nettement plus faible. On voit dj que la ponctuation initiale et la ponctuation nale ne se comportent pas de manire identique en fonction du contexte syntaxique dans lequel le constituant se trouve. Cependant, il est assez vident, vu les contributions normes pour cette ligne, que les constituants de la phrase ont une tendance au marquage trs nette et dpassant celles de tous les autres, que ce soit vis--vis de PPD ou de PPF. 5.2.2.2 Variable MF

Abordons prsent le comportement de la ponctuation par rapport la fonction des constituants. La ventilation des donnes dans la tabulation de MF et PPD donne la table 5.17: PPD.1 repousse les fonctions Ap, A4, Dt, P0 et Rl, mais attire les autres. Les rpulsions ont une contribution plus forte que les attractions; on remarquera toutefois que la contribution la plus leve est celle de la fonction C6, qui attire le ponctogramme initial. Il faut cependant relativiser ces observations. Comme nous lavons fait remarquer supra (5.2.2.2), le tri traite exactement de la mme manire des units que nous avons clairement distingues dun point de vue pistmologique. La ventilation des effectifs selon les variables MF et PPF est donne dans la table 5.18. Avec les mmes rserves que celles signales pour PPD, les fonctions Co, C6, Rl, P0 et S1 repoussent PPF.1. Malgr limportance de leffectif Ap dans la colonne PPF.1, la contribution de la ligne correspondant cette fonction est plus basse que les autres tout en restant statistiquement signicative. Cela montre que les constituants de cette fontion ne se laissent pas ranger dans une catgorie nette. La divergence entre PPD et PPF est encore plus prsente dans le cas de MF que dans celui de MI. On pourra distinguer (voir la synthse 5.2.3): 1/ les fonctions rejetant tout marquage; 2/ les fonctions attirant un marquage de part et dautre; 3/ celles qui impliquent un comportement diffrent gauche et droite du constituant.

183

PPF.0 MF.A4 MF.Ap MF.C5 MF.C6 MF.Co MF.Dt MF.P0 MF.Rl MF.R2 MF.R3 MF.S1 1178 34014 4494 1152 3291 3654 6963 11841 2423 713 4105 73828

PPF.1 590 7930 2075 5 54 2388 1097 103 1379 366 592 16579 1768 41944 6569 1157 3345 6042 8060 11944 3802 1079 4697 90407

PPF.0 48.93 ### 1.66 $$$ 141.22 ### 45.43 ### 114.56 ### 332.07 ### 22.06 ### 446.69 ### 149.71 ### 32.08 ### 18.91 ###

PPF.1 217.88 ### 7.38 $## 628.85 ### 202.29 ### 510.17 ### 1478.73 ### 98.24 ### 1989.16 ### 666.69 ### 142.86 ### 84.22 ###

2 = 7379.78, ddl = 10, p = 0 ###

TAB . 5.18 Tri crois MF PPF


PPD.0 MN.0 MN.pers MN.pers 76713 2371 2324 81408 PPD.1 8674 269 111 9054 85387 2640 2435 90462 PPD.0 0.21 $$$ 0.01 $$$ 8.04 $## PPD.1 1.92 $$$ 0.09 $$$ 72.27 ###

2 = 82.53, ddl = 2, p = 1.2e 18 ###

TAB . 5.19 Tri crois MN PPD


PPF.0 MN.0 MN.pers MN.pers 71328 936 1564 73828 PPF.1 14017 1702 860 16579 85345 2638 2424 90407 PPF.0 38.3 ### 688.92 ### 87.21 ### PPF.1 170.54 ### 3067.85 ### 388.34 ###

2 = 4441.16, ddl = 2, p = 0 ###

TAB . 5.20 Tri crois MN PPF

5.2.2.3

Variable MN

En ce qui concerne la nature, la tabulation avec PPD donne le tri de la table 5.19. Les rsultats du test sur cette dernire sont signicatifs et lexamen des dtails indique que llment fort est la rpulsion que les propositions non personnelles manifestent par rapport au marquage, o la contribution est trs forte. Lexamen du tableau de contingence appropri rvle que la nature des constituants est galement lie leur ponctuation nale (table 5.20): les propositions sopposent aux constituants non propositionnels par une attraction forte, particulirement par ce qui est personnel. Contrairement la ponctuation initiale, le marquage nal correspond tout fait au caractre saillant de ces structures, dont les tris plat montraient la raret relative. Le contraste morphosyntaxique entre les constituants simples et les constituants propositionnels est donc surtout marqu par la prsence de ponctuation la n de ces derniers.

184

PPD.0 MR.0 MR.1 69506 11902 81408

PPD.1 8106 948 9054 77612 12850 90462

PPD.0 -1.64 9.89

PPD.1 14.72 -88.89 1.46

2 = 114.78, ddl = 1, p = 8.77e 27 ###

TAB . 5.21 Tri crois MR PPD


PPF.0 MR.0 MR.1 66867 6961 73828
2

PPF.1 10695 5884 16579 77562 12845 90407

PPF.0 196.56 -1186.91

PPF.1 -875.32 5285.43 5.28

= 7542.08, ddl = 1, p = 0 ###

TAB . 5.22 Tri crois MR PPF


PPD.0 LID.0 LID.1 57785 23623 81408 PPD.1 4587 4467 9054 62372 28090 90462 PPD.0 48.83 -108.43 PPD.1 -439.07 974.93 2.38

2 = 1570.31, ddl = 1, p = 0 ###

TAB . 5.23 Tri crois LID PPD

5.2.2.4

Variable MR

La tabulation de MR et PPD mne la cration dun tableau de contingence 2 2, dont nous calculons le rapport de chances (table 5.21). La trs faible probabilit calcule nous autorise dire quil y a rpulsion manifeste entre les constituants relats et la ponctuation initiale. La valeur de correspond au rapport de chances entre les attractions et les rpulsions du tableau. Ici, lattraction est entre MR.1 et PPD.0. Il y a, selon le calcul des rapports de chances, 1.46 fois plus de chances derejeter le marquage initial pour les constituants relats que pour les constituants non relats.24 Par rapport PPF, les constituants relats manifestent une tendance oppose celle quils prsentaient pour PPD (table 5.22): les constituants relats attirent nettement le marquage nal. Cela donne limpression que la ponctuation marque la limite de droite des constituants relats, alors que le relateur indique la limite de gauche. Lutilisation simultane dun procd syntaxique et de la ponctuation encadrerait le constituant. 5.2.2.5 Variable LID

Les tris croisant la ponctuation et la position des constituants accusent des carts encore plus levs (table 5.23): les constituants se trouvant linitiale de la structure qui
24 Le rapport de chances inverse correspond naturellement linverse du rapport prsent (il est

donc infrieur 1). Dans les tableaux qui suivent, nous prsenterons toujours le rapport de chances suprieur 1, cest--dire celui qui correspond lattraction.

185

PPF.0 LID.0 LID.1 46295 27533 73828

PPF.1 15732 847 16579 62027 28380 90407

PPF.0 -374.84 819.25

PPF.1 1669.22 -3648.22 11.0

2 = 6510.04, ddl = 1, p = 0 ###

TAB . 5.24 Tri crois LID PPF


PPD.0 LIF.0 LIF.1 54089 27319 81408
2

PPD.1 7993 1061 9054 62082 28380 90462

PPD.0 -56.68 123.98

PPD.1 509.6 -1114.77 3.80

= 1804.01, ddl = 1, p = 0 ###

TAB . 5.25 Tri crois LIF PPD


PPF.0 LIF.0 LIF.1 57783 16045 73828 PPF.1 4589 11990 16579 62372 28035 90407 PPF.0 920.94 -2048.9 PPF.1 -4101.04 9123.97 9.4

2 = 16192.49, ddl = 1, p = 0 ###

TAB . 5.26 Tri crois LIF PPF

les intgre attirent PPD.1. Les tendances lies la ponctuation nale sont galement opposes celles quon observait pour PPD (table 5.24), o le rapport de chances est norme: la position initiale repousse trs nettement PPF.1. 5.2.2.6 Variable LIF

Si lon observe la tabulation entre PPD et LIF (table 5.25), on voit que la rpulsion est beaucoup plus forte que le lien entre LID et PPD. Si lon considre simultanment les deux derniers tris, on est amen penser que la ponctuation initiale marque la limite de gauche des constituants. La valeur de est leve dans les deux cas, ce qui signie quon aurait toutes les chances de reprer ces contrastes la simple lecture naturelle des documents. En reliant cette tendance au fait que les relateurs qui rejettent PPD se trouvent gnralement linitiale du constituant quils relatent, ce comportement va de pair avec la rpulsion existant entre PPD.1 et la fonction de relateur. On pourrait dj avancer comme hypothse que, puisque la position des relateurs marque la limite de gauche des constituants relats (3.4.4.2), la prsence de ponctuation cet endroit parat redondante. Et paralllement (table 5.26), la position nale attire PPF.1. La ponctuation nale marque ainsi la limite de droite des constituants de manire gnrale.

186

[ constituant 1 ] [ constituant 2 ]
F IG . 5.1 Synthse aprs tris croiss gnraux: segmentation et ponctogrammes

5.2.3

Synthse et critique de la dmarche

Cet ensemble de tris nous a permis de remarquer que la ponctuation tait lie chacune des variables slectionnes pour ltude. La synthse ci-dessous permettra de sen rendre compte, tout en nous invitant rchir sur la validit des analyses telles que nous avons pu les mener jusqu prsent. Cette dmarche critique nous mnera reconsidrer notre approche, de faon ce quelle soit plus respectueuse de la ralit que nous cherchons dcrire. Lanalyse du dtail des tris croiss met en lumire que la ponctuation est un procd qui sajoute ceux fournis par la morphosyntaxe pour marquer les limites des constituants25 (5.2.3.1). On pourrait galement tenter une synthse des diffrentes tendances en essayant de faire voir comment les variables qui ne relvent pas de la ponctuation se comportent par rapport celle-ci, mais la synthse obtenue resterait intuitive (5.2.3.2). En particulier, une telle analyse ne tiendrait pas compte de la multiplicit des tendances, cantonnant chaque modalit dans un schma spcique. De plus, elle diffracterait les variables dnitoires des individus, de sorte quil ne serait pas possible dvaluer comment les diffrentes combinaisons de modalits morphosyntaxiques et positionnelles sont lies PPD et PPF (5.2.3.3). 5.2.3.1 Ponctuation et segmentation en constituants

Au chapitre 3, nous avons vu que laccord et la prsence de relateurs dlimitaient les constituants (3.4.4.7). Les tris croiss avec MF, MR, LID et LIF indiquent que lon peut raisonnablement penser que la ponctuation remplit, entre autres, une fonction similaire. Le nombre de ponctogrammes aux bornes des constituants est en effet signicativement suprieur (5.2.2.5 et 5.2.2.6). Cela montre que ce sont principalement les limites des constituants qui sont marques et que la ponctuation a une fonction de segmentation isolant les constituants de mme niveau les uns des autres. Les scribes concevaient donc la segmentation en units de manire similaire la faon dont nous lavons modlise. Soit, schmatiquement, la gure 5.1.26 Par ailleurs, ce comportement est tout fait en accord avec ce que nous avons vu au sujet de MR.1: les constituants relats repoussent PPD.1 et attirent PPF.1. Quant MF.Rl, qui est la modalit gnralement vrie pour la fonction du premier constituant dune structure relate, il repousse fortement toute ponctuation (gure 5.2). On aurait donc deux manires de dlimiter les groupes de mots fonctionnant ensemble. Certains groupes seraient dlimits par un ponctogramme de part et dautre,
25 Voir le rle des relateurs cet gard: 3.4.4.2. 26 Dans les schmas qui suivent, nous reprsentons la prsence dun ponctogramme quelconque

par et son absence par . Quand les donnes ne sufsent pas ou que lcart observ nest pas signicatif, nous lindiquons par un point dinterrogation.

187

[ constituant 1 ] [ Rl reste du constituant 2 ]


F IG . 5.2 Synthse aprs tris croiss gnraux: segmentation, relateurs et ponctogrammes

[ constituant 1 ] [Rl reste du constituant 2 ] [ constituant 3 ]


F IG . 5.3 Synthse aprs tris croiss gnraux: interruption

alors que les syntagmes souvrant sur un relateur seraient marqus par un ponctogramme la nale. Rappelons quil sagit de tendances statistiques. Elles sont en ce sens relativement abstraites par rapport aux donnes: les signes sont, nous lavons vu (5.1.3), assez rares (en particulier linitiale), et leur apparition simultane aux deux extrmits dun constituant nest videmment pas systmatique. En outre, dans les faits, ce fonctionnement est rendu opaque par la rcursivit des structures syntaxiques. Si la chane graphique est linaire, la structure syntaxique ne lest pas; il arrive frquemment que certains constituants non marqus en contiennent dautres, qui au contraire le sont (gure 5.3). Par exemple, dans
en cel or et en cel ore memes l deuant dt fomens [14] en rendrent don et veture a frere johan condt pangnon delle vauz an lam [15]ber [. . .] (Document 12760224, 13).

la structure de condt pangnon est introduite par un relateur et sachve par un ponctogramme. Pourtant, elle se trouve lintrieur du constituant plus large a frere johan condt pangnon delle vauz an lamber. De la mme manire, quand nous avons tudi les liens entre les modalits de MF et celles de PPF (5.2.2.2), nous avons vu que PPF.1 et MF.Co taient lis ngativement. Cette observation, valide par le test du 2 , correspondrait ainsi un rejet du ponctogramme la suite dun coordonnant. Pourtant, il existe des occurrences de coordonnants qui sont suivis dun ponctogramme. Or, le lien entre les deux modalits va dans le sens de la rpulsion et la modalit PPF.1 renvoie la prsence dune autre modalit PPD.1 pour les constituants qui suivent un constituant marqu la nale. Il serait donc intressant de considrer que les constituants MF.Co qui vrient PPF.1 ne sont pas fonctionnellement marqus, mais que la marque qui les suit est cause par le contexte environnant. Un lien signicatif ne se comprend donc pas comme une implication logique: il ne sagit que dune tendance indiquant une convergence, nimpliquant pas ncessairement une relation de causalit. 5.2.3.2 Un panorama trop gnral

a. Schmas de ponctuation. En considrant conjointement lensemble des tendances, on schmatise facilement la manire dont sont rparties les marques de ponctuation. Il y a quatre cas de gure: 1/ ponctuation devant et derrire, 2/ seulement devant, 3/ seulement derrire, 4/ aucune ponctuation. chacune de ces possibilits sont asso188

MI.(phrase | phrase | pers-arg) | MF.(R2 | R3 | C5)

F IG . 5.4 Synthse aprs tris croiss gnraux: ponctogramme devant et derrire

MI.synt-arg | MF.(S1 | C6 | Co) | MR.0 | LID.1 | LIF.0

F IG . 5.5 Synthse aprs tris croiss gnraux: ponctogramme devant seulement

MI.pers-arg | MF.(A4 | Ap | Dt) | MN.pers | MR.1 | LID.0 | LIF.1


F IG . 5.6 Synthse aprs tris croiss gnraux: ponctogramme derrire seulement

MI.(synt | pers | pers) | MF.(P0 | Rl)

F IG . 5.7 Synthse aprs tris croiss gnraux: aucun ponctogramme

cies un certain nombre de modalits morphosyntaxiques et positionnelles.27 Le premier schma (ponctuation devant et derrire) est ainsi reprsent dans la gure 5.4. On voit que les modalits des deux variables associes un marquage de part et dautre ne sont pas incompatibles. Le schma de ponctuation uniquement initial est celui de la gure 5.5. Ce schma est la fois trivial et tonnant. Suivant notre connaissance de la langue tudie, il est normal de retrouver associes les modalits de MF et de MR quon voit ici (les C6 et les coordonnants ne sont jamais relats; les sujets ne le sont que trs rarement.28 De mme, C6 et S1 sont souvent en position initiale et Co nest jamais en position nale. Par contre, il nest pas possible de rencontrer S1 ou C6 dans un intgrant non propositionnel. De mme, il nous semble que Co nest quasiment jamais initial. Lassociation de la modalit MI.synt-arg est donc problmatique. Si la ponctuation nest que nale, le schma est celui de la gure 5.6. Les modalits ne sont pas incompatibles. Dans les cas o la ponctuation est gnralement absente de part et dautre, comme ceux de la gure 5.7, P0 nest jamais en contexte immdiat puisquil dnit les structures propositionnelles.29 Enn, deux autres schmas partiels ont t mis jour (gure 5.8). b. Limitations. Il faut toutefois faire preuve dune grande vigilance car une telle synthse est imprcise et donc dangereuse. Tout dabord, pour se faire une ide de la manire dont les attractions sont chelonnes, on devrait dcomposer progressivement chaque tableau en faisant des 2 suc27 Dans les schmas ci-dessous, la barre verticale signie ou. Grouper entre parenthses plu-

sieurs modalits spares par des barres verticales nous permet disoler une alternative: MI.(phrase | synt) signie MI.phrase ou MI.synt. 28 Gnralement dans le cadre de la tournure _cest a savoir. . . _ ou _conute chose soit. . . _, voir les sujets propositionnels (3.4.4.5). 29 Voir 3.4.2 sur la dnition du terme proposition.

189

MN.pers ? [ MN.0 ]

F IG . 5.8 Synthse aprs tris croiss gnraux: cas intermdiaires

cessifs (voir 6.1.1 pour un exemple). En effet, face au tableau croisant MN et PPF, par exemple, nous avons vu que la dcomposition de lcart laissait des cases dont la contribution isole ntait pas pertinente. Mais quen est-il de la comparaison des cases entre elles? Le nombre de tests effectuer deviendrait trs rapidement trop important pour tre grable et pour permettre une interprtation aise. Par ailleurs, la synthse a t construite sur la base de dpouillements qui ngligent toute relation entre PPD et PPF. On vrie ainsi que MF.Co attire PPD.1, mais y a-t-il une diffrence entre les MF.Co en fonction de leur ponctuation initiale? 5.2.3.3 Atomisation des individus

Revenons prsent aux problmes de compatibilit des modalits des diffrentes variables: deux modalits se rapprochent dune forme de marquage soit parce quelles se ressemblent par rapport au marquage (cest le cas des diffrentes modalits dune mme variable), soit parce quelles sattirent. Malheureusement, tels quils ont t mens, les tris croiss ci-dessus ne laissent pas quantier les relations entre les modalits non ponctuationnelles. Par exemple, nous savons par exprience quun grand nombre de R2 sont de nature propositionnelle (mode personnel). Or, autant MF.R2 que MN.pers attirent PPF.1. Comment pourrait-on dire si la prsence dun signe la nale est plus lie lune ou lautre de ces modalits morphosyntaxiques? Cet ensemble dobservations ne nous informe que sur la manire dont les variables se comportent lorquelles sont compares deux deux. Il sagit dun guide prcieux, mais qui gagnerait tre enrichi par une vue plus globale, comparant systmatiquement les relations entretenues par toutes les variables. Enn, si les tris croiss nous ont montr les liens entre MF.R2 et PPF.1, MR.0 et PPF.0, ces liens ngligent une dimension importante des donnes: les diffrentes modalits dune mme variable ont beau tre mutuellement exclusives, il est vident que les constituants combinent des modalits morphosyntaxiques et positionnelles qui sont lies de manire parfois antagonistes PPF. Ainsi, MF.R2 et MR.0 ne sont pas incompatibles, comme en tmoigne
et par che ke che ot plus ferme choe et etable / mes res renrs [. . .] at pendut on aal ace pre/[20]en lettre en temongnage devertet (Document 12740224, 18).

La construction on aal assumant la fonction R2 est loin dtre exceptionnelle. De mme, il se pourrait que les constituants vriant MR.1 soient marqus simplement parce quils sont souvent en position LIF.1. Cependant, ce nest pas la relation entre les variables morphosyntaxiques qui nous intresse, mais la manire dont ces dernires interfrent avec la ponctuation. Ds lors, que faire de ces informations si les individus traits sont trop complexes pour en dduire une description valable? Il sagit donc de trouver un moyen de traiter des relations entre plus de deux variables. Nous avons essay de faire en sorte que plusieurs 190

tris croiss successifs claircissent le terrain, ce que nous exposons dans la section suivante.

5.3

Tris croiss sur une variable de synthse

Nous expliquerons tout dabord comment nous avons mis en place une nouvelle srie de tris croiss effectus sur une variable synthtisant toutes les autres variables morphosyntaxiques et positionnelles (5.3.1) avant de les tudier en dtail (5.3.2). Dans la synthse qui suivra, nous valuerons dans quelle mesure la ponctuation est rgulire en dressant le tableau synoptique des tendances de ponctuations initiale et nale, ce qui nous mnera poser les questions qui orienteront la suite de notre travail (5.3.3). Nous avons rejet dautres techniques appliquables aux donnes catgorielles, comme lanalyse factorielle des correspondances, la description statistique des classes et lanalyse log-linaire. Ce rejet est li au fonctionnement de ces outils, quon aurait bien du mal prsenter en quelques lignes. Retenons simplement ceci: lanalyse factorielle a le dfaut dtre trop intuitive et ne permet pas dinfrence,30 et la description statistique des classes complique le traitement des units peu attestes. Quant lanalyse log-linaire, seule mthode que nous connaissions qui soit capable de tenir compte de la diffraction des modalits, elle impose des contraintes concernant les effectifs que nous ne pourrions respecter ici.31 5.3.1 Procdure

Pour viter latomisation, nous avons d grouper certaines variables morphosyntaxiques et positionnelles en une seule super-variable comportant de nombreuses modalits. La grande table de contingence obtenue en croisant cette nouvelle variable avec les variables ponctuationnelles a ensuite t dcompose en plus petites tables exploitables individuellement. 5.3.1.1 Fusion des variables

lexception de lanalyse log-linaire, impraticable avec les donnes dont nous disposons, les mthodes multivaries ne rsolvent pas efcacement le problme de latomisation des individus. Lide qui vient immdiatement lesprit est celle deffectuer des tests non sur des variables simples, mais sur des combinaisons de plusieurs dentre elles. On combinerait les variables retenues en une seule que lon valuerait par rapport sa relation au marquage. Nous avons donc regroup les variables morphosyntaxiques et positionnelles en une seule variable complexe, qui ne diffracte pas linformation apporte par
30 Nous en ferons nanmoins usage dans le cadre de ltude de la forme des ponctogrammes

(chapitre 7): dans ce cas, le nombre de modalits retenues est sufsamment rduit pour employer efcacement cette mthode. 31 Cf. Howell 1998, 705706 qui expose le problme en termes gnraux et Agresti 2002, 395 396 qui prsente les implications mathmatiques de ces faibles effectifs.

191

MI phrase phrase phrase phrase phrase phrase phrase

LID 1 0 0 0 0 0 0

LIF 0 0 0 0 0 0 1

MF C5 P0 P0 S1 R2 C5 C5

MN 0 0 0 0 pers 0 0

MR 1 0 0 0 0 0 1

MM 1,0,C5,0,1 0,0,P0,0,0 0,0,P0,0,0 0,0,S1,0,0 0,0,R2,pers,0 0,0,C5,0,0 0,1,C5,0,1

TAB . 5.27 Exemple de dnition dindividus, MM en dernire colonne

les individus. Les modalits possibles de cette nouvelle variable (note MM) correspondent toutes les combinaisons possibles entre les modalits des variables simples LID, LIF, MF, MN et MR. Soit, pour lexemple donn ci-dessus, la table 5.27.32 De cette manire, chaque individu nest plus dni que par une seule variable tenant simultanment compte des variables morphosyntaxiques et positionnelles. Le dsavantage de cette manipulation est que les individus dont la dnition en variables est peu reprsente ne sont pas exploitables laide dun simple test de 2 . Dans ces conditions, il y a deux possibilits: les regrouper avec des membres dune autre classe, ou les liminer des calculs. La premire possibilit ne tronque pas lchantillon; cependant, elle introduit progressivement un biais incontrlable au point de vue de la qualit des donnes, dont la description procure, nous lavons dj soulign,33 une reprsentation extrmement rduite. La seconde solution vite le biais, mais tronque lchantillon, nous privant dinformations peut-tre prcieuses. On ne pourrait adopter a priori la premire attitude, puisque nous ne connaissons pas la relation que nous voulons mettre en vidence. Nous avons donc choisi de rejeter dans un premier temps toutes les congurations qui ne sont pas sufsamment reprsentes, quitte les commenter par la suite. 5.3.1.2 Sparation par modalit de MI

Les analyses sont faites sparment pour les diffrents types de constituants intgrants (MI, division suivant les bases pistmologiques de la description), ainsi que pour les deux types de marquage. Cette sparation sest rvle ncessaire: elle permet de lever les problmes dhomognit que nous avions remarqus au sujet des modalits de MF (5.2.2.2). De cette manire, Ap et Dt, fonctions de syntaxe immdiate, seront traits indpendamment des modalits de MF correspondant des fonctions argumentales. Cette sparation des types dincluants diminue limprcision lie la rcursivit sans toutefois la rduire nant. Le seul moyen dy parvenir serait dliminer du traitement toute structure apparaissant plus dun niveau, ce qui nest pas envisageable pour une recherche de tendances gnrales et pourra ventuellement se faire dans des tudes plus cibles.

32 Voir la section o nous exposons comment sont dnis les individus (5.0.2). 33 Voir la section o nous choisissons les variables employes pour dcrire les individus (5.0).

192

0 0,0,C6,0,0 autres 132 8523 8655

1 10 2665 2675 142 11188 11330

0 5.1 -0.06

1 -16.51 0.21 4.13

2 = 20.97, ddl = 1, p = 4.68e 06 ### Aprs ajustement de idk pour 43 comparaisons: ### (seuils: 0.00119, 0.000234, 2.33e-05)

TAB . 5.28 Exemple de dcomposition de la table de contingence MM PPD: 0,0,C6,0,0

5.3.1.3

Dcomposition des carts

Pour apprhender la manire dont les diffrentes modalits de cette nouvelle variable morphosyntaxique et positionnelle attirent ou repoussent la ponctuation, il suft deffectuer un test pour chaque ligne des quatorze tableaux de contingence croisant MM avec PPD et PPF sept modalits de MI et deux variables de ponctuation. Ces tests sont bass sur des tables 2 2, rduisant les modalits de MM celle de la ligne intresse et une valeur nomme autres, reprenant les effectifs de toutes les autres modalits. De cette manire, les constituants 0,0,S1,0,0, par exemple, sont opposs toutes les autres constructions et lon peut faire de mme avec chaque modalit de MM. Lhypothse nulle de chaque test serait que le type de constituant focalis nattire ni ne rejette de manire particulirement signicative la ponctuation (initiale ou nale, en fonction de la variable croise avec MM). Si lon prend comme exemple linteraction des constituants 0,0,C6,0,0 et de PPD au niveau de la phrase, on obtient la table 5.28, qui est une table 2 2. Le tri crois nous invite rejeter lhypothse nulle et admettre que ces constituants rejettent signicativement PPD. Les constructions attestes moins de dix fois (qui mnent obligatoirement des valeurs attendues infrieures 5; 5.2.1.2) nont pas t examines de la sorte, mais leur effectif a toujours t pris en compte dans la ligne autres. Dautre part, nous avons ajout une ligne supplmentaire la suite du tableau, ce qui mrite un commentaire. Le fait de pratiquer ces deux comparaisons de manire indpendante mne en effet au problme des comparaisons multiples, bien connu des statisticiens. Oprer de multiples tests et combiner leur rsultat augmente la probabilit de commettre une erreur de la premire espce en fonction du nombre de tests et du seuil de tolrance retenu.34 Pour pallier ce problme, il est courant de corriger le seuil laide de lajustement nomm ajustement de idk. Cette correction tient compte du nombre de comparaisons effectues.35 Il reste nanmoins intressant de conserver les
34 La formule donnant la probabilit de commettre au moins une fois une erreur de la premire

espce est (cf. Upton/Cook 2006, 286): 1 (1 )c Soit 0.14 avec = 0.05 et seulement trois comparaisons.
35 Le seuil corrig est ainsi:

(5.4)

1 (1 )1/c

(5.5)

Voir par exemple Abdi 2007 pour une prsentation gnrale. Cet ajustement est universel, puisquil est bas sur lingalit de Bonferroni, qui stipule que la probabilit doccurrence

193

FAB 0 1 8655 2675 11330

FRE 76.39 23.61 100


0 1

2000

4000

6000

8000

TAB . 5.29 Tri plat de PPD pour les constituants MI.phrase

probabilits non corriges paralllement aux probabilits corriges. Nous avons ainsi ajout une ligne au tableau du 2 , comportant les seuils de 5%, 1% et 0.1% ajusts laide de la mthode de idk les toiles de cette ligne correspondent aux seuils ajusts: trois toiles noires correspondent une probabilit ajuste de 0.1% ou moins, deux toiles noires 1%, etc. 5.3.2 Examen des tris croiss

Les sept sections qui suivent comprennent lanalyse des quatorze tableaux de contingence correspondant aux sept types de structure incluante (modalits de MI). Chaque analyse comporte deux divisions: une pour la ponctuation initiale, une autre pour la ponctuation nale. 5.3.2.1 Phrase

Au niveau de la phrase, lindividualit des observations est garantie par labsence de rcursivit. Une phrase est toujours directement intgre au texte, et jamais aucune autre structure.36 a. Assimilation des noncs non phrastiques la phrase. Pour cette analyse et pour toutes celles qui suivront, nous avons dcid dassimiler aux phrases les noncs non phrastiques exprimant un procs.37 Ces derniers, dont lanalyse est faite sur le modle de la proposition, sont en effet peu nombreux et partagent leurs frontires avec celles des phrases (3.4.1.2). Il sera relativement ais de rviser nos conceptions ultrieurement, lorsquil sera question dtudier les constructions marques spciques aux noncs non phrastiques (6.1.3.12).
dun ou plusieurs vnements ne peut jamais dpasser la somme de leurs probabilits individuelles (cf. Howell 1998, 409, sic; italiques dans le texte). Cependant, il est considr comme relativement conservateur (cest--dire svre) et il augmente ainsi le risque de commettre lerreur (Upton/Cook 2006, 286) lajustement dit de Bonferroni est encore plus conservateur. Dans un contexte o les tests employs sont tous non paramtriques (voir note 45), la puissance des tests sen voit trs fortement diminue. Il faut cependant noter que les rgles de dcomposition du 2 en comparaisons indpendantes (exposes sous 6.1.1.1 a) ne sont pas respectes ici (les effectifs de chaque ligne sont pris en considration dans plusieurs tables). Dans ce cas, lajustement de idak est plus approximatif (Abdi 2007, 2.4). 36 Dans le cas contraire, il sagit dune proposition subordonne. Aucun cas de discours rapport na t relev. 37 Voir 3.4.5. Voir la liste de ces noncs dans lannexe dep-5.3.2.1.a-notphrase-1. Les noncs non phrastiques nexprimant pas un procs, peu nombreux une fois les noncs latins ignors (parmi lesquels on compte les seings notariaux), sont retirs de lchantillon (voir leur liste dans lannexe dep-5.3.2.1.a-notphrase-2).

194

Attractions (seuil adapt 0.119%) 1,0,C6,0,0 1,0,S1,0,0 1,0,C5,0,1 1,0,C5,0,0 1,0,R2,0,0 1,0,P0,0,0 1,0,R3,0,1 1,0,A4,0,0 1,0,A4,0,1 1,0,C5,pers,1 1,0,A4,pers,1 0,0,C5,pers,0 0,0,Co,0,0 0,1,C5,0,0 0,1,S1,pers,1 0,1,C5,pers,1 0,1,C5,pers,1 1e300 1 780/1002 (78%) 201/245 (82%) 98/112 (88%) 84/95 (88%) 80/107 (75%) 40/43 (93%) 27/27 (100%) 22/23 (96%) 26/33 (79%) 9/10 (90%) 14/21 (67%) 13/22 (59%) 171/605 (28%) 75/242 (31%) 14/49 (29%) 9/30 (30%) 8/30 (27%)

F IG . 5.9 Attractions entre PPD et MM, au niveau phrase


Rpulsions (seuil adapt 0.119%) 0,0,P0,0,0 0,0,C5,0,1 0,0,C5,0,0 0,0,A4,0,1 0,1,R2,pers,0 0,1,A4,0,1 0,1,P0,0,0 0,0,C5,pers,1 0,0,C6,0,0 0,0,R2,pers,0 0,0,A4,pers,1 0,0,R3,0,1 0,1,R2,pers,1 0,0,A4,0,0 0,0,R3,0,0 0,1,S1,0,0 0,1,A4,pers,1 0,1,R3,0,1 0,1,A4,0,0 0,0,R2,0,0 0,0,R2,pers,1 0,1,C5,0,1 0,1,R2,0,0 0,1,A4,pers,1 0,0,C5,pers,1 0,0,S1,0,0 1.23e124 1 103/2253 (4.6%) 55/826 (6.7%) 46/608 (7.6%) 13/273 (4.8%) 4/177 (2.3%) 2/110 (1.8%) 1/95 (1.1%) 7/128 (5.5%) 10/142 (7.0%) 0/70 (0.0%) 0/60 (0.0%) 58/378 (15.3%) 33/243 (13.6%) 1/54 (1.9%) 14/137 (10.2%) 14/127 (11.0%) 0/28 (0.0%) 3/39 (7.7%) 0/18 (0.0%) 149/722 (20.6%) 2/19 (10.5%) 79/366 (21.6%) 60/277 (21.7%) 6/33 (18.2%) 3/18 (16.7%) 331/1404 (23.6%)

F IG . 5.10 Rpulsions entre PPD et MM, au niveau phrase

b. Marquage initial. Les proportions entre les individus marqus linitiale et ceux qui ne le sont pas se rsument la table 5.29. Prs dun quart des individus sont marqus linitiale. On sait par les tris croiss prcdents (5.2.2.1) que cette proportion est signicativement suprieure aux autres. En dcomposant les tableaux de contingence croisant PPD avec les modalits de MM rencontres au niveau dintgration syntaxique correspondant la phrase et attestes au moins dix fois, on obtient une liste de probabilits. Celles-ci sont ensuite classes par ordre croissant en deux graphiques, correspondant respectivement aux attractions et aux rpulsions entre les modalits de MM et la prsence de marquage. Ces graphiques, dont nous allons dtailler les conventions de lecture, prennent la forme donne dans les gures 5.9 et 5.10.38 Les graphiques se lisent comme suit. Laxe des abscisses, construit sur une

38 Le tri crois sur la base duquel ce graphique a t construit peut tre consult en annexe; voir

annexe 5.3.2.table-PPD-phrase. Il en sera de mme pour tous les graphiques de ce chapitre, pour lesquels nous fournissons les tabulations sous un nom explicite.

195

chelle logarithmique,39 correspond la probabilit40 quune modalit de MM attire (premire gure) ou repousse (seconde gure) non signicativement le marquage initial (non-rejet de lhypothse H0 ). Le rapport exact des quantits de constructions marques est report sur laxe vertical de droite. Cette proportion donne une ide de la rgularit du marquage. La couleur du fond du graphique aide identier les paliers de signicativit: le fond blanc correspond un rejet de lhypothse nulle une fois que la correction de idk a t applique un seuil de 5%; le fond gris clair correspond une H0 qui ne serait pas rejete avec cette correction, mais qui le serait dans le cas dun test unique (toujours un seuil de 5%); le fond gris fonc indique que H0 ne peut tre rejete selon aucun de ces critres. Par exemple, la premire ligne gurant en haut du tableau des attractions concerne les constituants de type 1,0,C6,0,0, cest--dire les C6 non relats de nature non propositionnelle situs au dbut de la phrase. La probabilit quil ny ait pas attraction (H0 ) est inme et se trouve largement en-dessous du seuil corrig le plus bas. Pour cette raison, le point correspondant 1,0,C6,0,0 est situ trs haut dans dans la portion blanche du graphique. Les effectifs reports dans la marge de gauche correspondent aux dpouillements et rvlent quune trs large proportion des constituants sont marqus. On peut galement voir que 1,0,S1,0,0 apparat juste en dessous, avec une probabilit suprieure, mais demeurant extrmement signicative. Au fur et mesure que lon descend dans le graphique, la probabilit de H0 augmente, jusqu franchir le seuil critique au-del duquel les points gurent dans la zone grise. Les coordonnants (0,0,Co,0,0) sy trouvent, mais dans la partie la plus claire. Cela signie que si nous navions effectu quun seul test opposant les coordonnants aux autres constituants, le rsultat aurait permis de rejeter lhypothse nulle. Nanmoins, nous avons d effectuer de nombreux 2 et il est plus prudent de ne pas accepter que lattraction entre PPD.1 et 0,0,Co,0,0 est signicative. Quant aux 0,1,C5,pers,1 (propositions de mode personnel relates fonction de circonstant se trouvant en n de phrase), elles apparaissent dans la partie la plus fonce, ce qui veut dire que la probabilit du test est trop leve pour quon juge lattraction signicative. Combiner les tris croiss successifs et les comparer sous la forme de graphique met ainsi clairement en vidence les constituants qui se distinguent des autres, que ce soit du point de vue des attractions ou de celui des rpulsions. Pareilles visualisations rendent simultanment accessibles plusieurs types dinformations: ils nous informent certes sur la signicativit des carts, mais galement sur leur rgularit. Lobservation attentive du dtail des modalits de MM met en lumire des tendances qui les dpassent. On peut parfois observer quil existe un comportement solidaire de diffrents types de constituants, qui partagent une position, une fonction ou une nature similaires. Les graphiques ne sont cependant pas construits pour mettre
39 Il sagit, plus prcisment, dun logarithme dcimal. Le logarithme dcimal dun nombre est

la puissance laquelle il faut lever 10 pour obtenir ce nombre. Soit, par exemple, log10 (100) = 2, log10 (0.10) = 1, etc. (5.6)

Appliqu un axe, ce type dchelle permet de rduire la distance entre les paliers de signicativit: il y a la mme distance entre 0.1 et 0.01 quentre 0.01 et 0.001, puisque les logarithmes de 0.1, 0.01 et 0.001 sont 1, 2 et 3. 40 Nous avons x le plancher des probabilits 1e 300.

196

ce dernier type dinformation en vidence: ces ressemblances ne ressortent qu la lecture attentive de chacun dentre eux. On peut ainsi dcrire les deux graphiques. Examinons pour commencer celui qui symbolise les attractions: ce sont essentiellement les constituants initiaux qui attirent PPD; dans dautres positions (dans le corps ou la nale), les coordonnants et deux formes de C5 attirent le marquage, mais de ces trois types, seules les incidentes (cest--dire 0,0,C5,pers,0) sont marques dans plus de la moit des cas et doivent tre conserves aprs ajustement du seuil ; le marquage initial est extrmement rgulier; le pourcentage de marquage pour chaque constituant attirant le ponctogramme est suprieur 80% dans plus de la moiti des cas (toutes les fonctions sont concernes), ce qui est particulirement le cas pour les constituants initiaux; les constituants marqus sont gnralement simples (non relats et de nature non propositionnelle), mais cela est certainement d au fait que, de manire gnrale, ce sont des constituants simples qui ouvrent la phrase. Voyons ce que le second tableau nous apprend des rpulsions: cet gard, aucun constituant initial ne repousse le ponctogramme initial, mme de manire non signicative: les tendances ngatives rpondent aux tendances positives de manire remarquablement systmatique; les rpulsions ont une rgularit qui dpasse 90% (soit une proportion de constituants marqus infrieure 10%) pour la majorit des constituants concerns, ce qui implique toutes les fonctions; tant donn sa place centrale dans la construction de la phrase, le prdicat requiert toute notre attention: on voit ici quil manifeste le rejet le plus important par rapport PPD; il y a une trs grande diversit dans les types de constituants qui repoussent le marquage. Il ressort essentiellement un contraste entre les constituants initiaux, qui attirent le marquage, et ceux qui ne le sont pas, qui le repoussent. Ces observations mettent en vidence un emploi trs rgulier de la ponctuation pour dlimiter les bornes de la phrase: sans tudier PPF, nous savons dj que le marquage sera trs rgulier la nale, puisque les phrases senchanent les unes aux autres. On ne peut par contre pas savancer en ce qui concerne les fonctions particulires qui feraient exception cette tendance. tant donn son importance, le marquage du premier constituant de la phrase reprsente trs certainement la plus grande partie de lcart lindpendance. De ce fait, il est possible que les autres attractions soient compltement occultes par un contraste dune telle ampleur. Il est donc intressant de refaire lensemble des tris croiss, mais en retirant les constituants initiaux de lchantillon. Nous construisons ainsi les graphiques 5.11 et 5.12. Nous ne commenterons pas les rpulsions, sinon pour constater que leur nombre a logiquement diminu. Les attractions mises en lumire par cette nouvelle srie de tests sont bien entendu les coordonnants et les circonstants qui se distinguaient dj dans le graphique 5.9, mais galement:

197

Attractions (seuil adapt 0.160%) 0,0,S1,0,0 0,0,Co,0,0 0,1,C5,0,0 0,0,C5,pers,0 0,0,R2,0,0 0,1,C5,0,1 0,1,R2,0,0 0,1,S1,pers,1 0,1,C5,pers,1 0,1,C5,pers,1 0,0,R3,0,1 0,1,A4,pers,1 0,0,C5,pers,1 0,1,R2,pers,1 1.29e33 1 331/1404 (24%) 171/605 (28%) 75/242 (31%) 13/22 (59%) 149/722 (21%) 79/366 (22%) 60/277 (22%) 14/49 (29%) 9/30 (30%) 8/30 (27%) 58/378 (15%) 6/33 (18%) 3/18 (17%) 33/243 (14%)

F IG . 5.11 Attractions signicatives entre PPD et MM, au niveau phrase (sans les constituants initiaux)
Rpulsions (seuil adapt 0.160%) 0,0,P0,0,0 0,0,C5,0,1 0,0,C5,0,0 0,1,R2,pers,0 0,0,A4,0,1 0,1,A4,0,1 0,1,P0,0,0 0,0,R2,pers,0 0,0,A4,pers,1 0,0,C5,pers,1 0,0,A4,0,0 0,0,C6,0,0 0,1,A4,pers,1 0,1,A4,0,0 0,0,R3,0,0 0,1,R3,0,1 0,1,S1,0,0 0,0,R2,pers,1 1.20e44 1 103/2253 (4.6%) 55/826 (6.7%) 46/608 (7.6%) 4/177 (2.3%) 13/273 (4.8%) 2/110 (1.8%) 1/95 (1.1%) 0/70 (0.0%) 0/60 (0.0%) 7/128 (5.5%) 1/54 (1.9%) 10/142 (7.0%) 0/28 (0.0%) 0/18 (0.0%) 14/137 (10.2%) 3/39 (7.7%) 14/127 (11.0%) 2/19 (10.5%)

F IG . 5.12 Rpulsions signicatives entre PPD et MM, au niveau phrase (sans les constituants initiaux)
FAB 0 1 8648 2707 11355 FRE 76.16 23.84 100
0 1

2000

4000

6000

8000

TAB . 5.30 Tri plat de PPF pour les constituants MI.phrase

les sujets 0,0,S1,0,0, ainsi que les rgimes 0,0,R2,0,0 et 0,1,R2,0,0; les 0,1,S1,pers,1 (quoique de manire non signicative aprs correction du seuil); une grande varit de circonstants relats en position nale: 0,1,C5,0,0, 0,1,C5,pers,1 et 0,1,C5,pers,1. c. Marquage nal. Comme on sy attendait, la proportion de structures marques la nale est trs proche de la proportion observe pour le marquage initial (table 5.30). nouveau, du fait que la modalit de MI est MI.phrase, aucun problme de rcursivit ne se pose. Les graphiques synthtisant les attractions et rpulsions sont aussi riches que ceux que nous avons analyss pour PPD, auxquels ils rpondent assez bien. Pour ce qui est des attractions (gure 5.13):

198

Attractions (seuil adapt 0.119%) 0,1,C5,0,1 0,1,R2,0,0 0,1,R2,pers,1 0,1,R2,pers,0 0,1,C5,0,0 0,1,S1,0,0 1,0,R3,0,1 0,1,A4,0,1 0,0,C5,pers,1 0,1,A4,pers,1 0,1,C5,pers,1 0,1,R3,0,1 0,1,A4,pers,1 0,1,C5,pers,1 0,1,S1,pers,1 0,1,P0,0,0 0,0,C5,pers,0 0,0,R3,0,1 0,1,A4,0,0 0,0,C5,0,1 0,0,R2,pers,1 1,0,C5,pers,1 0,0,C5,pers,1 0,0,R2,pers,0 6.43e138 1 275/340 (81%) 212/276 (77%) 192/243 (79%) 147/177 (83%) 150/193 (78%) 110/127 (87%) 96/133 (72%) 81/109 (74%) 80/128 (62%) 32/33 (97%) 28/29 (97%) 30/37 (81%) 25/28 (89%) 26/30 (87%) 33/49 (67%) 36/58 (62%) 17/22 (77%) 131/378 (35%) 10/18 (56%) 225/826 (27%) 9/19 (47%) 5/10 (50%) 7/18 (39%) 17/70 (24%)

F IG . 5.13 Attractions entre PPF et MM, au niveau phrase


Rpulsions (seuil adapt 0.119%) 0,0,P0,0,0 1,0,C6,0,0 0,0,Co,0,0 1,0,S1,0,0 0,0,C6,0,0 0,0,S1,0,0 1,0,R2,0,0 0,0,A4,0,1 1,0,P0,0,0 1,0,C5,0,0 1,0,A4,0,1 0,0,R3,0,0 0,0,A4,pers,1 0,0,C5,0,0 0,0,R2,0,0 0,0,A4,0,0 1,0,A4,pers,1 1,0,C5,0,1 1,0,A4,0,0 3.24e155 1 56/2253 (2.5%) 5/1002 (0.5%) 13/605 (2.1%) 17/279 (6.1%) 0/142 (0.0%) 257/1404 (18.3%) 4/107 (3.7%) 38/273 (13.9%) 0/44 (0.0%) 8/95 (8.4%) 0/34 (0.0%) 17/137 (12.4%) 4/60 (6.7%) 116/608 (19.1%) 150/722 (20.8%) 7/54 (13.0%) 2/21 (9.5%) 21/112 (18.8%) 5/23 (21.7%)

F IG . 5.14 Rpulsions entre PPF et MM, au niveau phrase

elles restent trs rgulires, mais sont apparemment moins franches que pour PPD.1 (pourcentages moins levs); elles paraissent spciques de la position nale; les constituants attirant PPF.1 sans vrier LIF.1 sont les C5 qui prennent la forme dune proposition personnelle ou sont relats et les R3 non propositionnels relats; si lon ajoute cet inventaire les constituants ne passant pas le seuil corrig, on retrouve galement les R2 propositionnels (mode personnel) et les C5 non propositionnels non naux, mais relats. Les rpulsions principales (gure 5.14) nous disent que: le marquage nal nest jamais repouss par les constituants qui occupent la dernire position de la structure dont ils sont constituants immdiats; la rpulsion du marquage nal semble caractristique des constituants non relats de nature non propositionnelle. Seuls les constituants de fonction A4 paraissent

199

Attractions (seuil adapt 0.183%) 1,0,R3,0,1 0,0,C5,pers,1 0,0,R3,0,1 0,0,C5,0,1 0,0,C5,pers,0 0,0,R2,0,0 0,0,S1,0,0 0,0,C5,0,0 0,0,R2,pers,1 1,0,C5,pers,1 0,0,C5,pers,1 0,0,R2,pers,0 1,0,C5,0,1 1,0,A4,0,0 0,0,A4,0,1 5.86e86 1 96/133 (72%) 80/128 (62%) 131/378 (35%) 225/826 (27%) 17/22 (77%) 150/722 (21%) 257/1404 (18%) 116/608 (19%) 9/19 (47%) 5/10 (50%) 7/18 (39%) 17/70 (24%) 21/112 (19%) 5/23 (22%) 38/273 (14%)

F IG . 5.15 Attractions signicatives entre PPF et MM, au niveau phrase (sans les constituants naux)
Rpulsions (seuil adapt 0.183%) 0,0,P0,0,0 1,0,C6,0,0 0,0,Co,0,0 0,0,C6,0,0 1,0,S1,0,0 1,0,R2,0,0 1,0,P0,0,0 1,0,A4,0,1 0,0,A4,pers,1 1,0,C5,0,0 0,0,R3,0,0 1,0,A4,pers,1 0,0,A4,0,0 1.32e69 1 56/2253 (2.5%) 5/1002 (0.5%) 13/605 (2.1%) 0/142 (0.0%) 17/279 (6.1%) 4/107 (3.7%) 0/44 (0.0%) 0/34 (0.0%) 4/60 (6.7%) 8/95 (8.4%) 17/137 (12.4%) 2/21 (9.5%) 7/54 (13.0%)

F IG . 5.16 Rpulsions signicatives entre PPF et MM, au niveau phrase (sans les constituants naux)

en effet incompatibles avec le marquage dans dautres conditions, mais jamais de manire catgoriquement signicative; P0 repousse galement ce marquage. Ces faits ne contredisent pas ceux qui caractrisaient le marquage initial ci-dessus (5.3.2.1 b): il y a bien une propension employer les signes aux limites de la phrase. La diffrence fondamentale entre labsence de ponctuation des constituants simples (MN.0 et MR.0) et la ponctuation des constituants complexes est manifeste. Nanmoins, ces dernires observations ne rsistent pas un nouveau test ignorant les constituants naux. La force de lattraction entre PPF.1 et les constituants en n de phrase est telle quelle occulte dautres liens, tout comme lattraction entre la ponctuation initiale et le dbut de la phrase cachait dautres tendances (gures 5.15 et 5.16). Les nouveaux tests font ressortir lensemble des constituants non naux qui se distinguaient dj en premire analyse, mais galement: 0,0,S1,0,0 et 0,0,R2,0,0; ainsi quun ensemble de constructions ne dpassant pas le seuil corrig: 0,0,R2,pers,0 et les circonstants 1,0,C5,pers,1 et 0,0,C5,pers,1.

200

FAB 0 1 4714 629 5343

FRE 88.23 11.77 100


0 1

1000

2000

3000

4000

TAB . 5.31 Tri plat de PPD pour les constituants MI.pers-arg


Attractions (seuil adapt 0.171%) 0,0,Co,0,0 1,0,C6,0,0 0,0,Rl,0,0 1,0,Rl,0,0 1,0,S1,0,0 0,0,C5,pers,0 1,0,A4,pers,1 0,1,C5,0,1 0,1,C5,0,0 1,0,R2,0,0 0,1,R2,pers,1 4.18e40 1 127/387 (33%) 9/10 (90%) 12/33 (36%) 111/701 (16%) 6/13 (46%) 5/15 (33%) 4/12 (33%) 31/190 (16%) 12/73 (16%) 3/13 (23%) 7/49 (14%)

F IG . 5.17 Attractions entre PPD et MM, au niveau pers-arg

5.3.2.2

Propositions personnelles de fonction argumentale

Les spcicits du marquage de la phrase dgages, abordons celles des structures infrieures, en commenant par celles qui lui ressemblent le plus. Les constituants immdiats des structures de nature propositionnelle (mode personnel) de fonction argumentale sont beaucoup moins nombreux que les constituants immdiats de la phrase, ce qui se traduit par un nombre plus important de types de constituants peu reprsents (effectif < 10). Abordons, comme nous venons de le faire au niveau de la phrase, la ponctuation initiale, puis la ponctuation nale. Il faut noter qu partir de ce dpouillement, la rcursivit des structures introduit le problme mthodologique que nous avons prsent supra (5.1.3 a). ce stade, nous ne le traiterons pas. Nous y reviendrons au chapitre suivant, lorsquil sera question dtudier ces constituants particuliers (notamment 6.1.1). a. Marquage initial. La proportion de marquage est plus faible quau niveau de la phrase (table 5.31). Cela correspond, comme on la vu, un cart positif signicatif par rapport aux tendances dgages dans les tris croiss (5.2.2.3). La faible frquence de PPD.1 laisse entendre que le phnomne de marquage doit tre trs prgnant. Les attractions (gure 5.17) nous apprennent que: bien que les effectifs soient faibles, il reste particulirement clair que la position initiale est particulirement lie au marquage, les relateurs se trouvant gnralement linitiale des structures dont ils sont un constituant immdiat; la rgularit dattraction est beaucoup moins nette quau niveau de la phrase (il ny a gure que le peu frquent 1,0,C6,0,0 qui attire la ponctuation plus de 90%); les constituants qui attirent le plus le marquage sont les relateurs, les coordonnants et les C6 (cest--dire lensemble des mots capables de mettre en relation les propositions entre elles); en tenant compte des constituants rejets aprs correction, les incidentes sont galement lies au marquage initial.

201

Rpulsions (seuil adapt 0.171%) 0,0,P0,0,0 0,0,A4,0,1 0,1,P0,0,0 0,1,R2,0,0 0,1,A4,0,1 0,0,R2,0,0 0,0,A4,0,0 0,0,R2,pers,0 0,1,R2,pers,0 0,0,S1,0,0 0,0,R3,0,1 0,0,R3,0,0 0,0,C5,pers,1 0,1,A4,0,0 0,0,C5,0,0 0,0,A4,pers,1 0,0,C5,0,1 0,1,R3,0,1 0,1,S1,0,0 4.5e08 1 65/980 (6.6%) 4/261 (1.5%) 0/92 (0.0%) 6/127 (4.7%) 3/77 (3.9%) 19/249 (7.6%) 0/37 (0.0%) 0/37 (0.0%) 1/49 (2.0%) 82/830 (9.9%) 2/57 (3.5%) 2/46 (4.3%) 1/27 (3.7%) 0/12 (0.0%) 45/429 (10.5%) 0/11 (0.0%) 40/372 (10.8%) 3/26 (11.5%) 4/38 (10.5%)

F IG . 5.18 Rpulsions entre PPD et MM, au niveau pers-arg


Attractions (seuil adapt 0.205%) 0,0,Co,0,0 0,0,Rl,0,0 0,1,C5,0,1 0,0,C5,pers,0 0,1,C5,0,0 0,1,R2,pers,1 0,1,R3,0,1 0,0,C5,0,1 2.36e49 1 127/387 (33%) 12/33 (36%) 31/190 (16%) 5/15 (33%) 12/73 (16%) 7/49 (14%) 3/26 (12%) 40/372 (11%)

F IG . 5.19 Attractions signicatives entre PPD et MM, au niveau persarg (sans les constituants initiaux)
FAB 0 1 4281 1062 5343 FRE 80.12 19.88 100
0 1

1000

2000

3000

4000

TAB . 5.32 Tri plat de PPF pour les constituants MI.pers-arg

En ce qui concerne les rpulsions (gure 5.18): aucun constituant initial ne parat incompatible avec le marquage initial; par ailleurs, alors que les attractions du marquage initial sont trs faibles au mme niveau, les rpulsions sont quant elles extrmement fortes et leur rgularit dpasse systmatiquement les 90%; la position de P0 (rpulsion) parat aussi forte quau niveau de la phrase. La ressemblance de ces tendances avec celles qui caractrisaient la phrase est frappante. Ainsi, linstar de la phrase, la proposition de mode personnel et de fonction argumentale attire particulirement PPD.1 devant son premier constituant. Il est donc utile de procder une nouvelle analyse, liminant de lchantillon tous les individus dont la modalit de la variable LID est 1 (gures 5.19 et 5.20). Ces nouveaux graphiques ne changent pas les attractions de manire aussi spectaculaire que ctait le cas au niveau de la phrase. On voit simplement que les 0,1,C5,0,1 sont particulirement marqus, mais ne passent pas le seuil corrig. La relative pauvret des rsultats est certainement lie la faiblesse des effectifs.

202

Rpulsions (seuil adapt 0.205%)

0,0,A4,0,1 0,0,P0,0,0 0,1,P0,0,0 0,1,R2,0,0 0,0,A4,0,0 0,0,R2,pers,0 0,1,A4,0,1 0,1,R2,pers,0 0,0,R3,0,1 0,0,R2,0,0 0,0,R3,0,0 0,0,C5,pers,1 0,1,A4,0,0 0,0,S1,0,0 0,0,A4,pers,1 0,1,S1,0,0 0,0,C5,0,0

4/261 (1.5%) 65/980 (6.6%) 0/92 (0.0%) 6/127 (4.7%) 0/37 (0.0%) 0/37 (0.0%) 3/77 (3.9%) 1/49 (2.0%) 2/57 (3.5%) 19/249 (7.6%) 2/46 (4.3%) 1/27 (3.7%) 0/12 (0.0%) 82/830 (9.9%) 0/11 (0.0%) 4/38 (10.5%) 45/429 (10.5%)

1.64e06

F IG . 5.20 Rpulsions signicatives entre PPD et MM, au niveau persarg (sans les constituants initiaux)

Attractions (seuil adapt 0.171%)

0,1,C5,0,1 0,1,R2,0,0 0,1,C5,0,0 0,1,A4,0,1 0,1,R2,pers,0 0,1,R2,pers,1 0,1,P0,0,0 0,0,C5,0,1 0,1,R3,0,1 0,1,S1,0,0 0,1,A4,0,0 0,0,C5,pers,1 0,0,C5,pers,0 0,0,R2,pers,0 0,0,R3,0,1

151/190 (79%) 90/127 (71%) 55/73 (75%) 54/77 (70%) 40/49 (82%) 37/49 (76%) 55/92 (60%) 140/372 (38%) 20/26 (77%) 24/38 (63%) 11/12 (92%) 18/27 (67%) 11/15 (73%) 8/37 (22%) 12/57 (21%)

1.03e96

F IG . 5.21 Attractions entre PPF et MM, au niveau pers-arg

Rpulsions (seuil adapt 0.171%)

1,0,Rl,0,0 0,0,P0,0,0 0,0,Co,0,0 0,0,S1,0,0 0,0,C5,0,0 0,0,R3,0,0 0,0,Rl,0,0 0,0,A4,0,0 1,0,A4,pers,1 1,0,C6,0,0 0,0,R2,0,0 0,0,A4,0,1 1,0,R2,0,0 1,0,S1,0,0 0,0,A4,pers,1

1/701 (0.14%) 50/980 (5.10%) 0/387 (0.00%) 91/830 (10.96%) 50/429 (11.66%) 1/46 (2.17%) 0/33 (0.00%) 2/37 (5.41%) 0/12 (0.00%) 0/10 (0.00%) 42/249 (16.87%) 45/261 (17.24%) 1/13 (7.69%) 1/13 (7.69%) 2/11 (18.18%)

1.66e44

F IG . 5.22 Rpulsions entre PPF et MM, au niveau pers-arg

203

Attractions (seuil adapt 0.256%) 0,0,C5,0,1 0,0,C5,pers,1 0,0,C5,pers,0 0,0,A4,0,1 0,0,R2,0,0 0,0,R3,0,1 0,0,R2,pers,0 0,0,C5,0,0 0,0,A4,pers,1 0,0,S1,0,0 5.86e68 1 140/372 (38%) 18/27 (67%) 11/15 (73%) 45/261 (17%) 42/249 (17%) 12/57 (21%) 8/37 (22%) 50/429 (12%) 2/11 (18%) 91/830 (11%)

F IG . 5.23 Attractions signicatives entre PPF et MM, au niveau persarg (sans les constituants naux)

b. Marquage nal. La proportion de constituants marqus est galement plus rduite quau niveau de la phrase (table 5.32), o les liens entre MM et PPF prennent la forme des gures 5.21 et 5.22. Cela nous permet de remarquer que: le marquage est largement plus prsent la nale des constructions; bien quapparemment plus faibles quelles ne ltaient au niveau de la phrase, les attractions du marquage initial sont ici nettement plus rgulires; en outre, seuls quelques types de constituants attirent PPF.1 sans tre la nale. Ceux dont la frquence est sufsante sont de fonction C5: 0,0,C5,pers,0 (incidentes), 0,0,C5,pers,1 et 0,0,C5,0,1, cest--dire les circonstants complexes. Quant aux rpulsions: nouveau, PPF.1 nest repouss par aucun constituant nal, relat, ou de nature propositionnelle; outre le rejet systmatique de PPF.1 par P0, on voit que les constituants relateurs et coordonnants sont quasi totalement incompatibles avec un ponctogramme leur suite, ce qui correspond ce quon pouvait dj remarquer pour les constituants MI.phrase (rejet de PPF.1 par les C6 et les Co). Il saute aux yeux que les tendances dtectes pour les propositions personnelles de fonction argumentale ne diffrent que faiblement de celles quon a pu dgager au niveau de la phrase: ce sont les limites de gauche et de droite qui attirent le plus la ponctuation (de ce fait, les relateurs sont particulirement marqus linitiale), et certains C5 se dtachent distinctement du reste des constituants. ce stade, on est dj en droit de se demander si la diffrence de frquence de marquage des limites de la phrase et de la proposition personnelle de fonction argumentale est signicativement diffrente. En comparaison avec le marquage initial, les frquences absolues et relatives de marquage nal sont beaucoup plus leves. Nous nous attendons ce que le retrait des constituants naux de lchantillon produise des changements consquents dans les nouveaux graphiques (gures 5.23 et 5.24). Une srie dactants particulirement marqus la nale se dtachent: les 0,0,R2,0,0 et les 0,0,R3,0,1, qui attiraient dj PPF.1 au niveau de la phrase; mais galement les 0,0,A4,0,1.

204

Rpulsions (seuil adapt 0.256%) 1,0,Rl,0,0 0,0,Co,0,0 0,0,P0,0,0 0,0,Rl,0,0 0,0,R3,0,0 0,0,A4,0,0 1,0,A4,pers,1 1,0,C6,0,0 1,0,R2,0,0 1,0,S1,0,0 1.45e22 1 1/701 (0.14%) 0/387 (0.00%) 50/980 (5.10%) 0/33 (0.00%) 1/46 (2.17%) 2/37 (5.41%) 0/12 (0.00%) 0/10 (0.00%) 1/13 (7.69%) 1/13 (7.69%)

F IG . 5.24 Rpulsions signicatives entre PPF et MM, au niveau persarg (sans les constituants naux)
FAB 0 1 2198 187 2385 FRE 92.16 7.84 100
0 1

500

1000

1500

2000

TAB . 5.33 Tri plat de PPD pour les constituants MI.pers-arg


Attractions (seuil adapt 0.244%) 0,0,Co,0,0 0,1,R2,pers,1 0,1,C5,0,0 1,0,Rl,0,0 0,1,C5,0,1 0,0,R2,0,0 0,1,R3,0,1 0,0,C5,0,0 1.14e16 1 39/152 (25.7%) 8/15 (53.3%) 14/57 (24.6%) 36/270 (13.3%) 17/140 (12.1%) 20/189 (10.6%) 3/20 (15.0%) 6/76 (7.9%)

F IG . 5.25 Attractions entre PPD et MM, au niveau pers-arg

5.3.2.3

Propositions non personnelles de fonction argumentale

Le nombre de constituants est encore moindre ce niveau.41 Nous navons que peu de matriaux pour travailler. a. Marquage initial. La ponctuation initiale est ici trs rare (table 5.33). En consquence, on sattend ce que les attractions nous apprennent relativement peu de choses (peu de constituants ont un comportement sufsamment marqu pour tre distinctif), comme on le voit sur les gures 5.25 et 5.26.42 On peut tout de mme faire quelques observations, rendues possibles par les effectifs: il y a tout dabord une dissemblance notable avec ce qui prcde, puisque la position initiale ne ressort pas; par contre, lattraction du marquage par les constituants Co et Rl reste pertinente (quoique les proportions en rvlent laspect non systmatique); ces donnes sont peu diffrencies de ce que nous avons pu voir ci-dessus. Les quelques tendances ngatives ne concordent pas toujours avec celles que lon avait pu observer pour les autres constructions dj tudies:
41 Il est probable que cela est en partie d la manire dont nous avons trait les C5, que nous

avons remonts au niveau syntaxique le plus lev possible (3.4.7.4).


42 Voir les annexes pour les tableaux.

205

Rpulsions (seuil adapt 0.244%) 0,1,P0,0,0 0,0,P0,0,0 1,0,P0,0,0 0,1,R2,0,0 0,1,A4,0,1 0,0,R3,0,1 0,0,Rl,0,0 0,0,A4,0,1 1,0,R3,0,0 0,0,A4,0,0 0,0,R3,0,0 1,0,R2,0,0 0,0,C5,0,1 3.92e06 1 0/238 (0.00%) 2/280 (0.71%) 4/282 (1.42%) 8/164 (4.88%) 1/48 (2.08%) 1/35 (2.86%) 0/17 (0.00%) 1/33 (3.03%) 0/14 (0.00%) 0/11 (0.00%) 0/11 (0.00%) 8/122 (6.56%) 9/119 (7.56%)

F IG . 5.26 Rpulsions entre PPD et MM, au niveau pers-arg


Attractions (seuil adapt 0.301%) 0,0,Co,0,0 0,1,R2,pers,1 0,1,C5,0,0 0,1,C5,0,1 0,0,R2,0,0 0,1,R3,0,1 4.47e16 1 39/152 (26%) 8/15 (53%) 14/57 (25%) 17/140 (12%) 20/189 (11%) 3/20 (15%)

F IG . 5.27 Attractions signicatives entre PPD et MM, au niveau persarg (sans les constituants initiaux)
Rpulsions (seuil adapt 0.301%) 0,0,P0,0,0 0,1,P0,0,0 0,1,R2,0,0 0,1,A4,0,1 0,0,R3,0,1 0,0,Rl,0,0 0,0,A4,0,1 0,0,A4,0,0 0,0,R3,0,0 0,0,C5,0,0 0,0,C5,0,1 1.13e06 1 2/280 (0.71%) 0/238 (0.00%) 8/164 (4.88%) 1/48 (2.08%) 1/35 (2.86%) 0/17 (0.00%) 1/33 (3.03%) 0/11 (0.00%) 0/11 (0.00%) 6/76 (7.89%) 9/119 (7.56%)

F IG . 5.28 Rpulsions signicatives entre PPD et MM, au niveau persarg (sans les constituants initiaux)

il est vrai que P0 rejette presque toujours le marquage, avec une rgularit trs forte; nanmoins, ce rejet a lieu dans toutes les positions alors que dans les tableaux prcdents, il ny avait jamais de rpulsion entre PPD et la position initiale, mme non signicative. Cela est cohrent avec le fait que lattraction ntait pas particulirement importante linitiale. Comme on pouvait sy attendre, le fait de retirer les constituants initiaux de lchantillon ne change rien aux attractions (gures 5.27 et 5.28). Les coordonnants, les 0,1,R2,pers,1 et les 0,1,C5,0,0 restent les seuls tre lis au marquage. b. Marquage nal. Contrairement au marquage initial, le marquage nal reste bien prsent (table 5.34). Ce quil met en vidence est proche de ce qui a t dit plus haut. Les attractions (gure 5.29) montrent que: cest le critre positionnel qui demeure dominant: les constituants en position nale attirent le ponctogramme;

206

FAB 0 1 1861 523 2384

FRE 78.06 21.94 100


0 1

500

1000

1500

TAB . 5.34 Tri plat de PPF pour les constituants MI.pers-arg


Attractions (seuil adapt 0.244%) 0,1,C5,0,1 0,1,R2,0,0 0,1,C5,0,0 0,1,A4,0,1 0,1,R2,pers,1 0,1,R3,0,1 0,0,C5,0,1 0,1,P0,0,0 0,0,R3,0,1 2.09e54 1 105/140 (75%) 114/164 (70%) 49/57 (86%) 28/48 (58%) 12/15 (80%) 13/20 (65%) 27/119 (23%) 53/237 (22%) 8/35 (23%)

F IG . 5.29 Attractions entre PPF et MM, au niveau pers-arg


Rpulsions (seuil adapt 0.244%) 1,0,Rl,0,0 1,0,P0,0,0 0,0,P0,0,0 0,0,Co,0,0 1,0,R2,0,0 0,0,R2,0,0 0,0,Rl,0,0 1,0,R3,0,0 0,0,A4,0,0 0,0,R3,0,0 0,0,A4,0,1 0,0,C5,0,0 4.63e20 1 0/270 (0.0%) 6/282 (2.1%) 18/280 (6.4%) 6/152 (3.9%) 4/122 (3.3%) 26/189 (13.8%) 0/17 (0.0%) 0/14 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 6/33 (18.2%) 16/76 (21.1%)

F IG . 5.30 Rpulsions entre PPF et MM, au niveau pers-arg

le marquage est plus rgulier que pour PPD. Les rpulsions (gure 5.30) restent peu surprenantes: aucun constituant nal ne rejette PPF.1; les fonctions P0, Co et Rl sont presque systmatiquement PPF.0. Le marquage nal a un comportement qui reste assez proche de ce quon a remarqu pour les autres types de propositions. Lobservation combine du marquage initial et du marquage nal nous fait dire que les propositions non personnelles (prdicat au mode innitif ou participe) ne sont pas dlimites de la mme manire que les propositions dont le prdicat est un mode personnel. Dun autre ct, il est prsent clair que le prdicat rejette fortement toute forme de marquage nous verrons ci-dessous si cette tendance est conrme dans le cadre de propositions de fonction immdiate. Les tests sur lchantillon limit aux constituants non naux laissent se dmarquer une partie des mmes constituants que ceux relevs aux niveaux MI.phrase et MI.persarg (gures 5.31 et 5.32). Nous pouvons observer que: les circonstants propositionnels sont trop peu attests pour tre valus, mais les autres 0,0,C5,0,1 et 0,0,C5,0,0 sont particulirement marqus;

207

Attractions (seuil adapt 0.366%) 0,0,C5,0,1 0,0,C5,0,0 0,0,R2,0,0 0,0,R3,0,1 0,0,A4,0,1 1.98e10 1 27/119 (23%) 16/76 (21%) 26/189 (14%) 8/35 (23%) 6/33 (18%)

F IG . 5.31 Attractions signicatives entre PPF et MM, au niveau persarg (sans les constituants naux)
Rpulsions (seuil adapt 0.366%) 1,0,Rl,0,0 1,0,P0,0,0 1,0,R2,0,0 0,0,Co,0,0 0,0,Rl,0,0 0,0,P0,0,0 1,0,R3,0,0 0,0,A4,0,0 0,0,R3,0,0 6.31e07 1 0/270 (0.0%) 6/282 (2.1%) 4/122 (3.3%) 6/152 (3.9%) 0/17 (0.0%) 18/280 (6.4%) 0/14 (0.0%) 0/11 (0.0%) 0/11 (0.0%)

F IG . 5.32 Rpulsions signicatives entre PPF et MM, au niveau persarg (sans les constituants naux)
FAB 0 1 27866 3430 31296 FRE 89.04 10.96 100
0 1

5000

10000

15000

20000

25000

TAB . 5.35 Tri plat de PPD pour les constituants MI.synt-arg

les actants 0,0,R2,0,0 et 0,0,R3,0,1 sont nouveau dans le groupe des attractions signicatives; les 0,0,A4,0,1 attirent galement le marquage, mais de manire moins nette.

5.3.2.4

Arguments non propositionnels

Le modle ne posant que deux fonctions en syntaxe immdiate, on sattend ce que les listes soient plus courtes. Il est galement prvoir que soient mises en vidence des tendances de nature diffrente par rapport celles examines dans des contextes propositionnels. a. Marquage initial. Le tri plat est prsent dans la table 5.35. En consquence du petit nombre de modalits ce niveau dintgration, il y a effectivement peu de varit dans lattraction du marquage initial, ainsi que le montre la gure 5.33. Les faits les plus distinctifs au point de vue des attractions sont: les constituants attirant PPD.1 ne sont gnralement pas relats; de trs nombreux constituants qui ne se trouvent pas linitiale semblent attirer le marquage; cela va lencontre de ce que nous avions remarqu au sujet de la position des signes et de leur capacit dlimiter les constituants (5.2.3.1); aucun type de constituant nal nattire le marquage; les coordonnants sont nouveau mis en vidence.

208

Attractions (seuil adapt 0.256%) 1,0,Ap,0,0 0,0,Co,0,0 1,0,Ap,pers,0 0,0,Dt,0,0 0,0,Ap,0,0 1,0,Ap,0,1 1,0,Rl,0,0 1,1,Ap,0,0 2.15e104 1 981/4953 (20%) 311/1217 (26%) 39/56 (70%) 27/113 (24%) 1120/9286 (12%) 6/24 (25%) 539/4690 (11%) 4/34 (12%)

F IG . 5.33 Attractions entre PPD et MM, au niveau synt-arg


Rpulsions (seuil adapt 0.256%) 0,1,Ap,0,0 0,1,Dt,0,1 0,1,Ap,pers,0 0,1,Ap,pers,1 0,1,Ap,0,1 0,0,Ap,pers,0 0,0,Dt,0,1 0,1,Dt,0,0 0,0,Ap,pers,1 0,0,Rl,0,0 0,1,Dt,pers,1 1,0,Dt,0,0 8.2e72 1 231/5568 (4.15%) 31/1900 (1.63%) 4/723 (0.55%) 74/1254 (5.90%) 0/149 (0.00%) 0/130 (0.00%) 39/632 (6.17%) 5/202 (2.48%) 5/120 (4.17%) 4/79 (5.06%) 5/88 (5.68%) 1/25 (4.00%)

F IG . 5.34 Rpulsions entre PPD et MM, au niveau synt-arg


Attractions (seuil adapt 0.366%) 0,0,Co,0,0 0,0,Ap,0,0 0,0,Dt,0,0 5.22e103 1 311/1217 (26%) 1120/9286 (12%) 27/113 (24%)

F IG . 5.35 Attractions signicatives entre PPD et MM, au niveau syntarg (sans les constituants initiaux)
Rpulsions (seuil adapt 0.366%) 0,1,Ap,0,0 0,1,Dt,0,1 0,1,Ap,pers,0 0,1,Ap,0,1 0,1,Ap,pers,1 0,0,Ap,pers,0 0,1,Dt,0,0 0,0,Dt,0,1 0,0,Ap,pers,1 0,0,Rl,0,0 0,1,Dt,pers,1 1.27e43 1 231/5568 (4.15%) 31/1900 (1.63%) 4/723 (0.55%) 0/149 (0.00%) 74/1254 (5.90%) 0/130 (0.00%) 5/202 (2.48%) 39/632 (6.17%) 5/120 (4.17%) 4/79 (5.06%) 5/88 (5.68%)

F IG . 5.36 Rpulsions signicatives entre PPD et MM, au niveau syntarg (sans les constituants initiaux)

En ce qui concerne les rpulsions (gure 5.34): le rejet de PPD.1 est nouveau trs important, en particulier pour les constituants propositionnels (mode non personnel); on observe en outre que les constituants en position nale sont particulirement peu marqus. Comme on peut le remarquer dans le graphiques 5.35 et 5.36, aucun autre contraste ne ressort une fois que les constituants initiaux sont retirs de lchantillon, ce qui

209

FAB 0 1 25749 5594 31343

FRE 82.15 17.85 100


0 1

5000

10000

15000

20000

25000

TAB . 5.36 Tri plat de PPF pour les constituants MI.synt-arg


Attractions (seuil adapt 0.256%) 0,1,Ap,pers,1 0,1,Dt,0,1 0,1,Ap,0,0 0,1,Dt,0,0 0,0,Dt,0,1 0,1,Ap,0,1 0,1,Dt,pers,1 1,1,Ap,0,0 0,1,Ap,pers,0 0,0,Dt,0,0 0,0,Ap,pers,1 1e300 1 765/1252 (61%) 818/1832 (45%) 1717/5558 (31%) 100/201 (50%) 206/632 (33%) 69/146 (47%) 47/88 (53%) 24/34 (71%) 182/713 (26%) 42/113 (37%) 43/120 (36%)

F IG . 5.37 Attractions entre PPF et MM, au niveau synt-arg


Rpulsions (seuil adapt 0.256%) 1,0,Rl,0,0 1,0,Ap,0,0 0,0,Ap,0,0 0,0,Co,0,0 0,0,Rl,0,0 1,0,Ap,pers,0 0,0,Ap,pers,0 1,0,Dt,0,0 1,0,Ap,0,1 9e238 1 52/4797 (1.1%) 312/4987 (6.3%) 1151/9286 (12.4%) 28/1217 (2.3%) 1/79 (1.3%) 0/56 (0.0%) 13/130 (10.0%) 1/25 (4.0%) 1/24 (4.2%)

F IG . 5.38 Rpulsions entre PPF et MM, au niveau synt-arg

conrme que les attractions les plus importantes doivent tre cherches ailleurs que dans la position des constituants. b. Marquage nal. Les proportions de marquage sont gurent dans la table 5.36. Il y a plus de varit dans les constituants attirant le marquage nal que le marquage initial (gure 5.37). Nanmoins, nous constatons que: la plupart des constituants qui attirent le marquage et sont prsents en quantit sufsante pour tre valus se trouvent en position nale ( lexception des dterminants et des appositions propositionnelles non relates); les constituants relats attirent le marquage indpendamment de leur position. Par rapport aux rejets (gure 5.38), leur frquence est trs leve et implique les Co et les Rl; aucun constituant nal ne rejette la ponctuation nale; les frquences absolues des constituants de fonction Ap non naux acceptant le marquage sont sufsamment leves pour quon sinterroge sur leur particularit, malgr une frquence relative de rejet trs importante; les constituants propositionnels paraissent repousser le marquage dans la mesure o ils ne se trouvent pas directement la nale du constituant qui les intgre. Comme les frquences le laissaient prvoir, ce sont les 0,0,Ap,0,0 qui ressortent comme particulirement marqus une fois les constituants naux retirs de lchan-

210

Attractions (seuil adapt 0.427%) 0,0,Dt,0,1 0,0,Ap,0,0 0,0,Dt,0,0 0,0,Ap,pers,1 0,0,Ap,pers,0 3.37e104 1 206/632 (33%) 1151/9286 (12%) 42/113 (37%) 43/120 (36%) 13/130 (10%)

F IG . 5.39 Attractions signicatives entre PPF et MM, au niveau syntarg (sans les constituants naux)
Rpulsions (seuil adapt 0.427%) 1,0,Rl,0,0 0,0,Co,0,0 1,0,Ap,0,0 0,0,Rl,0,0 1,0,Ap,pers,0 1,0,Dt,0,0 1,0,Ap,0,1 6.28e99 1 52/4797 (1.1%) 28/1217 (2.3%) 312/4987 (6.3%) 1/79 (1.3%) 0/56 (0.0%) 1/25 (4.0%) 1/24 (4.2%)

F IG . 5.40 Rpulsions signicatives entre PPF et MM, au niveau syntarg (sans les constituants naux)
FAB 0 1 8018 374 8392 FRE 95.54 4.46 100
0 1

2000

4000

6000

8000

TAB . 5.37 Tri plat de PPD pour les constituants MI.pers

tillon (gures 5.39 et 5.40). Ce contraste est problmatique, dans la mesure o le type dapposition qui se dmarque ainsi est particulirement htrogne.43 5.3.2.5 Propositions personnelles de fonction immdiate

Abordons prsent les constituants des structures de fonction immdiate, en commenant par les propositions personnelles. a. Marquage initial. La proportion de constituants marqus est faible (table 5.37). Les frquences absolues sont donc souvent trop petites pour quon puisse les exploiter. Cependant, les attractions (gure 5.41) nous livrent des informations prcieuses: premirement, la position initiale semble lie au marquage, comme ctait le cas au niveau argumental, mais de manire assez peu rgulire (cf. pourcentages); 1,0,S1,0,0, qui reprsente toutes les propositions en qui, est signicativement li une ponctuation initiale; les autres constituants initiaux (Rl, R2, A4, C5) ne sont pas lis signicativement; les relateurs coordonnants attirent trs signicativement PPD, de la mme manire que nous lavons remarqu dans la plupart des autres contextes; par contre, les relateurs non coordonnants ne sont pas signicativement lis PPD.1, bien que le sens de lcart soit celui dune attraction; les diffrents types de C5 attirent PPD, particulirement la nale.
43 tant donn que le modle assimile de nombreux types de constituants des appositions

(3.4.6.1). Nous reviendrons ultrieurement sur cette question (6.2).

211

Attractions (seuil adapt 0.151%) 0,0,Co,0,0 0,0,Rl,0,0 0,0,R2,pers,1 0,1,C5,0,0 0,1,C5,pers,1 1,0,S1,0,0 1,0,C5,0,0 0,1,C5,0,1 0,0,C5,0,1 1,0,A4,0,0 1,0,R2,0,0 1,1,R2,pers,0 0,1,C5,pers,1 0,0,R3,0,1 0,1,R2,pers,1 0,0,C5,pers,1 0,1,S1,0,0 0,0,R2,pers,0 0,0,A4,0,1 1,0,Rl,0,0 4.72e63 1 95/476 (20.0%) 7/10 (70.0%) 4/10 (40.0%) 14/96 (14.6%) 4/12 (33.3%) 57/841 (6.8%) 11/97 (11.3%) 22/273 (8.1%) 21/267 (7.9%) 5/36 (13.9%) 18/256 (7.0%) 2/10 (20.0%) 2/13 (15.4%) 3/34 (8.8%) 2/23 (8.7%) 2/26 (7.7%) 1/17 (5.9%) 2/28 (7.1%) 5/107 (4.7%) 26/575 (4.5%)

F IG . 5.41 Attractions entre PPD et MM, au niveau pers


Rpulsions (seuil adapt 0.151%) 0,0,P0,0,0 0,1,P0,0,0 0,0,S1,0,0 0,0,R2,0,0 0,0,C5,0,0 0,1,R2,0,0 0,1,A4,0,1 0,0,R3,0,0 0,1,A4,0,0 0,1,R2,pers,0 0,0,A4,pers,1 0,0,A4,0,0 0,1,R3,0,1 1,0,R2,pers,0 3.12e16 1 12/1661 (0.72%) 3/764 (0.39%) 12/1074 (1.12%) 10/450 (2.22%) 9/404 (2.23%) 5/224 (2.23%) 6/246 (2.44%) 0/59 (0.00%) 0/46 (0.00%) 1/66 (1.52%) 0/20 (0.00%) 1/44 (2.27%) 1/43 (2.33%) 0/11 (0.00%)

F IG . 5.42 Rpulsions entre PPD et MM, au niveau pers


FAB 0 1 7002 1385 8387 FRE 83.49 16.51 100
0 1

1000

2000

3000

4000

5000

6000

7000

TAB . 5.38 Tri plat de PPF pour les constituants MI.pers

Pour les rpulsions (gure 5.42): le prdicat rejette le marquage, de la mme manire quen syntaxe argumentale; les constituants simples manifestent une rpulsion (signicative ou non). Les scribes avaient peut-tre tendance remonter le niveau de ces C5; le signe qui les prcde indiquerait ds lors la n de la proposition subordonne. Retirer les constituants initiaux de lchantillon avant de tester les associations a pour consquence principale daugmenter la signicativit des quatre types de constituants dpassant le seuil corrig de idk (gures 5.43 et 5.44). Les tendances restent donc plus ou moins stables. b. Marquage nal. Le marquage nal est, sans surprise, plus abondant (table 5.38). On met ainsi jour les tendances de la gure 5.45. PPF.1 est principalement observ pour les constituants en nale. Dans les autres cas, seuls les constituants vriant

212

Attractions (seuil adapt 0.190%)

0,0,Co,0,0 0,0,Rl,0,0 0,1,C5,0,0 0,0,R2,pers,1 0,1,C5,pers,1 0,1,C5,0,1 0,0,C5,0,1 0,1,C5,pers,1 0,0,R3,0,1 0,1,R2,pers,1 0,0,C5,pers,1 0,0,R2,pers,0 0,0,A4,0,1 0,1,S1,0,0

95/476 (20.0%) 7/10 (70.0%) 14/96 (14.6%) 4/10 (40.0%) 4/12 (33.3%) 22/273 (8.1%) 21/267 (7.9%) 2/13 (15.4%) 3/34 (8.8%) 2/23 (8.7%) 2/26 (7.7%) 2/28 (7.1%) 5/107 (4.7%) 1/17 (5.9%)

1.78e79

F IG . 5.43 Attractions signicatives entre PPD et MM, au niveau pers (sans les constituants initiaux)

Rpulsions (seuil adapt 0.190%)

0,0,P0,0,0 0,1,P0,0,0 0,0,S1,0,0 0,0,R2,0,0 0,0,C5,0,0 0,0,R3,0,0 0,1,R2,0,0 0,1,A4,0,1 0,1,A4,0,0 0,1,R2,pers,0 0,0,A4,pers,1 0,0,A4,0,0 0,1,R3,0,1

12/1661 (0.72%) 3/764 (0.39%) 12/1074 (1.12%) 10/450 (2.22%) 9/404 (2.23%) 0/59 (0.00%) 5/224 (2.23%) 6/246 (2.44%) 0/46 (0.00%) 1/66 (1.52%) 0/20 (0.00%) 1/44 (2.27%) 1/43 (2.33%)

3.33e14

F IG . 5.44 Rpulsions signicatives entre PPD et MM, au niveau pers (sans les constituants initiaux)

Attractions (seuil adapt 0.151%)

0,1,P0,0,0 0,1,C5,0,1 0,1,C5,0,0 0,1,A4,0,1 0,1,R2,0,0 0,1,R2,pers,0 0,1,R2,pers,1 0,1,C5,pers,1 0,0,C5,pers,1 0,1,R3,0,1 0,1,S1,0,0 0,1,C5,pers,1 0,0,R2,pers,1 0,1,A4,0,0 0,0,C5,0,1 1,1,R2,pers,0 0,0,A4,0,1 0,0,R2,pers,0 0,0,R3,0,1

438/764 (57%) 175/272 (64%) 78/94 (83%) 137/246 (56%) 125/222 (56%) 56/66 (85%) 17/23 (74%) 12/13 (92%) 17/26 (65%) 23/43 (53%) 13/17 (76%) 9/12 (75%) 8/10 (80%) 20/46 (43%) 67/267 (25%) 6/10 (60%) 23/107 (21%) 5/28 (18%) 6/34 (18%)

3.48e222

F IG . 5.45 Attractions entre PPF et MM, au niveau pers

213

Rpulsions (seuil adapt 0.151%) 0,0,P0,0,0 1,0,S1,0,0 0,0,S1,0,0 1,0,Rl,0,0 0,0,Co,0,0 0,0,C5,0,0 1,0,R2,0,0 0,0,R2,0,0 1,0,C5,0,0 0,0,R3,0,0 1,0,A4,0,0 0,0,A4,0,0 0,0,Rl,0,0 0,0,A4,pers,1 1,0,R2,pers,0 1.7e69 1 35/1661 (2.11%) 1/841 (0.12%) 30/1074 (2.79%) 0/575 (0.00%) 1/476 (0.21%) 13/404 (3.22%) 0/256 (0.00%) 36/450 (8.00%) 1/97 (1.03%) 0/59 (0.00%) 1/36 (2.78%) 3/44 (6.82%) 0/10 (0.00%) 2/20 (10.00%) 1/11 (9.09%)

F IG . 5.46 Rpulsions entre PPF et MM, au niveau pers


Attractions (seuil adapt 0.244%) 0,0,C5,0,1 0,0,C5,pers,1 0,0,R2,pers,1 0,0,A4,0,1 0,0,R2,0,0 0,0,R3,0,1 0,0,R2,pers,0 0,0,A4,pers,1 0,0,A4,0,0 1,0,R2,pers,0 1.89e72 1 67/267 (25.1%) 17/26 (65.4%) 8/10 (80.0%) 23/107 (21.5%) 36/450 (8.0%) 6/34 (17.6%) 5/28 (17.9%) 2/20 (10.0%) 3/44 (6.8%) 1/11 (9.1%)

F IG . 5.47 Attractions signicatives entre PPF et MM, au niveau pers (sans les constituants naux)
Rpulsions (seuil adapt 0.244%) 1,0,S1,0,0 1,0,Rl,0,0 0,0,P0,0,0 0,0,Co,0,0 1,0,R2,0,0 0,0,S1,0,0 0,0,R3,0,0 1,0,C5,0,0 0,0,C5,0,0 0,0,Rl,0,0 1,0,A4,0,0 1.96e09 1 1/841 (0.12%) 0/575 (0.00%) 35/1661 (2.11%) 1/476 (0.21%) 0/256 (0.00%) 30/1074 (2.79%) 0/59 (0.00%) 1/97 (1.03%) 13/404 (3.22%) 0/10 (0.00%) 1/36 (2.78%)

F IG . 5.48 Rpulsions signicatives entre PPF et MM, au niveau pers (sans les constituants naux)

MF.C5 ou MN.pers sont marqus. Les rpulsions (gure 5.46) sont quant elles trs fortes (elles atteignent 90% dans tous les cas) et elles ne concernent que les constituants simples. On peut se demander si les constituants initiaux qui ressortent ici (dont la frquence de marquage avoisine les 0% et dont les frquences absolues sont proche de 0) ne sont pas des relateurs (des constituants spciants) ayant une fonction argumentale (3.4.6.4 a), du type:
celi ki ces iiii muis tenrat en hyretage (Document 12711209, 8).

Si nous retirons les constituants naux de lchantillon, nous obtenons les gures 5.47 et 5.48; nous voyons nouveau se dmarquer:

214

FAB 0 1 2997 55 3052

FRE 98.2 1.8 100


0 1

500

1000

1500

2000

2500

TAB . 5.39 Tri plat de PPD pour les constituants MI.pers


Attractions (seuil adapt 0.341%) 0,0,Co,0,0 0,0,R2,0,0 0,1,C5,0,0 1,0,Rl,0,0 0,0,C5,0,1 0,1,C5,0,1 1,0,P0,0,0 0,0,C5,0,0 0,0,Rl,0,0 6.14e43 1 11/30 (36.7%) 5/26 (19.2%) 3/14 (21.4%) 8/105 (7.6%) 4/52 (7.7%) 4/63 (6.3%) 3/40 (7.5%) 1/14 (7.1%) 1/18 (5.6%)

F IG . 5.49 Attractions entre PPD et MM, au niveau pers


Rpulsions (seuil adapt 0.341%) 0,1,P0,0,0 1,0,C5,0,0 1,0,R3,0,0 0,1,A4,0,1 0,0,P0,0,0 1,0,R2,0,0 4.61e08 1 3/1296 (0.23%) 7/1210 (0.58%) 0/10 (0.00%) 0/14 (0.00%) 1/77 (1.30%) 0/31 (0.00%)

F IG . 5.50 Rpulsions entre PPD et MM, au niveau pers


FAB 0 1 2594 450 3044 FRE 85.22 14.78 100
0 1

500

1000

1500

2000

2500

TAB . 5.40 Tri plat de PPF pour les constituants MI.pers

de nombreux types de circonstants; ainsi que les relateurs 0,0,Rl,0,0; et les actants 0,0,R2,pers,0, 0,0,R3,0,1 et 0,0,A4,0,0.

5.3.2.6

Propositions non personnelles de fonction immdiate

a. Marquage initial. La ponctuation initiale est presque inexistante (table 5.39). Les effectifs, trs faibles, laissent paratre quelques tendances, mais on aurait de la peine les exploiter en les considrant seules. Remarquons tout de mme (gure 5.49) que les relateurs attirent le marquage initial et quau point de vue des rpulsions (gure 5.50), les C5 initiaux rejettent le marquage. b. Marquage nal. La ponctuation nale est plus frquente que la ponctuation initiale (table 5.40). On doit cependant sattendre ce que les attractions ne concernent pratiquement que les constituants qui se trouvent la nale de la structure tudie, ce qui est effectivement le cas (gure 5.51). Malgr le peu de matriaux disponibles,

215

Attractions (seuil adapt 0.341%) 0,1,P0,0,0 0,1,C5,0,1 0,1,C5,0,0 0,1,A4,0,1 0,0,C5,0,1 4.11e57 1 345/1288 (27%) 42/63 (67%) 12/14 (86%) 7/14 (50%) 15/52 (29%)

F IG . 5.51 Attractions entre PPF et MM, au niveau pers


Rpulsions (seuil adapt 0.341%) 1,0,C5,0,0 1,0,Rl,0,0 1,0,P0,0,0 1,0,R2,0,0 0,0,P0,0,0 0,0,Rl,0,0 0,0,Co,0,0 1,0,R3,0,0 0,0,R2,0,0 0,0,C5,0,0 3.72e73 1 5/1210 (0.41%) 0/105 (0.00%) 0/40 (0.00%) 0/31 (0.00%) 5/77 (6.49%) 0/18 (0.00%) 2/30 (6.67%) 0/10 (0.00%) 2/26 (7.69%) 2/14 (14.29%)

F IG . 5.52 Rpulsions entre PPF et MM, au niveau pers


Attractions (seuil adapt 0.465%) 0,0,C5,0,1 0,0,P0,0,0 0,0,C5,0,0 0,0,R2,0,0 0,0,Co,0,0 4.57e39 1 15/52 (28.8%) 5/77 (6.5%) 2/14 (14.3%) 2/26 (7.7%) 2/30 (6.7%)

F IG . 5.53 Attractions signicatives entre PPF et MM, au niveau pers (sans les constituants naux)
Rpulsions (seuil adapt 0.465%) 1,0,C5,0,0 1,0,Rl,0,0 1,0,R3,0,0 1,0,P0,0,0 1,0,R2,0,0 0,0,Rl,0,0 4.05e15 1 5/1210 (0.41%) 0/105 (0.00%) 0/10 (0.00%) 0/40 (0.00%) 0/31 (0.00%) 0/18 (0.00%)

F IG . 5.54 Rpulsions signicatives entre PPF et MM, au niveau pers (sans les constituants naux)

soulignons nanmoins que les C5 sont particulirement marqus et que les relateurs rejettent nouveau le ponctogramme (cela est encore plus visible dans la gure 5.53).

5.3.2.7

Constituants non propositionnels de fonction immdiate

Ce type dintgration syntaxique est trs difcile traiter. Alors que les propositions sont formes partir du prdicat et de ses arguments et que les arguments sont leur tour construits sur la base de propositions ou de syntagmes, les constituants non propositionnels sont trs souvents constitus dautres structures de mme nature, imbriques rcursivement. Par exemple,

216

FAB 0 1 26886 1690 28576

FRE 94.09 5.91 100


0 1

5000

10000

15000

20000

25000

TAB . 5.41 Tri plat de PPD pour les constituants MI.synt


Attractions (seuil adapt 0.285%) 1,0,Ap,0,0 0,0,Co,0,0 0,1,Ap,pers,1 1,0,Dt,0,1 0,1,Dt,pers,1 0,0,Ap,pers,1 1e300 1 1026/6426 (16.0%) 91/393 (23.2%) 38/423 (9.0%) 4/38 (10.5%) 1/10 (10.0%) 3/44 (6.8%)

F IG . 5.55 Attractions entre PPD et MM, au niveau synt


Rpulsions (seuil adapt 0.285%) 0,1,Ap,0,0 1,0,Rl,0,0 0,1,Dt,0,1 0,1,Dt,0,0 0,1,Ap,pers,0 0,0,Dt,0,1 0,0,Ap,pers,0 1,0,Dt,0,0 0,0,Rl,0,0 0,0,Dt,0,0 0,1,Ap,0,1 0,0,Ap,0,0 2.75e94 1 104/8004 (1.30%) 133/5261 (2.53%) 23/2158 (1.07%) 5/597 (0.84%) 6/559 (1.07%) 6/222 (2.70%) 1/89 (1.12%) 0/32 (0.00%) 2/76 (2.63%) 3/89 (3.37%) 0/11 (0.00%) 242/4116 (5.88%)

F IG . 5.56 Rpulsions entre PPD et MM, au niveau synt la nos requent l deuant d fre [7]res ke nos lour feemes don et veture delle lour part de dem boner de [8] terre erle k aluz et et k lour atot ekeut de par pere et de par mere eas [9] et damoelle helut lour erour et k get en el terrour de hekes (Document 12770504, 6).

Par ailleurs, la taille des constituants non propositionnels est gnralement rduite par rapport celle des structures argumentales. La simple lecture des documents laisse voir quun grand nombre de syntagmes sont composs de seulement deux mots, ce qui a pour consquence que le premier est forcment initial et que le deuxime est ncessairement nal. a. Marquage initial. Le tri plat (table 5.41) montre que le nombre de constituants marqus reste trs lev, en particulier si on le considre de manire absolue pour lensemble et le tableau.44 Selon la gure 5.55, il y a un dtachement trs net de Co et de Ap initiaux du ct des attractions, alors que les rpulsions prsentes ce niveau (gure 5.56) se rsument ainsi: les constituants naux rejettent le marquage; les relateurs font de mme. Il ny a pas, comme ctait le cas dans un contexte argumental, une grande quantit

44 Voir les annexes.

217

FAB 0 1 23611 4855 28466

FRE 82.94 17.06 100


0 1

5000

10000

15000

20000

TAB . 5.42 Tri plat de PPF pour les constituants MI.synt


Attractions (seuil adapt 0.285%) 0,1,Ap,0,0 0,1,Dt,0,1 0,1,Ap,pers,1 0,1,Dt,0,0 0,1,Ap,pers,0 0,1,Dt,pers,1 0,0,Ap,pers,1 0,1,Ap,0,1 1e300 1 2711/7914 (34%) 912/2150 (42%) 292/423 (69%) 214/579 (37%) 192/559 (34%) 7/10 (70%) 18/44 (41%) 6/11 (55%)

F IG . 5.57 Attractions entre PPF et MM, au niveau synt


Rpulsions (seuil adapt 0.285%) 1,0,Ap,0,0 1,0,Rl,0,0 0,0,Ap,0,0 0,0,Co,0,0 0,0,Dt,0,1 0,0,Rl,0,0 0,0,Dt,0,0 0,0,Ap,pers,0 1,0,Dt,0,0 1,0,Dt,0,1 8.13e266 1 172/6431 (2.67%) 47/5262 (0.89%) 234/4116 (5.69%) 3/393 (0.76%) 18/222 (8.11%) 2/76 (2.63%) 5/89 (5.62%) 6/89 (6.74%) 0/32 (0.00%) 5/38 (13.16%)

F IG . 5.58 Rpulsions entre PPF et MM, au niveau synt

de constituants non initiaux qui attirent le marquage. Concrtement, les syntagmes ne sont donc gnralement pas interrompus par la ponctuation. b. Marquage nal. La quantit de marquage nal est nouveau bien suprieure la quantit de marquage initial (table 5.42). Selon la gure 5.57, les seules constructions qui attirent le marquage sans se trouver la nale sont les propositions personnelles relates. Par ailleurs, le rejet (gure gure 5.58) semble caractriser tous les constituants ne se trouvant pas la nale. On ne peut cependant parler de rgle car un nombre non ngligeable (frquence absolue) dAp non naux acceptent PPF.1. Ces rpulsions impliquent nouveau que les syntagmes ne sont habituellement pas rompus par la prsence dun ponctogramme. 5.3.3 Synthse

En guise de synthse, nous comparons la rgularit du marquage initial la rgularit du marquage nal (5.3.3.1). Nous mettons ensuite en relation les observations des diffrents tris croiss. Pour ce faire, nous construisons deux tableaux synoptiques (5.3.3.2). Leur description mne la dnition de points forts et de questions concernant les tendances gnrales dgages (5.3.3.3).

218

5.3.3.1

Rgularits

Comme le montraient dj les tris plat (5.1.3), la ponctuation est un phnomne rare par rapport la non-ponctuation. On pouvait donc sattendre ce que la prsence dune marque dans un contexte qui lattire soit tout simplement moins rgulire que son absence dans un contexte qui la repousse. Les tris croiss ne sopposent pas cette conclusion et un rapide test permet de sen assurer. Reprenons toutes les spcicits positives et regroupons dans un premier chantillon (dsign du nom attraction) tous les pourcentages enregistrs pour les constituants attirant signicativement le marquage dans les tableaux ci-dessus. Faisons ensuite de mme avec les rpulsions, non pas en considrant le pourcentage de marquage, mais la diffrence de 100 diminu de ce dernier (chantillon nomm rpulsion). Nous obtenons deux distributions dont la diffrence des mdianes peut tre value laide dun test nomm test de Wilcoxon.45 Nous avons report les rsultats du test, ainsi quune reprsentation des deux chantillons, dans les graphiques de la gure 5.59. Les encoches gurant de part et dautre de la mdiane dans le troisime graphique sont un moyen graphique de mettre en vidence la diffrence entre les mdianes des deux chantillons: de manire gnrale, si les encoches de deux botes ne gurent pas en vis--vis, cela signie que les mdianes sont signicativement diffrentes.46 Le graphique est trs clair. Les courbes montrent que la distribution de la rgularit de marquage est bimodale, ce qui est gnralement lindice que lchantillon observ est le rsultat dun mlange entre deux chantillons diffrents. Il devrait tre possible de regrouper les constituants (par position, par fonction, etc.) de manire mettre en vidence ces deux groupes, mais aucun des dcoupages que nous avons pu effectuer na abouti une sparation nette. Il ressort de la diffrence entre les frquences dattraction et les frquences de rpulsion que la prsence de ponctuation autour dun constituant dun type qui la repousse est nettement plus prgnante que son absence dans un environnement lattirant. Extrapolons ainsi: si un ponctogramme apparat alors quil ne le devrait pas suivant les tendances dceles dans ce chapitre, il est plausible que les causes de son occurrence doivent tre recherches ailleurs, cest--dire soit dans le contexte immdiat, soit un niveau danalyse qui ne soit pas exclusivement morphosyntaxique. 5.3.3.2 Tableaux synoptiques

a. Visualisation simultane des tris croiss. Les vingt-huit graphiques de tendances et les commentaires que nous en avons fait ci-dessus ont chacun leur intrt propre, sans toutefois prsenter une vue densemble de la situation. Pour construire une telle
45 Les distributions ne sont pas normales (4.1.2) et requirent un test non paramtrique, ind-

pendant de la forme de la distribution (Howell 1998, ch. 18). Les tests non paramtriques ont lavantage de ne pas ncessiter que les donnes soient distribues dune manire particulire pour tre applicables (la plupart des tests paramtriques supposent la normalit des distributions). Ils ont cependant linconvnient de manquer de puissance, cest--dire daugmenter les chances de commettre lerreur (voir page 157). Le test est effectu par la fonction R wilcox.test(). 46 Voir laide de R, ?boxplot.

219

Attraction

0.030 0.025
Densit

0.020 0.015 0.010 0.005 0.000


0 20 40 60 80

18 16 14 12 10 8 6 4 2 0

Rpulsion

0.4 0.3 0.2 0.1 0.0


92 94 96 98 100

18 16 14 12 10 8 6 4 2 0

Densit

Test de Wilcoxon: p = 8.7e17

100 80 60 40 20

Attraction

Rpulsion

F IG . 5.59 Proportions de marquage

220

vue, il faut combiner les rsultats des diffrents graphiques. On obtient ainsi deux tableaux synthtiques: un pour le marquage par un ponctogramme linitiale et un pour le marquage par un ponctogramme la nale. Les tableaux ne donnent certes pas dinformations qui ne soient dj apportes par lanalyse dtaille, mais ils en prsentent une slection de manire simultane, de faon faire apparatre les ressemblances et les diffrences. Pour chaque combinaison positionnelle et morphosyntaxique (verticalement) et chaque type de structure intgrante (horizontalement), le tableau indique si le type de marquage concern est attir signicativement (indiqu par un carr noir), signicativement si lajustement de idk est nglig (triangle noir) et non signicativement (petit disque noir). Les symboles blancs reprsentent les rpulsions et correspondent au mme classement (carr, triangle, disque). Dans les cas o le nombre dattestations dune structure natteint pas 10 ou est absent un niveau dintgration particulier, la case est laisse vide. Pour PPD, le tableau obtenu sur la base des principes exposs est donc report dans la gure 5.60. Le tableau correspondant au marquage nal est donn dans la gure 5.61. Ces deux rsums ont t conus de manire mettre en vidence les ressemblances et les diffrences entre les constituants de mme MI (verticalement) et entre les MI o se rencontre un mme type de constituant (horizontalement). Nous avons commenc par sparer les tendances observes en syntaxe argumentale ( gauche) de celles observes en syntaxe immdiate ( droite), tant donn que peu de modalits de MM se retrouvent dans les deux types dintgration. Pour rendre les deux sous-tableaux plus lisibles, nous avons permut les lignes et les colonnes de manire regrouper les tendances signicatives en deux groupes, les plus denses quil a t possible. Ces tableaux, coupls aux analyses faites dans la section 5.2.2, synthtisent notre exploration en une srie de points forts et de questions qui nous serviront de guides par la suite. b. Ncessit dcarter les constituants aux bornes de la structure qui les contient. tant donn la rcursivit et lattraction du marquage aux bornes, chercher dans ce qui nest pas aux bornes parat plus raisonnable. La plupart du temps, dans le cas des structures propositionnelles, la ponctuation a tendance tre atteste au dbut ou la n des constituants englobants. La frquence de ce marquage est parfois,47 sufsamment forte pour occulter la prsence dautres tendances plus subtiles. Lexamen des tris croiss dbarrasss des positions extrmes (initiales pour PPD et nales pour PPF) a ainsi montr que certains types de constituants attiraient le marquage plus clairement quon ne laurait pens. Il est donc utile de construire de nouveaux tableaux synoptiques, fonds cette fois sur les tests effectus partir des chantillons modis. Le tableau 5.62 synthtise les tendances de ponctuation initiale, alors que le tableau 5.63 synthtise les tendances de ponctuation nale. Du fait de leur dpendance par rapport aux constructions de niveau dintgration syntaxique suprieur, les constituants dont la modalit de MI vaut synt ou synt-arg ne pourraient tre traits de la mme manire. Nous verrons ci-dessous (5.3.3.3 e) les options que nous avons choisies quant au traitement de ces units.

47 Voir 6.1.1 o les frquences dpassent les 80%.

221

0,0,Co,0,0 0,1,C5,0,0 1,0,Rl,0,0 1,0,C6,0,0 0,0,Rl,0,0 1,0,S1,0,0 1,0,A4,0,0 0,0,C5,pers,0 1,0,A4,pers,1 0,1,C5,pers,1 1,0,R3,0,1 1,0,R2,0,0 1,0,C5,pers,1 1,0,C5,0,1 1,0,A4,0,1 0,0,R2,pers,1 0,0,R2,0,0 0,1,C5,0,1 1,0,P0,0,0 1,0,C5,0,0 0,1,R2,pers,1 0,1,C5,pers,1 1,1,R2,pers,0 0,1,S1,pers,1 1,0,R2,pers,0 0,1,A4,pers,1 0,0,C5,pers,1 1,0,R3,0,0 0,1,S1,0,0 0,1,A4,pers,1 0,1,R3,0,1 0,1,A4,0,0 0,1,R2,0,0 0,0,R3,0,0 0,0,A4,0,0 0,0,C5,0,1 0,0,C6,0,0 0,0,C5,pers,1 0,0,R3,0,1 0,1,R2,pers,0 0,0,S1,0,0 0,0,A4,pers,1 0,0,R2,pers,0 0,0,C5,0,0 0,1,A4,0,1 0,0,A4,0,1 0,0,P0,0,0 0,1,P0,0,0

1,0,Dt,0,1 1,0,Ap,pers,0 1,0,Ap,0,0 0,0,Dt,0,0 0,0,Ap,0,0 0,0,Co,0,0 1,1,Ap,0,0 1,0,Ap,0,1 1,0,Rl,0,0 1,0,Dt,0,0 0,1,Dt,pers,1 0,0,Rl,0,0 0,0,Ap,pers,1 0,1,Dt,0,1 0,1,Dt,0,0 0,1,Ap,pers,1 0,1,Ap,pers,0 0,1,Ap,0,1 0,1,Ap,0,0 0,0,Dt,0,1 0,0,Ap,pers,0

syntarg

synt

Attraction significative Attraction significative (si non ajuste) Attraction non significative (seuil 5%) Rpulsion significative Rpulsion significative (si non ajuste) Rpulsion non significative (seuil 5%)

phrase

pers persarg pers persarg

F IG . 5.60 Tableau synoptique des tendances gnrales, PPD

222

0,1,C5,0,1 0,1,C5,0,0 0,1,A4,0,1 0,1,P0,0,0 0,1,R3,0,1 0,1,R2,pers,1 0,1,R2,0,0 0,1,S1,0,0 0,1,R2,pers,0 0,0,C5,pers,1 0,0,C5,0,1 0,1,A4,0,0 0,1,C5,pers,1 0,1,C5,pers,1 0,0,C5,pers,0 0,0,R2,pers,1 0,0,R3,0,1 1,0,R3,0,1 0,1,S1,pers,1 0,1,A4,pers,1 0,1,A4,pers,1 1,1,R2,pers,0 0,0,R2,pers,0 1,0,C5,pers,1 0,0,C5,pers,1 1,0,R2,pers,0 1,0,C5,0,1 1,0,R3,0,0 1,0,A4,pers,1 1,0,A4,0,1 1,0,A4,0,0 0,0,A4,pers,1 0,0,Rl,0,0 0,0,A4,0,0 0,0,R3,0,0 0,0,C6,0,0 1,0,C6,0,0 0,0,A4,0,1 0,0,R2,0,0 1,0,P0,0,0 1,0,S1,0,0 1,0,C5,0,0 0,0,C5,0,0 0,0,S1,0,0 1,0,R2,0,0 1,0,Rl,0,0 0,0,P0,0,0 0,0,Co,0,0

1,0,Dt,0,1 0,1,Dt,pers,1 0,1,Dt,0,1 0,1,Dt,0,0 0,1,Ap,pers,1 0,1,Ap,pers,0 0,1,Ap,0,1 0,1,Ap,0,0 0,0,Dt,0,1 0,0,Ap,pers,1 1,1,Ap,0,0 0,0,Dt,0,0 1,0,Dt,0,0 1,0,Ap,0,1 0,0,Ap,pers,0 1,0,Ap,pers,0 1,0,Ap,0,0 0,0,Ap,0,0 1,0,Rl,0,0 0,0,Rl,0,0 0,0,Co,0,0

syntarg

synt

Attraction significative Attraction significative (si non ajuste) Attraction non significative (seuil 5%) Rpulsion significative Rpulsion significative (si non ajuste) Rpulsion non significative (seuil 5%)

phrase

pers

persargpersarg pers

F IG . 5.61 Tableau synoptique des tendances gnrales, PPF

223

0,0,Co,0,0 0,1,C5,0,0 0,1,C5,0,1 0,0,Rl,0,0 0,0,R2,0,0 0,0,C5,pers,0 0,1,R2,pers,1 0,1,C5,pers,1 0,0,R2,pers,1 0,1,R2,0,0 0,1,C5,pers,1 0,1,S1,pers,1 0,1,A4,pers,1 0,0,C5,pers,1 0,1,R3,0,1 0,0,R3,0,1 0,1,S1,0,0 0,1,A4,pers,1 0,0,S1,0,0 0,1,A4,0,0 0,0,R3,0,0 0,0,R2,pers,0 0,0,C6,0,0 0,0,C5,pers,1 0,0,A4,pers,1 0,0,A4,0,0 0,1,A4,0,1 0,0,C5,0,1 0,1,R2,pers,0 0,0,C5,0,0 0,0,A4,0,1 0,1,P0,0,0 0,0,P0,0,0

Attraction significative Attraction significative (si non ajuste) Attraction non significative (seuil 5%) Rpulsion significative Rpulsion significative (si non ajuste) Rpulsion non significative (seuil 5%)

phrase

pers persargpersarg pers

F IG . 5.62 Tableau synoptique des tendances gnrales, PPD (sans les constituants initiaux)

5.3.3.3

Points forts et questions

Nous sommes prsent en mesure de visualiser clairement quels liens entre les constructions et la ponctuation sont les plus intressants. Les quatre tableaux synoptiques mettent en relief des ressemblances et des diffrences entre les lignes et les colonnes. Les points forts de ces synthses nous permettent de poser les questions qui nous guideront dans la suite de notre recherche. a. Critre positionnel et marquage de la phrase. Ce que les deux premiers tableaux synoptiques montrent,48 cest que les constituants naux attirent globalement la ponctuation nale, alors que les constituants initiaux attirent plutt la ponctuation initiale. Pour ce qui concerne le marquage initial, remarquons tout dabord qu lexcep48 Voir les gures 5.60 et 5.61.

224

0,0,C5,0,1 0,0,R2,0,0 0,0,C5,pers,1 0,0,R3,0,1 0,0,C5,0,0 0,0,R2,pers,1 0,0,C5,pers,0 0,0,A4,0,1 1,0,R3,0,1 0,0,S1,0,0 0,0,R2,pers,0 1,0,C5,pers,1 0,0,C5,pers,1 1,0,R2,pers,0 1,0,C5,0,1 0,0,A4,pers,1 1,0,A4,0,0 1,0,R3,0,0 1,0,A4,pers,1 0,0,A4,0,0 0,0,Rl,0,0 0,0,R3,0,0 1,0,A4,0,1 1,0,R2,0,0 0,0,C6,0,0 1,0,C6,0,0 1,0,C5,0,0 1,0,P0,0,0 1,0,S1,0,0 0,0,P0,0,0 0,0,Co,0,0 1,0,Rl,0,0

Attraction significative Attraction significative (si non ajuste) Attraction non significative (seuil 5%) Rpulsion significative Rpulsion significative (si non ajuste) Rpulsion non significative (seuil 5%)

phrase

pers

persargpersarg pers

F IG . 5.63 Tableau synoptique des tendances gnrales, PPF (sans les constituants naux)

tion des constituants immdiats des propositions dont le prdicat nest pas un verbe conjugu un mode personnel, les attractions semblent concentres en position initiale (modalit de MM commenant par 1,0) et les rpulsions sont particulirement prsentes la nale (0,1). la nale, aux bornes des structures intgrantes, la relation entre les positions des constituants et leur ponctuation nale est encore plus systmatique quelle ne ltait pour le marquage initial. Il ny a pratiquement pas dexception qui soit statistiquement signicative: sils sont initiaux, les constituants repoussent gnralement signicativement la ponctuation; sils sont naux, ils lattirent. Nanmoins, pour les propositions personnelles qui nont pas le statut dnonc, la proportion de rsultats non signicatifs est assez importante pour quon se pose la question de savoir si le lien entre les positions extrmes et la tendance au marquage

225

est spcique de la phrase. Si lon observe les propositions non personnelles, il serait peu raisonnable de conclure quil existe une tendance marquer leur premier constituant et ne pas marquer le dernier. Au contraire, ces propositions ne se caractrisent quasiment que par des phnomnes particuliers, comme le rejet de PPD par P0 et lattraction par C5 (d). Lanalyse effectue jusqu prsent ne donne pas de rponse la question du marquage de la phrase, puisque les dpouillements des diffrents types de structures ont t faits de manire indpendante. Il est donc ncessaire deffectuer une tude cible ce sujet. b. Prdicat. Le rejet du marquage par le prdicat dans toute position autre que linitiale (en particulier au dbut de la phrase, qui est le seul contexte o le marquage est effectivement attir) semble tre commun toutes les sortes de propositions. Il faudra galement se demander quelles conditions font que le prdicat initial dune proposition non personnelle en syntaxe immdiate attire le marquage. La situation est encore plus univoque pour le marquage nal, qui est toujours repouss, moins que le prdicat achve la structure laquelle il est intgr. Face un rejet dune telle systmaticit, comment expliquer que certains prdicats soient tout de mme marqus? c. Actants. Si lon ignore les tendances positionnelles, qui sont les plus fortes, on peut lablir une liste prcise, reprenant les actants au marquage atypique. Une fois les constituants initiaux retirs de lchantillon, les attractions particulirement fortes vis--vis de PPD.1 concernent:49 0,0,S1,0,0: phrase 0,1,S1,pers,1: phrase 0,0,R2,0,0: phrase, pers 0,1,R2,0,0: phrase 0,0,R2,pers,1: pers 0,1,R2,pers,1: pers-arg

Quant la ponctuation nale, les actants lattirant sont: 0,0,S1,0,0: phrase 0,0,R2,0,0: phrase, pers-arg, pers-arg, pers 0,0,R2,pers,1: phrase, pers 0,0,R2,pers,0: phrase, pers 0,0,R3,0,1: phrase, pers-arg, pers-arg, pers 1,0,R3,0,1: phrase 0,0,A4,0,1: pers-arg, pers-arg, pers

Il est ncessaire dtudier indpendamment chacun de ces types dactants. d. Marginalit des C5. ct des quelques actants particulirement marqus, les circonstants le sont encore plus fortement. On constate dailleurs que les attractions sont en gnral clairement signicatives. Le phnomne le plus prgnant dans le tableau du marquage initial est le comportement des incidentes (0,0,C5,pers,0), qui attirent gnralement la ponctuation initiale, en particulier au niveau de la phrase et de la proposition personnelle. Cette position tonnante des incidentes nest pas le seul phnomne digne dintrt. Tout dabord, le marquage initial des diffrents C5 en position nale se diffrencie
49 Chaque type de constituant est suivi de son ou ses niveau(x) dintgration syntaxique.

226

de celui des autres constituants. Cela est particulirement le cas au niveau de la phrase, o lon observe, sans mme retirer les constituants aux bornes, que les tendances de marquage sont non signicatives, alors que le rejet est trs net pour les autres constituants. De manire gnrale, part au niveau de la phrase (o le contraste principal est dordre positionnel), les tendances qui caractrisent C5, lorsquelles sont prsentes, vont dans le sens du marquage (ou dune tendance non signicative) et non du rejet. Le marquage nal des C5 ne se trouvant pas une des bornes du constituant qui les intgre est galement particulirement prsent, mais il concerne alors essentiellement les constituants complexes, cest--dire vriant MR.1 ou une autre nature que MN.0. Les attractions vis--vis de la ponctuation initiale (une fois les constituants initiaux retirs) sont: 0,0,C5,0,1: pers, pers 0,0,C5,pers,0: phrase, pers-arg 0,1,C5,0,0: phrase, pers-arg, pers, pers 0,1,C5,0,1: phrase, pers-arg, pers 0,1,C5,pers,1: phrase, pers 0,1,C5,pers,1: phrase

Les attractions concernant PPF.1 sont: 0,0,C5,0,0: phrase, pers-arg, pers 0,0,C5,0,1: phrase, pers-arg, pers-arg, pers, pers 0,0,C5,pers,0: phrase, pers-arg 0,0,C5,pers,1: phrase 0,0,C5,pers,1: phrase, pers-arg, pers 1,0,C5,pers,1: phrase

Chacun de ces types de circonstant devra tre tudi indpendamment. e. Appositions et dterminants. Au niveau dintgration immdiat, le rafnement des donnes est assez faible et nous a dj pos problme plusieurs reprises. Nous avons des difcults apprhender la tendance au marquage des constituants Ap et Dt qui ne se trouvent pas aux bornes du constituant les intgrant. On se doute dj que la prise en considration exclusive des variables choisies jusqu prsent ne sufra pas aborder ce problme, qui dpasse le modle morphosyntaxique tel que nous lavons conu. Par ailleurs, il est probable que les phnomnes de marquage observs au niveau de la syntaxe immdiate sont lis des tendances touchant directement des structures situes plus haut dans la hirarchie syntaxique ou plus gnralement rpandues. Il nous semble que le marquage des constituants MI.synt-arg et MI.synt ne pourra tre apprhend quune fois acheve ltude de la ponctuation au niveau actanciel. f. C6 et relateurs (dont coordonnants). Les coordonnants et les autres relateurs occupent une position morphosyntaxiquement dtermine dans le syntagme les relateurs simples sont presque systmatiquement linitiale et les coordonnants ne sont que trs rarement lune des extrmits. Le comportement de PPD reste trs cohrent dune colonne lautre du tableau. Les coordonnants attirent le marquage initial dans tous les cas. Quant aux relateurs initiaux (non coordonnants), ils attirent le marquage quand ils sont constituants immdiats soit de propositions personnelles fonction argumentale, soit de propositions

227

non personnelles. Les relateurs des constituants non propositionnels rejettent le marquage en contexte immdiat (ou bien lopposition nest pas signicative). Cela remet en question les tendances que les tris croiss mettaient en vidence: il semblerait que le type de constituant intgrant ait une inuence sur la ponctuation des relateurs. Pour PPF, les tendances sont globalement contraires celles dceles pour PPD: coordonnants et relateurs repoussent signicativement la ponctuation nale quelles que soient la nature et la fonction du constituant qui les contient directement mis part pour le coordonnant dans les propositions non personnelles en contexte immdiat, pour lequel la tendance nest pas claire. ces observations, il faut ajouter que les constituants initiaux des relatives, de nature non propositionnelle non relats intgrs une proposition personnelle ne jouant pas le rle dargument se comportent comme des relateurs par rapport la ponctuation nale et la repoussent. g. Coordination. Par ailleurs, la question des coordonnants ouvre celle de la coordination, que les dpouillements ont jusqu prsent totalement nglige. Le coordonnant ntant quune spcication supplmentaire (3.4.7.2), il y a lieu de se demander comment fonctionne le marquage entre les membres quil ne sert pas relier. h. Interfrences. Pour toutes les tendances dceles, gurent en trame de fond deux questions importantes auxquelles les tris croiss ne donnent pas de rponse. Premirement, le lien nest-il pas spcique un ou plusieurs documents? Dans la mesure o nous avons considr les documents comme indistincts, il peut nous avoir chapp que certaines attractions ou rpulsions mises en vidence dans ce chapitre soient spciques un petit ensemble de documents contenant de nombreuses attestations. Deuximement, la ponctuation nest-elle pas lie un environnement morphosyntaxique particulier, plutt qu la structure laquelle elle parat lie? Par exemple, ne peut-on pas dire que les incidentes attirent le marquage initial, en raison du constituant qui les prcde et non cause de leur nature propre?

228

Frquences de marquage

Les conclusions et les questions amenes par lexamen des tris croiss sur une variable de synthse1 formeront le point de dpart de ce chapitre. Prenant appui sur ces tendances principales, nous allons mettre en vidence celles qui peuvent tre gnralises et montrer comment les constructions quelles impliquent se comportent par rapport au marquage. Cest donc dans ce chapitre que nous dpasserons le reprage du marquage valeur simplement visuelle, pour identier exactement sur quelles units portent les signes. Nous aurons alors identi linteraction entre le systme de la ponctuation et la structuration morphosyntaxique. Nous commencerons par exposer la procdure suivie (6.0). Viendra ensuite une srie danalyses dtailles. Dans un premier temps, nous ferons ltude du marquage en syntaxe argumentale et dans les cas de coordination, ce qui mnera de premires conclusions (6.1). En nous servant de ces dernires, nous aborderons les constructions en syntaxe immdiate (6.2), puis la question des relateurs et des C6 (6.3). Au terme de ce parcours, nous aurons une ide nette de la manire dont la ponctuation se distribue autour des constituants, tout au moins du point de vue de sa frquence.

6.0

Procdure danalyse

En premier lieu, voyons comment nous avons dni nos donnes (6.0.1) et par quelles tapes sont passes chacune des tudes effectues dans les sections ultrieures (6.0.2). 6.0.1 Dnition des donnes

La dnition des individus et des variables servant leur description nest pas problmatique: les individus resteront les constructions et constituants. Quant aux variables descriptives de base, elles seront gnralement identiques celles employes dans le cadre du tri crois sur la variable synthtique MM. Nous ajouterons cependant trois variables supplmentaires, dont une partie ou lensemble sera mobilis pour chaque analyse (6.0.1.1). Posant nouveau le dlicat problme de la rcursivit, nous aurons expliquer la manire dont les individus ont t slectionns pour former les chantillons dont nous aurons besoin (6.0.1.2).

Voir, au chapitre prcdent, 5.3 et en particulier la synthse, sous 5.3.3.

229

6.0.1.1

Variables additionnelles

Pour afner le travail dj effectu, il nous faudra enrichir la description des individus laide de variables supplmentaires. La premire dentre elles sera la rfrence de la charte dans laquelle le constituant ou la phrase a t relev. Cette prcision rintroduit de manire systmatique lindividualit des documents, de faon ce quils ne soient plus ncessairement considrs comme indistincts. Cette variable prendra le nom de RB (pour rfrence bibliographique); ses modalits seront les 148 dates des documents dpouills telles que nous les citons dans la liste des rfrences en n de volume. La deuxime et la troisime variables ajoutes dcrivent lenvironnement des constituants. Tout constituant immdiat est susceptible, quelle que soit la structure qui lintgre, dtre suivi ou prcd dun autre constituant de mme niveau dintgration syntaxique bien entendu, les constituants initiaux ont comme particularit de ne pas tre prcds dun autre constituant, de mme que les constituants naux ne sont suivis par aucun autre.2 Nous appellerons contexte immdiat cet environnement direct des constituants tudis. Les variables dcrivant le contexte immdiat reprennent la description morphosyntaxique des constituants (MM) qui entourent lindividu. Elles prendront comme noms MMP pour le constituant prcdent et MMS pour le constituant suivant. Par exemple, dans le circonstant prenant la forme du syntagme:
el mos de jvle (Document 123607, 9).

le dterminant de jvle constitue le contexte immdiat se trouvant la suite du mot mos, lequel est donc dni entre autres par la modalit 0,1,Dt,0,1 de la variable MMS, soit MMS.0,1,Dt,0,1. Rciproquement, mos est le contexte immdiat se trouvant devant le dterminant, soit MMP.0,0,Ap,0,0. Dautres nouvelles variables seront parfois mobilises. Nous les prsenterons en temps utile. 6.0.1.2 Slection des individus

Lpineuse question de la rcursivit (5.1.3.2 a) se pose spciquement pour chaque construction faisant lobjet dun examen particulier. Dans certains cas, aucune rcursivit nest possible, notamment avec les constituants qui ne se trouvent pas lune des limites de la structure qui les intgre. Ainsi, jamais 0,0,Ap,0,0 ne posera de problme cet gard, puisque son premier ou son dernier constituant nauront jamais la mme valeur de MM. Dans dautres cas, le phnomne refait surface. Par exemple, dans le cadre de ltude du marquage de la proposition, il est invitable que lon trouve des mots qui soient la fois la n dune phrase et dune subordonne qui lachverait, comme dans:

Il arrive que lordre linaire ne corresponde pas une squence de constituants de mme niveau dintgration. Dans ce cas, le contexte immdiat ne peut tre tudi de manire aussi simple. Nous avons retir de lchantillon toutes ces structures complexes, dont la liste cgure dans les annexes dep-6.0.1.1.notMMP-PPD et dep-6.0.1.1.notMMS-PPF.

230

Conute choise soit a tos ke lan de_grasce m cc quatre_vins et chinq, [. . .] vinrent par devant nos [. . .] me sires Simons, [4] vestis delle Magdalene a_Treste, dune part, et freres Giles, maistres delle Va Benoite, datre part. (Document 12860323, 2).

o le mot part soulign est la n de la phrase, mais galement de la subordonne. On ne peut liminer compltement les inconvnients lis la rcursivit si lon sobstine vouloir garder lensemble des individus pour effectuer un test. Pour que lexprience soit utile, nous devons commencer par isoler les diffrentes structures les unes des autres, en ne considrant que les constituants indpendants. Pratiquement, sil faut, par exemple, comparer le marquage des phrases celui des subordonnes, nous slectionnerons donc exclusivement les individus qui sont lextrmit de gauche ou de droite (en fonction du marquage tudi) dune et une seule proposition phrase ou subordonne. De manire gnrale, si nous tudions la ponctuation initiale nous exclurons de lchantillon les constituants dont le premier mot est galement celui dun autre constituant. Quand nous tudierons la ponctuation nale, nous procderons de la mme manire avec les derniers mots. Ainsi, ni la phrase, ni la subordonne de lexemple cit ci-dessus ne seront conserves. 6.0.2 tapes de lanalyse

De manire gnrale, nous aborderons la frquence du marquage pour chaque structure tudie. Lanalyse prendra un tour diffrent en fonction du constituant ou de la structure tudi(e). La premire tape du traitement de chacune de ces questions particulires sera de vrier si les attractions ou rpulsions observes ne sont pas caractristiques dun ou de quelques documents particuliers, reprsents par la variable RB. Chaque fois que cela sera possible, le contexte immdiat sera test; de la mme manire que nous laurons fait par rapport la variable RB, nous vrierons si certains contextes immdiats ne sont pas particulirement surreprsents. Dans les cas o la structure se prte la comparaison avec une ou plusieurs autres, lexamen sera alors contrastif. Les constituants intressants qui suivent les mmes tendances et se ressemblent dun point de vue morphosyntaxique seront alors compars du point de vue de la frquence de leur marquage. On peut thoriquement arriver deux observations: soit les frquences de marquage sont clairement diffrentes, soit on ne peut statistiquement afrmer cette diffrence. Sil est possible den dceler une, cela signie que, dune manire ou dune autre, la structure a une certaine individualit par rapport dautres qui lui ressemblent. Il faudra souvent procder plusieurs tests successifs pour analyser la structure du tableau. Nous emploierons essentiellement le test du 2 et le test exact de Fisher3 pour valuer la pertinence des ventilations. Nous ferons sporadiquement appel dautres techniques; par exemple, le test de Wilcoxon sur des chantillons indpendants, le test de Kruskal-Wallis4 ou la reprsentation sous forme de courbes de densit ou de botes moustaches (4.1.2). Le fonctionnement des outils nouveaux sera expos quand nous en ferons usage pour la premire fois.
3 4

Voir, respectivement, 5.2.1.2 et 5.2.1.5. Voir Howell 1998, 740741.

231

6.1

Examen des structures argumentales et de la coordination

Pour des raisons qui apparatront au fur et mesure du dveloppement de cette section, lidal est de traiter dans un premier temps les structures argumentales ainsi que la coordination. La synthse des rsultats obtenus pourra alors tre exploite dans la suite, lors du traitement de la ponctuation en syntaxe immdiate (6.2). Les structures seront dcrites dans un ordre retant lorganisation de la structure argumentale: tout dabord la phrase et la proposition (6.1.1), puis le prdicat (6.1.2), les diffrents actants et A4 (6.1.3) et les circonstants (6.1.4). Nous tudierons enn la coordination et dresserons un premier bilan (6.1.5). 6.1.1 Phrase et proposition personnelle

Comme nous lavons expliqu ci-dessus (5.3.2.1), lnonc non phrastique exprimant un procs a t assimil la phrase pour les dpouillements qui suivent. Il existe une tendance marquer le dbut et la n de la phrase, cest du moins ce que nous apprennent les tris croiss sur la variable MM lorquils sont effectus au niveau de la phrase. De mme, les propositions personnelles sont surtout marques aprs leur dernier constituant. Morphosyntaxiquement, notre modle distingue les phrases des autres propositions personnelles par la capacit que les phrases ont jouer le rle dnonc (3.4.2.5 b). Les propositions personnelles ont ainsi une fonction syntaxique propre lintrieur dune proposition (fonction argumentale) ou dun syntagme non propositionnel (fonction immdiate).5 On peut donc se demander si cette diffrence morphosyntaxique correspond une diffrence signicative de frquence de marquage. La frquence du marquage initial, puis celle du marquage nal seront examines indpendamment. Nous considrerons les mots par rapport leur position dans la proposition personnelle. Si nous tentons dtudier la relation entre les propositions et la ponctuation initiale, nous devons, pour chaque mot, rpondre quatre questions: 1/ le mot est-il au dbut de la phrase? 2/ le mot est-il au dbut dune subordonne fonction dargument? 3/ le mot est-il au dbut dune subordonne en syntaxe immdiate? 4/ y a-t-il un ponctogramme devant ce mot? Pour tudier la ponctuation nale, les individus sont dcrits en posant les questions correspondantes (le mot est-il la n de la phrase? etc.). Comme nous dsirons comparer le marquage des diffrentes sortes de propositions personnelles, nous retirerons de lchantillon tous les individus pour lesquels la rponse aux trois premires questions est non. 6.1.1.1 Frquence du marquage initial

Vrions que les tendances sont bien gnrales (a) avant de traiter lopposition comme si le corpus ne constituait quun seul grand texte (b). Voyons enn ce qui

Voir 3.2.3.

232

PPD.0 Dbut de phrase.0 Dbut de phrase.1 2287 344 2631

PPD.1 240 1380 1620 2527 1724 4251

PPD.0 334.23 -489.91

PPD.1 -542.82 795.65 38.2

2 = 2159.62, ddl = 1, p = 0 ###

TAB . 6.1 Tri crois dbut de phrase PPD


PPD.0 Dbut de phrase.0 Dbut de phrase.1 1994 336 2330
2

PPD.1 216 1173 1389 2210 1509 3719

PPD.0 268.22 -392.82

PPD.1 -449.93 658.95 32.2

= 1767.02, ddl = 1, p = 0 ###

TAB . 6.2 Tri crois dbut de phrase PPD, (sans les documents126505b, 1272-03, 1283-02-13a, 1289-01-12)

se passe lorsque lon considre les proportions prises pour chaque document indpendamment (c).6 a. Tendances par document. Le test de dcomposition est un test ultrieur la constatation que les phrases sont marques au dbut: il vise voir uniquement si certains documents privilgient davantage ce type de marque. Le tri crois sur lensemble du corpus conrme sans surprise que la position initiale de la phrase attire effectivement PPD.1 (table 6.1). Reste savoir si cette tendance nest pas spcique un petit nombre de documents. Si nous croisons la modalit PPD des individus en tte de phrase avec la rfrence de la charte dans laquelle on les trouve, nous voyons comment les tendances dattraction (gure 6.1) et de rpulsion (gure 6.2) du marquage initial se dcomposent. Le premier graphique montre quels documents seraient susceptibles de dstabiliser les effectifs, de sorte quen ignorant la rpartition des phrases entre les textes, on aurait limpression que le marquage est un phnomne gnral, alors quil ne serait limit qu un nombre restreint de textes. Du fait quil met en vidence le phnomne oppos quelles chartes se distinguent de lensemble par labsence de marquage initial de la phrase , le second tableau nous intresse nettement moins. On voit ainsi quun ensemble de quatre documents se distingue du reste du corpus par prcaution, nous considrons de la mme manire les individus signicatifs aprs correction. Que se passerait-il si nous refaisions le mme tri crois que ci-dessus (tableau 6.1), aprs avoir enlev de la tabulation tous les individus relevs dans ces documents? Le nouveau 2 (table 6.2) montre un cart signicatif orient exactement dans le mme sens que le prcdent. Le rapport de chances, bien quinfrieur, reste trs lev. En conclusion, les quatre documents reprs ne dsquilibrent pas le corpus. Appliquons le mme procd aux propositions argumentales pour voir si la rpulsion repre par le tri crois suivant est spcique quelques documents (table 6.3). Il est dj visible que, par rapport la phrase, les carts sont orients dans la direction oppose. Le est par ailleurs beaucoup plus petit. Par rapport aux documents,
6

Les structures ignores cause de la rcursivit sont numres dans lannexe dep6.1.1.1.removed-PPD.

233

Attractions (seuil adapt 0.0754%)

127203 12890112 12830213a 126505b 12730512 12720622 126505a 12700606a 12660613 12700510 126305 127508 12651113 12630527a 12671022 12700929 12710725 12760224 12821222 128802b 12760610b 12770504 126311 12710420 12890719 12780406 12630331 12650704 12710522 12711209 12780801 12700324 12800504 12670828 12430709 12650415 12750110a 128802a 12770612 12600509 12600221b 12710318 12711222 12890419 12701126 12420502 12890305

62/62 (100%) 49/51 (96%) 63/68 (93%) 33/34 (97%) 18/18 (100%) 14/14 (100%) 13/13 (100%) 13/13 (100%) 18/19 (95%) 18/19 (95%) 11/11 (100%) 11/11 (100%) 17/18 (94%) 10/10 (100%) 10/10 (100%) 10/10 (100%) 10/10 (100%) 10/10 (100%) 10/10 (100%) 10/10 (100%) 16/17 (94%) 15/16 (94%) 14/15 (93%) 14/15 (93%) 14/15 (93%) 19/21 (90%) 18/20 (90%) 12/13 (92%) 17/19 (89%) 17/19 (89%) 20/23 (87%) 15/17 (88%) 15/17 (88%) 23/27 (85%) 9/10 (90%) 9/10 (90%) 9/10 (90%) 9/10 (90%) 22/26 (85%) 17/20 (85%) 9/11 (82%) 9/11 (82%) 13/16 (81%) 13/16 (81%) 17/21 (81%) 10/12 (83%) 15/18 (83%)

0.000122

F IG . 6.1 Attractions entre PPD et la phrase par charte

Rpulsions (seuil adapt 0.0754%)

12781017 12890405 12440119 12800720 12890801 12800505 12800809 12840511 12831226 12680310 12760722 12700416 124706 12600530b 12760610a 12780404a 123605 12600221a 12740531b 12520301a 12740531a

0/15 (0%) 2/13 (15%) 12/30 (40%) 10/23 (43%) 3/10 (30%) 5/11 (45%) 5/11 (45%) 5/11 (45%) 7/14 (50%) 18/29 (62%) 12/20 (60%) 6/11 (55%) 24/33 (73%) 10/14 (71%) 8/10 (80%) 8/10 (80%) 11/15 (73%) 8/11 (73%) 11/14 (79%) 12/16 (75%) 12/16 (75%)

8.22e14

F IG . 6.2 Rpulsions entre PPD et la phrase par charte

234

PPD.0 Dbut de prop. arg..0 Dbut de prop. arg..1 2076 555 2631

PPD.1 1503 117 1620 3579 672 4251

PPD.0 -8.73 46.52

PPD.1 14.18 -75.54 3.43

2 = 143.94, ddl = 1, p = 3.67e 33 ###

TAB . 6.3 Tri crois dbut de prop. argumentale PPD


Attractions (seuil adapt 0.465%) 12630527b 12630527a 127203 0.639 1 3/11 (27%) 2/10 (20%) 7/38 (18%)

F IG . 6.3 Attractions entre PPD et la proposition argumentale par charte


Rpulsions (seuil adapt 0.465%) 12830213a 12890112 12420502 12710420 12780801 124706 12430709 126505b 0.0999 1 2/35 (5.7%) 2/32 (6.2%) 0/11 (0.0%) 0/11 (0.0%) 1/13 (7.7%) 2/19 (10.5%) 1/11 (9.1%) 2/15 (13.3%)

F IG . 6.4 Rpulsions entre PPD et la proposition argumentale par charte


PPD.0 Dbut de prop. imm..0 Dbut de prop. imm..1 899 1732 2631 PPD.1 1497 123 1620 2396 1855 4251 PPD.0 -229.92 296.98 PPD.1 373.41 -482.32 23.4

= 1380.27, ddl = 1, p = 4.08e 302 ###

TAB . 6.4 Tri crois dbut de prop. immdiate PPD

on construit donc les tableaux de dcomposition des gures 6.3 et 6.4, qui montrent quaucun document ne se distingue particulirement notons cependant que trs peu de chartes attestent sufsamment la construction pour pouvoir tre values. Quant aux propositions en syntaxe immdiate, le tri crois montre galement quelles repoussent la ponctuation initiale (table 6.4). La rpulsion est encore plus forte quau niveau de la proposition argumentale. On observera donc le graphique des rpulsions par rapport aux documents (gure 6.6). On y remarque immdiatement que la structure est bien atteste dans de nombreux textes, mais quaucun deux ne se distingue par une rpulsion particulire du marquage. En n de compte, les tendances gnrales peuvent tre considres comme telles: aucun document ou groupe de documents ne parat dstabiliser lui seul les attractions ou rpulsions du marquage. b. Dpouillements gnraux. Le fait que les tris croiss ci-dessus soient orients diffremment (attraction de PPD.1 pour la phrase et rpulsion pour les autres modalits) est lindice dune diffrence entre les frquences, mais ne suft pas conrmer la si-

235

Attractions (seuil adapt 0.0666%) 12361215 12730512 12800814 12740224 123607 12651113 12760224 12630331 128603 123605 12680301 12700407 124706 127508 123712 12670706 128103 12831226 12890719 12640907 12700510 12630527b 12430709 12630527a 12700606a 12660613 126311 12760610b 2.32e12 1 7/11 (63.6%) 8/20 (40.0%) 5/13 (38.5%) 5/14 (35.7%) 4/10 (40.0%) 7/28 (25.0%) 4/13 (30.8%) 3/13 (23.1%) 3/14 (21.4%) 3/15 (20.0%) 3/19 (15.8%) 2/10 (20.0%) 3/20 (15.0%) 3/21 (14.3%) 2/12 (16.7%) 2/13 (15.4%) 2/13 (15.4%) 2/13 (15.4%) 2/13 (15.4%) 1/14 (7.1%) 2/16 (12.5%) 1/13 (7.7%) 1/12 (8.3%) 1/12 (8.3%) 1/12 (8.3%) 1/11 (9.1%) 2/25 (8.0%) 2/21 (9.5%)

F IG . 6.5 Attractions entre PPD et la proposition immdiate par charte


0 phrase prop. arg. prop. imm. 344 555 1732 2631 1 1380 117 123 1620 1724 672 1855 4251 0 489.91 ### 46.52 ### 296.98 ### 1 795.65 ### 75.54 ### 482.32 ###

2 = 2186.92, ddl = 2, p = 0 ###

TAB . 6.5 Tri crois types de propositions PPD

gnicativit du contraste. Pour ce faire, il est ncessaire de rassembler les trois types de propositions en un seul tri crois. Commenons lanalyse en faisant une tabulation. Les individus en sont les mots en dbut de proposition. Les variables dcrivant ces derniers sont: 1/ le type de construction au dbut de laquelle ils se trouvent; 2/ la prsence ou labsence dune ponctuation initiale. On obtient le tableau de contingence suivant ( gauche dans la table 6.5). Il est absolument clair que la phrase se dmarque fortement des autres structures par une ponctuation beaucoup plus frquente. Le 2 reste extrmement lev pour un tableau deux degrs de libert. Les propositions qui ne sont pas des phrases sont, comme le sens des attractions permet de le voir, caractrises par un rejet important de la ponctuation linitiale: on est dj assur quun 2 opposant la premire ligne aux deux autres serait signicatif un seuil infrieur au millime. La question est prsent de savoir si la ponctuation distingue galement les subordonnes entre elles. ce propos, aucun des tests effectus jusqu prsent napporte la moindre information. Il est lgitime deffectuer plusieurs tests conscutifs sur des sous-tables (Agresti

236

Rpulsions (seuil adapt 0.0666%) 12800720 12780801 12770612 12780406 12711209 12440119 12600509 12680310 12520301a 12800504 12740531a 12760722 12900824 12650415 12710420 12700324 12780404a 12420502 12740531b 12830213a 12710522 12600514 126404 12710318 12750110a 12821222 12890305 12890801 12711222 12710725 12770323 12770504 12781017 12781203 12840212 12840511 12850224 12850704 12870908 12890419 126505b 12530301 12600221a 12601002 12840609 127203 12670828 12701126 12890112 0.202 1 0/36 (0.0%) 0/32 (0.0%) 0/30 (0.0%) 0/29 (0.0%) 0/28 (0.0%) 0/27 (0.0%) 0/23 (0.0%) 0/22 (0.0%) 0/20 (0.0%) 0/20 (0.0%) 0/18 (0.0%) 0/18 (0.0%) 0/18 (0.0%) 0/17 (0.0%) 0/17 (0.0%) 0/16 (0.0%) 0/16 (0.0%) 0/15 (0.0%) 0/15 (0.0%) 3/67 (4.5%) 0/14 (0.0%) 0/13 (0.0%) 0/13 (0.0%) 0/13 (0.0%) 0/13 (0.0%) 0/13 (0.0%) 0/13 (0.0%) 0/12 (0.0%) 1/29 (3.4%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 1/19 (5.3%) 2/33 (6.1%) 0/10 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 3/48 (6.2%) 1/26 (3.8%) 1/20 (5.0%) 3/49 (6.1%)

F IG . 6.6 Rpulsions entre PPD et la proposition immdiate par charte

2002, 8284), en groupant ou en supprimant les lignes et les colonnes de manire respecter les rgles suivantes.7 Comme le prsente Alan Agresti (2002, 84):
1. The df8 for the subtables must sum to df for the full table. Each cell count in the full table must be a cell count in one and only one subtable. 2. Each marginal total of the full table must be a marginal total for one and only one subtable.
7

Ces rgles de dcomposition sont bases sur le rapport de vraisemblance, statistique proche du 2 not G2 , dont la formule (cf. Howell 1998, 179) est (o et e ont la mme signication que dans la formule du 2 (voir note 14, p. 178): G2 = 2 o ln o e (6.1)

Le rapport de vraisemblance calcul sur la table initiale correspond la somme des rapports de vraisemblance de toutes les sous-tables obissant aux critres cits. Cest--dire le nombre de degrs de libert.

237

0 phrase prop. 344 2287 2631

1 1380 240 1620 1724 2527 4251

0 -489.91 334.23

1 795.65 -542.82 38.2

2 = 2159.62, ddl = 1, p = 0 ### Aprs ajustement de idk pour 2 comparaisons: ### (seuils: 0.0253, 0.00501, 5e-04)

TAB . 6.6 Tri crois phrases et autres prop. PPD


0 prop. arg. prop. imm. 555 1732 2287 1 117 123 240 672 1855 2527 0 -4.65 1.68 1 44.31 -16.05 2.97

2 = 65.44, ddl = 1, p = 5.98e 16 ### Aprs ajustement de idk pour 2 comparaisons: ### (seuils: 0.0253, 0.00501, 5e-04)

TAB . 6.7 Tri crois prop. argumentales ou non PPD

En construisant la table de contingence correspondant au contraste que nous venons de relever, on obtient la table 6.6, o la dernire ligne du tri correspond la somme, colonne par colonne, des deux dernires lignes de la table de contingence prcdente. Lcart est extrmement important et le rapport de chances est norme. Nous sommes dans une situation o le contraste est tellement vident quil ne serait pas ncessaire de faire un test pour ladmettre. La simple lecture des documents inviterait nimporte quel lecteur attentif la mme conclusion. Ce test prouve quel point les exceptions la tendance gnrale sont insigniantes. Dautre part, nous pouvons oprer un nouveau test opposant exclusivement les subordonnes entre elles, cest--dire sur la base dun tableau de contingence ne comportant que les deux dernires lignes de la tabulation donne au dbut de cette section (tableau 6.5). La nouvelle table de contingence (table 6.7) montre nouveau une diffrence remarquable, les deux probabilits tant inmes. Les propositions de type argumental sont donc plus frquemment marques. Pour des raisons mathmatiques dont lexpos na pas sa place ici,9 il est prfrable de faire lconomie dun test supplmentaire par rapport aux conditions de dcomposition,10 le test initial a 2 ddl et chacun des deux tests ultrieurs en a un seul (ou bien les comparaisons ne seraient plus indpendantes). On ne peut liminer toutes les propositions qui ne sont pas des phrases et nont pas une fonction argumentale et faire un test sur la nouvelle tabulation. Nanmoins, ses rsultats sont impliqus par ceux des deux tests prcdents. Il ne serait de toute manire pas utile de comparer a posteriori le marquage de la phrase et celui des propositions immdiates: la premire
It might seem more natural to compute G2 for the ( J 1) separate 2 2 tables that pair each column with a particular one, say the last. However, these component statistics are not independent and do not sum to G2 for the full table. This is beyond our scope at this stage but relates to the contrasts of log probabilities that form the log odds ratios for the two tables not being orthogonal. (Agresti 2002, 82). 10 Voir page 237.
9

238

phrase prop. arg. prop. imm.

Densit

0.00

0.02

0.04

0.06

0.08

20

40

60

80

100

100

80

60

40

20

148 prop. imm.

147 prop. arg.

146 phrase

F IG . 6.7 Graphiques des frquences de marquage initial des propositions

tabulation montrait dj que la ligne correspondant ces dernires sopposait au reste du tableau. On peut donc synthtiser les rsultats de lanalyse de la frquence du marquage initial en une srie de conclusions relatives: la phrase a un taux lev de ponctuation initiale, la proposition en syntaxe argumentale a un taux moyen de ponctuation initiale et la proposition en syntaxe immdiate a un taux bas de ponctuation initiale. c. Proportions par document. Une autre manire daborder la question consiste considrer les documents comme des individus dnis par trois variables continues: le pourcentage de phrases marques quils contiennent, le pourcentage de propositions argumentales marques et le pourcentage de propositions immdiates marques en ne conservant que les individus non ambigus. Cette approche nest videmment possible que parce quun grand nombre dindividus sont notre disposition pour chaque charte. La distribution des valeurs de chacune de ces trois variables peut alors tre repr-

239

PRB Kruskal-Wallis Wilcoxon: phrase et p. arg. Wilcoxon: phrase et prop. imm. Wilcoxon: prop. arg. et prop. imm. 8.68e 56 ### 5.19e 36 ### 1.19e 46 ### 5.01e 02 $$$

seuil ajust
### ### $$$

TAB . 6.8 Probabilits de diffrence de marquage initial des propositions

sente sous la forme dune courbe ou dune bote moustache (gure 6.7).11 Les courbes montrent que la ponctuation de la phrase se caractrise par une tendance inverse trs prononce par rapport celle des autres propositions: comme les 2 le montraient, la phrase attire manifestement plus le marquage. Par contre, les courbes concernant les propositions subordonnes dcroissent dans la mme direction. Le fait que les encoches des botes correspondantes se recouvrent indique que si lon considre les taux de chaque charte, la diffrence entre les subordonnes sestompe. Nanmoins, la dispersion des donnes autour des mdianes est diffrente: les botes montrent des propositions immdiates ne dpassant 30% de marquage initial que dans des cas exceptionnels, alors que les pourcentages sont rpartis de manire beaucoup plus lche dans le cas des propositions argumentales; les courbes de densit sont tout aussi limpides. Il est possible de calculer les probabilits de labsence de diffrence (H0 ) entre les mdianes des trois distributions laide de tests non paramtriques qui nimposent pas que les distributions aient une forme particulire (Howell 1998, ch. 18). Malheureusement, le test de Wilcoxon12 ne suft plus valuer H0 en prsence de plus de deux chantillons. On utilise alors le test de Kruskal-Wallis (Howell 1998, 740741), dont H1 stipule quau moins un des chantillons a une mdiane diffrente des autres. On effectue ensuite un test a posteriori en comparant les chantillons deux deux test de Wilcoxon ajust par la correction de idk (Abdi 2007). Les statistiques calcules conrment tout fait ce que lexamen des encoches pouvait nous apprendre (table 6.8).13 Les mdianes des proportions de marquage des deux types de subordonnes ne sont pas signicativement diffrentes. La probabilit non modie par lajustement de idk tait dj la limite de la signicativit. Cela pourrait signier que la diffrence observe dans les 2 est en ralit caractristique de quelques documents comprenant un grand nombre des constructions, alors que la situation de chaque charte prise isolment est beaucoup plus oue. Les conclusions sont donc diffrentes suivant quon envisage tous les documents comme sils constituaient un seul texte ou quon prserve leur individualit. De manire gnrale, il y a un cart trs net entre les frquences de marquage des trois types de propositions, mais le contraste entre les subordonnes est certainement caractristique dun nombre limit de documents. Si lon considre tous les documents comme participant la construction du mme texte, on perd compltement cette particularit.
11 Voir les dpouillements en annexe: 6.1.1.1.c.proportions-phrase, 6.1.1.1.c.proportions-

proparg et 6.1.1.1.c.proportions-propimm.
12 Dj employ ci-dessus (5.3.3.1). 13 Bien entendu, le test de Kruskal-Wallis ne doit pas tre ajust, puisquil porte sur lensemble

des chantillons.

240

PPF.0 Fin de phrase.0 Fin de phrase.1 568 191 759

PPF.1 553 753 1306 1121 944 2065

PPF.0 59.04 -70.11

PPF.1 -34.31 40.75 4.05

2 = 202.91, ddl = 1, p = 4.85e 46 ###

TAB . 6.9 Tri crois n de phrase PPF


Attractions (seuil adapt 0.171%) 127203 12830213a 126505b 126505a 12760610b 12890305 12890112 12700510 12660613 12710522 12630331 12650704 12700324 12711209 12711222 12800504 12890719 12780406 12770612 12670828 0.00305 1 38/38 (100%) 22/23 (96%) 18/19 (95%) 11/11 (100%) 11/11 (100%) 11/11 (100%) 17/18 (94%) 10/10 (100%) 13/14 (93%) 12/13 (92%) 11/12 (92%) 10/11 (91%) 10/11 (91%) 9/10 (90%) 9/10 (90%) 9/10 (90%) 9/10 (90%) 8/10 (80%) 12/14 (86%) 14/17 (82%)

F IG . 6.8 Attractions entre PPF et la phrase par charte

6.1.1.2

Frquence du marquage nal

La mme procdure sapplique sans encombre la ponctuation nale. Appliquons ainsi les mmes 2 sur lensemble des individus retenus, en considrant la n des structures, ainsi que la prsence ou non dun ponctogramme leur suite. Les effectifs sont beaucoup plus faibles que ceux qui taient mobiliss pour la ponctuation initiale. Un grand nombre dindividus ont en effet d tre retirs du fait quils cumulaient plusieurs positions.14 a. Tendances par document. Vrions tout dabord globalement lassociation entre la position la nale dune phrase et le marquage (table 6.9). Lattraction est assure, mais on voit quelle est moins forte que pour PPD. Un seul document se dmarque de lensemble par une ponctuation remarquablement rgulire (gures 6.8 et 6.9). Notons quen raison du retranchement de nombreuses structures pour viter de considrer les propositions sachevant au mme endroit, peu de chartes rassemblent sufsamment de donnes pour tre testes. Retirer les phrases de ce document de lchantillon ne change pas la tendance gnrale, comme en tmoigne la table 6.10. De mme, le lien entre PPF et les propositions de fonction argumentale peut tre test laide du tri de la table 6.11, qui laisse voir que

14 Les structures ignores cause de la rcursivit sont numres dans lannexe dep-

6.1.1.2.removed-PPF.

241

Rpulsions (seuil adapt 0.171%) 12781017 12831226 12680310 12440119 12701126 12520301a 124706 12600530b 12600509 12780801 3.28e09 1 0/10 (0%) 4/11 (36%) 8/17 (47%) 9/18 (50%) 10/14 (71%) 7/10 (70%) 15/20 (75%) 10/13 (77%) 9/12 (75%) 9/12 (75%)

F IG . 6.9 Rpulsions entre PPF et la phrase par charte


PPF.0 Fin de phrase.0 Fin de phrase.1 562 191 753
2

PPF.1 523 715 1238 1085 906 1991

PPF.0 56.04 -67.12

PPF.1 -34.09 40.82 4.02

= 196.77, ddl = 1, p = 1.06e 44 ###

TAB . 6.10 Tri crois n de phrase PPF, (sans le document 1272-03)


PPF.0 Fin de prop. arg..0 Fin de prop. arg..1 684 75 759 PPF.1 1182 124 1306 1866 199 2065 PPF.0 -0.01 0.05 PPF.1 0 -0.03 1.05

2 = 0.04, ddl = 1, p = 0.834 $$$

TAB . 6.11 Tri crois n de prop. argumentale PPF


PPF.0 Fin de prop. imm..0 Fin de prop. imm..1 266 493 759 PPF.1 877 429 1306 1143 922 2065 PPF.0 -56.54 70.09 PPF.1 32.86 -40.73 3.79

= 198.91, ddl = 1, p = 3.61e 45 ###

TAB . 6.12 Tri crois n de prop. immdiate PPF

la tendance ne peut tre dtermine avec certitude. Peu soumise aux extrmes, cette absence de tendance ne peut tre impute un seul document.15 Le mme test effectu sur les propositions immdiates donne voir une tendance la rpulsion, nette cette fois, entre cette structure et le marquage nal (table 6.12). Le petit tableau dcomposant les carts par document ne nous apprend pas grand-chose, nous lavons report en annexe.16 b. Dpouillements gnraux. En croisant le type de structure la prsence de la ponctuation nale, on obtient les rsultats de la table 6.13. Une opposition est apparente
15 Voir lannexe 6.1.1.2.table-propargRBxPPF-all, o lon voit que la construction ne compte

gnralement pas assez dattestations par document pour que lcart puisse tre test.
16 Voir 6.1.1.2.gure-propimmxPPF.

242

0 phrase prop. arg. prop. imm. 191 75 493 759

1 753 124 429 1306 944 199 922 2065

0 70.11 ### 0.05 $$$ 70.09 ###

1 40.75 ### 0.03 $$$ 40.73 ###

2 = 221.75, ddl = 2, p = 7.03e 49 ###

TAB . 6.13 Tri crois types de propositions PPF


0 phrase autre proposition 191 568 759 1 753 553 1306 944 1121 2065 0 -70.11 59.04 1 40.75 -34.31 4.05

= 202.91, ddl = 1, p = 4.85e 46 ### Aprs ajustement de idk pour 2 comparaisons: ### (seuils: 0.0253, 0.00501, 5e-04)

TAB . 6.14 Tri crois phrases et autre proposition PPF


0 prop. arg. prop. imm. 75 493 568
2

1 124 429 553 199 922 1121

0 -6.62 1.43

1 6.8 -1.47 1.9

= 15.68, ddl = 1, p = 7.48e 05 ### Aprs ajustement de idk pour 2 comparaisons: ### (seuils: 0.0253, 0.00501, 5e-04)

TAB . 6.15 Tri crois propositions argumentales ou non PPF

entre le marquage de la phrase et celui des autres propositions, dont les contributions sont assez proches, alors que la direction de lcart est oppose. Les contributions de la deuxime ligne sont annules par la prsence de ces deux scores antagonistes. La table rduite (6.14, qui groupe donc les lignes en fonction de lorientation de lcart) oppose nouveau les phrases aux subordonnes. Il ny a pas vraiment de surprise, mais on voit que le rapport de chances est beaucoup plus petit quil ne ltait dans le rapport ci-dessus, entre le marquage des propositions et le marquage initial (tableau 6.4). Pour complter ce tableau, il faut examiner la manire dont les propositions argumentales sopposent aux propositions immdiates (table 6.15). La diffrence entre les deux types de subordonnes merge de ce test, qui nous montre un cart toujours signicatif entre les frquences. Lajustement de idk ninvalide pas le rsultat. En consquence, la gradation de la frquence de ponctuation nale est donc similaire celle de la ponctuation initiale, mais moins prononce. Exprimes relativement, les tendances de marquage sont: les phrases sopposent aux subordonnes et les deux types de subordonnes sont distincts. c. Proportions par document. Considrons, comme nous lavons fait pour la ponctuation initiale, les documents comme des individus dnis par trois variables continues (pourcentage de phrases marques la nale, pourcentage de propositions argumentales et pourcentage de propositions immdiates).

243

phrase p. arg. p. imm.

Densit

0.005

0.015

20

40

60

80

100

100

80

60

40

20

147 p. imm.

67 p. arg.

144 phrase

F IG . 6.10 Graphiques des frquence de marquage nal des propositions

Les courbes et botes moustaches se rapportant ces distributions sont visibles dans la gure 6.10.17 Les renseignements que les graphiques fournissent propos des propositions argumentales sont particulirement intressants. La courbe comporte deux modes (sommets), localiss 0 et un peu moins de 100%. La prsence de deux modes signie gnralement que la distribution tudie rassemble deux chantillons issus de populations distinctes. En loccurrence, certaines chartes ont tendance marquer toutes les propositions argumentales, alors que dautres nen marquent aucune. La dispersion des frquences est de ce fait trs large, ce qui est particulirement visible quand on regarde la bote centrale du graphique au bas de la gure 6.10. Les tests de Kruskal-Wallis et les tests a posteriori ajusts donnent des rsultats concordant aux conclusions amenes par les graphiques (table 6.16). Il y a donc bien au moins une diffrence signicative entre les trois distributions: celle qui oppose
17 Voir les dpouillements 6.1.1.2.c.proportions-phrase, 6.1.1.2.c.proportions-proparg et

6.1.1.2.c.proportions-propimm en annexe.

244

PRB Kruskal-Wallis Wilcoxon: phrase et p. arg. Wilcoxon: phrase et p. imm. Wilcoxon: p. arg. et p. imm. 1.69e 14 ### 3.85e 02 $$# 1.56e 17 ### 2.77e 02 $$#

seuil ajust
$$$ ### $$$

TAB . 6.16 Probabilits de diffrence de marquage nal des propositions

les phrases aux propositions personnelles immdiates. Les autres contrastes sont trop peu marqus pour tre exploitables: mme sans ajustement, ils sont beaucoup moins signicatifs (phrase vs p. arg. est dailleurs la limite du seuil de 5%). d. Deux populations. Lhtrognit de la distribution bimodale invite relativiser les rsulats ne permettant pas de rejeter H0 : puisquil y a probablement deux populations mles, la solution raisonnable consisterait les considrer comme disjointes. Divisons lchantillon en quatre sous-chantillons, en fonction de la proportion de marquage des subordonnes argumentales: 0%, 100%, entre 0% et 100% (non inclu, cet intervalle se note ]0; 100%[) et un dernier groupe comprenant les chartes dont aucune proposition argumentale na pu tre retenue (NA). En effet, nous navons pas la possibilit dexpliquer par une autre variable la diffrence entre les chartes des deux populations. De ce fait, tous les pourcentages intermdiaires posent problme. De mme, les chartes dont nous navons pas pu retirer la moindre proposition personnelle argumentale font partie de lchantillon total, mais nentrent videmment dans aucune catgorie; la donne est considre comme manquante. En ralit, la situation est difcile valuer, parce que les effectifs des constructions diffrentes des phrases sont souvent limits quelques units, voire une seule par charte.18 On peut cependant garder la rpartition en quatre groupes comme hypothse de travail. Si lon construit donc les botes moustaches correspondant dune part au pourcentage de marquage des phrases dans les chartes de chacun des groupes, dautre part au marquage des propositions immdiates, on obtient les graphiques de la 246 (les donnes manquantes sont spares des autres par une ligne verticale). Observons les graphiques avant deffectuer le moindre test. De manire gnrale dans les deux ensembles, les mdianes laissent apparatre une gradation: plus le pourcentage de marquage des propositions argumentales augmente, plus la mdiane se rapproche de 100%. Le groupe NA prsente toujours une dispersion qui couvre toutes les valeurs. Si lon regarde les encoches, pour les phrases, le groupe NA nest distinct que du groupe 100%. En nanalysant que les documents des groupes associs un pourcentage, on voit que seul le groupe 0% se distingue bien des deux autres. La situation est similaire pour les propositions immdiates, mais le groupe 0% semble distinct du groupe intermdiaire. Les calculs de probabilits (test de Kruskal-Wallis et tests de Wilcoxon non pairs ajusts) correspondent tout fait au graphique 6.11 pour ce qui est de la phrase, comme on le voit dans la table 6.17. On constate en outre que les ajustements de idk ne modient pas excessivement la signicativit des tests.
18 Voir les dpouillements complets en annexe: dep-6.1.1.2.proparg-PPF.

245

Frquence de marquage des phrases

20

40

60

80

100

81

20

17

30

NA

0%

]0,100%[

100%

Frquence de marquage des p. arg.

Frquence de marquage des p. imm.

20

40

60

80

100

81

20

17

30

NA

0%

]0,100%[

100%

Frquence de marquage des p. arg.

F IG . 6.11 Graphiques des frquences de marquage nal de la phrase (haut) et de la p. imm. (bas) par rapport p. arg.

246

PRB Kruskal-Wallis Wilcoxon: 0% et ]0,100%[ Wilcoxon: 0% et 100% Wilcoxon: ]0,100%[ et 100% Wilcoxon: NA et 0% Wilcoxon: NA et 100% Wilcoxon: NA et ]0,100%[ 0.00286 $## 0.01035 $$# 0.00100 $## 0.60992 $$$ 0.57453 $$$ 0.00442 $## 0.05692 $$$

PRB ajuste
$$$ $## $$$ $$$ $$# $$$

TAB . 6.17 Probabilits de diffrence de frquence de marquage nal de la phrase par rapport p. arg.
PRB Kruskal-Wallis Wilcoxon: 0% et ]0,100%[ Wilcoxon: 0% et 100% Wilcoxon: ]0,100%[ et 100% Wilcoxon: NA et 0% Wilcoxon: NA et 100% Wilcoxon: NA et ]0,100%[ 6.88e 04 ### 2.85e 02 $$# 7.48e 05 ### 5.86e 02 $$$ 1.84e 02 $$# 6.58e 03 $## 9.55e 01 $$$ PRB ajuste
$$$ ### $$$ $$$ $$# $$$

TAB . 6.18 Frquence de marquage nal de la p. imm. par rapport p. arg.: statistiques

Les mmes tests appliqus aux frquences de marquage des propositions immdiates donnent la table 6.18. Lajustement oblige rejeter les distinctions entre NA et 0% (cela est visible dans la gure p. 246 si lon observe les encoches des botes), ainsi quentre 0% et ]0, 100%[. Les chartes qui marquent toujours les p. arg. ont une nette tendance marquer dautant plus les phrases et les p. imm. On retiendra que le contraste fondamental oppose nettement les groupes 0% et 100%. Le fait que la subdivision en quatre classes mne la constatation de ce contraste, parfaitement cohrent, est un srieux argument en faveur de la distinction relle entre les chartes qui marquent et celles qui ne marquent pas les propositions argumentales. Bien entendu, la non-signicativit des contrastes (en particulier avec des tests non paramtriques et des ajustements svres19 ) ne signie pas pour autant que ces contrastes nexistent pas il subsiste un risque de commettre lerreur , mais le fait quils soient nettement moins importants permet tout de mme de leur reconnatre une position intermdiaire. Ainsi, le groupe des NA et celui des ]0, 100%[ se trouvent mi-chemin entre les deux autres, ce qui conrme lintuition selon laquelle il fallait distinguer deux populations. En gnralisant ces dernires conclusions, il semblerait donc quil existe une cohrence interne chaque charte, qui fait que les tendances de ponctuation sont, pour les propositions au moins, orientes dans le mme sens. 6.1.1.3 Synthse de lanalyse sur la ponctuation de la phrase

Que retenir de cet examen? Les diffrents tests ont men la conclusion que les phrases taient toujours beaucoup plus marques que les subordonnes.

19 Voir note 45.

247

a. Cohrence travers le corpus. Trois tendances ont pu tre dceles, en fonction de la structure implique. Les phrases sont les units les plus stables et lattraction quelles manifestent vis--vis du marquage semble rpandue dans presque tout le corpus. Linverse est vrai de la part des propositions immdiates, qui rejette au contraire fortement la prsence de ponctuation, en particulier linitiale. Par ailleurs, les derniers tests effectus sur les proportions de marquage nal par document ont montr que non seulement les propositions de fonction argumentale ne sont pas ncessairement toujours moins marques que les phrases, mais surtout que leur marquage se fait de manire diffrente suivant le document dans lequel on les rencontre. La prsence de ponctuation est dautre part visiblement lie au reste des tendances concernant les autres propositions, puisque la proportion de phrases et de subordonnes de fonction immdiate marques augmente avec celle des subordonnes argumentales. Cela a dimportantes consquences sur la manire dont nous devrions, lavenir, considrer llaboration du corpus: pour classer les documents et tenter dexpliquer cette variation, il serait ncessaire davoir notre disposition un ensemble de variables supplmentaires, dnissant les documents de manire plus externe. Il est possible quon puisse dcrire les chartes manes de certaines autorits ou datant dune certaine poque comme tant plus ou moins marques que la moyenne. Malheureusement, cette dmarche nest pas possible lheure actuelle, o le corpus exploitable est encore bien maigre. b. La phrase comme unit de lecture. Quoi quil arrive, la phrase est toujours nettement distingue des autres propositions par le fait quelle attire plus systmatiquement un ponctogramme chacune de ses bornes. Cette observation est extrmement importante: elle montre que lunit phrase, telle que nous lavons dnie empiriquement et telle que lont conue intuitivement les philologues jusqu prsent, constituait rellement une unit de lecture pour les scribes. Ces derniers ressentaient le besoin den marquer le dbut et la n plus souvent quils ne marquaient les limites des propositions nayant pas le statut dnonc. Au del de la signicativit de la diffrence, lintensit montre quel point elle tait prsente: nous avons remarqu que les rapports de chances, notamment ceux impliqus dans ltude de PPD (6.1.1.1), taient normes. La distinction entre les diffrents types de subordonnes est plus oue. Ltude rpond donc une question fondamentale laquelle les premiers travaux sur la ponctuation mdivale avaient men:
[Selon Hlne Nas 1979, dans le ms. B de la Conqueste de Constantinople, l]a ponctuation na pas de caractre grammatical, elle vise plutt mettre en valeur les qualits esthtiques des pages et souligner les lments intressants du texte (les sous-titres tant absents), de sorte quil est difcile de reprer les lments initiaux de la phrase ce qui pose la question de savoir quelle ralit correspond la notion de phrase en ancien franais. (Gruaz 1980, 9, nous soulignons).

Comment les scribes mdivaux concevaient-ils la phrase dun point de vue morphosyntaxique? Au regard de ce que la ponctuation des chartes peut nous apprendre, il y a tout lieu de croire que leurs conceptions ne diffraient pas grandement des ntres. c. Proportions expliques. Il est ds lors utile dexaminer les tendances sous un autre angle, en observant non plus les mots, mais les positions entre les mots. Ces positions sont alors considres comme des individus et permettent de ne plus distinguer 248

P.0 Phrase.0 Phrase.1 57615 420 58035

P.1 4572 1462 6034 62187 1882 64069

P.0 29.3 -968.23

P.1 -281.83 9312.43 43.9

2 = 10583.54, ddl = 1, p = 0 ###

TAB . 6.19 Proportions de marquage expliqu par la ponctuation de la phrase


FAB 0 1 57615 420 58035 FRE 99.28 0.72 100
0 1

10000

20000

30000

40000

50000

TAB . 6.20 Tri plat de la position (limite de phrase ou non) pour les positions non ponctues
FAB 0 1 4572 1462 6034 FRE 75.77 24.23 100
0 1

1000

2000

3000

4000

TAB . 6.21 Tri plat de la position (limite de phrase ou non) pour les positions ponctues

la ponctuation initiale de la ponctuation nale. Chaque individu est dni par deux variables aux modalits dichotomiques: la premire variable spcie si la position est remplie par un ponctogramme ou non; la valeur de la deuxime variable rpond la question: Cette position correspond-elle la limite dune phrase?. En rpondant ces questions pour toutes les positions entre les mots, on construit la table de contingence 6.19. Il est peine ncessaire de commenter le rapport de chances. La valeur de ce dernier est si leve quelle autorise extrapoler: non seulement le lecteur habitu parcourir des chartes sait que les phrases sont plus frquemment marques que les autres propositions, mais, en plus, il sattend ce que la plupart, sinon toutes les phrases quil rencontrera soient dlimites clairement par lemploi de la ponctuation. Observons prsent sparment les deux colonnes du tableau de contingence au travers des tris plats correspondants. La premire colonne (table 6.21), qui reprend les positions non marques, montre que la proportion de phrases est effectivement inme. La deuxime colonne (table 6.20) indique que la description de la ponctuation mdivale ne pourrait se limiter la dnition de la seule tendance selon laquelle la phrase attire le marquage. Les limites des phrases expliquent un peu moins du quart des ponctogrammes. d. Relation avec dautres tendances. Dautre part, il y a lieu de remarquer que le rejet qui caractrise lassociation entre MF.Rl et PPD.1 trouve ici une illustration concrte: les subordonnes commencent en effet presque toujours par un relateur lexception des cas de parataxe et des incidentes, que nous traiterons plus loin (6.1.4.1). Les relateurs seront tudis de manire dtaille ci-dessous (6.3).

249

FAB 0 1 7547 190 7737

FRE 97.54 2.46 100


0 1

1000

2000

3000

4000

5000

6000

7000

TAB . 6.22 Tri plat de PPD pour les prdicats non initiaux

6.1.2

Prdicat

Les tris croiss gnraux nous ont appris que les prdicats rejetaient massivement le marquage, moins quils ne se trouvent en position initiale ou nale (5.3.3.3 b). Nous allons tudier la ponctuation initiale (6.1.2.1) et la ponctuation nale (6.1.2.2) des prdicats qui ne se trouvent pas aux bornes des structures dans lesquelles ils sont intgrs. Nous verrons ensuite le cas particulier du lien entre PPD.1 et les prdicats qui sont les premiers consituants de subordonnes de mode non personnel (1,0,P0,0,0 avec MI.pers, 6.1.2.3). 6.1.2.1 P0 et PPD de manire gnrale

Si nous slectionnons tous les prdicats qui ne gurent pas en position initiale du constituant qui les contient et que nous faisons le tri plat de la variable PPD pour ces individus, nous obtenons la table 6.22, qui manifeste clairement la consquence de la rpulsion du marquage initial: la proportion de constituants marqus est minime. a. Tendances par document. Employons nouveau le mme procd que ci-dessus (6.1.1.1 a) pour vrier si la tendance la rpulsion, que nous avons observe en considrant que tous les documents taient identiques, nest pas caractristique dune ou plusieurs chartes particulires. Dans un premier temps, seul le graphique des rpulsions nous retiendra: cest en effet une tendance ne pas marquer le prdicat que nous avons pu souligner ci-dessus. Si celle-ci est caractristique dun petit ensemble de chartes, il se pourrait bien que la tendance gnrale observe soit en ralit limite ce nombre restreint. Or, il nen est rien: aucun document ne repousse signicativement les ponctogrammes devant P0, comme lindique la gure 6.13. Il faut noter que ce procd vise rvler labsence de lien signicatif, cest--dire H0 . Or, comme on la vu plus haut en exposant les concepts de base de la description et de linfrence statistiques, il nest pas lgitime dessayer de prouver lhypothse nulle (4.1.3.1). Il importe donc de bien se rendre compte que ces tests, dans la mesure o ils ne mettent pas en vidence dassociations entre les documents et le (non-)marquage, ne prouvent pas labsence dattraction ou de rpulsion, mais se contentent de dire que les carts observs ne sufsent pas se persuader de leur prsence. Dans un cas comme celui-l, on peut adopter la position pragmatique suivante: jusqu preuve du contraire, tant donn que rien ne prouve quil y ait une association, nous estimerons quelle nexiste pas. b. Examen du contexte immdiat: tri gnral. prsent que nous avons admis que la tendance rejeter PPD.1 est commune lensemble des chartes, interrogeons-nous sur lenvironnement de P0. Si le rejet est en effet une tendance bien nette, il nen est pas pour autant une tendance absolue. Il souffre donc des exceptions. Peut-on remarquer que ces exceptions sont lies un type de constituant particulier prcdant le prdicat?

250

Attractions (seuil adapt 0.0351%)

123712 12830213b 127203 12800814 128103 12370916 12700510 124109 12680301 12870908 12600203 128802b 126311 12651113 127508 12890719 123607 12710707a 12890419 12820303 12630331 12770701 12890112 12900824 12630527a 12770519 12590116 12700407 12710522 12810303 12770323 128802a 12740224 12830502 12810606 12860515 12490625 12711203a 12820201a 126505a 12711203b 12740906 12750110b 12430815 12860323 128710 12710917 12740630 12710420 127312 12750110a 12670828 12740531b 12601002 12870624 128603 12600221b 12680325 126404 124706 12630527b 12890305 12700606a 12671029

6/47 (12.8%) 4/33 (12.1%) 12/205 (5.9%) 4/35 (11.4%) 4/37 (10.8%) 3/23 (13.0%) 5/76 (6.6%) 3/36 (8.3%) 4/65 (6.2%) 3/41 (7.3%) 2/20 (10.0%) 3/44 (6.8%) 5/104 (4.8%) 4/78 (5.1%) 4/82 (4.9%) 3/55 (5.5%) 2/28 (7.1%) 2/28 (7.1%) 3/61 (4.9%) 2/34 (5.9%) 3/66 (4.5%) 2/35 (5.7%) 7/203 (3.4%) 3/68 (4.4%) 3/74 (4.1%) 2/41 (4.9%) 1/40 (2.5%) 1/40 (2.5%) 3/75 (4.0%) 1/39 (2.6%) 2/42 (4.8%) 2/42 (4.8%) 1/38 (2.6%) 1/38 (2.6%) 1/37 (2.7%) 1/37 (2.7%) 1/36 (2.8%) 1/36 (2.8%) 1/36 (2.8%) 2/44 (4.5%) 1/35 (2.9%) 1/35 (2.9%) 1/35 (2.9%) 1/12 (8.3%) 1/34 (2.9%) 1/34 (2.9%) 1/33 (3.0%) 1/32 (3.1%) 2/79 (2.5%) 2/48 (4.2%) 2/48 (4.2%) 4/123 (3.3%) 2/75 (2.7%) 1/28 (3.6%) 1/28 (3.6%) 2/51 (3.9%) 1/27 (3.7%) 1/27 (3.7%) 2/52 (3.8%) 3/92 (3.3%) 2/64 (3.1%) 2/64 (3.1%) 2/60 (3.3%) 1/21 (4.8%)

3.99e05

F IG . 6.12 Attractions entre PPD et le prdicat par document

251

Rpulsions (seuil adapt 0.0351%) 12830213a 12780801 12740531a 12760610b 12520301a 12800504 12600509 12800720 12600221a 12730512 12640907 12650415 12780406 12420502 123605 12831226 12430709 12700416 12821222 126305 12680802a 12680310 12700929 12840609 12890801 12781203 12840212 12850224 12630527c 12600530b 12650704 12701126 12760224 12680802b 12670706 12361215 12760916 12800505 12850704 12890405 12711222 12720622 126505b 12670323 12800809 12760722 12700606b 12840511 12760610a 12600514 12630715 12710318 12660613 12600530a 12671022 12710707b 12710725 12711209 12781017 12371012 12530301 12690223 12770612 12700324 12630719 12680531 12720708 12780404a 12520301b 12641129 12750527 12841004 12711203c 12830221 12770504 12440119 12630720 12680802c 12790310 12850721 12550521 12600609 0.0718 1 2/292 (0.68%) 0/135 (0.00%) 0/77 (0.00%) 0/76 (0.00%) 0/73 (0.00%) 0/71 (0.00%) 0/70 (0.00%) 1/126 (0.79%) 0/68 (0.00%) 0/68 (0.00%) 0/63 (0.00%) 0/62 (0.00%) 1/116 (0.86%) 0/60 (0.00%) 0/54 (0.00%) 0/51 (0.00%) 0/50 (0.00%) 0/48 (0.00%) 0/48 (0.00%) 0/45 (0.00%) 0/44 (0.00%) 1/95 (1.05%) 0/42 (0.00%) 0/41 (0.00%) 0/41 (0.00%) 1/41 (2.44%) 1/41 (2.44%) 1/41 (2.44%) 0/40 (0.00%) 0/39 (0.00%) 0/39 (0.00%) 1/87 (1.15%) 1/43 (2.33%) 1/44 (2.27%) 1/45 (2.22%) 0/34 (0.00%) 0/33 (0.00%) 0/32 (0.00%) 0/32 (0.00%) 0/32 (0.00%) 1/78 (1.28%) 1/48 (2.08%) 3/165 (1.82%) 0/30 (0.00%) 1/49 (2.04%) 1/76 (1.32%) 0/29 (0.00%) 1/50 (2.00%) 0/28 (0.00%) 1/51 (1.96%) 1/51 (1.96%) 1/51 (1.96%) 1/73 (1.37%) 0/27 (0.00%) 0/27 (0.00%) 0/27 (0.00%) 1/52 (1.92%) 2/90 (2.22%) 1/53 (1.89%) 0/26 (0.00%) 0/26 (0.00%) 0/16 (0.00%) 2/112 (1.79%) 1/69 (1.45%) 0/25 (0.00%) 0/25 (0.00%) 0/25 (0.00%) 1/55 (1.82%) 0/17 (0.00%) 0/24 (0.00%) 0/18 (0.00%) 0/18 (0.00%) 0/23 (0.00%) 0/23 (0.00%) 1/57 (1.75%) 2/107 (1.87%) 0/22 (0.00%) 0/22 (0.00%) 0/22 (0.00%) 0/22 (0.00%) 0/20 (0.00%) 0/20 (0.00%)

F IG . 6.13 Rpulsions entre PPD et le prdicat par document

252

Attractions (seuil adapt 0.205%) 0,0,C5,0,1 0,0,S1,0,0 1,0,C5,0,1 1,0,A4,0,0 0,0,R3,0,1 0,0,R2,0,0 1,0,A4,pers,1 0,0,A4,0,0 2.24e42 1 38/235 (16.2%) 69/1575 (4.4%) 5/32 (15.6%) 4/23 (17.4%) 2/13 (15.4%) 16/486 (3.3%) 2/34 (5.9%) 2/75 (2.7%)

F IG . 6.14 Attractions entre PPD et le prdicat par construction prcdente


Rpulsions (seuil adapt 0.205%) 1,0,C5,0,0 0,0,P0,0,0 1,0,S1,0,0 1,0,Rl,0,0 0,0,Co,0,0 0,0,R3,0,0 1,0,C6,0,0 0,0,C6,0,0 0,0,A4,0,1 1,0,R3,0,0 1,0,P0,0,0 0,0,Rl,0,0 0,0,C5,0,0 0,0,R2,pers,0 0,0,A4,pers,1 1,0,A4,0,1 1,0,R2,0,0 2.02e07 1 4/1240 (0.32%) 6/778 (0.77%) 4/640 (0.62%) 0/374 (0.00%) 0/351 (0.00%) 0/176 (0.00%) 0/138 (0.00%) 0/124 (0.00%) 0/110 (0.00%) 0/10 (0.00%) 0/11 (0.00%) 0/35 (0.00%) 17/767 (2.22%) 0/17 (0.00%) 0/18 (0.00%) 0/23 (0.00%) 2/105 (1.90%)

F IG . 6.15 Rpulsions entre PPD et le prdicat par construction prcdente

En croisant les deux variables (PPD et MMP) pour le premier chantillon,20 nous pouvons dcomposer le tableau de contingence (gures 6.14 et 6.15). c. Examen du contexte immdiat: attractions. En observant les attractions, nous essayons de reprer quels environnements permettent la ponctuation dapparatre malgr la rpulsion manifeste entre PPD.1 et la fonction P0. Ce sont essentiellement les circonstants relats de nature non propositionnelle qui se dmarquent. On peut citer, en guise dexemples:21
/ et a la requete mon egnor jehan [19] deuant dt / auon no m notre seel auuec le en seel a ce preente lettre (Document 126404, 18). / et tel hyretage por ces j mus et tel cens ke dt et / reportat johans deuant ds en [14] mans de maors deuant d (Document 12711209, 13). je wel ke de plu aparlle meules com trouera entour m oent pae lescoutenge de me epulture (Document 127203, 2).

Dans ces cas, les constituants formant le contexte direct du prdicat font partie de ceux pour lesquels nous avions repr une tendance au marquage nal dans le chapitre prcdent (5.3.3.3). Nous y reviendrons quand nous traiterons les circonstants (6.1.4).
20 Voir la table de contingence en annexe, 6.1.2.1.table-P0-MMPxPPD. 21 Le P0 est soulign. Voir le relev complet dep-6.1.2.1.P0-PPD. On y voit que ces constituants

C5, sils ne sont pas initiaux, se rencontrent immdiatement aprs un C6.

253

Les autres types de constituants prcdant P0 sont moins faciles commenter. Ainsi, les formes de 0,0,S1,0,0 sont assez htroclites et inattendues,22 tant donn que ce type de constituant est cens rejeter massivement le marquage nal. Malgr les difcults quon prouve y reprer quelque rgularit, on trouve nanmoins la formule _qui le vesture/lafaitement/. . . st_ atteste quinze fois mais on ne peut faire autre chose que simplement relever le phnomne:
la quele conanche johans condt delle roe ctans [13] de lege k lafaton en ft mt ens elle warde des homes delle che deu k [14] la furent preens (Document 12810606, 12).

Par ailleurs, le S1 contient une subordonne qui sachve en sa n dans de nombreux cas; par exemple:
conute [2] choe ot achacun et atos / que damoelle sblle flhe mon angnor leone uelle k a fut / vnt par deuant [3] no et par deuant le homme dele chee deu cheualr deny / entre ante mare et ant lambert (Document 12600514, 1). cl k [13] pour lun v pour eaus deus et et a auor ke e l do preudome deuant dt / v enuoe au our de le taxaton fare par lokon deuant dte / precent [14] vn eroent prs v terch pour ce kl ne e porroent acorder / l ds et le taxatons des deus de ces tros erot tenus (Document 12630527b, 12).

Le seul moyen de traiter efcacement ces attestations serait de prendre en considration tous les niveaux dintgration syntaxique pour vrier si ce dtail vaut la peine dtre pris en compte. Comme nous lavons dj dit, la dmarche nest pas envisageable (4.2.3). Les A4 simples initiaux sont peu nombreux, ce qui nous donne la possibilit de les numrer:
[. . .] foemen de toute le choe deeure ecrte fach ou mon gneur ehan de hodege [. . .] et mon gneur ernol de begenler [. . .] (Document 127203, 43).

la ou cs ugement fut fas et rendus pardeuant [22] nos furent notre uor uret et ugeor [. . .] (Document 12651113, 21). [22] la ov cte reconanche fut fate et cs recors fut [. . .] radeles dle (Document 12750110, 22). la ov totes ces choes deorecrtes furent fates / furent homes de le ce deu (Document 12740531a, 23).

Il est remarquable que ces constituants soient du type _la ou ces choses furent faites_ dans trois cas sur quatre. Or, pour avoir acquis lhabitude de parcourir des chartes de lpoque, nous savons que la structure en question tout comme la formule releve pour S1 fait partie du style formulaire des documents. Il est videmment impossible de dpasser la simple constatation, mais nous verrons que ce type de correspondance ventuelle entre une formule et la ponctuation nest pas limit aux alentours de P0 (par exemple, 6.1.3.9).
22 Voir le dpouillement complet dep-6.1.2.1.P0-MMP00S100-PPD.

254

Les autres attractions dans le contexte immdiat MMP.0,0,R3,0,1 natteignent pas le seuil corrig et ne nous apprennent pas grand-chose:
y / auons en donrs contes nos faons auor atous ke nos a damme agnes hubne de ho reches / quaranteset ma rs [4] delegos (Document 128802b, 3). [. . .] par la ctet [6] que l ban dure a tote lae perones prendra om vn ecot par proudome por cete dette paer et [7] antr (Document 12600203, 5).

d. Examen du contexte immdiat: rpulsions. Quant au rejet du marquage, il sagit de la tendance la plus rgulire, mais un certain nombre de constituants lui sont particulirement lis. Seuls les C5 non relats initiaux sopposent signicativement au marquage. Cela ne concerne en fait que les propositions non personnelles en syntaxe immdiate, du type _devant dit_.
et [20] ce choe deuant dte unt fate lan del jncarnaton jheu crt m cc ettren / [21]teettme el mos de decembre (Document 123712, 19). et auuec [5] ce choe deuant dte deuon no reprende del eveske deuant dt sante et ds nant et franchermont marche de terre ke no [6] deuon aener a leueke deuant dt entre dy et entre waromme et la roche (Document 12420502, 4).

Remarquons que tous les cas o il y a tout de mme un ponctogramme sont en bout de ligne:
[16] [. . .] no akemn mare et l eceun deor / preen lettre [. . .] (Document 12720622, 16).
[17]

ecrt auon pendu no saa a ce

[30]

/ le [29] quel recor et le quel temongnage wlheames de an loren deeur ds / mt ens eno tre warde s ke mares (Document 12900824, 28).

et par [13] ce ke les change et le conuenance k c unt devee oent plu ferme et [14] melz conute auon no fat aeler cete lettre del ael les poures de or [15] nommez (Document 12601002, 12). et fut deuet la as ke mes res corbeas et lj atre deordt pooent raquere cel cens deordt dedens dos ans prochanement [16] venant apres la date de ces lettres preens [. . .] (Document 127508, 15). et pas comandames dant henon deor / [22] dt a oes de la maon de la ual ant lambert deornomee es vnte boner daluen deornomez ke [23] dros et los porte (Document 12740531a, 21).

Les autres tendances ne dpassent pas le seuil corrig, mais demeurent rvlatrices. Comme on sy attendait, le fait quun P0 en prcde un autre ne favorise pas le marquage.23 Ce type de squence correspond la construction qui fait se suivre un auxiliaire et un participe:24
yau [13] et por ce que ce ot fermement tenut / l veke et l cuen j ont pendut lor sa (Document 12361215, 12).
23 Voir le dpouillement exhaustif dep-6.1.2.1.P0-MMP00P000-PPD en annexe. 24 Voir cependant le paragraphe Problmes de la section Analyses syntaxiques dans les annexes.

255

FAB 0 1 5451 170 5621

FRE 96.98 3.02 100


0 1

1000

2000

3000

4000

5000

TAB . 6.23 Tri plat de PPF pour les prdicats non naux et por co que ce ot ferme 12371012, 6).
[7]

coze je a pendu mon al a ce lettre (Document

Les rares cas marqus sont tous des coordinations:


et mo pra mes res et mes freres [29] com lh auoet en couent a freres de la vaus ant lambert ke e totes ces choes k deoure unt dtes [30] greae / loae / et conente (Document 12670828, 28). et cet h yretage ne puet lh ne e hor / vendre / dechanger / ne oblger [10] ne trecener ens laens dela maon (Document 12710522, 9).

Les autres rejets pertinents avant correction du seuil sont cohrents avec ce que nous avions relev: les S1 non propositionnels initiaux, ainsi que les relateurs (6.3), imposent un rejet important du signe devant eux. 6.1.2.2 P0 et PPF de manire gnrale

Aprs avoir observ les relations entre P0 et PPD, voyons ce quil en est de la ponctuation nale. Changeons donc dchantillon pour slectionner les individus de fonction P0 qui ne se trouvent pas la nale pour cette nouvelle slection. Le tri plat de la variable PPF (tri plat pour PPF: voir table 6.23). a. Tendances par document. Le graphique des rpulsions25 de la modalit PPF.1 par rapport la rfrence du document o se trouve loccurrence ne nous montre aucune tendance signicative repousser PPF.1. Ces ensembles de tests conrment que, jusqu preuve du contraire, aucune charte ne se distingue particulirement des autres en ce qui concerne les rpulsions. Il y a du reste un petit nombre de documents qui attirent le marquage plutt quils ne le rejettent (gure 6.16). Nous navons malheureusement pas pu tirer de conclusions leur sujet. b. Examen du contexte immdiat. Suivant la mme progression que pour PPD, nous croisons la prsence dun ponctogramme la nale avec le type de constituant suivant directement le prdicat. La manire dont les rpulsions et les attractions sont diffrencies se dessine dans les graphiques 6.17 et 6.18. Il ne nous parat pas ncessaire dillustrer les attractions: on voit que les types de constituants attirant signicativement le plus dapparitions de la ponctuation sont les coordonnants et deux types de circonstants, sur lesquels nous reviendrons.26 Cela est clairement en accord avec les tendances gnrales. Les cas de rpulsion les plus importants qui se dmarquent statistiquement
25 Voir annexes. 26 Voir, respectivement, 6.1.5 et 6.1.4.

256

Attractions (seuil adapt 0.0351%)

12700606a 12890112 12710707a 124109 128710 12361215 12720622 127508 123712 12800814 12600203 12890719 12830502 12370916 12670706 12640907 126311 12680301 12900824 12371012 12770323 12730512 12670828 12490625 12630331 12711203a 12890405 12651113 12830213b 12750110a 12770612 12870908 128802b 128802a 12760224 126505b 128603 12850224 12740906 12671029 12710522 12890305 12641129 12680325 12770701 124706 12520301b 12600221b 12711203c 12830221 12870624

10/44 (22.7%) 18/158 (11.4%) 6/26 (23.1%) 5/31 (16.1%) 4/28 (14.3%) 4/32 (12.5%) 4/35 (11.4%) 5/54 (9.3%) 4/44 (9.1%) 3/27 (11.1%) 2/17 (11.8%) 3/37 (8.1%) 2/19 (10.5%) 2/20 (10.0%) 3/41 (7.3%) 3/42 (7.1%) 4/66 (6.1%) 3/43 (7.0%) 3/43 (7.0%) 2/23 (8.7%) 2/23 (8.7%) 3/50 (6.0%) 5/103 (4.9%) 2/27 (7.4%) 3/53 (5.7%) 2/28 (7.1%) 2/30 (6.7%) 3/56 (5.4%) 2/31 (6.5%) 1/32 (3.1%) 3/62 (4.8%) 1/30 (3.3%) 1/30 (3.3%) 1/29 (3.4%) 1/27 (3.7%) 5/127 (3.9%) 2/39 (5.1%) 1/25 (4.0%) 1/23 (4.3%) 1/13 (7.7%) 2/55 (3.6%) 2/54 (3.7%) 1/19 (5.3%) 1/19 (5.3%) 1/19 (5.3%) 3/81 (3.7%) 1/16 (6.2%) 1/16 (6.2%) 1/17 (5.9%) 1/17 (5.9%) 1/17 (5.9%)

5.21e13

F IG . 6.16 Marquage nal du prdicat par document (attractions)

Attractions (seuil adapt 0.205%)

0,0,Co,0,0 0,1,C5,0,0 0,1,S1,0,0 0,1,C5,0,1 0,1,R2,pers,1 0,0,R2,0,0 0,0,S1,0,0 0,0,R2,pers,1 0,1,R3,0,1

47/379 (12.4%) 9/141 (6.4%) 6/86 (7.0%) 13/290 (4.5%) 6/119 (5.0%) 18/506 (3.6%) 14/422 (3.3%) 1/13 (7.7%) 2/54 (3.7%)

2.65e27

F IG . 6.17 Attractions entre le prdicat et PPF par construction suivante

257

Rpulsions (seuil adapt 0.205%) 0,1,A4,0,1 0,0,P0,0,0 0,1,P0,0,0 0,1,R2,pers,0 0,0,A4,0,1 0,0,C5,0,0 0,0,R3,0,1 0,0,R2,pers,0 0,1,A4,0,0 0,0,A4,pers,1 0,0,R3,0,0 0,0,A4,0,0 0,1,R2,0,0 0,1,A4,pers,1 0,1,A4,pers,1 0,0,C5,0,1 0.00167 1 0/327 (0.00%) 6/628 (0.96%) 0/161 (0.00%) 0/155 (0.00%) 4/349 (1.15%) 7/396 (1.77%) 2/169 (1.18%) 0/72 (0.00%) 0/67 (0.00%) 0/60 (0.00%) 0/38 (0.00%) 0/37 (0.00%) 13/485 (2.68%) 0/11 (0.00%) 0/19 (0.00%) 10/345 (2.90%)

F IG . 6.18 Rpulsions entre le prdicat et PPF par construction suivante

concernent dune part les P0 la suite dun 0,1,A4,0,1. Tous les P0 marqus devant un autre P0 sont des coordinations:
[1] no [. . .] faon a auor [. . .] ke no [. . .] auon donee ordenee et deuee a notre volente cete forme de pa k en ce letre [4] et ecrte (Document 124109, 1, deux formes). et slh auent en acun tens k uenrat ke celle halle deuantdte le que [16]le lh ont fatte a leur propres cot et aleur propres depens / chaet / ardet / v empret enparte uentot / nos [. . .] por lemotet des cot et des depens [. . .] ummes oblget et atrant (Document 126311, 15). et e por deu et por la prere mon sangnor mon frere ce ke fut fat des [31] vnze boners par deuant lu et par mes homes / gree / lou / et conferme (Document 12670828, 30). et mo pra mes res et mes freres [29] com lh auoet en couent a freres de la vaus ant lambert ke e totes ces choes k deoure unt dtes [30] greae / loae / et conente (Document 12670828, 28). et cet h yretage ne puet lh ne e hor / vendre / dechanger / ne oblger [10] ne trecener ens laens dela maon (Document 12710522, 9).

De plus, de nombreux contextes nattirent jamais le ponctogramme. Ils ont donc une frquence de marquage de 0%. Nanmoins, cette rpulsion ne peut tre juge signicative en raison du faible effectif valu. Gardons lesprit que quelle que soit leur position dans les graphiques, ces diffrents constituants suivant P0 repoussent globalement la ponctuation de manire signicative, puisquils se trouvent la suite dun prdicat. Ce sont les tendances les plus extrmes que nous venons de dcrire. 6.1.2.3 1,0,P0,0,0 et PPD dans MI.pers

Prsentons prsent brivement le cas particulier des individus vriant la fois MM.1,0,P0,0,0 et MI.pers, qui se dmarquent des autres prdicats par leur attraction vis--vis de la ponctuation initiale. En slectionnant lchantillon comprenant les prdicats initiaux dans les propositions innitives ou participiales (table 6.24), on voit qu il y a trs peu dattestations de ce lien. Si bien que notre examen doit se limiter un simple relev: 258

FAB 0 1 37 3 40

FRE 92.5 7.5 100


0 1

10

15

20

25

30

35

TAB . 6.24 Tri plat de PPD pour les 1,0,P0,0,0 dans pers [1] no [. . .] faons connant a tou cas k verront ce preens lettres ke freens [. . .] acqut ben et loalment [. . .] vntequatre ols [. . .] or leur maon klh ont adnant [6] et or le cortlh dererle maon ket enle ruwe do couert puh jondant le maon jehan [. . .] (Document 12550521, 1). me re gerars de hermee deman / [6]dot or le mauer labee deuant dtte et le couent manent a hermees [. . .] forche et reteal et corruee (Document 12630331, 3). et sepre et requer au amanbor delamone deeur dtte qul donent [19] et oent tenu de doner afreres precheurs delege de eur nomet lettres derecognance de vj mars decens deeur dt / aelees deaeal delamone depoures delactet delege (Document 12830213b, 18).

Les trois attestations sont tires de documents diffrents et ne nous voyons pas quel point commun permettrait de les regrouper. 6.1.2.4 Synthse

Tirons les premires conclusions de ces examens dtaills. Bien que le travail se soit jusquici focalis sur le marquage du prdicat, il parat dj protable de gnraliser les observations. Les faits relevs inclinent penser que les tendances mises en vidence au chapitre prcdent sont correctes et cohrentes, mais que le modle qui a servi les faire merger souffre de limitations. a. Cohrence travers tout le corpus. Nous avons pu constater que nous ntions assur de la signicativit du marquage des P0 que pour un nombre trs limit de documents, alors quaucune charte ne parat rejeter particulirement les ponctogrammes autour du prdicat. Le rejet est donc un phnomne gnral, qui caractrise trs clairement une fonction. Nous en concluons que les scribes ne marquaient gnralement pas le prdicat, moins que quelque chose dautre que la fonction de ce constituant ne les y pousse, comme le contexte immdiat. b. Examen du contexte immdiat. Le contexte inuence manifestement la ponctuation du prdicat de manire trs visible. La prise en considration du contexte permet de comprendre les exceptions la rgle qui voudraient quon ne place pas de ponctogramme devant ou la suite dun P0: sil est prsent, le ponctogramme marque trs certainement une autre structure, qui attire sa prsence par ailleurs. Ainsi, dans les phrases:
et la endrot mme loera et fera loer me femme et tenr le pa k et fte entre le glze et mon / [5] egnor ernol de que l et fa ecr qu en encommence jo erno (Document 12371012, 4).
et mons auot v ren ne [17] vent nos deuons del nostre en toz kas paer les cnquante mus (Document 126505a, 16).

259

il est raisonnable de penser que la prsence du qui suit loera et auot est lie au coordonnant. La question de la coordination, que nous navions aborde quau travers des relateurs coordonnants au chapitre prcdent, prend ici une dimension plus complte. Les attestations sont trs claires: on ne rencontre de ponctogrammes entre deux P0 de mme niveau dintgration syntaxique que dans le cas dune coordination. Le phnomne est important, puisque lenvironnement, tant prcdant que suivant la position en question, est particulirement rfractaire la prsence du marquage. Nous verrons plus loin comment la relation de coordination, quelle soit spcie ou non, est lie la prsence dun ponctogramme (6.1.5). Malheureusement, les analyses morphosyntaxiques du contexte des prdicats que nous avons pu laborer ne permettent pas toujours de poser avec autant dassurance une conclusion de ce type quand le marquage ne correspond pas aux tendances gnrales. Dans ce cas, il est possible que la ponctuation soit explicable par des structures qui dpassent le cadre du point de vue morphosyntaxique. c. Formules. Le style formulaire des documents na pas t pris en considration pour laborer le modle danalyse syntaxique employ. En consquence, nous navons encore aucun moyen de retrouver et de comparer ces formules et de vrier nos hypothses laide de tests adquats. Remarquons simplement leur prsence et posons la question (qui restera ouverte) de leur rapport la ponctuation. Jusqu prsent, nous avons ainsi repr (le symbole reprsente lendroit o on peut trouver un ponctogramme): _x [= reprsentant de lautorit] qui lafaitement t mit en la garde de. . . _; _la ou ces vestures furent faites furent x [= tmoins]_. d. Priorit du marquage. Toutes ces constatations sont soutenues par un fait: bien que la force de la rpulsion soit considrable et quon puisse quasiment parler de rgle, le marquage semble prioritaire par rapport au non-marquage. Admettre que la prsence dun ponctogramme peut tre lie une partie seulement de son environnement revient hirarchiser ce dernier. Il faut dpasser ce que nous disions plus haut au sujet de:
et la endrot mme loera et fera loer me femme et tenr le pa k et fte entre le glze et mon / [5] egnor ernol de que l et fa ecr qu en encommence jo erno (Document 12371012, 4).

Le ponctogramme nest pas seulement attir par le coordonnant: il y a lieu dajouter que seul ce dernier conditionne sa prsence. Poser la priorit du marquage sur le non-marquage nous met en mesure de rpondre la question pose par la possibilit quun phnomne dabsorption (5.1.3.2 a) soit prsent. Lorsque la rpulsion est rgulire, il ny a pas dabsorption: le signe prsent ne marque pas le constituant qui rejette la prsence dun ponctogramme, mais celui qui le suit ou le prcde. On peut dores et dj sattendre ce que cette explication convienne tout ce qui rejette quasi systmatiquement la ponctuation, comme cest le cas des relateurs. Nous aurons loccasion de le montrer ci-dessous (6.3).

260

FAB 0 1 1073 331 1404

FRE 76.42 23.58 100


0 1

200

400

600

800

1000

TAB . 6.25 Tri plat de PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)

6.1.3

Actants et A4

Comme nous allons le voir, les conclusions amenes par lexamen du marquage du prdicat sont loin dtre contredites pas les observations concernant la ponctuation gravitant autour des actants S1, R2, R3 et A4 que nous allons examiner successivement. partir de cette section et jusqu la n du chapitre, les dpouillements et tableaux qui napparaissent pas dans le texte peuvent tre consults dans les annexes.27 Nous les y avons rangs suivant une clef de classement correspondant leur numro de section,28 la modalit de MM concerne (sans les virgules de sparation29 ) et la variable ponctuationnelle tudie. Les diffrentes tables sont identies par la clef table, et les gures par la cl gure. Les tableaux de contingence sont gnralement au nombre de deux: un tableau complet (clef all) et un tableau reprenant les modalits dont les effectifs marginaux sont infrieurs dix (clef fqlt10).30 Quant aux dpouillements, ils sont identis par la clef dep. Nous ne renverrons pas systmatiquement ces annexes. Par contre, lorsque le traitement dun type de constituant aura ncessit des dpouillements et des tests complmentaires mais non reports dans le texte, nous donnerons le nom de lannexe correspondante. 6.1.3.1 0,0,S1,0,0 (phrase): PPD

Au niveau dintgration MI.phrase, lorsquil nest ni initial, ni relat, ni propositionnel, le sujet attire le marquage initial. Les proportions des modalits de PPD pour ce type de constituant sont reprsentes dans la table 6.25. En slectionnant les 0,0,S1,0,0 et en croisant la variable PPD avec la variable correspondant la rfrence du document o lindividu apparat, on obtient les probabilits des gures 6.19 et 6.20. Il est possible que les quelques documents auxquels est associe une probabilit signicative dattraction soient les seuls o le marquage est effectivement attir les effectifs sont assez levs. Si nous retirons de lchantillon les documents ne dpassant pas le seuil non corrig (5%) et que nous croisons nouveau MM et PPD pour les constituants qui napparaissent pas linitiale, la relation entre 0,0,S1,0,0 et lattraction reste stable, avec une probabilit de 6.324188e 23. En dautres termes, la tendance estbel et bien de porte gnrale. Observons prsent la manire dont lenvironnement inuence le marquage ini27 Ces dernires contiennent galement tous les tableaux employs dans la prsente tude. 28 Parfois, pour des raisons techniques, le numro est un niveau hirarchique suprieur; par

exemple, les tableaux correspondant la section 6.1.3.1 sont rfrencs en 6.1.3.


29 Pour des raisons techniques galement, le signe est remplac par not. 30 Lordre des clefs nest pas ncessairement xe.

261

Attractions (seuil adapt 0.0967%)

12740224 12760610a 12680325 126505a 12780801 127203 12740531a 12600530b 12651113 12630331 123712 12430709 12830213a 12420502 12890719 12780406 12650704 12890112 126505b 12890419 12760722

20/27 (74%) 11/18 (61%) 9/14 (64%) 9/16 (56%) 9/21 (43%) 10/25 (40%) 9/22 (41%) 7/16 (44%) 7/16 (44%) 6/13 (46%) 5/12 (42%) 4/10 (40%) 11/36 (31%) 4/11 (36%) 4/11 (36%) 7/25 (28%) 4/13 (31%) 12/46 (26%) 6/25 (24%) 4/15 (27%) 5/19 (26%)

1.82e09

F IG . 6.19 Attractions signicatives entre RB et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)

Rpulsions (seuil adapt 0.0967%)

12440119 12680310 124706 12710318 12770612 12630527c 12740531b 12890305 12800720 12590116 126305 12710522 12800504 12520301a 12711209 12660613 12711222 12700324 12700416 12670828 12890405 123605 12700510 12781017 12650415 12850704 12600509 12760610b 12600221a 126311 12641129 12710420

0/28 (0.0%) 1/26 (3.8%) 1/25 (4.0%) 0/15 (0.0%) 1/18 (5.6%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 2/23 (8.7%) 0/10 (0.0%) 0/10 (0.0%) 2/22 (9.1%) 2/21 (9.5%) 1/15 (6.7%) 2/20 (10.0%) 1/14 (7.1%) 2/18 (11.1%) 1/12 (8.3%) 1/12 (8.3%) 3/20 (15.0%) 1/10 (10.0%) 2/15 (13.3%) 2/15 (13.3%) 3/19 (15.8%) 2/14 (14.3%) 2/13 (15.4%) 3/16 (18.8%) 3/14 (21.4%) 2/10 (20.0%) 2/10 (20.0%) 2/10 (20.0%) 2/11 (18.2%)

0.00607

F IG . 6.20 Rpulsions signicatives entre RB et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)

262

Attractions (seuil adapt 0.394%) 0,0,S1,0,0 1,0,R3,0,1 0,0,C5,pers,1 0,0,C5,0,1 0,0,A4,0,1 1.16e49 1 88/105 (84%) 74/107 (69%) 55/78 (71%) 46/110 (42%) 7/12 (58%)

F IG . 6.21 Attractions signicatives entre MMP et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)
Rpulsions (seuil adapt 0.394%) 0,0,P0,0,0 1,0,C6,0,0 0,0,Co,0,0 1,0,P0,0,0 1,0,R2,0,0 1,0,C5,0,0 1,0,C5,0,1 0,0,C5,0,0 2.14e26 1 9/343 (2.62%) 2/217 (0.92%) 6/135 (4.44%) 0/41 (0.00%) 2/42 (4.76%) 7/49 (14.29%) 14/74 (18.92%) 5/29 (17.24%)

F IG . 6.22 Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)

tial. Les attractions et rpulsions entre le contexte immdiat prcdent et la ponctuation initiale sont reprsentes dans les gures 6.21 et 6.22. Les attractions visibles sont de deux types: soit le contexte immdiat est un autre sujet, soit il est dun type pour lequel nous avons dj repr une tendance attirer le marquage nal. Dans le premier cas, qui rejette H0 avec la probabilit la plus basse, nous avons affaire une relation de coordination, comme dans:
et furent au sres [26] gles de jehagnhe chevalers rgaz de la nouevlhe et wlheames kon dt wloe es freres et [27] albers de vous et pluour autre temong (Document 12660613, 25).

Dj observ en analysant la ponctuation du prdicat, le lien entre le marquage initial et la coordination apparat comme de plus en plus plausible. Les autres contextes, comme on le verra ci-dessous au sujet des circonstants (6.1.4), sufsent gnralement expliquer la prsence de ponctuation. ce stade, il faut conclure que lattraction observe entre le marquage initial et 0,0,S1,0,0 nest probablement pas intrinsquement lie ce type de constituant, mais plutt une srie de contextes spciques o ces sujets sont attests. Quant aux rpulsions, elle nont rien dtonnant, puisquelles correspondent aux rpulsions observes entre la ponctuation nale et les prdicats, les C6 et les coordonnants. 6.1.3.2 0,0,S1,0,0 (phrase): PPF

Daprs les tendances repres, les sujets non relats et non propositionnels attirent galement le marquage nal. Les proportions sont celles de la table 6.26. Vrions nouveau lassociation entre le marquage nal de 0,0,S1,0,0 et les diffrents documents du corpus (gures 6.23 et 6.24). Comme pour le marquage initial, un certain nombre de documents ressortent de lensemble. En comparant la colonne de gauche du dernier graphique celle du graphique 6.19, on voit que les documents qui sont signicative-

263

FAB 0 1 1147 257 1404

FRE 81.7 18.3 100


0 1

200

400

600

800

1000

TAB . 6.26 Tri plat de PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)
Attractions (seuil adapt 0.0967%) 12740224 126505a 123712 12760610a 12651113 12680325 12740531a 12650704 12600530b 12780406 12890419 12711209 12760722 12590116 126305 12710522 12630331 12660613 8.52e23 1 25/27 (93%) 11/16 (69%) 9/12 (75%) 11/18 (61%) 8/16 (50%) 7/14 (50%) 9/22 (41%) 6/13 (46%) 6/16 (38%) 8/25 (32%) 5/15 (33%) 6/20 (30%) 5/19 (26%) 2/10 (20%) 2/10 (20%) 5/22 (23%) 3/13 (23%) 3/14 (21%)

F IG . 6.23 Attractions signicatives entre RB et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)
Rpulsions (seuil adapt 0.0967%) 12890112 127203 12680310 126505b 12600509 12800720 12700416 12740531b 12890305 12430709 12600221a 12890405 123605 12520301a 12710318 12780801 12650415 12711222 12770612 12830213a 12420502 12630527c 12890719 12710420 12440119 126311 12641129 12700324 12800504 12700510 12670828 12850704 12760610b 124706 12781017 0.0217 1 2/46 (4.3%) 0/25 (0.0%) 1/26 (3.8%) 1/25 (4.0%) 0/16 (0.0%) 1/23 (4.3%) 0/12 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 1/15 (6.7%) 1/15 (6.7%) 1/15 (6.7%) 2/21 (9.5%) 1/14 (7.1%) 2/18 (11.1%) 2/18 (11.1%) 5/36 (13.9%) 1/11 (9.1%) 1/11 (9.1%) 1/11 (9.1%) 2/11 (18.2%) 4/28 (14.3%) 1/10 (10.0%) 1/10 (10.0%) 2/12 (16.7%) 3/21 (14.3%) 2/15 (13.3%) 3/20 (15.0%) 2/13 (15.4%) 2/14 (14.3%) 4/25 (16.0%) 3/19 (15.8%)

F IG . 6.24 Rpulsions signicatives entre RB et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)

264

Attractions (seuil adapt 0.341%) 0,0,S1,0,0 0,0,Co,0,0 0,1,S1,0,0 0,0,R2,0,0 0,1,A4,0,1 0,0,A4,0,1 2.61e70 1 88/105 (84%) 41/124 (33%) 7/10 (70%) 25/109 (23%) 2/10 (20%) 5/25 (20%)

F IG . 6.25 Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)
Rpulsions (seuil adapt 0.341%) 0,0,P0,0,0 0,0,C5,0,1 0,0,C5,0,0 0,0,R3,0,1 0,1,R2,pers,0 0,1,R2,pers,1 0,1,C5,0,1 0,0,R3,0,0 0,1,R2,0,0 4.87e13 1 34/440 (7.7%) 13/162 (8.0%) 2/57 (3.5%) 3/46 (6.5%) 1/26 (3.8%) 6/55 (10.9%) 1/13 (7.7%) 2/19 (10.5%) 4/25 (16.0%)

F IG . 6.26 Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)

ment lis au marquage nal sont tous observs dans le groupe de ceux qui attiraient le marquage initial. Malgr ces ressemblances, une fois les quelques documents attirant le marquage retirs de leffectif, les constituants 0,0,S1,0,0 nattirent plus le marquage au niveau dintgration MI.phrase. Le graphique des attractions vis--vis du contexte immdiat montre que la relation de coordination a un poids particulirement important, puisque seuls les coordonnants ou dautres S1 se dmarquent effectivement (gures 6.25 et 6.26). Il semble que seules les constructions coordonnes soient particulirement propices au marquage. Nous concluons donc nouveau que lattraction entre 0,0,S1,0,0 et PPF, limite quelques chartes, est certainement due au contexte doccurrence de ces sujets dans une relation de coordination, dont nous avons constat plusieurs reprises linuence sur la ponctuation. La rpulsion lie un contexte immdiat prenant la forme dun prdicat est cohrente avec lanalyse de ce dernier, tandis que les rpulsions propres aux C5 correspondent ce qui avait t repr dans lanalyse ci-dessus (5.3.2.1 b). 6.1.3.3 0,1,S1,pers,1 (phrase): PPD

Daprs le tri plat, leffectif des actants de fonction sujet qui prennent la forme dune subordonne et sachvent en n de phrase est assez rduit, mais les proportions dvoilent une ponctuation relativement frquente (table 6.27). Aucune charte ne regroupe un effectif sufsant dattestations pour quon puisse tester la distribution du marquage entre les documents.31 Nous ne nous attarderons pas sur la question, pas plus que sur lexamen contrastif du contexte, tant donn la limpide ventilation du tri crois entre PPD et la forme de la structure prcdente (table 6.28). Dans les faits, les 0,1,S1,pers,1 correspondent un nombre restreint de structures strotypes: les
31 Voir annexes.

265

FAB 0 1 35 14 49

FRE 71.43 28.57 100


0 1

10

15

20

25

30

35

TAB . 6.27 Tri plat de PPD, pour les constituants de type 0,1,S1,pers,1 (niveau: phrase)
PPD.0 MMP.0,0,A4,0,1 MMP.0,0,A4,pers,1 MMP.0,0,C5,0,0 MMP.0,0,P0,0,0 MMP.0,0,R3,0,1 2 3 2 2 26 35 PPD.1 0 0 0 0 14 14 2 3 2 2 40 49

TAB . 6.28 Tri crois entre MMP et PPD, pour les constituants de type 0,1,S1,pers,1 (niveau: phrase)

types _conute chose soit que. . . _ et _est a savoir que. . . _.32 Les exemples sont tous trs semblables pour le premier de ces types:
le mare [3] de n conute choe ot achacun et atos que gy yuelle et l echeun de n yuelle vnrent par deuant no alege (Document 12600530b, 2). conute choe ot achacun et ato ke l mare et l echeun de n yuelle deuant no alege (Document 12600530a, 2).
[3]

vnrent par

Cependant, lafnit avec le marquage ne concerne que les constructions directement prcdes dun R3, ce qui exclut les attestations impliques dans la formule du type _est a savoir que. . . _:
et et [13] aauor a ke parm cete amone dotons fare on anuerare j fo lan a quatre temporas delan (Document 12840511, 12).

De mme, les autres cas qui ne correspondent pas des formules ne sont pas marqus:
com en ot ke nos aen entendut par le verrtet de prodome / ke [3] vns betens / et vne querele etot emute (Document 12730512, 2). et et au de ma volente et de mon conentement ke mes res [7] deor ds lor a qutte et done en almone slh auot nul drot de mettre pechor en es eawes (Document 12680802a, 6 et sa copie Document 12680802b, 6).

Nous voyons reparatre ici, de manire encore plus nette qu propos du prdicat, une tendance autant lie la fonction syntaxique du constituant qu son emploi dans un style formulaire.

32 Voir le dpouillement exhaustif en annexe.

266

FAB 0 1 594 154 748

FRE 79.41 20.59 100


0 1

100

200

300

400

500

TAB . 6.29 Tri plat de PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers)
Attractions (seuil adapt 0.301%) 127203 12830213a 12890112 124706 12800505 12740531b 3.14e19 1 41/63 (65%) 22/34 (65%) 15/36 (42%) 6/11 (55%) 6/11 (55%) 7/17 (41%)

F IG . 6.27 Attractions signicatives entre RB et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers)
Rpulsions (seuil adapt 0.301%) 12670828 12600509 12770612 12800720 126505b 12760722 12680310 12440119 12701126 12520301a 12630331 0.132 1 0/13 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 1/17 (5.9%) 1/14 (7.1%) 1/12 (8.3%) 1/10 (10.0%) 1/10 (10.0%)

F IG . 6.28 Rpulsions signicatives entre RB et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers)

6.1.3.4

0,0,R2,0,0 (phrase, pers): PPD

Aprs avoir trait les attractions lies aux constituants de fonction sujet, voyons comment se comportent les rgimes. Les proportions de marquage initial de 0,0,R2,0,0 sont reprsentes dans la table 6.29. Comme nous allons le voir, lassociation entre 0,0,R2,0,0 et le marquage initial est soumise des conditions trs limites. Tout dabord, un certain nombre de documents manifestent tout particulirement cette tendance (gure 6.27). Parmi ces six documents, quatre ont la particularit dtre des testaments, comme le protocole de trois dentre eux33 le montre clairement:
jou helus dtte da [. . .] fach en me boen en tetament de tou me ben meule et hretage et ordenance [2] en com ecrtet c apres (Document 127203, 1). je lambers dele foe [. . .] de tos mes bens [2] que ea en mueble et en hretage a champ et a vlhefadeue (Document 12830213b, 1). ju batens apeles dawans [. . .] ordenne deue et fas mon tetament [. . .] de tos [2] me bens mobles et hretages en ke ch par deos et ecrt (Document 12890112, 1).
33 Voir note 76.

267

Attractions (seuil adapt 0.465%) 0,0,R3,0,1 1,0,R3,0,1 0,0,R3,0,0 0,0,R2,0,0 0,0,C5,0,0 0,0,C5,0,1 0,0,S1,0,0 7.52e26 1 45/61 (74%) 12/12 (100%) 12/15 (80%) 9/10 (90%) 9/26 (35%) 13/44 (30%) 26/118 (22%)

F IG . 6.29 Attractions signicatives entre MMP et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers)
Rpulsions (seuil adapt 0.465%) 0,0,P0,0,0 1,0,C6,0,0 0,0,Co,0,0 0,0,A4,0,1 1.19e13 1 7/216 (3.2%) 1/88 (1.1%) 5/73 (6.8%) 4/48 (8.3%)

F IG . 6.30 Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers)

De mme, la charte 124706 constitue une liste de legs:


re wlheame l pretre de ant alber [etc.] funt conance ke damoeelhe lear sy r de jace at laet [3] az damme de robermont le mote dum moln kelle flhe sangnor ty erchen ky jpartnent [4] al tenot vltre lez mon le jardn et les cen et lez chapon et lez ty moln az che kelle jat laet us marothe la flhe on antan dalor j muj de muture a ve (Document 124706, 1).

En refaisant les tests croisant la variable MM et la variable PPD tous les niveaux concerns, nous constatons que lattraction ne subsiste quau niveau MI.pers (gures 6.29 et 6.30).34 Observons quelques attestations reprsentatives de ces R2 lintrieur des testaments (on repre aisment les R2 qui expriment les legs dans les exemples qui suivent):
je la a pon de lege refaere et retenr x ols [27] al ba cornllon xx ols en ptance al hoptal noual de ant crtoe x ols et vn lt a celu de ant ehan baptste d a celu de tenlemo n t x pour doner en couteen cheme et en oller [28] ou promer uer apres me mort dz mars a jehan me frere xl a henron e fl xx a mon gneur ernol pretre de begenler sgneur glon provost a deu pretres del hoptal a gneur wll de begenler [29] sgneur henr de lens sgneur moral de lantremenge a cecun des pretres de ant dens et de perrochen dou chaptle nostre damme de lege vn tre ntel [30] necen vaedane x adle v a ce dou forborc vj d cune enclue de lege et a me er x agne de prce x auaen le ereur mo orette de begenl n gn eur ernol x eme de lens x a cecun de enfan jehan da ens he nron xx et l [31] muerent voent de lun a lautre a helut flle ad rob n me mart dz ols etle huge k fu e pere a caterne flle me frere vn lt et j l n chee a da m me omont x a robn e frere a [32] helut flle me frere le lt k fu damme maghn me ereur a caterne flle me x frere lx ols ele ben e prveue al dt de me foemen et e ce non e oent donet pour deu a ael me dammele xx [33] a frere ehan de waremme de croe x ols e m
34 Voir la probabilit dans la premire colonne de 6.1.3.00R200PPDstable.

268

FAB 0 1 1356 254 1610

FRE 84.22 15.78 100


0 1

200

400

600

800

1000

1200

TAB . 6.30 Tri plat de PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, pers-arg, pers)
foement le voent en cet pa deuens le promer dem an apres me mort autrement nent a mahllon me nechen v waemuet et vedelette [34] cecune v pour querre les orzon en com boen amblera a me foemen xl (Document 127203, 26).

jelas au acecun pretre parrochen delege entel et por requerre les orons aual an cretoe v ma rs et enlaparroche ant alber / [47] j ma rs alabee deolere x et a maron le flhe thr dean mort x (Document 12830213b, 46).

La simple observation de ces attestations laisse voir que les chiffres sont souvent dlimits par un ponctogramme les prcdant, voire un ponctogramme de part et dautre. Il est par ailleurs clair, lorsque lon inspecte les attestations de niveau MI.pers,35 quune fois les documents les plus fortement marqus retirs de lchantillon, lattraction implique surtout les chiffres. Nous avons dj constat ci-dessus (6.1.2.1 ou 6.1.3.3) que le marquage ne pouvait toujours tre expliqu laide de lanalyse syntaxique cause de linuence que les formules faisaient peser sur les tendances observes. Dans le cas prsent, nous sommes nouveau amen constater que lanalyse morphosyntaxique ne suft pas, mais pour une tout autre raison, dordre smantique cette fois: les chiffres ont la particularit dexprimer une valeur numrique apparemment, que cette valeur soit exprime en chiffres romains ou non ne change rien la situation. 6.1.3.5 0,0,R2,0,0 (phrase, pers-arg, pers-arg, pers): PPF

Nous avons remarqu que les constituants 0,0,R2,0,0 taient lis la ponctuation nale. Lorsquon regarde quelles proportions sont marques, on obtient: a. Tendances par document. En effectuant les tris croiss (gure 6.31) entre les rfrences des documents et le marquage de ce type de constituant, on voit que trois documents comportent nettement plus dattestations de 0,0,R2,0,0 que les autres et que la majorit des occurrences quils contiennent sont suivies dun ponctogramme. Les trois documents qui se dmarquent sont trois des testaments attirant galement le marquage initial (6.1.3.4). Si on les retire du corpus et quon croise nouveau MM et PPF, la signicativit de lattraction entre PPF.1 et MM.0,0,R2,0,0 ne subsiste pas au niveau de la phrase.36 b. Examen du contexte immdiat. Narrtons pas l. Si nous conservons lchantillon complet (incluant les trois testaments), nous pouvons voir comment se distribuent les types de constituants qui suivent le plus souvent ces rgimes marqus (gures 6.33 et 6.34). Deux des trois types attirant signicativement le marquage (les Co et les R2) font
35 Voir dep-6.1.3.4.00R200. 36 Voir 6.1.3.00R200PPFstable.

269

Attractions (seuil adapt 0.0855%)

12890112 127203 12830213a 12780406 12740531b 128802b 126505a 127508 12630715 128103 124706 126311 12700510 12630331 12711203b 12890305 12720622 12651113 12710420 124109 126305 12680301 12780801 12711203a 128802a 12900824 12630527a 12730512 12600514 12700324 12770504

22/54 (41%) 30/91 (33%) 24/77 (31%) 6/16 (38%) 6/18 (33%) 4/11 (36%) 4/13 (31%) 5/18 (28%) 4/15 (27%) 3/10 (30%) 5/21 (24%) 5/21 (24%) 4/18 (22%) 3/13 (23%) 3/13 (23%) 3/13 (23%) 4/19 (21%) 3/19 (16%) 3/19 (16%) 2/12 (17%) 2/12 (17%) 2/12 (17%) 3/18 (17%) 2/11 (18%) 2/11 (18%) 2/11 (18%) 4/24 (17%) 4/24 (17%) 3/15 (20%) 2/10 (20%) 2/10 (20%)

8.25e07

F IG . 6.31 Attractions signicatives entre RB et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, persarg, pers)

Rpulsions (seuil adapt 0.0855%)

12760722 12600509 12440119 12800505 12590116 12650415 12750110b 12760610b 12680310 123605 12430709 12700929 12750110a 12660613 12701126 12600221a 12700606a 12800720 12640907 12670828 12770612 12800504 12740531a 12520301a 12711209 123712 12650704 12870908 126505b

0/21 (0.0%) 0/18 (0.0%) 1/27 (3.7%) 0/17 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 1/20 (5.0%) 0/10 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 1/16 (6.2%) 2/23 (8.7%) 1/15 (6.7%) 1/15 (6.7%) 2/21 (9.5%) 2/13 (15.4%) 3/25 (12.0%) 2/14 (14.3%) 2/14 (14.3%) 1/11 (9.1%) 3/21 (14.3%) 2/15 (13.3%) 1/10 (10.0%) 1/10 (10.0%) 1/10 (10.0%) 4/29 (13.8%)

0.09

F IG . 6.32 Rpulsions signicatives entre RB et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, persarg, pers)

270

Attractions (seuil adapt 0.394%) 0,0,R2,0,0 0,0,Co,0,0 0,1,C5,0,0 0,1,R3,0,1 2.30e19 1 15/17 (88%) 59/208 (28%) 12/46 (26%) 3/21 (14%)

F IG . 6.33 Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, persarg, pers)
Rpulsions (seuil adapt 0.394%) 0,1,P0,0,0 0,0,P0,0,0 0,0,C5,0,0 0,0,R3,0,0 0,0,A4,0,1 0,1,C5,0,1 0,0,R3,0,1 0,1,A4,0,1 0,0,C5,0,1 2.81e06 1 1/154 (0.65%) 15/291 (5.15%) 8/104 (7.69%) 0/18 (0.00%) 2/32 (6.25%) 18/171 (10.53%) 4/41 (9.76%) 4/41 (9.76%) 11/92 (11.96%)

F IG . 6.34 Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, persarg, pers)

directement penser quil y a, de la mme manire que pour P0 et S1, une tendance au marquage en cas de coordination. Sur le plan smantique, ces contextes dans les testaments montrent de longues listes associant des patients (legs) leur bnciaire (lgataire), ce qui se traduit morphosyntaxiquement par lemploi de paires de R2 et R3. En analysant le corpus, nous avons choisi de considrer que les diffrentes paires associant lexpression des legs celle des lgataires taient coordonnes,37 ce qui fait de chaque patient un R2 non initial, non propositionnel et non relat. Il est en effet possible cest mme la solution qui malmne le moins le modle38 de dire, pour le premier des contextes cits, par exemple, que le prdicat principal la est complment par chacun des groupes de R2 et R3 qui le suivent. Il faut donc rapprocher cette attraction de celle que nous avons dj observe plus haut pour les P0 et S1 coordonns: la relation de coordination est lie la prsence des ponctogrammes. Une autre faon de voir la situation serait de considrer que cet enchanement de paires (qui peut, comme le premier exemple ci-dessus latteste, tre trs long) de les contraintes habituelles de taille des constituants grce son caractre conventionnel trs marqu: dans un testament, on sattend rencontrer ce genre de liste. De ce point de vue, on aurait ainsi affaire une sorte de formule, moins strotype que celles rencontres aux articulations fondamentales des actes, mais tout de mme sufsamment ge pour permettre lexpression dun message raccourci. Nous parlerons plus des R3 impliqus dans la section qui leur sera ddie cidessous (6.1.3.11). Quant la seule rpulsion statistiquement signicative, on voit quelle concerne
37 Voir le paragraphe Problmes dans la section Analyses syntaxiques des annexes. 38 Dans lanalyse que nous avions donne de Document 127203 (voir Mazziotta paratre),

nous avions estim que les associations en question taient des noncs non phrastiques, avec ellipse du prdicat.

271

FAB 0 1 6 4 10

FRE 60 40 100
0 1

TAB . 6.31 Tri plat de PPD, pour les constituants de type 0,0,R2,pers,1 (niveau: pers)
FAB 1 0 17 12 29 FRE 58.62 41.38 100
1 0

10

15

TAB . 6.32 Tri plat de PPF, pour les constituants de type 0,0,R2,pers,1 (niveaux: phrase, pers)
PPF.0 MMS.0,0,Co,0,0 MMS.0,0,P0,0,0 MMS.0,1,C5,0,1 MMS.0,1,C5,pers,1 10 1 0 1 12 PPF.1 15 0 1 1 17 25 1 1 2 29

TAB . 6.33 Tri crois entre MMS et PPF, pour les constituants de type 0,0,R2,pers,1 (niveaux: phrase, pers)

un environnement correspondant un P0, ce qui suit la tendance gnrale et scarte des cas que nous venons daborder. 6.1.3.6 0,0,R2,pers,1 (pers): PPD

Les quelques attestations releves ne sufsent pas effectuer la moindre analyse Lobservation des contextes doccurrence39 napporte aucune information que nous ayons pu exploiter40 . 6.1.3.7 0,0,R2,pers,1 (phrase, pers): PPF

Comme on le voit dans le tri plat (table 6.32), ce type de constituant est trs peu attest, mais frquemment marqu.41 Aucun document ne peut, cause des faibles frquences, tre distingu des autres.42 Un tri crois impliquant les constituants rencontrs la suite de la structure montre de manire trs claire que la coordination joue ici un rle prpondrant (table 6.33). Le marquage est donc certainement d des causes extrieures lanalyse du constituant en lui-mme.
39 Voir les annexes. 40 Voir les tables en annexe. 41 Voir les annexes. 42 Voir les annexes.

272

FAB 0 1 217 60 277

FRE 78.34 21.66 100


0 1

50

100

150

200

TAB . 6.34 Tri plat de PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase)
Attractions (seuil adapt 1.70%) 127203 12830213a 12890112 6.86e06 1 12/18 (67%) 10/19 (53%) 6/11 (55%)

F IG . 6.35 Attractions signicatives entre RB et PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase)
Attractions (seuil adapt 0.73%) 0,0,R3,0,1 0,0,C5,0,1 0,0,C5,0,0 0.00043 1 14/25 (56%) 15/34 (44%) 4/11 (36%)

F IG . 6.36 Attractions signicatives entre MMP et PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase)
Rpulsions (seuil adapt 0.73%) 0,0,P0,0,0 0,0,Co,0,0 0,0,S1,0,0 0,0,A4,0,1 8.38e07 1 4/80 (5%) 3/27 (11%) 5/26 (19%) 3/14 (21%)

F IG . 6.37 Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase)

6.1.3.8

0,1,R2,0,0 (phrase): PPD

Les proportions: indiquent un marquage important, dont on peut voir, daprs le graphique 6.35,43 que seules ressortent quelques attractions, qui concernent deux des testaments relevs quand nous avons tudi 0,0,R2,0,0 (6.1.3.4). La probabilit44 que lattraction entre PPD.1 et cette modalit de MM est due des causes alatoires est trop forte si lon retire ces documents du corpus. Dautre part, si lon examine les constituants qui se rencontrent devant les R2 tudis (gure 6.36), nous constatons que les tendances sont trs proches de celles dans lesquelles les constituants 0,0,R2,0,0 sont impliqus. Au vu de ces similitudes, nous concluons que le marquage initial de 0,1,R2,0,0 nest, lui non plus, pas d au rgime lui-mme, mais une combinaison de facteurs impliquant son contexte immdiat et le type dacte juridique enregistr par le document o le constituant est attest.

43 Aucune rpulsion ne se manifeste dans les modalits de RB retenues; voir les annexes. 44 Voir annexe 6.1.3.01R200PPDstable.

273

FAB 1 0 8 7 15

FRE 53.33 46.67 100


1 0

TAB . 6.35 Tri plat de PPD, pour les constituants de type 0,1,R2,pers,1 (niveau: pers-arg)

faisons

R2

[savoir]

R2

que. . .

F IG . 6.38 Structure de savoir faisons que. . .

[a savoir]

A4

faisons

R2

que. . .

relation attributive
F IG . 6.39 Structure de a savoir faisons que. . . (rappel)

6.1.3.9

0,1,R2,pers,1 (pers-arg): PPD

Cette structure nest pas trs frquente, mais plus de la moiti des occurrences sont marques (table 6.35). Comme cela apparat nettement dans la table croisant les rfrences au marquage relgue aux annexes , on ne peut pas dire que lattraction soit cantonne certains documents. Un dpouillement complet45 rvle que cette structure correspond en fait une formule strotype dans nos documents: la construction _savoir faisons que. . . _. Par exemple:
[1] ge jehan annes fs le conte de los fa auor a tou ceuls qu ce lettres [2] verront et oront / que la terre que me res me peres arnols cuen de lo et de [3] chn y a donee et abeau dont ele et do que [4] ge a prom au deuant aenee en marage a mo et a ma feme y dt mon egnor mon pere par ma fo creantee loau / [5]ment / deuant mon egnor henr par la grace de deu eueque de lege / que tant [6] come ge vura / l receura et prendra le fru et le rente (Document 126404, 1). [4] nos faons auor atous / ke nos a damme agnes hubne de ho y auons en doners contes reches / quarante set mars dele / [5]gos (Document 128802a, 3).

Malgr le petit nombre dattestations, la signicativit de lcart, couple la possibilit dobserver toutes les occurrences, nous permet de dpasser la simple constatation dune afnit possible entre une formule et une structure morphosyntaxique: dans ce cas prcis, ces deux plans (nonciatif et grammatical) concident exactement. Cependant, on trouve des constructions formulaires proches (apparaissant aux mmes endroits dans les documents ou formes sur les mmes lexmes), mais syntaxiquement dcrites de manire trs diffrente. Par exemple, si la structure _savoir faisons que. . . _ sanalyse effectivement comme indiqu dans la gure 6.38. La structure _a savoir faisons que. . . _ est par contre dcrite dans la gure 6.39.46
45 Voir le dpouillement complet en annexe. 46 Voir 3.4.4.6, o nous justions cette diffrence.

274

FAB 0 1 76 22 98

FRE 77.55 22.45 100


0 1

10

20

30

40

50

60

70

TAB . 6.36 Tri plat de PPF, pour les constituants de type 0,0,R2,pers,0 (niveaux: phrase, pers)
Attractions (seuil adapt 1.70%) 0,0,Co,0,0 0,1,C5,0,1 0.0382 1 6/12 (50%) 10/34 (29%)

F IG . 6.40 Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,R2,pers,0 (niveaux: phrase, pers)
Rpulsions (seuil adapt 1.70%) 0,0,C5,0,0 0.378 1 1/12 (8.3%)

F IG . 6.41 Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,R2,pers,0 (niveaux: phrase, pers)

Or, du point de vue nonciatif, on voit que linformation est porte la connaissance du rcepteur de manire similaire dans les deux cas: le thme (formule) prcde le propos. De mme, en limitant lanalyse morphosyntaxique au lexique mobilis pour construire les deux formules, il faut conclure que ce sont les mmes units qui sont utilises. Il y aurait donc lieu de sinterroger sur la cohrence entre les deux formules par rapport la ponctuation. Malheureusement, il nest pas possible, faute dun encodage adquat, de retrouver toutes les attestations de la deuxime forme (avec un relateur devant savoir), ce qui empche toute comparaison. 6.1.3.10 0,0,R2,pers,0 (phrase, pers): PPF

Le tri plat est donn dans la table 6.36. Les tests habituels montrent que lattraction nest pas spcique un petit groupe de documents particuliers.47 Lexamen des formes la suite dun de ces R2 marqus doit se limiter aux attractions (gure 6.40). Deux observations ressortent de ce graphique. Dune part, les coordonnants occupent nouveau une position prdominante en matire dattraction du marquage. Quelques exemples illustrent bien ce genre de cas:
et no l arbtre deor nomet preen enno le fas del arbtre [. . .] ke no deuen enquerre droturerement entre lune parole et lautre et or le uertet a checun (Document 12630331, 6).
[16] je la al deeure dt henron [. . .] v mars par en [. . .] qul nen put faere don ne deue an reungnent a me foemens [. . .] (Document 127203, 15).

Dautre part, bien que lattraction les concernant de manire indpendante natteigne
47 Voir les annexes.

275

FAB 0 1 347 157 504

FRE 68.85 31.15 100


0 1

50

100

150

200

250

300

TAB . 6.37 Tri plat de PPF, pour les constituants de type 0,0,R3,0,1 (niveaux: phrase, pers-arg, pers-arg, pers)
Attractions (seuil adapt 1.70%) 127203 12830213a 12890112 3.85e10 1 29/37 (78%) 43/69 (62%) 8/13 (62%)

F IG . 6.42 Attractions signicatives entre RB et PPF, pour les constituants de type 0,0,R3,0,1 (niveaux: phrase, pers-arg, persarg, pers)
Attractions (seuil adapt 0.73%) 0,1,S1,pers,1 0,0,R2,0,0 0,1,R2,pers,1 0,1,R2,0,0 0.00444 1 14/40 (35%) 8/21 (38%) 7/32 (22%) 2/10 (20%)

F IG . 6.43 Attractions signicatives entre MMS et PPF pour les constituants de type 0,0,R3,0,1 (niveau: phrase), rduit

pas le seuil de probabilit de 5%, les autres constituants participant lattraction du marquage sont tous des circonstants; les deux types les plus fortement lis PPF.1 font partie de ceux qui ont t relevs dans le cadre de la recherche de tendances gnrales (5.3.3.3). Cette combinaison de facteurs (coordonnant ou circonstant la suite) explique presque toutes les occurrences de ponctogrammes derrire 0,0,R2,pers,0. On peut donc se permettre de conclure que ce dernier nattire pas la ponctuation. 6.1.3.11 0,0,R3,0,1 (phrase, pers-arg, pers-arg, pers): PPF

Certains rgimes R3 attirent galement PPF; pour les 0,0,R3,0,1, le tri plat de PPF est dans la table 6.37. a. Tendances par document. La tabulation que nous avons dj effectue plusieurs fois est loquente (le manque deffectifs empche de se prononcer propos des rpulsions): quand on regarde les dcomptes de prs (gure 6.42), on voit que trois documents apparaissent dans les attractions. Ces trois documents sont exactement les mmes que ceux qui attiraient le marquage la n de 0,0,R2,0,0. De fait, en retirant les deux textes signicatifs du corpus avant de croiser MM et PPF, on voit que les R3 nattirent plus signicativement PPF.1 quau niveau de la phrase.48 Le graphique valuant les relations entre les contextes immdiats et la ponctuation ce niveau prend la forme de la gure 6.43.49 Quelles attirent ou repoussent la
48 Voir les probabilits 6.1.3.00R301PPFstable. 49 Voir le relev des attestations en annexe: dep-6.1.3.00R301reduced-PPF.

276

Rpulsions (seuil adapt 0.73%) 0,0,C5,0,1 0,0,Co,0,0 0,1,C5,0,1 0.126 1 2/31 (6.5%) 6/57 (10.5%) 2/21 (9.5%)

F IG . 6.44 Rpulsions signicatives entre MMS et PPF pour les constituants de type 0,0,R3,0,1 (niveau: phrase), rduit
FAB 1 0 96 37 133 FRE 72.18 27.82 100
1 0

20

40

60

80

TAB . 6.38 Tri plat de PPF, pour les constituants de type 1,0,R3,0,1 (niveau: phrase)
PPF.0 MMS.0,0,C5,0,0 MMS.0,0,P0,0,0 MMS.0,0,S1,0,0 1 1 33 35 PPF.1 0 0 74 74 1 1 107 109

TAB . 6.39 Tri crois MMS PPF, pour les constituants de type 1,0,R3,0,1 (niveau: phrase, Document 1272-03 retir)

ponctuation la suite dun 0,0,R3,0,1, toutes les constructions sufsamment attestes pour tre soumises un 2 sont propices la prsence du marquage initial. Cest du moins ce qui est ressorti de la conclusion du chapitre prcdent. Par ailleurs, quand le constituant suivant est un R2 non propositionnel, il sagit la plupart du temps dun chiffre.50 Pour les niveaux autres que la phrase, il faut donc conclure, comme nous lavions dj fait pour la ponctuation nale de 0,0,R2,0,0 (6.1.3.4) que lattraction manifeste par 0,0,R3,0,1 vis--vis du marquage nal est lie une toute petite partie seulement du corpus, compose de textes dun type nonciatif tout fait spcique (testaments). Au niveau de la phrase, les ponctogrammes sont vraisemblablement dus une combinaison de facteurs impliquant le contexte immdiat de 0,0,R3,0,1. 6.1.3.12 1,0,R3,0,1 (phrase): PPF

La proportion de prsence de ponctuation est ici exceptionnellement leve (table 6.38). Aucune charte ne contient sufsamment dattestations pour quil soit possible de calculer si elle se distingue particulirement de lensemble. Lexamen du contexte immdiat montre que la construction est particulirement atteste devant un sujet (table 6.39). Par ailleurs, quand le marquage prcde systma-

50 Voir la liste des attestations en annexe: dep-6.1.3.00R301reduced-PPF.

277

FAB 0 1 327 74 401

FRE 81.55 18.45 100


0 1

50

100

150

200

250

300

TAB . 6.40 Tri plat de PPF, pour les constituants de type 0,0,A4,0,1 (niveaux: pers-arg, pers-arg, pers)

tiquement un sujet,51 la construction se rencontre tout au dbut de la charte. Elle en constitue ce que les diplomatistes nomment adresse:52
[1] a tos cheaz k ces lettres veront / l mares et l ekeun de nandren / saluz en deu (Document 12700324, 1). [1] a toz ceaz k ces lettres veront et oront / henrs cheualers sres de hermale saluz et conance [2] de verte (Document 12710420, 1). [1] a to cheau k ce preens lettre verront et oront l homme dele che deu font conotre vertet (Document 12740224, 1).

Cependant, la forme de ladresse est code dans le type discursif quest la charte, et le fait quelle prcde immdiatement la suscription invite hsiter: que marque le ponctogramme, en n de compte? marque-t-il ladresse? marque-t-il la suscription? Dautant que certains cas non marqus reportent visiblement le signe devant le deuxime mot de la suscription:
[1] atous cheas k ches preens lettres veront et oront l homes delle che deu / alus et conotre vertet (Document 12870624, 1).

La frquence et la cohrence du marquage sont telles que nous devons souligner nouveau limportance du style formulaire, bien que nous soyons oblig de le ngliger pour linstant. Du fait que la structure syntaxique correspond presque toujours la formule dadresse, il reste envisageable de ne considrer que laspect grammatical du constituant et den tirer une tendance de ponctuation: 1,0,R3,0,1 attire bien le marquage. 6.1.3.13 0,0,A4,0,1 (pers-arg, pers-arg, pers): PPF

Une importante proportion de 0,0,A4,0,1 sont marqus la nale (table 6.40). Alors que les effectifs demeurent trop rduits pour quon puisse vrier si un document se dmarque particulirement, on peut par contre observer les contextes immdiats les plus lis au marquage. Selon la gure 6.45, le contexte attirant le marquage nal est MMS.0,0,S1,0,0, type de constituant qui attire apparemment le marquage (au niveau de la phrase seulement), mais dont lexamen approfondi rvle que cette tendance est due des causes
51 En ralit, bien souvent, lnonc nest pas phrastique, mais correspond un de ceux que

nous avons assimils la phrase pour simplier le traitement (5.3.2.1).


52 Voir le dpouillement complet en annexe.

278

Attractions (seuil adapt 0.465%) 0,0,S1,0,0 0,1,C5,0,1 0,0,Co,0,0 0,1,C5,0,0 0,0,R2,0,0 3.72e13 1 26/43 (60%) 9/25 (36%) 13/50 (26%) 3/11 (27%) 3/13 (23%)

F IG . 6.45 Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,A4,0,1 (niveaux: pers-arg, pers-arg, pers)
Rpulsions (seuil adapt 0.465%) 0,0,A4,0,1 0,0,P0,0,0 0,1,P0,0,0 0,1,R2,0,0 0,0,C5,0,1 0,1,A4,0,1 6.92e07 1 3/112 (2.7%) 0/29 (0.0%) 0/13 (0.0%) 1/15 (6.7%) 3/17 (17.6%) 5/29 (17.2%)

F IG . 6.46 Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,A4,0,1 (niveaux: pers-arg, pers-arg, pers)

extrieures (6.1.3.1). Un certain nombre de 0,0,A4,0,1 sont lexpression du lieu dans la partie de la charte que les diplomatistes nomment expos.53 6.1.3.14 Synthse

ce stade, et avant de passer ltude des circonstants, on peut synthtiser les dcouvertes en enrichissant les conclusions auxquelles avait men lexamen du marquage du prdicat (6.1.2.4). En rgle gnrale, les faits dtaills compltent cette premire synthse ou mettent en vidence des phnomnes diffrents. Sans revenir sur les questions de priorit du marquage, nous passerons en revue les autres points abords propos du prdicat. a. Cohrence travers le corpus. La question de la cohrence des liens entre les constituants et la ponctuation lintrieur de lensemble du corpus prend toute sa dimension lorsque nous tudions les actants. Parfois, nous avons constat qu linstar des tendances manifestes autour du prdicat, il ntait pas possible de relguer certaines tendances un petit groupe de documents, puisque lintensit des liens (probabilits) restait grosso modo identique, que ces documents soient prsents ou non. Dans dautres cas,54 par contre, les tendances observes sont cantonnes un trs petit nombre de documents, partageant qui plus est une caractristique commune: il sagit de testaments. Ce type daction juridique est dune telle singularit que sa mise lcrit55 rend possible (voire oblige) lemploi de structures particulires, lesquelles attirent leur tour une ponctuation spcique. Dans ce cas, la ponctuation se fait lindice dun type discursif particulier. Soyons nanmoins prudent: trois testaments ressortent ainsi du lot, non lensemble dentre eux. . . On pourrait par ailleurs dissquer les diffrentes attractions et rpulsions ngliges jusquici pour ventuellement mettre en vidence des groupements de chartes, mais
53 Voir note 78. 54 Par exemple, R2, cf. 6.1.3.4, ou R3, cf. 6.1.3.11. 55 Daprs la conception de Marie-Guy Boutier, expose ci-dessus, sous 3.1.2.1 b.

279

une tude srieuse ce sujet ncessiterait que soit clairement dni un protocole de description extralinguistique des documents du corpus, fond, par exemple, sur un classement en fonction des protagonistes impliqus dans lacte juridique. De la mme manire que P0, le marquage des actants semble associ des conditions qui les dpassent, de sorte que la plupart des ponctogrammes pourraient tre lis lenvironnement des actants plutt qu leurs caractristiques propres. b. Contexte immdiat. La plupart des constituants attirant le marquage (nal) peuvent tre mis en relation avec le constituant de mme niveau dintgration qui se trouve directement leur suite: 0,0,S1,0,0 est suivi dun autre sujet ou dun coordonnant; 0,0,R2,0,0 (dans certains testaments) est suivi dun coordonnant, dun autre R2 ou dun autre groupe exprimant le patient et le bnciaire; 0,0,R2,pers,0 et 0,0,R2,pers,1 sont suivis dun coordonnant ou dun circonstant. Il est prsent trs clair que les environnements morphosyntaxiques attirant le marquage peuvent tre rangs en deux catgories: 1/ ceux qui sont impliqus dans une relation de coordination; 2/ ceux qui sont proximit dun circonstant. Presque toutes les attractions mettent en vidence ces mmes afnits. ce stade, on voit donc combien il est ncessaire de dcrire la ponctuation autour des circonstants et celle qui apparat en cas de coordination. c. Relations avec les autres points de vue. Aux deux formules semblant attirer le marquage devant le prdicat, il faut ajouter celles qui interviennent aux alentours des actants: 0,1,R2,pers,1 (6.1.3.9): _savoir faisons que x [= expos ou dispositif de lacte]_; 1,0,R3,0,1 (6.1.3.12): _a tous ceux qui ces lettres verront . . . x [= auteur de lacte] fait savoir. . . _. Ces formules paraissent lies au marquage et sont de porte gnrale. On peut dire que les suites dassociations entre les legs et les lgataires dans les testaments ont galement une forme conventionnelle prvisible, qui attire le marquage voir les sections sur 0,0,R2,0,0 (6.1.3.4) et 0,0,R3,0,1 (6.1.3.11):
_a y [= un lgataire] z [= legs]_

o le ponctogramme marque en quelque sorte llision du prdicat (6.1.3.5). nouveau, ce recensement de formules remarquables ne peut dpasser la simple constatation, faute de dpouillements exhaustifs. Dautre part, lexamen des attestations de la ponctuation initiale des 0,0,R2,0,0 (6.1.3.4) mne considrer le cas du marquage des chiffres (romains ou non), qui paraissent attirer la ponctuation bien quaucun test ne puisse tre fait. Si ce lien existe, le marquage ne porte pas sur une structure syntaxique, ni sur une formule propre aux chartes, mais sur un certain contenu, relevant du point de vue smanticorfrentiel. d. Units de lecture. Au bout de lexamen du marquage des actants, nous sommes mme dajouter un petit nombre de positions supplmentaires celles qui attirent la ponctuation. Une petite proportion de ponctogrammes expliqus complte ainsi la premire synthse que nous avons pu faire au sujet de la phrase (6.1.1.3). La 280

P.0 Act.0 Act.1 57158 457 57615

P.1 4297 275 4572 61455 732 62187

P.0 0.86 -72.14

P.1 -10.83 909.05 8

2 = 988.39, ddl = 1, p = 6e 217 ###

TAB . 6.41 Proportions de marquage expliqu par la ponctuation des actants


FAB 0 1 57158 457 57615 FRE 99.21 0.79 100
0 1

10000

20000

30000

40000

50000

TAB . 6.42 Tri plat de la position (limite dactant ou non) pour les positions non ponctues
FAB 0 1 4297 275 4572 FRE 93.99 6.01 100
0 1

1000

2000

3000

4000

TAB . 6.43 Tri plat de la position (limite dactant ou non) pour les positions ponctues

liste des actants considrs comme propices lapparition dun ponctogramme est la suivante pour PPD: 0,1,S1,pers,1, au niveau MI.phrase (6.1.3.3); 0,1,R2,pers,1, au niveau MI.pers-arg (6.1.3.9). Pour PPF, la liste est: 0,0,R3,0,1, uniquement pour Document 127203 et Document 12830213b (6.1.3.11); 1,0,R3,0,1 (6.1.3.12); 0,0,A4,0,1, aux niveaux MI.pers, MI.pers-arg et MI.pers-arg (6.1.3.13). Une fois les limites dnoncs retires de leffectif des positions entre les mots, ces dernires peuvent tre dnies par deux variables dichotomiques: la ponctuation est attire cet endroit par un actant de la liste (oui ou non); la ponctuation est prsente ou non. On peut ds lors construire le tri crois de la table 6.41. Le test du 2 conrme que les actants slectionns attirent bel et bien la ponctuation. On voit toutefois que le rapport de chances est ici plus petit quil ne ltait pour les positions aux limites des noncs (6.1.1.3 c). Comme en tmoignent les effectifs, parmi les constituants non marqus, peu font partie de la catgorie des actants attirant le marquage. Le fait est encore plus perceptible prsent sous la forme dun tri plat (table 6.42). Si nous observons les constituants marqus, le tri plat de la table 6.43, rvle que trs peu de ponctogrammes sont expliqus par les tendances de marquage des actants. Nanmoins, bien

281

que peu frquentes, ces constructions nen demeurent pas moins rgulirement marques. Le fait quelles ne sufsent mme pas expliquer 10% des occurrences de ponctogrammes napparaissant pas aux limites des noncs ne signie pas quelles soient insigniantes, mais que lanalyse ne doit pas sarrter l: dans la section suivante nous allons voir que lexamen du marquage des circonstants permet denrichir substantiellement cet inventaire des positions lies la ponctuation. 6.1.4 Circonstants

Jusqu prsent, la position marginale des circonstants dun point de vue morphosyntaxique se rpercute sur leur ponctuation: dans de nombreux cas ci-dessus, le marquage peut tre expliqu par la proximit directe des constituants avec un circonstant attirant particulirement la ponctuation. Les congurations morphosyntaxiques qui ont t juges dignes dintrt au terme de lexamen gnral (5.3.3.3) seront abordes ci-dessous dans lordre suivant: 0,0,C5,pers,0; 0,0,C5,0,0 (phrase, pers-arg, pers): PPF; 0,0,C5,0,1 (pers, pers): PPD; 0,0,C5,0,1 (phrase, pers-arg, pers-arg, pers, pers): PPF; 0,0,C5,pers,1 (phrase): PPF; 0,0,C5,pers,1 (phrase, pers-arg, pers): PPF; 1,0,C5,pers,1 (phrase): PPF; 0,1,C5,0,0 (phrase, pers-arg, pers, pers): PPD; 0,1,C5,0,1 (phrase, pers-arg, pers): PPD; 0,1,C5,pers,1 (phrase, pers): PPD; 0,1,C5,pers,1 (phrase): PPD. 0,0,C5,pers,0

6.1.4.1

De toutes les structures prises par les circonstants, les incidentes prennent la forme la plus susceptible dune analyse contrastive: nous avons dni lincidente comme une proposition de mode personnel qui assume la fonction C5 sans tre relate (3.4.4.5 b). Il faut donc poser la question de la frquence du marquage de ces structures par rapport la frquence du marquage de la phrase. Ces units, si proches des noncs, mais dont lenchssement trahit la dpendance, sont-elles aussi bien dlimites que le sont les phrases? Dautre part, la seule diffrence morphosyntaxique entre une subordonne circonstancielle et une incidente est la prsence dun relateur. Cette proximit a-t-elle un cho dans la ponctuation? Suivant notre modle, une incidente ne se trouve jamais la n ou au dbut de la phrase, ce qui simplie la slection des individus, puisque nous ne sommes pas confront au phnomne de rcursivit, comme ctait le cas lorsquil tait question de comparer la phrase aux autres subordonnes (6.1.1). On concevra donc facilement une variable deux modalits, distinguant les propositions qui sont des phrases dune part et les incidentes dautre part. Cependant, lorsque nous avons expos les choix poss an de dterminer le niveau dintgration des C5 (3.4.7.4 a), nous avons vu quen cas de doute, nous avons

282

0 phrase incidente (phrase) incidente (autre) 8655 8 15 8678

1 2675 13 15 2703 11330 21 30 11381

0 0.03 $$$ 4.01 $$# 2.71 $$$

1 0.09 $$$ 12.87 ### 8.7 $##

Test exact de Fisher, p = 3.08e 06 ### Valeur attendue minimale = 4.99

TAB . 6.44 Tri crois phrases et incidentes PPD

considr que les C5 se trouvaient au niveau le plus lev de la hirarchie syntaxique chaque fois que cela tait possible. Certaines incidentes ne peuvent tre remontes au niveau de la phrase, et leur enchssement dans un constituant de niveau infrieur la phrase est manifeste; par exemple:
je welh et ordene ke se johans me freres v lambon se fls welent et puent aenner v mars [4] de cens hretablement ben as a etmaton depreusdommes / a manbors de lamone depoures de la ctet delege que [5] l vj mars decens les ques a laes en me tetament orma maon delefoe dont l manbor delamone ont rech [6]ueur et rendeurs arre a freres precheurs delege le or de mon annuerare checun an oent quttes et paueles [7] a ohan mefrere et alambon eflh et aceas k apres eaus tenront hretablement lemaon deeur dtte (Document 12830213a, 3).

Pour notre examen, nous avons donc spar les incidentes quil tait possible danalyser comme des C5 de la phrase des autres, ce qui nous permet de crer une variable trois modalits, suivant le type de structure auquel nous sommes confront: phrase, incidente (phrase) et incidente (autre). Nous allons donc croiser ces dernires avec les valeurs des modalits PPD et PPF. Nous sparons derechef ltude de la ponctuation initiale de celle de la ponctuation nale. Pour chacune delles, nous examinons dabord sil y a une diffrence entre le marquage de la phrase et celui des deux types dincidentes, avant dobserver la manire dont se comportent les circonstants propositionnels relats par rapport aux phrases et aux incidentes. Ces dernires tant peu reprsentes, il nest pas possible de sassurer quaucune charte ou contexte immdiat particulier ne correspond ce type de structure.56 a. Frquence du marquage initial. En guise de premire tabulation, croisons le type de proposition considr et PPD. On obtient un tableau de six cases (table 6.44). Le test sur lensemble du tableau est signicatif, mais le contraste entre les cases nest pas particulirement marqu. Les deux types dincidentes se distinguent des phrases par leur attraction vis--vis du marquage initial. Si lon regroupe les incidentes en additionnant les totaux des colonnes des deux dernires lignes en une seule, on obtient la tabulation 6.45, qui indique clairement que les phrases et les incidentes sont globalement distinctes. Le rapport de chances nous apprend que les phrases sont environ quatre fois moins marques que les incidentes. Quen est-il de lcart entre les diffrentes sortes dincidentes? Lanalyse du soustableau ne tenant pas compte de la phrase donne la table 6.46. Malgr un rapport de
56 On voit dans les tableaux gurant en annexe quil ny a pas de charte ou de structure parti-

culire qui se retrouve dans lenvironnement des incidentes marques.

283

0 phrase incidente 8655 23 8678

1 2675 28 2703 11330 51 11381

0 0.03 -6.49

1 -0.09 20.84 3.94

2 = 25.75, ddl = 1, p = 3.88e 07 ### Aprs ajustement de idk pour 2 comparaisons: ### (seuils: 0.0253, 0.00501, 5e-04)

TAB . 6.45 Tri crois phrases et incidentes (groupes) PPD


0 incidente (phrase) incidente (autre) 8 15 23 1 13 15 28 21 30 51 0 -0.23 0.16 1 0.19 -0.13 1.63

2 = 0.31, ddl = 1, p = 0.579 $$$ Aprs ajustement de idk pour 2 comparaisons: $$$ (seuils: 0.0253, 0.00501, 5e-04) Valeur attendue minimale = 9.47

TAB . 6.46 Tri crois incidentes PPD


0 phrase incidente (phrase) C5,pers,1 8655 8 142 8805 1 2675 13 16 2704 11330 21 158 11509 0 0.02 $$$ 4.05 $$# 3.69 $$$ 1 0.06 $$$ 13.19 ### 12.02 $##

Test exact de Fisher, p = 5.91e 08 ### Valeur attendue minimale = 4.93

TAB . 6.47 Tri crois phrases, incidentes et autres circonstants propositionnels PPD

chances relativement lev, il nest absolument pas possible dinfrer un lien entre les variables. Il est vrai que si un test ne parvient pas rejeter H0 cela ne signie pas pour autant quil faut considrer que cette hypothse est dmontre (4.1.3.1), mais les contributions sont si faibles quon ne pourrait ignorer la faiblesse du contraste. Il y a donc bien une gradation, qui distingue la phrase de lincidente, mais aucun moyen de sassurer que le comportement de la ponctuation varie en fonction de linsertion syntaxique des incidentes. Examinons prsent le tableau de contingence croisant les phrases, incidentes et autres propositions personnelles subordonnes la phrase avec PPD (sans tenir compte de celles qui se trouvent en dbut de phrase, pour lesquelles le marquage interfrerait bien videmment avec celui de la phrase) il ne parat pas pertinent dintgrer les incidentes de niveau infrieur, puisquelles constituent des units qui ne pourraient tre compares aux C5 de phrase. Au niveau de la phrase, les attractions montraient dj que les incidentes se distinguaient des autres C5 propositionnels de mode personnel. Les tests sur lchantillon limit conrment cette tendance (table 6.47). Les incidentes sont apparemment

284

0 incidente (phrase) C5,pers,1 8 142 150

1 13 16 29 21 158 179

0 -5.23 0.7

1 27.08 -3.6 14.4

Test exact de Fisher, p = 3.23e 07 ### Aprs ajustement de idk pour 2 comparaisons: ### (seuils: 0.0253, 0.00501, 5e-04) Valeur attendue minimale = 3.4

TAB . 6.48 Tri crois incidentes et autres circonstants propositionnels PPD


0 phrase incidente (phrase) incidente (autre) 8637 6 11 8654 1 2702 17 16 2735 11339 23 27 11389 0 0.05 $$$ 7.54 $## 4.41 $$# 1 0.16 $$$ 23.85 ### 13.97 ###

2 = 49.98, ddl = 2, p = 1.40e 11 ### Valeur attendue minimale = 5.52

TAB . 6.49 Tri crois phrases et incidentes PPF

considrer comme des structures plus proches des phrases que des autres subordonnes circonstancielles. Ensuite, au vu du dernier sous-tableau, on ne pourrait confondre les incidentes et les subordonnes circonstancielles relates au point de vue de leur marquage initial (table 6.48). La probabilit est galement trs faible et atteint nouveau une valeur intuitivement perceptible. On peut synthtiser cette description de la ponctuation initiale par une gradation: la phrase est plus marque que les incidentes, qui sont plus marques que lensemble des autres circonstancielles. b. Frquence du marquage nal. Remarquons tout dabord que les effectifs sont trop faibles pour pouvoir vrier si quelque document serait signicativement diffrent de la majorit. Quen est-il du marquage nal? Si nous construisons un tableau de contingence similaire celui que nous avons obtenu en croisant les phrases et les diffrents types dincidentes avec PPD, remplaant ce dernier par PPF, nous obtenons la table 6.49. Le rsultat de lanalyse statistique de la tabulation est similaire celui que nous avons observ pour PPD: les incidentes se distinguent des autres propositions tudies, par une tendance attirer le marquage. Par ailleurs, la diffrence de marquage entre les phrases et lensemble des incidentes parat plus forte quavec PPD (table 6.50). Enn, il nest nouveau pas possible de distinguer les incidentes entre elles (table 6.51): la valeur du 2 est si faible quil parat raisonnable de considrer que lhypothse nulle nest certainement pas loin de la ralit. Passons prsent la comparaison des phrases, incidentes et autres subordonnes circonstancielles qui ne se trouvent pas en n de phrase. Ces dernires sont, daprs la dcomposition de lcart de la table 6.52, nettement moins marques que les autres modalits. Par contre, comme on peut le voir dans la table 6.53, la distinction entre les incidentes et les autres subordonnes circonstancielles est trs oue. 285

0 11339 50 11389

phrase incidente

8637 17 8654

2702 33 2735

0.05 -11.6

-0.16 36.7

6.2

2 = 46.23, ddl = 1, p = 1.05e 11 ### Aprs ajustement de idk pour 2 comparaisons: ### (seuils: 0.0253, 0.00501, 5e-04)

TAB . 6.50 Tri crois phrases et incidentes PPF

0 23 27 50

incidente (phrase) incidente (autre)

6 11 17

17 16 33

-0.42 0.36

0.22 -0.19

1.95

2 = 0.63, ddl = 1, p = 0.429 $$$ Aprs ajustement de idk pour 2 comparaisons: $$$ (seuils: 0.0253, 0.00501, 5e-04) Valeur attendue minimale = 7.82

TAB . 6.51 Tri crois phrases et incidentes (phrase) PPF

0 11339 23 138 11500

phrase incidente (phrase) C5,pers,1

8637 6 53 8696

2702 17 85 2804

0.46 $$$ 7.46 $## 25.27 ###

1.42 $$$ 23.14 ### 78.37 ###

2 = 136.13, ddl = 2, p = 2.76e 30 ### Valeur attendue minimale = 5.61

TAB . 6.52 Tri crois phrases, incidentes et circonstants propositionnels PPF

0 23 138 161

incidente (phrase) C5,pers,1

6 53 59

17 85 102

-0.7 0.12

0.4 -0.07

1.77

= 0.81, ddl = 1, p = 0.367 $$$ Aprs ajustement de idk pour 2 comparaisons: $$$ (seuils: 0.0253, 0.00501, 5e-04) Valeur attendue minimale = 8.43

TAB . 6.53 Tri crois incidentes et circonstants propositionnels PPF

286

FAB 0 1 564 134 698

FRE 80.8 19.2 100


0 1

100

200

300

400

500

TAB . 6.54 Tri plat de PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, pers-arg, pers)
Attractions (seuil adapt 0.366%) 12890112 12670828 124706 12780801 126505b 0.0119 1 9/21 (43%) 4/12 (33%) 6/25 (24%) 3/12 (25%) 3/13 (23%)

F IG . 6.47 Attractions signicatives entre RB et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, pers-arg, pers)
Rpulsions (seuil adapt 0.366%) 12800720 12710522 12700324 12440119 12701126 127203 12800504 12830213a 12711209 0.134 1 0/14 (0.0%) 0/10 (0.0%) 1/12 (8.3%) 1/11 (9.1%) 1/11 (9.1%) 3/22 (13.6%) 1/10 (10.0%) 8/42 (19.0%) 2/12 (16.7%)

F IG . 6.48 Rpulsions signicatives entre RB et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, pers-arg, pers)

c. Synthse. Lanalyse du comportement des incidentes par rapport ce qui leur ressemble le plus (dune part les phrases proprement dites, dautre part les propositions personnelles C5 relates au niveau de la phrase) montre que les 0,0,C5,pers,0 sont des units que lon peut qualier dintermdiaires, clairement distinctes des deux autres types de structures. Par contre, il nest pas possible de distinguer des tendances diffrentes quant au marquage des diffrents types dincidentes. Cette position correspond tout fait au problme que soulvent intrinsquement les 0,0,C5,pers,0: bien que ntant pas tout fait des phrases indpendantes, elles sont perues comme des units plus autonomes que les subordonnes. notre avis, devenant lindice de la conscience linguistique du scribe, la ponctuation rete cette perception. 6.1.4.2 0,0,C5,0,0 (phrase, pers-arg, pers): PPF

Les proportions de marquage des 0,0,C5,0,0 sont celles de la table 6.54; et lon peut constater quune seule charte attire ce marquage (gure 6.47). En retirant cette charte de lchantillon, la probabilit que les 0,0,C5,0,0 soient lis PPF.1 ne change aucun niveau.57 Comme en tmoignent les gures 6.49 et 6.50, peu de contextes immdiats res57 Voir lannexe 6.1.4.00C500PPFstable.

287

Attractions (seuil adapt 0.366%) 0,1,C5,0,0 0,1,C5,0,1 0,0,R2,0,0 0,0,Co,0,0 0,1,R2,0,0 0,0,C5,0,0 0,1,R2,pers,1 0,0,C5,0,1 2.02e19 1 38/59 (64%) 21/45 (47%) 12/34 (35%) 8/26 (31%) 5/18 (28%) 10/43 (23%) 3/11 (27%) 10/48 (21%)

F IG . 6.49 Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, pers-arg, pers)
Rpulsions (seuil adapt 0.366%) 0,0,P0,0,0 0,1,P0,0,0 0,1,R2,pers,0 0,0,A4,0,1 0,0,R3,0,1 0,0,S1,0,0 1.65e11 1 4/181 (2.2%) 0/51 (0.0%) 0/11 (0.0%) 2/18 (11.1%) 5/33 (15.2%) 5/29 (17.2%)

F IG . 6.50 Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, pers-arg, pers)
FAB 0 1 294 25 319 FRE 92.16 7.84 100
0 1

50

100

150

200

250

TAB . 6.55 Tri plat de PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, pers)

sortent. En observant les dpouillements,58 on remarque que les attestations releves au niveau de la phrase sont souvent aux alentours de chiffres. Par exemple:
ce choes ont fate lan del jncarna / [13]ton notre sangeor mlhe do cens et trete s el mo de ma y (Document 123605, 12). cte [24] choze et ce lettre furent fate lan notre angnor mlh deucen et quarante troz le lond apre le otaue de le treme (Document 12440119, 23). et de cez xa l j deners revat arrre j deners al trefon (Document 124706, 20).

Toutefois, cette correspondance nest pas systmatique. En outre, aux autres niveaux, les chiffres ninterviennent pas. 6.1.4.3 0,0,C5,0,1 (pers, pers): PPD

Cette construction nest pas souvent atteste (voir table 6.55). Le seul document qui ressort (gures 6.51 et 6.52) ne perturbe pas les attractions, qui restent identiques si on lignore. Quant lenvironnement attirant le marquage, il est essentiellement form de circonstants (gure 6.53). En observant les attestations, on voit que cest la
58 Voir en annexe.

288

Attractions (seuil adapt 0.73%) 12700407 12651113 12550521 12780801 12830213a 0.0402 1 3/10 (30%) 2/12 (17%) 1/10 (10%) 2/16 (12%) 2/16 (12%)

F IG . 6.51 Attractions signicatives entre RB et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, pers)
Rpulsions (seuil adapt 0.73%) 126505b 12711222 0.679 1 0/11 (0%) 0/11 (0%)

F IG . 6.52 Rpulsions signicatives entre RB et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, pers)
Attractions (seuil adapt 0.73%) 0,0,C5,0,1 0,0,S1,0,0 0,0,R2,0,0 8.23e08 1 14/51 (27%) 2/10 (20%) 3/21 (14%)

F IG . 6.53 Attractions signicatives entre MMP et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, pers)
Rpulsions (seuil adapt 0.73%) 0,0,P0,0,0 0,0,Co,0,0 1,0,S1,0,0 0,0,C5,0,0 0.0130 1 2/102 (2.0%) 0/43 (0.0%) 0/38 (0.0%) 0/15 (0.0%)

F IG . 6.54 Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, pers)

coordination qui ressort. Par exemple:


de laterre [. . .] ke damme oderne et ez fs re gles attenue a nodue a ramelhes en dme groe et menue en patronage de glse en cen en chapon en terre arables et en [4] tote atre rente re gles et amere reconoent a le gle et clament qutte le quarte part [. . .] (Document 123605, 2). [1] no [. . .] faons connant a tou cas k verront ce preens lettres ke freens l beggne com [4] dt l degle acqut ben et loalment par nom dachat alambert vennon et age [5]luj t e femme vntequatre ols [. . .] appaer chacon an atou jour ce vntequatre ols de cen [8] a j termne motet a fete an jehan baptte et motet a noel par telh drot [9] et par telh amende ke on paet les atres cens enle vlhe de dnant (Document 12550521, 1). [8] et l abee et l couens de robermont deords repondrent encontre eau en tel manere ke cls hrretage lor fut [9] donez en almone de ohan le boros et de rau e flh ke del drot hor k ahrete enfut par le cuert et [10] par les ugeors s ke los et ugement portet et qulh aparot par les lettre pendans qulh enauoent de mo [11] et par les lettres qulh auoent de mon sangnor roger de waenberge cu frere e ou et par les oeure k fate en [12] furent par no et par les ugeors k a uger en orent k par ugement ale requete

289

FAB 0 1 1162 474 1636

FRE 71.03 28.97 100


0 1

200

400

600

800

1000

TAB . 6.56 Tri plat de PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, pers-arg, pers, pers)
Attractions (seuil adapt 0.0777%) 12700606a 12651113 12680301 12630331 12361215 12700407 12750110b 12730512 128802a 127203 12700929 12720622 12710707a 127508 12650415 128802b 12550521 12750110a 12630527b 12770504 12700510 12890112 126505a 12900824 12780801 12420502 1.66e06 1 17/22 (77%) 18/27 (67%) 16/24 (67%) 13/20 (65%) 8/11 (73%) 10/16 (62%) 10/16 (62%) 8/15 (53%) 8/15 (53%) 21/55 (38%) 5/10 (50%) 5/10 (50%) 6/13 (46%) 7/16 (44%) 9/22 (41%) 7/17 (41%) 8/22 (36%) 5/13 (38%) 4/10 (40%) 4/10 (40%) 3/10 (30%) 7/24 (29%) 5/15 (33%) 5/16 (31%) 10/33 (30%) 4/12 (33%)

F IG . 6.55 Attractions signicatives entre RB et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, persarg, pers, pers) labee et le couent deuantdt [13] lor lurarent cete terre par verge et par meure et abonarent et pas commandarent par ugement ke lo porte (Document 12651113, 7).

6.1.4.4

0,0,C5,0,1 (phrase, pers-arg, pers-arg, pers, pers): PPF

Les proportions de marquage de cette structure sont parmi les plus leves (table 6.56). a. Tendances par document. La dcomposition de la tabulation entre les rfrences et PPF indique que lattraction est caractristique de trois documents (sept sans les ajustements, voir gure 6.55). Mais mme si lon retire les 0,0,C5,0,1 contenus dans ces sept chartes de lchantillon, lattraction reste du mme ordre.59 b. Contexte immdiat. On peut se pencher sans crainte sur lexamen du contexte immdiat la suite de ces constituants (gures 6.57 et 6.58). Les constructions qui suivent gnralement un de ces circonstants marqus sont les coordonnants, les 0,0,S1,0,0 et, dans une moindre mesure, les incidentes et les 0,1,C5,0,0.

59 Les tests gurent en annexe.

290

Rpulsions (seuil adapt 0.0777%)

12740531b 126505b 12600221a 12740531a 12711209 12670828 12711222 12700416 12760610b 12660613 12800720 12780406 126305 12831226 12600509 12760722 12701126 12710318 12710707b 12710420 12640907 12700324 12870908 124706 12630527c 12711203a 126311 12630527a 123605 12840511 12710522 12600514 12830213b 12440119 12520301a 12770612 126404 12830213a 12650704 12760610a

0/18 (0.0%) 7/51 (13.7%) 0/13 (0.0%) 1/18 (5.6%) 2/22 (9.1%) 3/25 (12.0%) 2/20 (10.0%) 2/19 (10.5%) 2/18 (11.1%) 2/17 (11.8%) 3/20 (15.0%) 1/11 (9.1%) 1/10 (10.0%) 1/10 (10.0%) 2/14 (14.3%) 3/18 (16.7%) 4/22 (18.2%) 2/13 (15.4%) 2/13 (15.4%) 5/25 (20.0%) 3/17 (17.6%) 3/17 (17.6%) 3/16 (18.8%) 2/12 (16.7%) 2/12 (16.7%) 2/12 (16.7%) 8/33 (24.2%) 6/25 (24.0%) 3/14 (21.4%) 3/14 (21.4%) 5/21 (23.8%) 2/10 (20.0%) 2/10 (20.0%) 4/17 (23.5%) 4/17 (23.5%) 3/11 (27.3%) 3/13 (23.1%) 13/45 (28.9%) 4/15 (26.7%) 3/12 (25.0%)

0.0138

F IG . 6.56 Rpulsions signicatives entre RB et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, persarg, pers, pers)

Attractions (seuil adapt 0.270%)

0,0,Co,0,0 0,0,C5,pers,0 0,0,S1,0,0 0,1,C5,0,0 0,1,A4,pers,1 0,0,R2,0,0 0,0,R3,0,1 0,1,R2,0,0

130/327 (40%) 9/11 (82%) 51/121 (42%) 40/103 (39%) 6/10 (60%) 21/65 (32%) 7/22 (32%) 15/50 (30%)

1.43e06

F IG . 6.57 Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, persarg, pers, pers)

291

Rpulsions (seuil adapt 0.270%) 0,0,P0,0,0 0,0,C5,pers,1 0,1,A4,0,1 0,1,P0,0,0 0,0,A4,0,1 0,1,C5,0,1 0,0,C5,0,1 0,0,C5,0,0 0,1,R3,0,1 0,0,C6,0,0 0,1,R2,pers,1 7.43e05 1 38/219 (17%) 0/16 (0%) 0/16 (0%) 0/16 (0%) 5/37 (14%) 34/144 (24%) 41/170 (24%) 24/101 (24%) 3/16 (19%) 8/33 (24%) 13/47 (28%)

F IG . 6.58 Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, persarg, pers, pers)
FAB 0 1 11 7 18 FRE 61.11 38.89 100
0 1

10

TAB . 6.57 Tri plat de PPF, pour les constituants de type 0,0,C5,pers,1 (niveau: phrase)
FAB 1 0 115 66 181 FRE 63.54 36.46 100
1 0

20

40

60

80

100

TAB . 6.58 Tri plat de PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers)

6.1.4.5

0,0,C5,pers,1 (phrase): PPF

Nous ne pouvons dgager de tendances claires sur la base des attestations examines, si ce nest que deux dentre elles gurent dans le document 127203 et sont marques comme les 0,0,R3,0,1 que nous avons analyss ci-dessus (6.1.3.11):
je la a pon de lege refaere et retenr x ols [. . .] pour doner en coute en cheme et en oller [28] ou promer uer apres me mort dz mars [. . .] pour querre les orzon en com boen amblera a me foemen xl (Document 127203, 26).

Il est plausible que la dimension smantique prime dans ce contexte. 6.1.4.6 0,0,C5,pers,1 (phrase, pers-arg, pers): PPF

La structure est galement trs souvent marque (table 6.58). Lattraction (gure 6.59) ne semble pas limite une charte en particulier60 et lexamen du contexte (gures 6.61 et 6.62) ne nous en apprend pas davantage.

60 Voir le tableau en annexe.

292

Attractions (seuil adapt 1.70%) 127203 126505b 0.0841 1 16/19 (84%) 9/10 (90%)

F IG . 6.59 Attractions signicatives entre RB et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers)
Rpulsions (seuil adapt 1.70%) 124706 0.000388 1 1/11 (9.1%)

F IG . 6.60 Rpulsions signicatives entre RB et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers)
Attractions (seuil adapt 1.70%) 0,0,S1,0,0 0,0,Rl,0,0 0.0474 1 68/96 (71%) 7/10 (70%)

F IG . 6.61 Attractions signicatives entre MMS et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers)
Rpulsions (seuil adapt 1.70%) 0,0,C5,0,0 0.048 1 5/14 (36%)

F IG . 6.62 Rpulsions signicatives entre MMS et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers)
FAB 0 1 5 5 10 FRE 50 50 100
0 1

TAB . 6.59 Tri plat de PPF, pour les constituants de type 1,0,C5,pers,1 (niveau: phrase)

6.1.4.7

1,0,C5,pers,1 (phrase): PPF

Le peu dattestations dans le corpus (voir table 6.59) ne nous laisse dautre choix que de les citer:
se vn hom dt lat a autre v ou dot (Document 124109, 4). e vn hom fert autre an anc [5] corant xx ols dot (Document 124109, 4).
sl et deuen le deu promers ans apres [14] me mort generau paage outre mer je la ale cro dx mar de leoes (Document 127203, 13).

se e _u _tenue_ pour m v pour autrv par promee v par autre raon a perone v alu a cu e ae laet v donet en cet ecrt v autrement e wel [37] que tout oet en paement / e e ne le deue nommeement a paer (Document 127203, 36).

293

FAB 0 1 303 106 409

FRE 74.08 25.92 100


0 1

50

100

150

200

250

300

TAB . 6.60 Tri plat de PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, pers-arg, pers, pers)
Attractions (seuil adapt 1.70%) 126505b 0.0646 1 6/11 (55%)

F IG . 6.63 Attractions signicatives entre RB et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, pers-arg, pers, pers)
Rpulsions (seuil adapt 1.70%) 127203 12830213a 0.100 1 1/17 (5.9%) 5/20 (25.0%)

F IG . 6.64 Rpulsions signicatives entre RB et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, pers-arg, pers, pers)
Attractions (seuil adapt 0.639%) 0,0,C5,0,0 0,0,C5,0,1 9.76e12 1 39/64 (61%) 36/92 (39%)

F IG . 6.65 Attractions signicatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, pers-arg, pers, pers) quant chefut fat l homme dele che deu / l commandarent en pas et l fent tote les droture / com [15] uelt fare atels veture (Document 12740224, 14).

Certains signes gurent devant des chiffres, mais les effectifs sont si faibles que nous ne pouvons nous prononcer. 6.1.4.8 0,1,C5,0,0 (phrase, pers-arg, pers, pers): PPD

Les proportions de marquage sont gures dans la table 6.60. Pour peu quon puisse observer les associations entre PPD et certains documents (leffectif est gnralement insufsant pour ce faire), elles sont toutes non signicatives (gures 6.63 et 6.64).61 Quand on regarde de prs quelles structures prcdent ces circonstants, on voit que ce sont principalement dautres circonstants qui attirent signicativement la prsence du ponctogramme. Si lon observe les attestations, on dcouvre que leschatocole revient frquemment:62
61 Voir le tableau en annexe. 62 Voir le dpouillement complet en annexe.

294

Rpulsions (seuil adapt 0.639%) 0,0,P0,0,0 0,0,Co,0,0 0,0,S1,0,0 0,0,R3,0,1 0,0,R2,0,0 0,0,A4,0,1 1.11e07 1 7/109 (6.4%) 0/12 (0.0%) 1/12 (8.3%) 2/16 (12.5%) 11/51 (21.6%) 4/21 (19.0%)

F IG . 6.66 Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, pers-arg, pers, pers)
PPD.0 LCF.0 LCF.1 344 20 364 PPD.1 87 31 118 431 51 482

TAB . 6.61 Tri crois position nale ou non PPD


FAB 0 1 697 132 829 FRE 84.08 15.92 100
0 1

100

200

300

400

500

600

TAB . 6.62 Tri plat de PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) cte [24] choze et ce lettre furent fate lan notre angnor mlh deucen et quarante troz le lond apre le otaue de le treme (Document 12440119, 23). che fut fat en lan del ncarnaton notre sangnour hesucrt mo derren our de march (Document 12630331, 30). cco lxjo le

[31]

chefut fat et donet lan et les jours deeur nomes (Document 12890719, 22).

On peut vrier cette association entre la n de leschatocole et le marquage initial en tabulant une variable binaire indiquant si le constituant est ou non la n de la charte (LCF) avec la variable PPD (tableau 6.61). Le tri crois est parlant (2 = 38.4907, p = 5.502e 10): lassociation entre la position en n de charte et ce marquage est nette. Ce quon dcouvre ici est donc la limite de la morphosyntaxe et fait nouveau entrer en jeu le style formulaire. 6.1.4.9 0,1,C5,0,1 (phrase, pers-arg, pers): PPD

La proportion de 0,1,C5,0,1 marqus linitiale est apprciable (table 6.62). Elle ne parat pas lie un document en particulier (la probabilit de H0 est trs leve pour tous les documents, cf. gures 6.67 et 6.68). Lafnit du marquage et dun contexte immdiat constitu dun autre circonstant est nouveau trs claire (gure 6.69). Les 0,1,C5,0,1 prennent des formes trs di295

Attractions (seuil adapt 0.270%) 12830213a 12710420 12700510 12780801 12701126 123605 127203 12730512 0.576 1 9/45 (20%) 3/12 (25%) 3/13 (23%) 3/13 (23%) 2/12 (17%) 2/11 (18%) 7/39 (18%) 2/10 (20%)

F IG . 6.67 Attractions signicatives entre RB et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers)
Rpulsions (seuil adapt 0.270%) 12670828 12680310 12440119 12660613 12651113 12711209 12600509 12711222 12890112 12760610b 126505b 0.262 1 0/12 (0.0%) 0/12 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 1/12 (8.3%) 1/12 (8.3%) 1/11 (9.1%) 1/11 (9.1%) 3/21 (14.3%) 1/10 (10.0%) 2/16 (12.5%)

F IG . 6.68 Rpulsions signicatives entre RB et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers)
Attractions (seuil adapt 0.568%) 0,0,C5,0,0 0,0,C5,0,1 0,0,A4,0,1 0,0,R2,pers,0 5.1e09 1 24/53 (45%) 30/107 (28%) 15/56 (27%) 12/44 (27%)

F IG . 6.69 Attractions signicatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers)
Rpulsions (seuil adapt 0.568%) 0,0,P0,0,0 0,0,Co,0,0 0,0,S1,0,0 0,0,R2,0,0 0,0,R3,0,1 9.54e09 1 7/213 (3.3%) 1/80 (1.2%) 2/53 (3.8%) 22/162 (13.6%) 4/28 (14.3%)

F IG . 6.70 Rpulsions signicatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers)

verses et nous navons pu dgager de points communs frquents pour les occurrences ponctues.63 6.1.4.10 0,1,C5,pers,1 (phrase, pers): PPD

Cette structure, qui prend la forme dune innitive relate, est galement trs peu atteste (table 6.63). En consquence, il est prvisible quaucun document ne contienne

63 Voir le dpouillement en annexe.

296

FAB 0 1 30 12 42

FRE 71.43 28.57 100


0 1

10

15

20

25

30

TAB . 6.63 Tri plat de PPD, pour les constituants de type 0,1,C5,pers,1 (niveaux: phrase, pers)
FAB 0 1 21 9 30 FRE 70 30 100
0 1

10

15

20

TAB . 6.64 Tri plat de PPD, pour les constituants de type 0,1,C5,pers,1 (niveau: phrase)

assez doccurrences de la construction pour quon puisse tester son association.64 Cependant, et la diffrence avec la structure qui prcde est majeure, ces C5 marqus sont trs cohrents: un coup dil sur les attestations, dont voici les trois premires,65
et l auenot que l eueke [11] e plent que hon l fet tort / no deuon enuoer douz de no home la v on l [12] ferot tort / por auor e on l faot tort v non (Document 12430709, 10). et net en erauenrat le maon mantenant por achater vn [19] et otez al acrament (Document 124706, 18). et par lor jugement cele dme groe et menue [11] de peres rendemes nos a la maon deuant dte por tenr et recuor perpetuement [12] s commelour dme lgement (Document 126505b, 10).

montre que le relateur employ est toujours por. On avait pu admettre, au vu des sections prcdentes tude du prdicat (6.1.2.1) et des actants (6.1.3) , que la ponctuation ne dpendait pas uniquement de la morphosyntaxe, mais quelle suivait certainement des tendances lies la structure nonciative des documents et au style formulaire. Avec ce type de structure, on peut en outre sinterroger sur les mots employs pour marquer les relations et tendre la question de la ponctuation aux considrations portant sur lexique employ. 6.1.4.11 0,1,C5,pers,1 (phrase): PPD

Cette fois, plus du quart des constituants de ce type attirent le marquage (table 6.64). La tabulation relgue aux annexes entre les rfrences des documents et le marquage laisse voir quaucun texte ne rassemble sufsamment dattestations pour tre valu.

64 Voir le tableau en annexe. 65 Voir le dpouillement complet en annexe.

297

Du reste, les constructions correspondant ce type sont trs varies. titre dexemple, on peut citer:66
et chacune de no parte at ce le [19]tre emblanz mot amot ecrte kele ne puent etre change ne muees (Document 123712, 18). et ce pament doent lh [8] faere des dj s mus en com lh et deuet de mos en moz entrement quenke moln auenge (Document 12520301a, 7). l quel quatre reproment [12] couent a tenr de part mon angnor gerar de quarante mar de lgos lh eot de nos ds (Document 12630331, 11). lesquez nos paerons tant ke nos vuerons et la maons [14] apres le deces de nos et dame adelhen deuant dte quant elle entrement la dme recuerat (Document 126505a, 13).

Si bien que nous navons pu leur trouver un point commun qui les caractriserait. 6.1.4.12 Synthse

a. Cohrence. Bien que souvent trop peu reprsentes pour permettre un test en bonne et due forme, les structures laissent voir que, dans le cas o les effectifs sufsent, il ny a pas dexclusivit ou de quasi exclusivit, comme ctait le cas pour les actants. Les phnomnes de marquage sont, jusqu preuve du contraire, rpartis dans lensemble du corpus. b. Contexte. Lorsque les effectifs le permettent, il est possible de sassurer que les constituants attirent une ponctuation aux alentours les uns des autres, mais on ne voit pas reparatre les actants attirant le marquage reprs prcdemment. Cela conforte lide de lindpendance du marquage. Les circonstants marqus se rencontrent dans lentourage dautres C5, ce qui ne choque pas dans les quelques cas valus. Thoriquement, la dnition des circonstants dans le modle fait quils ne sont pas considrs comme prvus par le schma actanciel du lexme verbal assumant la fonction P0 (3.4.2.3). Par consquent, le nombre de constituants possibles nest pas x. Les diffrents circonstants slectionnant le mme prdicat peuvent gnralement tre jugs indpendants, mais le fait relev ci-dessus nous incite nous demander sil ne vaudrait pas mieux les dcrire comme des coordonns. En effet, prenons lexemple suivant:
[Elles67 ] furent fate lan notre angnor mlh deucen et quarante troz le lond apre le otaue de le treme (Document 12440119, 24).

Cette phrase, qui contient les deux circonstants lan notre angnor mlh deucen et quarante troz et le lond apre le otaue de le treme, est reprsente comme dans la gure 6.71 daprs notre modle, ce qui nest pas trs diffrent de ce quon observe dans la gure 6.72.68 Il existe cependant une relation smantique entre les deux circonstants qui nest pas du mme ordre que celle observe gnralement en cas de
66 Voir le dpouillement complet en annexe. 67 Nous pronominalisons cte choze et ce lettre pour simplier lexpos. 68 Voir 3.4.7.2 sur la schmatisation de la coordination.

298

lan Nostre Saignor. . . C5

le londi aprs. . . C5

furent faites S1 [Elles]

F IG . 6.71 Structure dune phrase comprenant deux circonstants (modle choisi)

coordination lan Nostre Saignor. . . C5 le londi aprs. . . C5

furent faites S1 [Elles]

F IG . 6.72 Structure dune phrase comprenant deux circonstants (modle alternatif)

coordination. Cela se traduit morphosyntaxiquement par labsence gnralise de coordonnant spciant la relation entre les deux C5. Quon accepte lide que les circonstants sont coordonns ou non ne change rien lattraction quils manifestent de manire gnrale par rapport au marquage. Cette attraction semble dautant plus forte que les circonstants sont en contact les uns avec les autres. c. Hors de la morphosyntaxe. la liste des formules releves jusqu prsent, il faut peut-tre ajouter la portion nale de leschatocole, de forme varie. Par ailleurs, ltude des 0,1,C5,pers a mis en vidence lemploi systmatique du relateur por. Pour approfondir ltude de la relation entre les lexmes mobiliss, les structures quils servent construire et leur ponctuation, il serait ncessaire de lemmatiser le corpus. Lentreprise pourrait commencer par les adverbes relateurs. d. Proportions expliques. Si lon admet de ranger les constituants parmi les units attirant la ponctuation, on peut dresser la liste des attractions, de la mme manire que nous lavons fait ci-dessus pour les actants. Ainsi, pour la ponctuation initiale, les circonstants attirant sa prsence sont: 0,0,C5,pers,0; 0,1,C5,0,0 (phrase,pers-arg,pers,pers); 0,0,C5,0,1 (pers,pers); 0,1,C5,0,1 (phrase,pers-arg,pers); 0,1,C5,pers,1 (pers,phrase); 0,1,C5,pers,1 (phrase).

299

P.0 ActCirc.0 ActCirc.1 54919 2696 57615

P.1 3479 1093 4572 58398 3789 62187

P.0 12.26 -188.95

P.1 -154.49 2381.1 6.4

2 = 2733.45, ddl = 1, p = 0 ###

TAB . 6.65 Proportions de marquage expliqu par la ponctuation des complments


FAB 0 1 3479 1093 4572 FRE 76.09 23.91 100
0 1

500

1000

1500

2000

2500

3000

TAB . 6.66 Tri plat de la position (limite de complment ou non) pour les positions ponctues

Paralllement, pour la ponctuation nale, nous retenons les attractions impliquant les constituants: 0,0,C5,pers,0; 0,0,C5,0,0 (pers-arg,pers); 0,0,C5,0,1 (phrase,pers-arg,pers-arg,pers,pers); 0,0,C5,pers,1 (phrase); 0,0,C5,pers,1 (phrase,pers-arg,pers); 1,0,C5,pers,1 (phrase).

Nous pouvons ainsi reconsidrer les rsultats de la synthse sur la ponctuation des actants (6.1.3.14), et construire un tri crois sur la base de la dnition de chaque position entre deux mots (limites de lnonc exceptes) par deux variables rpondant aux questions: la position est-elle la limite dun actant ou dun circonstant attirant la ponctuation cet endroit? la position est-elle effectivement marque dun ponctogramme? Cela nous permet de construire la table 6.65. En dehors du marquage de la phrase, les positions reconnues comme attirant la ponctuation sont signicativement beaucoup plus marques que les autres. nouveau, si nous envisageons les exceptions ces tendances, il est plus frquent que les positions ne soient pas marques alors que le contexte attire la ponctuation plutt que le contraire. Ainsi, considrer les circonstants comme des environnements propices lapparition de la ponctuation permet daugmenter la proportion de ponctogrammes expliqus par leur position (table 6.66) sans pour autant augmenter de manire dmesure la quantit de constructions non marques alors quelles pourraient ltre (table 6.67). 6.1.5 Coordination

Daprs les analyses effectues jusqu prsent, linuence de la coordination sur lemploi de la ponctuation est apparemment aussi importante que gnralise. On a en effet vu apparatre son inuence tant aux alentours du prdicat que des actants et

300

FAB 0 1 54919 2696 57615

FRE 95.32 4.68 100


0 1

10000

20000

30000

40000

50000

TAB . 6.67 Tri plat de la position (limite de complment ou non) pour les positions non ponctues

mme, dans une certaine mesure, des circonstants. La coordination est donc un type de construction qui touche tous les niveaux dintgration syntaxique. En tant que telle, on pourrait exiger de ltude du marquage de la coordination quelle tienne compte dun important nombre de variables pour tre tout fait able. Nanmoins, la gnralit de la relation sur le plan morphosyntaxique justie une approche unie, o les coordinations de niveaux argumental et immdiat seront tudies sans tre distingues. Les donnes ont t slectionnes et annotes (6.1.5.1) de manire permettre un traitement appropri de la problmatique (6.1.5.2). 6.1.5.1 Prparation des donnes

La slection des constituants qui formeront lchantillon de notre analyse devra tenir compte de ce que nous avons dcouvert ce point de lexpos (a). Les variables disponibles ne sufsant pas aborder les coordinations, nous serons amen dnir une nouvelle variable, plus adquate au traitement de la problmatique (b et c). a. Slection des individus. Ltude de la phrase, des actants et des circonstants a mis en vidence une srie denvironnements qui favorisaient lapparition de la ponctuation. Il est probable que ces tendances interagissent avec la manire dont la coordination inuence la prsence des ponctogrammes. Dans une logique similaire celle qui nous a pouss carter les propositions partageant une de leurs limites avec une autre quand nous avons tudi leur marquage,69 il nous parat protable de ne pas intgrer lchantillon les constituants dont la ponctuation peut dj tre explique par un des environnements pouvant tre considrs comme la justiant. b. Ajout dune nouvelle variable. Pour tudier de manire approfondie la construction, nous avons d crer une nouvelle variable dcrivant les constituants, laquelle nous avons assign le sigle MC. Les modalits de cette variable dcrivent la position du constituant dans un ensemble coordonn: MC.coord indique que lunit nest pas coordonne; MC.dbut signie quil sagit de la premire unit du groupe coordonn; MC.n quil sagit de la dernire et MC.centre que lunit est coordonne, mais nest ni en premire, ni en dernire position. Par exemple, dans la phrase:
[1] jakemes l prouot johans l don l archakene et toz l captelez [. . .] (Document 123605, 1).

la valeur de MC pour le constituant jakemes l prouot est MC.dbut; celle de johans l don et de l archakene est MC.centre; celle de toz l captelez correspond MC.n. Plusieurs constituants peuvent ainsi avoir comme modalit MC.centre tout en faisant
69 Voir 6.0.1.2 sur les raisons qui nous poussent retirer de chaque chantillon les units

partageant une de leurs limites avec une autre unit du mme chantillon.

301

PPD.0 MC.coord. MC.dbut MC.n MC.centre 67480 2284 2872 2677 75313

PPD.1 2996 414 139 1559 5108 70476 2698 3011 4236 80421

PPD.0 33.2 ### 23.3 ### 0.97 $$$ 419.46 ###

PPD.1 489.55 ### 343.54 ### 14.27 ### 6184.53 ###

2 = 7508.82, ddl = 3, p = 0 ###

TAB . 6.68 Tri crois des positions de coordination et PPD

partie du mme groupe coordonn. Pour simplier le traitement, le coordonnant qui spcie la relation reoit la modalit de MC correspondant sa position, exactement comme sil tait lui-mme coordonn, cest--dire, gnralement MC.centre. c. Cas particulier des groupes de constituants. Le traitement est plus complexe dans le cas de coordination de groupes de constituants, comprenant par exemple un prdicat et un ensemble darguments:

et [10] e cel meme drot [. . .] lor qutte au et lor done en almone / e nul drot aj (Document 12680802b, 9).

La valeur de MC pour les diffrents arguments dpend alors de la ponctuation tudie (initiale ou nale). Dans tous les cas, les arguments regroups dans un membre coordonn qui ne se trouvent ni au dbut, ni la n de ce membre reoivent la modalit MC.coord. Cest le cas de done et en dans lexemple ci-dessus. Si on tudie la relation entre la coordination et la ponctuation initiale, tout argument autre que le premier du groupe sera galement MC.coord, alors que le premier sera MC.dbut, MC.centre ou MC.nal, en fonction de la position de lensemble du groupe dans la structure rassemblant les lments coordonns. Par exemple, seul le constituant lor sera dcrit par la modalit MC.dbut. Pour la ponctuation nale, on procde de mme, mais en ne marquant que largument nal (ici, almone). 6.1.5.2 Analyse

Nous navons ce jour pas dvelopp de moyen permettant dextraire efcacement le contexte immdiat des groupes coordonns. Aussi, les analyses fournies ci-dessous ne tiennent pas compte des constituants qui prcdent ou suivent les groupes coordonns. Pour tudier la ponctuation des diffrents membres coordonns, il ne parat pas ncessaire daborder distinctement la ponctuation initiale et la ponctuation nale des constituants. Nous commencerons par traiter la ponctuation initiale dans toutes les positions correspondant aux modalits de la variable MC (a, b et c) avant de nous focaliser sur le marquage nal du dernier membre (d). a. Tabulation gnrale. Une fois lchantillon slectionn et les constituants dcrits laide de la variable MC, il est ais de construire la tabulation 6.68, qui croise les modalits de la nouvelle variable avec celles de PPD. La ventilation est trs signicative. La dcomposition de lcart, sur le tableau de droite, prsente principalement les MC.coord et les MC.n comme repoussant PPD.1.

302

PPD.0 MC.coord. MC.dbut 67480 2284 69764

PPD.1 2996 414 3410 70476 2698 73174

PPD.0 1.24 -32.31

PPD.1 -25.3 660.94 4.08

2 = 717.29, ddl = 1, p = 5.21e 158 ### Aprs ajustement de idk pour 4 comparaisons: ### (seuils: 0.0127, 0.00251, 0.00025)

TAB . 6.69 Tri crois des positions de coordination MC.coord et MC.dbut et PPD
PPD.0 MC.coord. MC.centre 67480 2677 70157
2

PPD.1 2996 1559 4555 70476 4236 74712

PPD.0 25.57 -425.35

PPD.1 -393.77 6551.31 13.1

= 7390.31, ddl = 1, p = 0 ### Aprs ajustement de idk pour 4 comparaisons: ### (seuils: 0.0127, 0.00251, 0.00025)

TAB . 6.70 Tri crois des positions de coordination MC.coord et MC.centre et PPD
PPD.0 MC.coord. MC.centre 67446 562 68008 PPD.1 2979 931 3910 70425 1493 71918 PPD.0 10.84 -511.54 PPD.1 -188.62 8897.43 37.5

2 = 9597.14, ddl = 1, p = 0 ### Aprs ajustement de idk pour 4 comparaisons: ### (seuils: 0.0127, 0.00251, 0.00025)

TAB . 6.71 Tri crois des positions de coordination MC.coord et MC.centre et PPD (coordonnants retirs)

b. Attractions. Lorsquon compare sparment la ponctuation de MC.coord et des modalits MC.dbut et MC.centre,70 on voit tout dabord que lattraction est effective pour MC.dbut (table 6.69). De mme (table 6.70),71 les constituants MC.centre (parmi lesquels on compte les coordonnants, rappelons-le) sopposent galement la tendance propre la noncoordination. En retirant les coordonnants (table 6.71), le rapport de chances est nettement plus lev. c. Rpulsions. Les constituants non coordonns et les constituants naux dune coordination sopposent ensemble la prsence de marquage. Ils peuvent leur tour tre compars (table 6.72). Les constituants qui rejettent la ponctuation ne sopposent pas entre eux signicativement. Lobservation de quelques attestations permet den entrevoir la raison:
70 La rpartition des attractions par document ne modie pas lorientation et la signicativit

de lcart. Voir lannexe 6.1.5.gure-coord-init.


71 La rpartition des attractions par document ne modie pas lorientation et la signicativit

de lcart. Voir 6.1.5.gure-coord-centre.

303

PPD.0 MC.coord. MC.n 67480