Vous êtes sur la page 1sur 52

ELEMENTS DE LINGUISTIQUE

ET DE PRAGMATIQUE POUR LA COMPREHENSION AUTOMATIQUE DU LANGAGE : du signe au sens

J. Caelen

CLIPS
Communication Langagire et Interaction Personne-Systme
Fdration IMAG BP 53 - 38041 Grenoble Cedex 9 - France

PLAN

Elments de linguistique
La smiotique La syntaxe Le lexique La smantique La rhtorique

Elements de pragmatique
La pragmatique La dixis Le discours et le texte

La comprhension du langage
Psycholinguistique et comprhension Processus de comprhension Quelques hypothses et modles Pour une structure logique intermdiaire

La comprhension dans le systme DIRA

Note : Ce support de cours ne peut-tre reproduit ni diffus sans autorisation de lauteur.

La smiotique
Le smiotique traite des systmes de signes en adressant le champ de la signifiance qui est propre au signe et qui le constitue comme unit. Ltude smiotique consiste identifier les units, en dcrire les marques distinctives et dcouvrir des critres de plus en plus fins de pertinence. Extension de la linguistique tous les types de signe, la smiotique se distingue de la smiologie en ce sens quelle tudie davantage les signes en tant quunit plutt que comme systmes de communication. Avec la smantique nous entrons dans le mode spcifique de signifiance qui est engendr par le discours. Les problmes qui se posent ici sont fonction de la langue comme production de messages.

1. Le signifiant et le signifi de De Saussure


De Saussure fondateur de la linguistique distinguait seulement deux notions : le signifiant (le mot porteur de sens comme chien, dog) et le signifi (la chose nomme, chien rfrant un chien particulier). Le signe linguistique est form dun signifiant et dun signifi : il est dyadique et arbitraire.

2. Le signe ternaire de Pierce


Les trois dimensions du signe de Pierce (contemporain de Saussure) sont : (a) syntaxique : le signe en lui-mme, (b) smantique (existentielle) : le signe dans son rapport lobjet, (c) pragmatique : le signe dans son rapport linterprtant, Elles se dveloppent sur trois axes : la primit (tre tel quil est), la secondit (tre tel quil est par rapport un autre), la tiercit (tre tel quil est par rapport aux deux autres)

Catgories Dimensions /lui-mme /objet /interprtant primit qualisigne icne rhme secondit sinsigne indice dicisigne tiercit lgisigne symbole argument

licne ressemble son objet (le panneau routier), lindice est un existant actualis (le cadran de lhorloge), le symbole exige des infrences intellectuelles pour conduire lobjet (tout mot comme oiseau, etc.). Dans ce systme les dictiques sont des lgisignes indiciaires. La linguistique moderne na gure retenu de Pierce que les notions dicne, indice et symbole.

3. Le signe linguistique de Hjemslev


Hjemslev distingue deux plans (Expression, Contenu) et deux composantes dans chacun de ces plans (Substance, Forme). Le Signe est la runion des formes sur les deux plans. Il ne peut y avoir de linguistique sans signe. Signe = {forme de l'expression + forme du contenu} Exemples: eau eau dans bouteille eau minrale eau Evian substance forme | | |

Expression

substance forme

| | |

Contenu

Substance de l'expression : matire non analyse (eau dans son expression la plus gnrale) Forme de l'expression : matire organise action de l'esprit sur le donn (eau dans une bouteille cest--dire ayant pris forme de bouteille par ex.) Substance du contenu : catgorisation abstraite, structurale (eau minrale parmi toutes les espces deau) Forme du contenu : catgorisation concrte action de l'esprit sur le structurel (cette eau concrte de marque Evian, donc de forme caractristique)

4. Le carr smiotique

Monde des signes forme de l'expression


Smantique Psycholinguistique

Monde mental forme du contenu Concept


Psychologie cognitive

Signifi
Linguistique

Signifiant
Philosophie

Rfrent Monde physique substance du contenu

Monde des signes substance de l'expression


Phonologie phontique

Signifiant

le processus de signification va du signe au rfrent : signe -> concept -> rfrent

et le sens du rfrent au signe : rfrent -> concept -> signe

La syntaxe
1. La grammaire gnrative de Chomsky
En 1957 Chomsky propose une nouvelle thorie, beaucoup plus computationnelle que les grammaires classiques, fonde sur la dcomposition structurelle en constituants (phrase, groupes, syntagmes, mots, etc.) formalisable par des rgles de rcriture. Partant de lhypothse que la syntaxe est inne, il suggre quil existe une structure de surface (la phrase) et une structure profonde dduite de cette dernire par des rgles de transformation. Ses travaux suscitent beaucoup de recherches en psycholinguistique mais nul ne parvient fonder sa thorie chez lhumain. Il la rvise alors compltement (1982) en introduisant le liage directement sur la structure de surface. Cette thorie parait tre ad hoc et sloigne encore plus dun modle cognitif possible. Pour rendre ltude de la syntaxe indpendante du sujet parlant, il avait ds le dbut distingu performance et comptence : la comptence serait celle dun locuteur parlant parfaitement la langue en en connaissant toutes les rgles, la performance serait le niveau de ralisation rellement atteint par un sujet parlant. La plupart des thories et modles utiliss en TALN (Traitement Automatique du Langage Naturel) drivent de la thorie gnrativiste. Nous en examinons certaines ci-aprs.

2. Les grammaires lexicales fonctionnelles de Bresnan-Kaplan


La diffrence entre LFG et grammaire de Chomsky (premire manie) rside essentiellement dans l'absence de distinction entre structure profonde et structure de surface. La syntaxe permet d'attribuer toute phrase de la langue: (a) une structure de constituants (c-structure) qui est un arbre tiquet engendr partir de rgles de rcriture mais qui dcrit directement l'agencement superficiel des lments de la phrase et (b) une structure fonctionnelle (f-structure) qui sera le seul input de la composante smantique et qui distribue les notions "SUJET", "OBJET", "ADJOINT", "GENRE", "NOMBRE", etc. Il n'y a pas de rgles transformationnelles. Le lexique contient des informations catgorielles et fonctionnelles. Les rgles de rcriture peuvent tre annotes l'aide de "gabarits" qui permettent de colporter des informations fonctionnelles dans l'arbre syntaxique. Ex: (a) la fille prend au bb le jouet (b) la fille prend le jouet au bb

Le verbe prendre accepte les deux constructions: (a) CONST prendre <(+SUJ) (+A-OBJ) (+OBJ)> (b) CONST prendre <(+SUJ) (+OBJ) (+A-OBJ)>

et une rgle unifie les deux solutions (+OBJ) <-> (+A-OBJ) (ce n'est pas une rgle transformationnelle) L'quivalence smantique se retrouve au niveau de l'interprtation sur les notions de "agent", "bnficiaire", "objet", etc. et non aprs un jeu subtil de transformations syntaxiques comme chez Chomsky. Les rgles de constituants sont pour cet exemple: P -> GN . GV /(+SUJ)=-, +=-/ GN -> DET . N /(), (+NUM)=-/ GV -> V . GN . GP /(), (+OBJ)=-, (+A-OBJ)=-/ GP -> Prp . GN + et - notent les relations de dominance sur le pre (+) et les fils (-) qui sont instancier au niveau de la structure fonctionnelle. SUJ, OBJ etc. sont des mtavariables. Reprsentation de l'arbre syntaxique "dcor": P GN (+SUJ)=DET N (+NUM)=V GV

GN (+OBJ)=DET N

GP (+A-OBJ)=Prp GN DET N bb

la

fille

prend

le

jouet

(le)

Reprsentation du lexique : la DET, (+SPEC)=le, (+GENRE)=F, (+NUM)=S fille N, (+SEM)="Personne", (+GENRE)=F, (+NUM)=S prendre V, (+TEMPS)="Prsent", (+MODE)="Ind", (+PERS)=3, (+NUM)=S, CONSTRUCT prendre <(+SUJ) (+A-OBJ) (+OBJ)> le DET, (+SPEC)=le, (+GENRE)=M, (+NUM)=S jouet N, (+SEM)="Objet", (+GENRE)=M, (+NUM)=S au DET, (+SPEC)= le, (+GENRE)=M, (+NUM)=S bb N, (+SEM)="Personne", (+GENRE)=M, (+NUM)=S

L'analyse se fait en propageant les valeurs des mtavariables jusqu'au lexique (ascendant ou descendant selon les indications fournies par les oprateurs + et -), puis en remontant le long des noeuds, on s'assure de la cohrence des attributs. P GN (+SUJ)=DET N (+NUM)=V GV +=GN (+OBJ)=DET N GP (+A-OBJ)=Prp GN DET jouet (le) N bb

(+SPEC)=le (+NUM)=S

(+TEMPS)=prsent (+CONSTRUCT)= etc. (+SPEC)= (+SPEC)=le (+NUM)=S (+NUM)=S

la

fille

prend

le

ce qui donne l'analyse suivante: [SUJ=fille SPEC=le NUM=singulier GENRE=fminin SEM=personne ACTION=prendre TEMPS=prsent MODE=indicatif PERS=3 NUM=singulier CONSTRUCT prendre <(+SUJ) (+A-OBJ) (+OBJ)> OBJ=jouet SPEC=le NUM=singulier GENRE=masculin SEM=objet A-OBJ=bb SPEC= le NUM=singulier

GENRE=masculin SEM=personne] qui est applele la structure fonctionnelle de la phrase. On remarque le rle central du verbe avec son cadre rectionnel. Il est diffcile dans ce cadre d'laborer une syntaxe des adverbiaux et des subordonnes circonstancielles. Ce formalisme fonctionne bien pour des relations de dominance proche. Dans un autre cas il faut introduire des mtavariables ayant une porte plus tendue (++ et --) BIBLIOGRAPHIE J. Bresnan and R.M. Kaplan: Introduction: Grammar as mental representation of Language - The mental representations of grammatical relations. Bresnan d., Cambridge, Mass. & London. The MIT Press, 1982.

3. Les grammaires catgorielles (GPSG) de Gazdar


Ces grammaires sont fondes sur le lambda-calcul et la notion de catgories qui hritent les unes des autres. Exemple, la catgorie SN D2 Cat = SN
agr = nombre =sing personne = 3 subj = <Indices>

agr et subj sont des traits. Parmi ceux-ci le trait BAR joue un rle prpondrant, il donne le degr de profondeur dans la structure arborescente finale. Gazdar remarque que dans les grammaires hors-contexte (CFG) une rgle de la forme SV -> V SN SP est ambige dans la mesure o elle ne permet pas de distinguer la notion de dominance de celle de succession. Il propose de les distinguer par lcriture : SV -> V SN SP (domination) [SubCat] < ~[SubCat] (succession) o SubCat est un trait de sous-catgorisation Il obtient galement une conomie de rgles en propageant les traits par hritage dans les catgories. Par ex : SN[BAR=2][agr=x] -> Dt[agr=x] N[BAR=1][agr=x] qui assure laccord du trait agr (genre et nombre) entre le dterminant et le nom. Cette rgle est un sous-arbre de profondeur 2 construite sur des lments de profondeur 1. La syntaxe dune phrase peut donc tre reprsente par un arbre construit

partir de sous-arbres. La phrase est correcte si larbre admissible est bien form. Rciproquement la grammaire se rduit des rgles de formation darbres (imbrication de sous-arbres en utilisant le principe de tte, de pied, daccord, cest--dire les relations entre les sous-arbres). Il dfinit aussi des mtargles pour dduire dautres rgles de formation ex: pour former le passif RgleActif -> RglePassif. Du lambda-calcul il tire loprateur / qui fonctionne comme une mtargle ou comme un trait X -> Y Z est (X/W -> Y/W Z ou X/W -> Y Z/W) avec W/W ->[e] et X/W = X[slash=W] Soit la phrase: Quels amis, Pierre croit partis ? Elle est dabord traite par une grammaire transformationnelle pour rapprocher les termes qui doivent saccorder, Pierre croit ((Quels amis) partis ?) qui peut tre analyse comme une phrase laquelle il manque un SN, cest--dire P/SN. Le / peut tre lu comme manque et larbre comme une propagation de ce manque. S/SN
SN V Pierre crot SV/SN SN/SN [e] SA partis

Complt par la rgle de topicalisation : SP -> SN P/SN P SN Quels amis Les principes dinstanciation : 1. HFC = Head Feature Convention, les traits de tte doivent avoir la mme valeur pour le pre et le fils tte 2. FFP = Foot Feature Principle, idem 1. pour le pre et tous ses fils 3. Accord entre les traits des frres S/SN Pierre crot partis

Forme logique de Montague


Cest une composante smantique associe la GPSG Ex. : Pierre regarde Marie => Regarde(Pierre, Marie)

11

P SN e=Pierre#

t=regarde#(Perre#, Marie#) SV <e,t>=regarde#(Marie#) V SN e=Marie#

<e,<e,t>>=regarde#

Rgle gnrale : <e,t> -> <e,<e,t>> e cest--dire "x regarde#(x, Marie#) -> "(x,y) regarde#(x,y) ET y=Marie# BIBLIOGRAPHIE P. Miller et Th. Torres. Formalismes syntaxiques pour le traitement des langues naturelles. Herms ed.

Le lexique
1. Les catgories lexicales
On distingue deux grandes classes lexicales Mots outils (ou mots grammaticaux) : Dterminants Pronoms Prpositions Conjonctions Interjections Mots lexicaux : Adverbes Noms Adjectifs Verbes Locutions particulires (lexicalises) La premire catgorie est peu volutive et constante dans presque tous les champs dapplication. La seconde est trs variable en ce qui concerne la quantit des instances des classes : cest la richesse du vocabulaire.

2. Les dterminants
du premier groupe D1 Articles Dfini le,la,les,[+]au,aux,du,des Indfini un,une,de,des loc. indf. n'importe lequel,je ne sais quel Partitif du [de le],de la,des Dmonstratifs ce,cet,cette,ces,ce+ci[l] Possessifs mon,ton,son,notre,votre,leur,ma,ta,sa,nos,vos,leurs Interrogatifs, Exclamatifs quel,quelle,quels,quelles Relatifs lequel,laquelle,duquel,de laquelle,lesquels,lesquelles du deuxime groupe D2 Numraux (quantitatifs) Cardinaux un,deux,trois...etc. Ordinaux premier,deuxime...etc. Formes substantives Multiplicatifs double,triple,centuple... Fractions moiti,tiers,quart... Collectifs dizaine,douzaine,centaine... Indfinis Quantitatifs Nulle nul,aucun,pas un Singulier tout,chaque,tel,quelque,un certain,maint Pluriel quelques, certains, maints, divers,diffrents Indtermine quelque Totalit numrale tous Totalit quantitative tout (est aussi adverbe) Loc.la plupart,une foule,une multitude,une masse de Identit Diffrence

plusieurs,

3. Les pronoms
Personnels Formes normales Formes rflchies antposes postposes Dmonstratifs prsentatif Relatifs je,tu,il,nous,vous,ils,elle,eux,elles,lui,on me,te,se,s',nous,vous moi,soi,toi,lui,nous,vous,eux c',ce,celui,cela,ce+[ci,l],ce[lui,eux,elle,elles]+[ci,l] c'est...

13

Simple qui,que,quoi,qu',dont,o Compos [le+,+,de+]quel,qui que ce soit, qui, quiconque Interrogatifs Formes simples qui,que,quoi Formes composes [+,de+,par+,pour+,sur+] qui,quoi,qui est-ce qui... Indfinis qui,quiconque (quivivra verra),quel que,quel que soit celui que, quoi que ce soit qui,quoi que.... Possessifs le mien,le tien,le sien,le ntre,le vtre,le leur

4. Les prpositions
Racines 1er groupe 2me groupe Locutions prpos. de, dans,par,pour,sur,avec,devant,derrire,sans,sous,contre, vers,chez loin de,prs de,au lieu de, ct de [='de' + A ou GP]

5. Les conjonctions
Coordination et,ou,ni,mais,or,car,donc Subordination Compltives que circonstanciels si, quand, comme, lorsque, puisque, quoique, parce que,ds que, pour que, etc. Locutions conj. (construites avec 'que') temps aussitt que, avant que, etc. but pour que, afin que, etc. cause parce que, du fait que, etc. consquence de sorte que, pour que, etc. concession/opposition bien que, alors que, etc. condition pourvu que, condition que, etc. comparaison ainsi que, de mme que, etc.

6. Les interjections
H, quoi, etc.

7. Les adverbes
Manire Lieu Temps Quantit Adj+[ment] ici,devant,derrire hier,demain

Modificateurs Comparatifs plus,moins,autant,aussi Superlatifs t rs,trop,peu,beaucoup,trs bien,passable,mdiocre Interrogatifs, exclamatifs comment,o,quand Ngation pas,point,gure,plus,jamais,personne,rien,aucun,nul Opinion oui,si,non Modalisateurs Insistance certainement Rserve probablement,peut-tre Liaison ensuite,puis,ainsi,en effet,aussi Locutions adverbiales de coordination l'improviste, tort et travers, l'anglaise, croupetons, califourchon... Interrogatifs Lieu o Cause pourquoi Temps quand Manire comment Quantit combien

8. Les noms ou substantifs


peuvent tre classs dans une matrice de traits: commun/propre, anim/non-anim, humain/non-humain, concret/abstrait, comptable/non-comptable, simple/compos, individuel/collectif espce robot robot, roue, capteur, bras, etc. environnement fixeobstacle, batiment, rue, lampadaire, etc. environnement mobile table, chaise, lampe, tuyau, etc. lieu de passage: porte, couloir, escalier, monte, etc. obstacles: mur, sol, coin, etc. temps: jour, heure, minute, seconde, date, instant, etc. instrument: cl, bras, capteur, etc. matire: bois, fer, ciment, etc. indfinis units de mesure: centimtre, mtre, kilo, etc. directions: gauche, droite, haut, bas, est, ouest, etc. qualit (comportement d'adjectif) d'action: avance, recul, etc. (nominalisation des verbes) etc.

9. Les verbes

15

Catgories syntaxiques Transitif direct indirect avec 2 C.O.D. possibles (+combinatoire anim/non-anim) Intransitif Copules: tre, devenir, rester, sembler, paratre, etc. Conjugus avec tre Conjugus avec avoir (et/ou tre) Pronominaux se regarder, etc. Auxiliaires: devoir, falloir, tre, avoir, pouvoir, aller, venir, etc. Sujet anim: penser, marcher, etc. Catgories smantiques procs (action) factitif (peut tre remplac par 'faire'+infinitif) mouvement du robot: avancer, reculer, tourner, attendre, arrter, contourner, longer, monter, suivre, descendre, aller, passer, acclrer, ralentir, etc. manipulation: prendre, lcher, mesurer, dplacer, bouger, lire, crire, allumer, teindre, dtruire, etc. perfectif/imperfectif (pass encore actuel ou non) comprendre,finir,partir,arriver, etc. /possder,esprer,hsiter,habiter, etc. duratif/momentan itrer, recommencer, continuer, donner,rester, /copier,transmettre, alerter, appeler,sauter, etc. tat -id- sous classes L'aspect donne un prcision de sens au verbe: accompli/non accompli (dj fait/ faire) inchoactif (dbute ou finit) progressif (tre en train de) immdiat (tre sur le point de) rsultatif

10. Les adjectifs et participes


peuvent tre classs dans une matrice de traits: commun/propre, anim/non-anim, humain/non-humain, concret/abstrait, comptable/non-comptable, simple/compos, etc. comme les noms qualification manire

incurv, souple, silencieux, etc.

temps lieu matire forme: couleur simple compose dimension poids concret/abstrait anim/non anim tat permanent/passager transitif/intransitif

tard, tt, etc. loign, rapproch, etc. ferreux, poussireux, etc. allong, court, etc. vert, rouge, etc. rouge fonc, bleu clair, etc. grand, petit, troit, etc. lourd, lger, etc.

haut, bas/sale, propre

11. Les dimensions du lexique


Prototype : terme appropri la situation dnonciation. Kleiber situe ce terme au niveau de base : on dira plutt il y a chien sur la pelouse que il y a un animal sur le ray-grass. Dans la deuxime phrase animal est trop gnral et ray-grass trop spcifique dans une situation ordinaire. Dimension verticale : hypernonyme (terme plus gnral) ou hyponyme (terme plus spcifique) Dimension horizontal : synonyme (terme voisin) ou antonyme (terme oppos) autre plan : homonyme (terme de sens diffrent) Ces distinctions nous amnent au schma suivant :
Homonyme Hyperonyme

Synonyme

Prototype

Antonyme

Hyponyme

BIBLIOGRAPHIE G. Bs, Lexique et paraphrase. Revue Lexique n6. 1979.

17

La smantique
1. La smantique descriptive
Questions de vocabulaire... Antonymie : Synonymie : Homonymie : Polysmie : contradictoire: beau/laid complmentaire: acheter/vendre graduelle: brlant/chaud/tide/froid/glacial paradigmatique: abdomen/ventre/bidon syntagmatique: connatre le succs/tre rput homographique et/ou homophonique louer(une voiture)/(quelqu'un=faire des louanges) conter/compter plusieurs sens: lettre=caractre/missive/culture

Formes de changement: Ellipse : Mtaphore : Mtonymie : Synecdoque : Extension : Restriction : Anaphore : Cataphore : mon gnral=substantivisation de capitaine gnral analogie lunettes=origine: lune mtaphore de contiguit: casier judiciaire figure de sens (trope) qui rduit le sens d'un objet l'une de ses proprits: allez les verts panier=origine: pour le pain sens commun->sens spcialis: maraudage (juridique) rfrence indirecte rtrograde= cet exemple, prends-le -di- mais dans un sens progrdient= quand il entra, le facteur...

Les units terminologiques: Groupe de mots ou termes: en gnral le GN Nomenclature : liste numrative Taxinomie : systme structur Nome : unit cognitive, sorte d'axiome non rfrenable par une dfinition utilisant d'autres mots Paraphrase : P paraphrase Q ssi P et Q conduisent aux mmes actions Reprsentation des smes: Table d'attributs ou traits

A geai + pigeon -

B + +

C + -

A: passereau B: taille voisine de 35 C: plumage bigarr

Prdicats x='geai' y='pigeon' taille(pigeon)=35cm oiseau(x)=passereau ET taille(x)=taille(y) ET plumage(x)=bigarr pigeon, passereau, bigarr sont des prototypes ou des proprits Frames passereau: sorte_de oiseau taille: [pigeon, hibou, aigle] plumage: [gris, stri, bigarr] geai: est_un passereau taille=pigeon plumage=bigarr

2. La smantique gnrative de Chomsky et succ.


Les bases de la thorie gnrativiste: - une composante syntaxique: rgles de formation et rgles de transformation oprant sur les sorties des premires. Cette composante opre sur un ensemble fini de symboles (catgories grammaticales) et sur un lexique. - pour gnrer un ensemble infini de phrases, les rgles doivent tre rcursives (surtout au niveau lev de phrase) - les relations grammaticales tablies sur ces bases constitue la structure profonde. P SN Dt N Aux M V SV SN Dt La sincrit peut effrayer l' enfant N P -> SN Aux SV SV -> V SN SN -> Dt N Dt -> le/la Aux -> M M -> peut N -> sincrit/enfant V -> effrayer

19

Le pb de la comptence/performance se pose ici en clair puisque syntaxe et smantique sont rduites aux mmes reprsentations (structures parenthses ou arborescentes dduites de rgles de rcriture) - comptence [Fodor et Katz]: capacit de la thorie (ou le locuteur) dceler les ambiguits - performance: rsultat de l'analyse ou de l'explication les ambiguits peuvent tre leves (a) par le rapport qu'entretiennent certains mots dans la phrase ou le texte (b) l'aide d'attributs incompatibles: (a) la note est juste mais un peu chre ==> note au sens de "addition" (b) la peinture est silencieuse ==> (?) La sous-catgorisation syntaxique trop pousse fait apparaitre les distinctions smantiques (Chomsky est partisan de cette approche). Il faut donc sparer les rles syntaxe/smantique dans le lexique: les entres de ce dernier sont: - catgories syntaxiques - traits smiques (ou attributs) - diffrentiateurs (indiquent les diffrents sens selon le contexte) Ex: Lapin
Lapin = NC

Abstrait

Concret

rendez-vous manqu

Anim animal mle mammifre rongeur

Inanim comestible peau de vtement viande

Les diffrentiateurs permettent de s'aiguiller dans le graphe (on peut aussi dupliquer les entres lexicales) comme suit: 1. Lapin [NC, Abstrait, rendez-vous] 2. Lapin [NC, Concret, Anim, animal, mle, mammifre, rongeur] 3. Lapin [NC, Concret, inanim, comestible, viande] 4. Lapin [NC, Concret, inanim, peau]) Analyse par amalgame et projection

La composante d'interprtation smantique: la manire dont les significations se combinent est fixe par la structure syntagmatique de la phrase: les rgles associeront d'abord les sens des units domines par les noeuds les plus bas puis rassembleront les informations ainsi obtenues au niveau des noeuds immdiatement suprieurs et ainsi de suite jusqu'au noeud phrase. Ex: Jette la petite chemise Petit -> Adj, spatial Petit -> Adj, jeune Petit -> Adj, abstrait, peu important Petit -> Adj, abstrait, mprisable Chemise -> Nom, fm, vtement Chemise -> Nom, fm, classeur Chemise -> Nom, fm, pice de moteur amalgame petite+chemise ==> 3 sens sur les 9 on remonte au SN: la+petite+chemise ==> 3 sens Jette -> V, trans, action, lancer [sujet=humain, objet=obj physyque] Jette -> V, trans, action, se dbarasser [sujet=humain, objet=obj physique] on remonte la P: jette+la+petite+chemise ==> 6 sens car tous les attributs sont compatibles Critiques : 1. Weinreich: on ne tient pas compte de l'ordre des mots dans l'amalgame (professeur femmefemme professeur et plus grave dans des phrases entires). Chomsky distingue alors le concept de structure profonde li aux rgles transformationnelles qui ne modifient pas le sens de la structure originelle et introduit des degrs de grammaticalit. 2. McCawley: drivation et arbres: l'ordre d'application des rgles impose la structure l'arbre (ceci est incompatible avec l'apprentissage); les rgles transformationnelles A->B ne sont pas conomiques car elles reproduisent des informations dj contenues dans le lexique; les restrictions de slection: le systme de traits est infini ou incomplet (ex. 'diagonaliser' ne s'applique qu'avec 'matrice') Pour conclure on peut dire que l'amalgame-projection permet de rduire l'ambiguit smantique d'une phrase mais ne permet pas de trouver le sens de la phrase. Analyse par structure sous-jacente : se fait en paraphrasant une suite d'items lexicaux l'aide de rgles transformationnelles. Ex: x a tu y tu->faire(aux+part. pass)+devenir+non+vivant mais pb dans: Jean a mis Paul dehors, car mettre+dehors -> expulser -> faire(aux+part. pass)+devenir+non+odieux Controverses : Postal puis Lakoff

21

prblmes du focus (accentuation des mots smantiques), des prsuppositions, du topique (thme), de l'interaction entre quantificateurs et ngation. Cela conduit une modification de la thorie standard : extension de l'interprtation smantique aux structures de surface. BIBLIOGRAPHIE N. Chomsky: Rules and representations. New York: Columbia University Press, 1980.

3. La grammaire de cas de Fillmore: une smantique interprtative


Postulat: la structure profonde n'est pas un niveau pertinent. Il faut un niveau de reprsentation smantique propre. Les pbs d'accord et de placement sont lis la structure de surface (comme sujet, objet). Le verbe a un rle prdicatif, une phrase (ou une proposition) pouvant se mettre sous la forme Prdicat(arguments): je conduis mon pre Niort ===> conduire (agent=je, bnf=mon pre, lieu=Niort) L'analyse se fait en envisageant les cas suivants: Agent, Exprienceur, Instrument, Action, Objet, But, Source, Bnficiaire, Lieu, Temps, Manire --attachs aux SN de la phrase. Celle-ci s'analyse donc par: V[cas(i), i=1 N] o les 'cas' pointent sur les SN on peut donc rpondre par l'explicitation de cette structure aux questions: qui fait quoi, qui, au bnfice de qui, avec quoi, o, quand, comment, pourquoi ? Ex: Jean a cass la vitre avec un marteau casser[agent=Jean, instrument=un marteau, objet=la vitre] notons que le mot 'avec' introduit souvent l'instrument. Pour certaines langues ( dclinaison par ex.) il faut recourir aux cas profonds et aux cas de surface. Ces cas permettent de classer les verbes selon les cas qu'ils admettent. D'autre part on peut introduire des rgles pour faire correspondre les cas profonds aux cas de surface, comme : si Agent alors Agent=sujet sinon si Instrument finsi finsi Les controverses : Lakoff : cette analyse ne fonctionne qu'en vrification. Une phrase telle que 'Angle a utilis un litre de lait/pendant 2 heures/ pour faire la pte' est correcte au sens de Fillmore. Cela montre qu'il faut revenir aux structures syntaxiques pour associer les syntagmes V, SN1 et SN2. alors Instrument=sujet sinon si Objet alors objet=sujet, finsi

BIBLIOGRAPHIE C.J. Fillmore: The Case for Case. Universals in Linguistic Theory. Bach, Emmon & Harns, Richard ds. Holt, Rinehard and Winston, 1968.

4. La smantique logique
P(=phrase) est une fonction propositionnelle s'appuyant sur des prdicats de verbe V(x1,x2,...xn) o les xi sont des arguments du SN (adjectifs, noms munis d'oprateurs logiques). Exemple: Paul joue un air Dominique P(Jouer(Paul, air, Dominique)) Dans une certaine mesure crire P -> SV SN peut tre considr comme une relation (logique) entre SV et SN et de l on peut affirmer que toute grammaire se fonde sur un systme logique. On peut donc aussi de ce fait reprsenter la smantique l'aide d'arborescences s'appuyant sur la structure syntaxique de surface (on tourne donc un peu en rond). Paul a achet un stylo plume en or (est-ce la plume ou le stylo qui est en or ?) --selon le cas le SP "en or" sera rattach au SN "le stylo" ou au SN "la plume". Problmes: "Ma brosse dent est enceinte" est inacceptable (prdicat faux) tandis que "J'ai rv que ma brosse dent est enceinte" devient acceptable car le prdicat rver(je,x) est vrai pour tout x. Autres formes de reprsentation: "Le monsieur a embrass la dame" Embrasser y(x,z) ET Pass(y) ET Monsieur(x) ET Dame(z) Je nie que le monsieur a embrass la dame comment reprsenter cette ngation ? est-ce une ngation du fait dans son ensemble ? ou que ce n'tait pas un monsieur ? ou pas une dame ? etc. "Simone veut pouser un Italien" 1re lecture: Quelque x(tq: x=Italien ET Veut_pouser(Simone,x)) cet Italien n'est pas quelqu'un de prcis 2me lecture: Veut(Simone, (Quelque x(tq: x=Italien ET pouser(Simone,x))) l'homme que veut pouser Simone est Italien "L'un de vous est srement en train de mentir" 1re lecture: Etre_sr(Existe x tq: (Mentir(x) ET x "vous")) 2me lecture: Existe x tq: (Etre_sr(Mentir(x) ET x "vous")) La logique mathmatique est dfectueuse pour toutes les phrases introduisant une modalit sur l'assertion, comme "Paul dit que..." pense que, crois que, suppose que, sait que... Paul croit que Simone veut pouser un Italien

23

McCawley propose de traiter ce cas par emboitements, d'autres linguistes en ajoutant un oprateur spcial "iota" et d'autres enfin par introduction de la logique modale (dite naturelle) par extension de la catgorie des verbes performatifs --comme ordonner (qui introduit une forme imprative), demander (forme interrogative)-- au cas de "affirmer", "dire", "croire", "penser", etc. Paul crot que Simone veut pouser un Italien devient Possible(P) o P est le prdicat d'une des formes ci-dessus.

La rhtorique

La rhtorique est lart de persuader par le langage. La smiologie a remis la rhtorique lordre du jour la reliant au concept de connotation qui associe aux lments dnots des signifis supplmentaires.

Connotation Dnotation

Signifiant Signifiant Signifi

Signifi

La rhtorique tudie la forme des signifiants de connotation

---------------------------------------------------------------------------------------------------------------------------Figures de rhtorique Relations avec les lments variants Adjonction Suppression Substitution Echange

---------------------------------------------------------------------------------------------------------------------------Identit Similarit - de forme - de contenu Homologie Diffrence Opposition - de forme - de contenu Fausses homologies - double sens - paradoxe Antanaclase Paradoxe Tautologie Prtrition Calembour Antiphrase Antimtabole Antilogie Attelage Antithse Dubitation Rticence Priphrase Euphmisme Analocuthe Chiasme Rime Comparaison Circonlocution Allusion Mtaphore Hendiadyn Rptition Ellipse Hyperbole Inversion

Accumulation

Suspension

Mtonymie

Asyndte

----------------------------------------------------------------------------------------------------------------------------

25

La pragmatique
Les acteurs... Ling. pragmatique Linguistique non pragmatique ------------------------------------------------------------------------------Peirce (1839-1914) Saussure (1857-1913) Russell Frege Wittgenstein (1889-1951) Bloomfield Morris (1901) Chomsky (1928-) Austin Searle Benveniste Ducrot Culioli Pragmatique historique et linguistique non pragmatique : Descartes postule quun langage parfait est cach sous le langage ordinaire (Port-Royal, Condillac) la logique de Port-Royal : les mots sont des sons distincts et articuls, dont les hommes ont fait des signes pour marquer ce qui se passe dans leur esprit , le meilleur moyen pour viter les confusions des mots qui se rencontrent dans les langues ordinaires, est de faire une nouvelle langue, et de nouveaux mots qui ne soient attachs quaux idees que nous voulons quils reprsentent donc le signe dnote et se dsigne lui-mme soit autre (Frege) soit a priori (Husserl, Chomsky, Piaget dans une certaine mesure) : les mots sont par rapport nos ides ce que les chiffres sont par rapport aux nombes [Condillac], le langage peut tre compar la main qui malgr sa capacit remplir les tches extrmement diverses, ne nous suffit pas : il nous faut des outils ou des mains artificielles [Frege]. certaines caractristiques du langage sont laboutissement de structures cognitives profondes [Chomsky] Le problme concerne donc la possibilit ou non de faire limpasse sur les prmices langagires de la connaissance, sur le rle transcendantal du langage lgard de toutre connaissance. Descartes pense que oui, Pierce et Wittgenstein pensent que non. Le signe Vnus synonyme de ltoile du berger lui est-il sunstituable dans la phrase Vnus est un mot de cinq lettres ? La pragmatique tudie lutilisation du langage dans le discours et les marques spcifiques qui, dans la langue, attestent sa vocation discursive [Morris]. Le sens renvoie non au contenu mais lusage. Le concept de la pense, du calcul, de la dduction est dtermin par un accord ralis non pas sur les donnes de lexprience incontestables (empirisme) ni sur les donnes dune sorte dultra-exprience (platonisme) ni sur de simples dfinitions (conventionalisme) mais sur des formes daction et de vie , parler un langage est une partie dune activit ou dune forme de vie [Wittgenstein]

Pragmatique = {langue, locuteurs, monde, situation} Lnonciation : lnonciation est la mise en fonctionnement de la langue par un acte individuel dutilisation [Benveniste] avant lnonciation par la parole, la langue nest quune possibilit de la langue Pour Morris pragmatique et linguistique interfrent par les modalits nonciatives (ordre, question, assertion, etc.) et les dictiques selon le schma suivant dans lequel les deux processus se droulent en parallle :
PHRASE Forme linguistique des modalits SITUATION

Dictiques

Valeurs modales

Sens linguistique

Sens pragmatique

Pour Ducrot la pragmatique sintgre davantage la linguistique par un double processus : celui de la signification et celui du sens (du signifiant au rfrent et inversement) travers deux composantes, linguistique et rhtorique
PHRASE SITUATION

LING.

Signification de la phrase Instanciation rfrentielle Sens littral Lois du discours Sens de l'nonc

RHETORIQUE

(a) Instanciation rfrentielle : elle sappuie sur la distinction entre fonction rfrentielle et indication existentielle mon voisin de pallier qui entraine un prsuppos sur son existence et sur le fait que jhabite dans un appartement. Ce prsuppos est un lment du contenu et non une simple condition demploi. (b) lorganisation interne de lnonc peut en modifier le sens : sous-entendu, ironie, etc. Cest ce niveau quinterviennent les lois du discours et les effets ds la situation, comme modifieurs secondaires du sens.

27

Searle conteste la ralit du sens littral : on ne peut interprter une phrase en dehors de tout contexte le chat est sur le paillasson, peut-on ne pas imaginer la scne en lisant cette phrase ?`(on sait par exemple que le chat ne flotte pas au-dessus du paillasson). On doit donc prciser : sens littral relatif un systme de prsomption darrire-plan. Donc pour Searle la situation entre avec le sens littral dans le processus de signification. Pour Culioli la rfrence contextuelle se fait ds le niveau lexical : il apparait que le systme linguistique sarticule avec lextra-linguistique par tout un rseau de relations entremles les unes aux autres, qui mettent en jeu les diverses composantes du systme ainsi que lactivit symbolique et langagire de lhomme.
Enonc Evnement

Lexis

Situation

Sens

Les actes de langage


Austin puis Searle et Vanderveken dfinissent trois composantes dans un acte de langage : le locutoire, lillocutoire (ou force illocutoire) et le perlocutoire munies de deux paramtres, valeur et force. Ils distinguent cinq catgories dactes illocutoires qui pour le franais sont en partie dnotes par le verbe [Vanderveken] Les verbes de type assertif
jurer attester proclamer certifier maintenir assurer insister dnoncer confesser se vanter rprimander accuser

vaticiner se lamenter prophtiser notifier se plaindre prdire dclarer conjecturer

soutenir informer vanter dire affirmer penser relater confier suggrer

blmer avouer critiquer reconnatre

Les verbes de type promissif

prter serment

vouer

consentir

certifier

renoncer

jurer

promettre accepter asurer souscrire menacer

s'engager

Les verbes de type directif


mendier qumander convoquer inviter prier convier implorer supplier conjurer solliciter requte revendiquer rclamer questionner demander recommander conseiller suggrer insister le primitf presser dire de aviser avertir alerter prescrire enjoindre ordonner exiger adjurer commander

Les verbes de type dclaratif

29

ratifer

abdiquer

entriner

sanctionner dmissionner homologuer suspendre ajourner

rsigner

abjurer

destituer

abroger

consacrer abrger

se dmettre rpudier

renier congdier

casser

abolir

confirmer

capituler

dfinir

endosser ouvrir maudire dmettre appeler bnir approuver terminer renoncer dclarer

annuler

Les verbes de type expressif

rcriminer se lamenter protester

se vanter vanter

dplorer

dsapprouver

louer

fliciter

saluer

s'excuser

se plaindre

huer

approuver

remercier

condolances

exprimer

Ces classes sont distinctes des types dnoncs au niveau de la grammaire classique : 1. dclaratifs : la porte est ouverte, comment les choses sont 2. conditionnels : il pourrait le faire ce qui se passerait si certains faits existaient 3. impratifs : ferme la porte, faire faire lallocutaire 4. interrogatifs : comment allez-vous ? question 5. exclamatifs : comme cest triste, expression des tats mentaux 6. optatifs : si seulement il pleuvait expresion des souhaits Pour Searle la pragmatique des actes de langage sinscrit dans une thorie du langage et une thorie de laction selon deux perspectives : la description des actes de langage, leur rgulation selon le principe dexprimabilit, cest--dire, (a) noncer des mots = effectuer des actes dnonciation, (b) rfrer et prdiquer = effectuer des actes propositionnels, (c) affirmer, ordonner, promettre, etc. = effectuer des actes illocutoires, (d) effectuer des actes perlocutoires. en (c) on peut reprsenter tout acte de langage par F(p), p=contenu propositionnel et F=force illocutoire. ex. : je te promets que je viendrai , F marque par je te promets et p marqu par je viendrai. Pour bravo , p=. A ce niveau Searle ne prend pas en compte le rle du destinateur ni celui du destinataire qui napparaissent quen (d). Ceci peut lui tre reproch, comme pour Chomsky : llimination du locuteur parlant au profit dun locuteur abstrait. Rcanati propose den rester au niveau (c) des potentialits

31

illocutoires qui ne sont instancies quau niveau (d). En effet pour Searle linterprtation des actes indirects pose problme. Ils se font par nonciation non littrale : Enonciation littrale : on dit ce quon veut dire donne-moi le sel ! , Enonciation non littrale : on dit autre chose peux-tu me donner le sel ? Searle propose pour linterprtation de ce type dacte une stratgie infrentielle, qui examine toutes les conditions de ralisation de lactes (situation, monde, arrire-plan, etc.), le pourquoi, les intentions du demandeur, le but poursuivi, etc., veut-il me tester dans ma capacit passer le sel ? cela est-il habituel de passer le sel dans ce restaurant ? veut-il me faire comprendre que je nai pas assez sal la cuisson ? etc. La question est de savoir ici si des mcanismes plus simples fonds sur lusage ne sont pas plus pertinents. Cela reviendrait numrer tous les cas dusage et en fait remplacer lintension par lextension, ce qui nest pas forcment une bone solution. La pragmatique doit, en conclusion, relever dune communication conue comme tentative dajustement o lon doit ajouter au transport de linformation, le jeu des rles et des actes par quoi les interlocuteurs se reconnaissent comme tels, agissent comme tels et fondent ainsi des communauts linguistiques dans un monde humain. La communication est au cur de la pragmatique. BIBLIOGRAPHIE J.C. Anscombre et O. Ducrot, Largumentation dans la langue. Langages N42, p. 5-27, 1976. J.L. Austin, Quand dire cest faire, Int. et Trad. de G. Lane, Le Seuil, Paris, 1970. A. Berrendonner, Elements de pragmatique linguistique, Ed. de Minuit, Paris, 1981. L. Bloomfield, Le Langage, Trad. J. Gazio, Payot, Paris, 1969. O. Ducrot, Dire et ne pas dire. Principes de smantique linguistique, Herman d., Paris, 1972. R. Eluerd, La pragmatique linguistique, Nathan d., Paris, 1985. C.S. Pierce, Collected Papers slectionns et prsents par P. Weiss et C. Hartshorne, 8 vol., Harvard University Press, 1932-1954. F. Rcanati, La transparence et lnonciation. Pour introduire la pragmatique. Le Seuil, 1979. F. de Saussure, Le cours de linguistique gnrale. d. cr. Tullio de Mauro, Payot, Paris, 1972. J.R. Searle, Les actes de langage. Essai de philosophie du langage, Tr. H. Pauchard, Hermann, Paris, 1972 J.R. Searle, Sens et expression. Etudes et thorie des actes de langage. Tr. de J. Proust, Ed. de Minuit, Paris, 1982. L. Wittgenstein, Philosophical Investigations, B. Blackwell, Oxford, 1953. L. Wittgenstein, Grammaire philosophique, d. R. Rhees, Tr. de A.M. Lescourret, Gallimard d., Paris, 1980

La deixis

Il est possible de dgager trois conceptions majeures de la deixis. Pour certains cette opration permet de rapporter les objets et les vnements du monde aux coordonnes associes au locuteur : espace et temps (je-ici-maintenant = ego-hic-nunc). Pour dautres la deixis prcde ce positionnement et constitue un certain type de construction rfrentielle, ce qui fait de la dixis une opration nonciative qui se conjugue et senchevtre avec celle que la tradition mdivale regroupe sous le terme de modus. Mais cette modalit langagire est-elle ncessairement associe au geste dostension ? Se fonde-t-elle sur la co-prsence dun champ visible o lon trouverait sinon lobjet dsign, du moins les instructions ncessaires la construction de son identit ? Pour dautres enfin, la deixis est foncteur de cohsion textuelle permettant lorateur dinflchir le fil de son discours en proposant un nouveau lien lintrt de son auditoire. Elle se conoit alors comme une rupture construite dans et par le discours. 1. la deixis comme reprage dune rfrence constitue, 2. comme construction dune rfrence, 3. comme dfinition dun nouveau topos discursif. Entre deixis et anaphore, il ny a nullement opposition mais continuit gradue : lanaphore est endophorique, la deixis est exo-phorique (phorique = qui renvoie ). Quelques marqueurs de la deixis spatiale [Borillo, 92] : la cible est lobjet localise, le site est le repre par rapport auquel stablit la localisation. La forme la plus courante en franais est Ncible V Prploc Nsite o V est un verbe statif (tre, se trouver, etc.). La localisation de la cible peut tre tablie de deux manires : soit directement partir du site (orientation intrinsque), loin de, prs de, dans le voisinage, proximit, aux alentours, dans les parages, aux abords, lcart, ici, l, l-bas, ailleurs, prs dici ce ct-ci, etc. dnotent la distance, soit partir dun autre polarisateur que le site (orientation contextuelle ou extrinsque). Au niveau des traits smantiques on distingue gnralement trois types de dictiques (orients par la distance lnonciateur) ICI +proche -loign +locuteur -interlocuteur LA -proche -loign -locuteur +interlocuteur LA-BAS -proche +loign -locuteur -interlocuteur

La deixis temporelle [D. Jouve, 92] : linterprtation de maintenant avec le pass simple ne sefectue pas dans un texte de fiction comme dans les noncs de ralit; elle est tritement lie des phnomnes danaphore, car si le texte cre ses propres repres, il doit sans cesse les expliciter au moyen dadverbes et de complments adverbiaux qui se rpondent les uns les autres en recrant sans cesse de nouveaux repres selon les points de vue privilgis des personnages, ceux-ci pouvant bien sr appartenir dautres registres que la reprsentation de lhumain : Le prdicateur marque une pause; sa voix sleva maintenant plus lente... [Morel, 92] : les fonctions essentielles de la deixis (dnomination et ostension) sorganisent partir de

33

la fonction rfrentielle, qui est son attache dans le langage. BIBLIOGRAPHIE A. Borillo, Quelques marqueurs de la deixis spatiale, in La deixis, 1992. M.A. Morel, L. Danon-Boileau, La deixis. Colloque en Sorbonne, 8-9 juin 1990. PUF, Linguistique Nouvelle, 1992. D. Jouve, Maintenant et la deixis temporelle, in La deixis, 1992. A. Rousseau, La deixis : un problme de logique et de philosophie du langage, in La deixis, 1992.

Le discours, le texte
Un texte (ou discours oral) vhicule : - un sens propre travers les mots et les phrases, - des relations rhtoriques entre les constituants, - les intentions de lauteur (locuteur), - les attitudes de lauteur travers le contenu du texte. De faon gnrale un texte met en jeu des agents : les auteurs et les rcepteurs. On peut dfinir la grammaire du texte (ou structure du texte) par : T = < s, r > avec s = {s1,s2,...} ensemble de significations des clauses du texte r = {r1,r2,...} ensemble de relations entre les clauses du texte de plus on a : si = < i, pi, {aij} > avec i contenu smantique de la clause i pi pointeur vers le plan de lauteur (dans lagenda) aij ensemble dattitudes de lauteur lies aux significations si qui se mettent leur tour sous la forme : aij = < typeij, valeurij, attij, vueij > Ces atttitudes peuvent tre de diffrents types [Reichman, 85], [Ducrot, 83] : - pistmique (peut-tre, ncessaire, possible} - valuative ou comparative {le mieux, le pire, etc.} - dontique {bien, mal} - expectative, attente et prennent leurs valeurs dans [0, 1] (modalits continues). Leur attribution (attij) renvoient aux

diffrents agents mis en jeu par le texte et vueij est un modifieur qui indique une partie de ou renvoie une autre attitude. Par exemple, le train est malheureusement parti lheure qui renvoie au sens je lai rat de peu mais malheureusement, je dois partir peut conduire deux valuations selon le degr de confiance que lon accorde au mot malheureusement. Il est bon de sparer le sens objectif du texte des opinions des agents afin de faire des raisonnements diffrents et cibls. Du ct des relations ri on a ri = < typei, dei, i, atti > avec typei domaines du texte dei i termes de la relation (origine et destination de larc incident) atti renvoie aux attitudes produites via la relation Exemple : Le train est malheureusement parti lheure T = < s, r > s = < , {a1,a2}, p > = (proposition = mouvement le train est parti agent = machiniste <- infr thme = train source = gare <- infr destination = ? aspect = inchoactif temps = T1, temps de laction <- corfrence lheure) 1 a = (type = valuatif malheureusement valeur = mauvais vue = s attribu- = locuteur) 2 a = (type = epistmique /modalit de a1/ valeur = 1 vue = s attribu- = locuteur) p -> (plan1 = acte de parole informant type = information de lallocutaire forme = directe temps = T2, temps de lnonciation) r= (type = domaine de lintention aprs <- T2 > T1 de = plan . temps = s . temps attitude = neutre) Une tentative de taxinomie des types de relation

35

(a) portes par les mots lexicaux causalit : volontaire, non-volontaire, raisonnement, propos, supposition, rsultatif, condition temporalit : , aprs, pendant, entre, etc. spatialit : en face de, derrire, dans, sous, etc. conjonction / disjonction / opposition / ngation : addition, numration, contraire, concession, restriction, degr, etc. (b) portes par les pointeurs du texte dictiques, anaphores (c) portes par les frontires de la structure du discours (on suppose que le discours est divis segments cohrents difficiles dfinir vis--vis dun focus). Ces relations traduisent la dominance des segments les uns sur les autres nouveau, retour au prcdent, fin (d) portes par le plan du discours particularisation, reformulation, progression, laboration, conclusion (e) portes par les intentions relations temporelles entre le temps de laction et le temps de lnonciation motivations (causes des intentions sur les actes de parole) BIBLIOGRAPHIE

Allen J. and Litman D. : Discourse Processing and Commonsense Plans. Cohen, Morgan and Pollack eds., Intentions and Plans in Discourse. MIT Presse, 1987 Defrise C. and Nirenburg S. : Aspects of text meaning : using discourse connectives and attitudinals in Natural Language Generations. CMU Report, CMU-CMT-MEMO-89, 1989 Ducrot O. : Polyphonies, 1984 Reichman R. : Getting computers to talk like You and Me. MIT Press, Cambridge Mass., 1985

La comprhension du langage
1. Psycholinguistique et comprhension
Comprendre = tablir un lien logique ou analogique entre des objets et/ou des concepts laide de signes ou de symboles. Avoir lintuition = comprendre de manire inconsciente. Penser = cheminer dans des rseaux de signification.
Lintercomprhension nest pas le transfert dune information dun locuteur un autre mais une interfrence dinterprtants jaillie dans la communication de deux locuteurs :

le monde est lhorizon de cette rencontre, le destinataire est un co-nonciateur. locuteur 1 locuteur 2

Les mots ne sont pas des tiquettes mais un hritage de perplexits [Bouveresse] Construire un modle du locuteur en se situant par rapport aux modles linguistiques d'un ct et par rapport aux modles cognitifs de l'autre (entre "Chomsky et Piaget"). Position de Marslen-Wilson et Tyler (modle interactif): "l'auditeur essaie d'interprter compltement ce qu'il peroit au moment mme o il le peroit. La reconnaissance de chaque mot, ds le dbut d'une squence, est directement influence par l'environnement contextuel dans lequel ce mot apparait" Position de Forster (modle sriel): "le traitement lexical (c'est--dire l'identification des units, qu'il s'agisse de lxmes ou de grammmes) permettrait de construire les premires hypothses sur la structure de la phrase, hypothses qui ne seraient pas affectes par la construction du sens, au moins jusqu' la fin de chaque proposition" [Noizet, 83]. En fait deux approches: (a) interaction o syntaxe et smantique s'influencent rciproquement, (b) autonomie de la syntaxe vis--vis de la smantique, le calcul de la structure syntaxique de la phrase se fait indpendamment de sa signification.

37

Le processus de reconnaissance comporte les aspects suivants, d'aprs Marslen-Wilson et Tyler : - l'apport phontico-acoustique est trait en continu. Les phonmes initiaux activent une cohorte de candidats possibles. Au fur et mesure que le mot se droule, cette cohorte se rduit jusqu' ce que ne soit plus slectionne que la forme connue (si elle l'est) adquate, - les "lments de reconnaissance" ainsi activs par l'input phontico-acoustique initial ne confronterait pas seulement les connaissances lexicales mais fonctionnerait comme un spcialiste du mot qu'il reprsente et ferait interagir les proprits syntactico-smantiques de ce membre particulier de la cohorte voque avec les contraintes de contexte. Pour mettre ces processus en oeuvre M-W et T postulent trois sources de savoir : - les mots reprsents comme des objets phonologiques ayant des attributs syntaxiques et smantiques (l'accs aux cohortes n'est pas seulement phontique), - une forme d'analyse structurale "non smantique" (donc syntaxique), - une source de savoir interprtatif (non dissocie du savoir smantique). A ceci s'ajoute un principe de "priorit ascendante": la recherche des mots part des donnes acoustiques. BIBLIOGRAPHIE [Marslen-Wilson et Tyler, 80] Marslen-Wilson W.D. et Tyler L.K., The temporal structure of spoken language understanding. Cognition Vol. 8, 1 (1980), p. 1-71. [Noizet, 80] Noizet G., De la perception la comprhension du langage. P.U.F. Paris, 1980.

2. Processus de comprhension
Pour discuter plus fond ce problme, examinons quelques hypothses et modles proposs par les psycholinguistes et les linguistes. Pour Chomsky [Chomsky, 80] la signification d'un nonc est vhicule par : (a) le sens attach aux items lexicaux, (b) les relations entre ces items, tablies sur l'axe de l'nonc, (c) certaines connaissances spcifiques au domaine auquel se rapporte l'nonc, (d) la situation rfrentielle qui regroupe les entits perceptives et/ou conceptuelles de l'nonc, (e) la situation d'nonciation. La question ci-dessus replace dans le cadre de la signification, relve donc de la question de l'autonomie des traitements psycholinguistiques. La composante (b) relve de comptences proprement psycholinguistiques qui sont au centre de ce dbat. A l'oppos les composantes (c) et (d) relvent de mcanismes cognitifs gnraux qui entretiennent des rapports troits avec les connaissances pragmatiques. L'ide dfendue par certains psycholinguistes est que les connaissances non spcifiquement psycholinguistiques interviennent relativement tardivement, aprs qu'une forme logique ait t assigne chaque phrase. C'est cette ide d'hypothse d'autonomie du traitement

psycholinguistique qui peut conduire l'introduction d'un module spcifique dans un systme artificiel. Ce module aurait alors traiter de la composante (b) pour fournir la forme logique de l'nonc. D'un autre ct les composantes (a) et (c) semblent lies par le biais des significations lexicales contextuelles au domaine "morceau" prend un sens diffrent dans "morceau de musique" et "morceau de boeuf". La question de l'autonomie du traitement psycholinguistique est donc indissociable de celle de l'insertion lexicale. Pour l'attachement des significations aux items, deux modles gnraux semblent possibles selon le degr dancrage au concret que lon accorde au langage : un ancrage de surface (a1) pour lequel un calcul symbolique sur les objets ou les situations prcde linsertion lexicale et un ancrage profond (a2) dans lequel un calcul sur le signifiant dtermine le sens de la situation. On aboutit ainsi deux modles dapprentissage puis de traitement : (a1) - apprentissage partir de situations relles par gnralisation et typicalisation (schmas) - rappel du schma et raisonnement par dfaut pour la comprhension d'une phrase - mise en correspondance du schma et de la situation : le lien produit est appel sens, ou, (a2) - apprentissage sur des situations relles par mise en correspondance de ces situations travers le langage - gnralisation des items lexicaux et des expressions langagires en informations abstraites et symboliques - comprhension de la phrase par manipulation des symboles en vue du "calcul" d'un rsultat appel sens. L'argument suivant plaide pour la solution (a2) : l'tre humain peut "comprendre" une phrase totalement nouvelle. Sinon quelle situation la rattacherait-il ? Inversement, le choix du sens correct d'un mot ambig est fait d'une manire tonnament rapide par l'humain en fonction du contexte. D'o l'ide d'organiser l'analyse comme en (a1) non pas autour de rgles gnrales mais d'aprs les interactions idiosyncrasiques des mots avec leurs contextes. De ceci il ressort que les deux stratgies paraissent tour tour possibles et que donc, la notion de contrle devient essentielle pour rpartir les poids entre ces divers processus.

2.1. Quelques hypothses et modles


La diversit des solutions pouvant exister est donc assez grande selon le point de vue adopt, lordre et les poids accords aux porcessus (a) (e). Pour en donner un aperu, nous numrons brivement ciaprs quelques hypothses de modles. (a) l'hypothse interactionniste lexique/smantique Bever [Bever, 70] suppose qu'une des stratgie employe par l'tre humain pour comprendre une phrase consiste supposer que la squence Nom-Verbe-Nom dans la structure de surface de la phrase correspond la suite Acteur-Action-Objet. La machine perceptuelle de Bever, qui modlise la comprhension d'une phrase, a comme entre la structure de surface de cette phrase et comme sortie, sa

39

structure interne reprsente par les relations entre les constituants. Aprs avoir expriment sur des sujets, Fraser [Fraser et al, 63] a trouv que les enfants interprtent la phrase "The cow was kissed by the horse" comme "The horse kissed the cow": deux structures de surface diffrentes (formes active et passive) correspondent bien une seule structure interne. Pour des adultes le passage d'une forme l'autre n'est pas aussi directe et dpend beaucoup du degr de cohrence entre syntaxe et smantique. La question est donc de savoir quelle est la relation entre la structure Nom-Verbe-Nom (acteur-actionobjet) et l'analyse syntaxique, puis comment le sujet intgre les rsultats des diffrentes analyses. Dans le cadre de cette thorie, [Forster, 79] a prsent un modle de comprhension extension de la stratgie de Bever qui stipule que les constituants majeurs dans la phrase sont fonctionnellement relis par des contraintes smantiques. A ct des tages qui correspondent aux analyseurs lexical, syntaxique, smantique, le modle de Forster dispose d'un GPS (General Problem Solver). Dans certains cas, ce GPS peut driver une interprtation de la phrase seulement par r-arrangement des items lexicaux avant que l'analyse syntaxique de la phrase soit termine. Pour soutenir sa thorie Forster cite les rsultats d'une exprience faite par Ratcliff o des sujets sont capables de classer des phrases syntaxiquement incorrectes, en phrases acceptables ou non-acceptables : cela signifie que dans la comptition syntaxe/comprhension les sorties des modules d'analyse sont confrontes avec des poids diffrents ce mcanisme n'est cependant pas encore compltement lucid l'heure actuelle. Il en dduit que le GPS doit tre capable de donner une interprtation correcte pour une phrase o on a la possibilit (syntaxique) de changer les positions des constituants et dinterdire toute interprtation dans le cas contraire : c'est le phnomne de "lexical priming" (amorage smantique) c'est--dire de facilitation de l'identification d'un mot par la prsentation pralable ou simultane d'un autre mot reli smantiquement. Exemple : Le boulanger N1(suj) fait V le pain N2(cod) de mie N3(cn)

Pour Forster cette phrase s'analyse en : N1(suj) V(actif) N2(cod) => Acteur Action Objet comme la phrase le pain de mie est fait par le boulanger en : N1(cod) V(passif) N2(suj) => Acteur Action Objet Le rle du GPS est de rarranger les items lexicaux pour faire concider les sorties. La syntaxe ne joue donc quun rle secondaire par rapport la smantique. Le phnomne damorage smantique, qui reste externe au lexique, nest considr que comme une facilitation dans le processus du rarrangement (Fig. 2.1.).

forme de surface

Acteur Action Objet

Rarrangement lexical Lexique G. P. S. Contraintes de 2me niveau Amorage Smantique Syntaxe

Fig. 2.1. : L'amorage smantique est pris en charge par le GPS : il reste un phnomne externe au lexique, c'est le rsultat d'un calcul sur le sens. [Kiger et al, 83] ont dmontr l'existence du "backward priming" (amorage rtrograde) temporaire qui influence la tche de dcision lexicale. Un mot prsent avec une latence de 50 ms aprs un mot cible peut faciliter la classification de la cible dans le cas o les mots sont fortement relis smantiquement. Des combinaisons de "forward et backward priming" temporaires peuvent augmenter les effets d'amorage pour acclrer l'accs lexical et faciliter la classification des rponses des sujets (en diminuant les temps d'valuation des reprsentations smantiques de la phrase). Les expriences qui ont t faites dans ce cadre tentent de montrer que les adultes utilisent des stratgies de type Nom-Verbe-Nom proposes par [Bever, 70] et que la prsence des relations entre les mots (amorage smantique) influencent la comprhension de la phrase bien avant la fin de l'analyse syntaxique (en tout cas pour des phrases incorrectes). (b) l'hypothse autonomiste Sans nier les effets d'amorage smantique, les partisans de l'hypothse autonomiste considrent qu'il s'agit l de phnomnes internes au lexique mental sans incidence sur les mcanismes proprement dits de comprhension [Fodor, 83]. Des expriences de "saturation smantique" dans lesquelles les mots sont rpts un grand nombre de fois, mettent en vidence un ralentissement des phnomnes d'amorage lexical. Ceci suggre qu'il faut distinguer entre diffusion de l'activation l'intrieur du rseau responsable des phnomnes d'amorage et accs aux significations lexicales. Fodor suppose que ces significations lexicales sont traduites dans un format compatible avec la forme logique de l'nonc. Il modlise le phnomne d'amorage smantique par des liens statiques internes au lexique. Ces liens sont dabord pris en compte par la syntaxe puis par la smantique au cours de lanalyse de la forme de surface; enfin la forme logique finale est calcule aprs insertion lexicale sur la c-structure (structure des constituants) (Fig. 2.2). Lhypothse selon laquelle les significations lexicales pourraient intervenir sous forme de rgles (ou propositions) a t galement dfendue par Fodor mais ce nest pour lui quune variante dans la reprsentation des liens internes du lexique. La comprhension comporterait donc deux tapes distinctes : 1. une analyse syntaxique permettant d'associer une forme logique l'nonc,

41

2. l'application sur cette forme logique des rgles dfinissant le domaine.


Forme de surface Le boulanger fait le pain de mie Forme logique faire(boulanger, pain(mie))

N: boulanger N: pain N: mie V: faire Lexique de

c-structure

Smantique Syntaxe

Fig. 2.2. : L'amorage smantique : liens lexicaux grs travers la syntaxe (pain de mie mie de pain) au premier niveau. La forme logique est obtenue aprs insertion lexicale sur la structure des constituants (c) l'hypothse propositionnelle Cette hypothse est une variante de l'hypothse autonomiste, on suppose que les connaissances smantiques sont mises sous forme prdicative, par exemple l'entre lexicale "tuer" = causer(x, changer(tat(y)), z) avec x=anim, y=mort, z=anim. Il reste instancier les variables en recherchant dans l'nonc les items adquats. Selon [Le Ny, 79] la comprhension d'une phrase comporte donc : 1. la dcomposition smantique des mots lexicaux qui permet de faire apparatre des prdicats lmentaires ainsi que les arguments qui devront tre recherchs dans l'nonc, 2. le r-arrangement des arguments autour des prdicats lmentaires pour aboutir au sens global de l'nonc. Dans cette perspective la comprhension est guide par l'analyse de la signification individuelle des mots lexicaux travers une forme logique sans vritable analyse syntaxique. Nanmoins, celle-ci sera ncessaire chaque fois que des caractristiques de surface devront tre prise en compte.

Forme de surface Le boulanger fait le pain de mie

Forme logique faire(boulanger, pain(mie))

N: boulanger N: pain N: mie V: faire AS(boulanger,pain) AS(pain,mie) AS(boulanger,faire) AS(faire,pain) Lexique

Calcul logique

Syntaxe Smantique

Fig 2.3. : La smantique intervient avant la syntaxe en s'appuyant sur un calcul logique sur les prdicats stocks dans le lexique. (d) l'hypothse infrentielle Cette approche [Wilson, 79] donne une grande importance au contexte dans l'interprtation des noncs. Cependant, le processus de dduction dont dpend l'attribution d'une signification pertinente, dmarre aprs qu'une forme logique ait t assigne l'nonc. (e) l'hypothse procdurale Downty [Dowty et al, 81] a appliqu la thorie des modles procduraux au langage naturel. Aux noms propres sont associs des individus, aux noms communs et aux adjectifs des ensembles d'objets prsentant telle ou telle caractristique, aux verbes transitifs des ensembles de couples d'individus ou d'objets, etc. Ce type de dfinition en extension peut tre remplac par des fonctions permettant d'associer une valeur de vrit (Vrai/Faux) au mot lexical considr (tout individu du monde rel, tout couple d'individus, etc.). L'ensemble des valeurs smantiques associes aux mots lexicaux constituent le modle par rapport auquel les noncs sont interprts. Des rgles smantiques, permettent de dterminer la valeur de vrit d'une phrase partir des valeurs smantiques assignes ses constituants par exemple <Si X est un nom propre et Y est un adjectif la phrase (X est Y) est vraie si la valeur smantique de X appartient, au sens de la thorie des ensembles, la valeur smantique de Y>. La valeur smantique d'un syntagme nominal complexe dtermin par l'intersection des valeurs smantiques de ses constituants, et de mme pour la valeur smantique d'une phrase. On peut dire qu'un modle mental associ un nonc est dcrit comme une reprsentation mentale de la situation dnote par l'nonc. Ceci suppose que l'auditeur est capable de construire cette reprsentation d'o l'ide de smantique procdurale. Avec cette hypothse, Winograd [Winograd, 72] a crit le programme SHRDLU qui permet de commander un robot en langage naturel et de dialoguer avec lui. Interprter un nonc, c'est construire et activer un programme qui excutera la commande correspondante. Le nom du programme est fourni, directement par le verbe principal de la phrase. L'essentiel du travail rside dans la recherche des rfrents des syntagmes nominaux qui sont passs comme des arguments au programme.

43

Pour Winograd comprendre cest attribuer des rles aux mots de la commande pour gnrer un script compatible avec la structure fonctionnelle. Cette gnration se fait par lintermdiaire dun moteur externe (GPS).
forme de surface Lexique N: boulanger : artisan N: pain : nourriture composition : farine, eau... producteur : boulanger spcialisation : pain de mie... V: faire : produire(obj) Scriptfaire suj : boulanger objet : pain spcialisation :

G. P. S. f-structure Syntaxe Rgles

Si Suj=anim alors faire(suj,obj)

Fig. 2.4. : Les liens entre mots ne sont pas explicitement reprsents dans le lexique mais s'tablissent en fonction des "rles" des mots dfinis travers la structure fonctionnelle.

2.2. Pour une structure logique intermdiaire


La prsentation de ces quelques modles, montre la diversit des solutions envisageables. En particulier l'insertion lexicale se fait, selon les modles, aprs le calcul de la forme logique ou avant et aprs. Lamorage smantique est vu soit comme un phnomne principal soit comme un artfact, sorte de sous-produit rsultant des computations linguistiques sur les mots. Quant nous, nous proposons une alternative qui consiste ajouter un module spcifique pour traiter de lamorage smantique. Ce module serait plac entre un module syntaxico-smantique classique et un module dinterprtation pragmatique. Pour cela nous avons mis en oeuvre un modle mixte inspir des modles de Fodor et de Winograd (cf. hypothses c et e) car il prserve l'autonomie pshycholinguistique et il s'exprime commodmentt sous forme de rgles. Ce modle dont les relations avec la syntaxe restent claires est compatible avec les concepts des Grammaires Lexicales Fonctionnelles que nous avons choisies dans le systme DIRA et peut simuler l'amorage smantique entre les constituants de la phrase. De manire squentielle et simplificatrice on peut concevoir deux tapes dans la comprhension : la premire qui s'appuie sur les marqueurs smantiques principaux de la phrase (mots, groupes) et qui produit un premier type de comprhension par mise en relation des lments de sens et une deuxime qui ne permet de vritable comprhension qu'en contexte, un niveau proprement pragmatique. C'est ce double point de vue qui est mis en oeuvre dans le systme DIRA : - le module C2M2 (Comprhension en Constituants Majeurs et Mineurs) modlise les processus concernant l'amorage smantique li la forme logique de l'nonc,

- le module Dialogue s'occupe, entre autres, de l'instanciation des scripts au niveau pragmatique. Une autre srie d'arguments non linguistiques cette fois, plaide en faveur de l'introduction de ce module C2M2 en aval du module de dialogue et en parallle avec une analyse syntaxico-smantique dterministe; ce sont des arguments (1) lis l'architecture choisie dans le systme DIRA rduire le facteur de branchement lexical typique d'une stratgie gauche-droite avec retour arrire et (2) lis aux difficults propre la reconnaissance du langage oral construire une structure smantique s'appuyant le plus possible sur les mots lexicaux, ce qui vite, dans une certaine mesure, de reconnaitre parfaitement les mots grammaticaux. De plus ce module peut fonctionner en prdiction avec synchronisation dans le parcours de l'ATN syntaxico-smantique du systme (voir ci-aprs).

2.3. La comprhension dans le systme DIRA


Dans le systme DIRA [Caelen, 91], la comprhension se fait au fur et mesure de la reconnaissance c'est--dire dans le sens gauche-droite, tantt en vrification tantt en prdiction. La vrification se fait sur des squences de mots constituant des phrases incompltes. La prdiction doit permettre de faire des hypothses sur quelques structures de phrase et mots possibles utilisables par l'analyseur syntaxicosmantique. Trois composantes participent la comprhension dune phrase : 1) la composante syntaxico-smantique qui contrle la formation des constituants de la phrase, 2) la composante damorage smantique qui permet de comprendre partiellement le message, grace aux relations tablies entre certains mots de la phrase, 3) la composante pragmatique qui donne une interprtation de la phrase dans le contexte de lapplication choisie.

La composante syntaxico-smantique
Cette composante dlivre la c-structure et la f-structure conformment au modle des GLF (Grammaires Lexicales Fonctionelles) de Bresnan/Kaplan [Kaplan and Bresnan, 82]. Dans les GLF, la description interne d'une phrase est forme de deux lments indpendants : 1. La structure des constituants ou c-structure pour les aspects purement syntaxiques, 2. La structure fonctionnelle ou f-structure pour les aspects syntaxico-smantiques. La c-structure est obtenue par une analyse classique de la phrase avec une grammaire indpendante du contexte. Cette grammaire est beaucoup plus large qu'une grammaire syntagmatique seule puisqu'elle autorise des structures incorrectes qui sont filtres ultrieurement laide de la f-structure. Cette dernire est fonde sur la notion de schma. Elle est engendre partir des quations qui sont associes aux rgles de la grammaire. Pour dcrire ces quations on utilise les notations d'embotement des proprits par une liste: (A B) reprsente l'attribut B de l'lment A. Les quations sont attaches aux arcs de l'arbre engendr. Par

45

convention on considre que : p : dsigne la structure fonctionnelle du noeud pre. f : dsigne la structure fonctionnelle du noeud fils. Soit la rgle : P ---> GN GV (p sujet) = f p=f

Dans cette rgle p dsigne le noeud pre du GN, c'est--dire la phrase P elle-mme, et f dsigne les noeuds fils de GN, de mme pour GV. Cette quation signifie donc que le sujet du verbe du GV, qui est aussi sujet de la phrase P, se trouve dans le GN. L'analyse (ou la production) d'une phrase suit donc trois tapes : 1. en utilisant la grammaire hors contexte, et en ngligeant les quations qui sont attaches aux rgles, on produit un arbre de drivation dont les feuilles sont toutes des catgories lexicales. 2. on tiquette chaque feuille par le mot appropri de la phrase et son reprsentant dans le dictionnaire, puis selon les drivations et les mots choisis, on met jour les quations que l'on propage vers la racine (en remplaant les variables (p, f) qui y figurent par les termes convenables). 3. on rsoud ces quations, jointes celles qui sont attaches aux entres du lexique, pour fournir la structure fonctionnelle de la phrase. Il est vident que les quations peuvent transporter toutes sortes d'attributs et en particulier des smes. C'est pourquoi les grammaires lexicales fonctionnelles sont bien adaptes au problme du traitement de la langue naturelle. Une telle grammaire a t mise en oeuvre travers un ATN par Reynier [Reynier et al, 89] qui est utilis comme module danalyse syntaxico-smantique dans le systme DIRA.

La composante pragmatique
Nous ne dtaillerons pas cette composante qui prsente toutes les caractristiques habituelles que l'on rencontre en gestion de dialogue, savoir la base de connaissance statique dcrivant les objets de lapplication traite, les actions possibles sur ces objets, les faits et les connaissances dynamiques, les historiques, etc. [Pierrel, 87]. En particulier, cette composante sappuie sur une grammaire de cas et a pour tche d'instancier les scripts relatifs aux noncs. L'analyseur pragmatique lit les informations fournies par l'analyseur syntaxico-smantique, la c-structure (constituants de surface) et la f-structure (structure fonctionnelle) [Reynier et al, 89], gre les historiques et complte les slots des scripts correspondant aux tches de lapplication. Le langage envisag ici tant opratif, ces scripts sont donc dclenchs par le verbe de la phrase tiquet dans la f-structure. Une tche compltement instancie peut tre qualifie de compltement comprise.

La composante damorage
Cette composante doit fonctionner en vrification et en proposition comme les autres modules du systme. Elle a pour rles : (a) en vrification dtablir les relations, de type "forward" et "backward", entre les constituants de la phrase, et dcrire dans le tableau noir un drapeau qui indique le degr de comprhension atteint, (b) en proposition de prdire les catgories de mots qui peuvent convenir aprs une squence donne. Cette composante a t implante dans le systme laide dune base de connaissance contenant tous les prdicats damorage entre mots et de rgles dapplication. Une telle reprsentation permet dune part de garantir lindpendance avec le lexique puisque les relations sont externes au lexique et dautre part davoir un mcanisme fonctionnant indpendamment de lanalyseur syntaxique remarquons quen effet, il aurait t possible dintroduire le contrle damorage sous forme dactions dans lATN. Les rgles sappliquent sur la f-structure dans un ordre de priorit donne par la c-structure : en largeur dabord et de gauche droite. Pour lexemple le boulanger fait le pain de mie lanalyse donne :
P SN SV GN2 V fait Action art le N pain C.o.d. GN c-structure GN1 art Le N boulanger Sujet 1 AS AS AS GP pr de N mie Comp. Nom f-structure

amorage

pour les connaissances suivantes... GRAMMAIRE Constituants Majeurs Constituants Mineurs

47

P >

SN SV (p suj)=f p=f

GN1 > GP >

[art] prp

N p=f N p=f

SN > GN1 p=f SV > V p=f GN (p cod)=f

GN > GN2 GP p=f (p cn)=f LEXIQUE V: faire temps={ind. cond. subj.} mode={prsent, pass, futur} constr.=<V, suj, cod> classe='produire'; boulanger genre=masculin nombre={sing. pluriel} classe='artisan'; N: pain genre=masculin; nombre={sing. pluriel} classe='nourriture'; N: mie genre=masculin classe='pain';

N:

PREDICATS DAMORCAGE SEMANTIQUE AS: AS: AS: (N(suj),V) ('anim', 'produire'); cette relation lie tous les sujets anim aux verbes de la classe produire (N, N) (boulanger, pain); cette relation lie les deux instances boulanger et pain (N,N(cn)) (pain, mie); (pain, 'crale');

...les rgles suivantes permettent dappliquer la stratgie de comprhension selon la structure des phrases analyses par la composantes syntaxico-smantique : REGLES D'AMORCAGE Ras-phrase : si P=(SN SV) alors AS(N(suj), V) fin

Ras-SV : si SV=(V GN) alors AS(suj,N(cod)); fin Ras-GN : si GN=(GN2 GP) alors AS(N, N(cn)); fin etc. Il est facile de voir sur cet exemple que la phrase tant du type SN SV on commence par vrifier la relation sujet-verbe puis, comme le syntagme verbal se dcompose son tour en verbe + groupe nominal on vrifie la relation sujet-complment dobjet-direct et ainsi de suite. Il est vident que le moteur dinfrences qui applique cette stratgie doit parcourir la c-structure et rechercher les lments fonctionnels dans la f-structure pour unifier les diffrents termes. Limplantation de ce mcanisme a t ralis en Prolog. La comprhension d'une phrase est soumise la condition que l'amorage smantique entre les mots lexicaux doit pouvoir s'tablir. La stratgie consiste donc activer l'ASS (analyseur syntaxicosmantique) pour quil fournisse la c-structure et la f-structure des fragments de phrases construites dans le tableau noir ; il peut fournir plusieurs hypothses. Puis le superviseur active le module C2M2 dont le rle est alors d'tablir l'amorage smantique entre les constituants dtermins par l'ASS et prsents dans le tableau noir. En cas de succs la phrase (ou portion de phrase) est dite "partiellement comprhensible" ce qui permet au superviseur de valider ses hypothses et de passer le relai la composante pragmatique pour une comprhension totale et une excution de la tche ou de la requte. Une des mission importante du module de comprhension (en mode vrification) dans le systme DIRA est de filtrer les hypothses de mots au cours de l'exploration de gauche droite des phrases. La Fig. 2.5 montre la comparaison entre deux courbes visualisant la perplexit lexicale pour la phrase "lcher la cl", avec et sans ce module damorage smantique pour la mme chane phontique d'entre. On constate bien videmment que la perplexit dans le premier cas est constamment infrieur au second, avec un rapport significatif (ici rduction dans un rapport 4). A elle seule, cette amlioration justifie dj pleinement l'existence d'un tel module. Un autre intrt est daccepter des hypothses syntaxiquement incorrectes mais comprhensibles au cours de lanalyse. Il serait inutile de multiplier les exemples qui montreraient tous que le nombre dhypothses est rduit : il lest dans un rapport 5 en moyenne.

49

Branchement lexical
400

300

Nb de mots

200

gauche droite la fin

100

0 0 2 4 N phonme 6 8 10

Fig. 2.5 : comparaison entre le branchement lexical dans les cas o on a (1) un processus de comprhension progressif de gauche droite et (2) un processus de comprhension la fin de la phrase seulement. La composante linguistique traitant spcifiquement de l'amorage smantique remplit bien le rle attendu dans le filtrage des hypothses lexicales au cours de leur mission : il diminue la perplexit lexicale chaque instant dans un rapport intressant (5 en moyenne), il acclre le filtrage smantique dans la mesure o il limine dj quelques hypothses avant l'utilisation des informations pragmatiques en vitant notamment l'instanciation prmature de certains scripts de la composante pragmatique, il introduit une composante "prcoce" de comprhension, il fonctionne de gauche droite, en prdiction et en vrification, il permet d'obtenir une forme logique de l'nonc qui peut ventuellement permettre d'viter de reconnatre systmatiquement tous les mots de la phrase et donc daccepter des phrases syntaxiquement incorrectes mais comprhensibles. Un tel modle semble compatible avec les hypothses actuelles concernant les processus de comprhension humains savoir surtout le calcul d'une forme logique avant l'insertion des connaissances spcifiques au domaine auquel se rapporte l'nonc.

REFERENCES
CAELEN, J. et TATTEGRAIN, H. (1988). Le dcodeur acoustico-phontique DIRA-DAP. Actes 17 JEP, Nancy, pp. 115-121. BEVER. T.G. (1970). "The cognitive basis for linguistic structures." In J.R. Hayes (edition), cognition and the development of language (New York), pp. 279-362. BRANSFORD, J. & JOHNSON, M. (1972). "Contextuelle prerequisites for understanding : Some investigations of comprehension and recall." Jounal of Verbal Learning and Verbal Behavior , 11,

pp. 717-726. BRESNAN, J. and KAPLAN, R.M. (1982). Introduction: Grammar as mental representations of language. The mental representations of grammatical relations. In Bresnan ed., Cambridge Mass. & London, MIT Press. FODOR, J. D. (1980). "Semantics : theories of meaning in generative grammar." Cambridge : Harvard University Press. FODOR, J.D. (1983). The Modularity of Mind. Cambridge, MA : the MIT Press. FORSTER, K. I. (1979). "Levels of processing and the structure of the language processor." In W.E. Cooper and E.C.T. Walker (eds.), Sentence Processing: Psycholinguistic Studies , pp. 216-225. FRASER, C., BELLUGI, U., BROWN, R.W. (1963). "Control of grammar in imitation, comprehension, and production." Journal of Verbal Learning and Verbal Behavior, 2, 121-135. HALLIDAY, M. A. K. (1967). "Notes on transitivity." Part II Journal linguistic , 3, pp 199-244. KAPLAN, R.M. and BRESNAN, J. (1982). Lexical Functional Grammar : a formal system for grammatical representations. The mental representations of grammatical relations. In Bresnan ed., Cambridge Mass. & London, MIT Press. KEMPER, S., CATLIN, J. (1979). "On the role of semantic constraints in sentence comprehension." LANGUAGE AND SPEECH, Vol. 22, Part 3. KIGER, J. I., GLASS, A. L. (1983). "The facilitation of lexical decisions by a prime ocurring after the target." Memory and Cognition, 11, 356-365. LE-NY, J. F. (1979). "La smantique psychologique." Press Universitaire, Paris. MOUSEL, P., PIERREL, J.M. et ROUSSALANY, A. (1989). Coopration entre syntaxe, smantique et pragmatique dans un systme de dialogue homme-machine Actes 7 congrs AFCET-RFIA, Paris, pp. 371-386. NASRI, M.K., CAELEN-HAUMONT, G. et CAELEN, J. (1989). Using Prosodic Rules in Continuous Speech Recognition Proc. of ICASSP-IEEE, Glasgow, Vol. 1, pp. 671-674. PIERREL, J.M. (1987). Dialogue oral Homme-machine. Herms, Paris. REYNIER, E. et CAELEN J. (1989). ATN Compiler and Parser for an ASR system Proc. of EUROSPEECH'89, Paris, pp. 398-401. WILSON, D. and SPERBER, D. (1979). Remarques sur l'interprtation des noncs selon Paul Grice. Communication , 30, pp. 80-94. WINOGRAD, T. (1972). Understanding Natural Language. New York Academic Press.

51

Vous aimerez peut-être aussi