Vous êtes sur la page 1sur 77

Raliser et exploiter lannotation syntaxique de textes mdivaux Mthodes et outils du Syntactic Reference Corpus of Medieval French

Nicolas Mazziotta
Universit de Lige/Universitt Stuttgart, ILR

COST Workshop, Cracovie, 25-26 avril 2013

Plan

Expos en deux parties :

1. SRCMF
Le projet en quelques mots Principes gnraux de lanalyse Structures particulires

2. Mise en pratique
Dmonstration

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

1re partie : Syntactic Reference Corpus of Medieval French

Le projet en quelques mots Principes gnraux de lanalyse Structures particulires

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Le projet en quelques mots Objectif et matriaux Principes gnraux de lanalyse Un modle dpendanciel Principes gnraux Dlimiter lunit maximale de traitement Structures particulires Prpositions, conjonctions de subordination Amalgames Pronom relatif Coordinations

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Objectif et matriaux
Objectif
Enrichir les principaux corpus dafr. avec une annotation syntaxique

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Objectif et matriaux
Objectif
Enrichir les principaux corpus dafr. avec une annotation syntaxique Rend possible lexamen des interactions syntaxe/autres domaines de la grammaire

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Objectif et matriaux
Objectif
Enrichir les principaux corpus dafr. avec une annotation syntaxique Rend possible lexamen des interactions syntaxe/autres domaines de la grammaire

Matriaux
Base de Franais Mdival (BFM, Lyon, dir. Cline Guillot) ; Nouveau Corpus dAmsterdam (NCA, Stuttgart, dir. Achim Stein).

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Objectif et matriaux
Objectif
Enrichir les principaux corpus dafr. avec une annotation syntaxique Rend possible lexamen des interactions syntaxe/autres domaines de la grammaire

Matriaux
Base de Franais Mdival (BFM, Lyon, dir. Cline Guillot) ; Nouveau Corpus dAmsterdam (NCA, Stuttgart, dir. Achim Stein). Annotations prsentes : Mtadonnes Morphosyntaxe Lemmatisation automatique (NCA) Identication de loral reprsent (BFM)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Objectif et matriaux
Une annotation plusieurs niveaux
Complments relevant du verbe (syntaxe propositionnelle) Complments ne relevant pas dun verbe

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Objectif et matriaux
Une annotation plusieurs niveaux
Complments relevant du verbe (syntaxe propositionnelle) Complments ne relevant pas dun verbe

Complments relevant du verbe


Permet ltude lexicale et syntaxique des verbes Tous les textes

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Objectif et matriaux
Une annotation plusieurs niveaux
Complments relevant du verbe (syntaxe propositionnelle) Complments ne relevant pas dun verbe

Complments relevant du verbe


Permet ltude lexicale et syntaxique des verbes Tous les textes

Complments ne relevant pas dun verbe


Description approfondie du SN, p. ex. Certains textes

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Le projet en quelques mots Objectif et matriaux Principes gnraux de lanalyse Un modle dpendanciel Principes gnraux Dlimiter lunit maximale de traitement Structures particulires Prpositions, conjonctions de subordination Amalgames Pronom relatif Coordinations

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Un modle dpendanciel
Positionnement
Suivant Tesnire et Mel cuk Un modle relativement souple, fond sur les relations unissant les units lexicales

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Un modle dpendanciel
Positionnement
Suivant Tesnire et Mel cuk Un modle relativement souple, fond sur les relations unissant les units lexicales

Approche concrte

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Un modle dpendanciel
Positionnement
Suivant Tesnire et Mel cuk Un modle relativement souple, fond sur les relations unissant les units lexicales

Approche concrte

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Un modle dpendanciel
Positionnement
Suivant Tesnire et Mel cuk Un modle relativement souple, fond sur les relations unissant les units lexicales

Approche concrte

Une phrase (Snt), unit maximale de traitement

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Un modle dpendanciel
Positionnement
Suivant Tesnire et Mel cuk Un modle relativement souple, fond sur les relations unissant les units lexicales

Approche concrte

Mots, unit minimale de traitement

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Un modle dpendanciel
Positionnement
Suivant Tesnire et Mel cuk Un modle relativement souple, fond sur les relations unissant les units lexicales

Approche concrte

Fonctions et des structures grammaticales (ellipses), reliant et groupant les mots

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Un modle dpendanciel
Positionnement
Suivant Tesnire et Mel cuk Un modle relativement souple, fond sur les relations unissant les units lexicales

Approche concrte

Relations de dpendance [D] entre les mots et les structures

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Un modle dpendanciel
Positionnement
Suivant Tesnire et Mel cuk Un modle relativement souple, fond sur les relations unissant les units lexicales

Approche concrte

Ralisation lexicale [L] des structures

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Un modle dpendanciel

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Le verbe dit ni est le nud principal

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Le verbe dit ni est le nud principal

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Le verbe dit ni est le nud principal

Il ralise lexicalement [L] la phrase (Snt) Il en est le nud principal (ou la tte )

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Les autres structures qui constituent Snt dpendent de ce verbe

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Les autres structures qui constituent Snt dpendent de ce verbe

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Les autres structures qui constituent Snt dpendent de ce verbe

Chaque structure de mme niveau a une fonction par rapport au verbe :

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Les autres structures qui constituent Snt dpendent de ce verbe

Chaque structure de mme niveau a une fonction par rapport au verbe : dans sa valence (SjPer, Obj)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Les autres structures qui constituent Snt dpendent de ce verbe

Chaque structure de mme niveau a une fonction par rapport au verbe : dans sa valence (SjPer, Obj) hors de sa valence (Circ)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Les autres structures qui constituent Snt dpendent de ce verbe

Chaque structure de mme niveau a une fonction par rapport au verbe : dans sa valence (SjPer, Obj) hors de sa valence (Circ) lie sa morphologie et modiant ventuellement la valence (AuxA)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Les dpendants du verbe sont rlaliss lexicalement

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Les dpendants du verbe sont rlaliss lexicalement

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Les dpendants du verbe sont rlaliss lexicalement

. . . Ou bien ils constituent une structure propositionnelle (rcursivit)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Les dpendants du verbe sont rlaliss lexicalement

. . . Ou bien ils constituent une structure propositionnelle (rcursivit) Si lannotation nest pas complte (ici), plusieurs mots ralisent simultanment la structure

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Fonctions principales des dpendants du verbe (hirarchises)


Actant

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Fonctions principales des dpendants du verbe (hirarchises)


Actant
Sujet (SjPer/SjImp)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Fonctions principales des dpendants du verbe (hirarchises)


Actant
Sujet (SjPer/SjImp) Rgime (Regim)
Objet (Obj) Complment (Cmpl)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Fonctions principales des dpendants du verbe (hirarchises)


Actant
Sujet (SjPer/SjImp) Rgime (Regim)
Objet (Obj) Complment (Cmpl)

Attribut
Attribut du sujet (AtSj) Attribut de lobjet (AtObj)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Fonctions principales des dpendants du verbe (hirarchises)


Actant
Sujet (SjPer/SjImp) Rgime (Regim)
Objet (Obj) Complment (Cmpl)

Attribut
Attribut du sujet (AtSj) Attribut de lobjet (AtObj)

Auxili (Aux)
Auxili actif (AuxA) Auxili passif (AuxP)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Principes gnraux

Fonctions principales des dpendants du verbe (hirarchises)


Actant
Sujet (SjPer/SjImp) Rgime (Regim)
Objet (Obj) Complment (Cmpl)

Attribut
Attribut du sujet (AtSj) Attribut de lobjet (AtObj)

Auxili (Aux)
Auxili actif (AuxA) Auxili passif (AuxP)

Circonstant (Circ)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Dlimiter lunit maximale de traitement


Difcult

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Dlimiter lunit maximale de traitement


Difcult
Le terme phrase est tributaire dune longue tradition grammaticale

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Dlimiter lunit maximale de traitement


Difcult
Le terme phrase est tributaire dune longue tradition grammaticale La distinction entre phrase et nonc est loin dtre consensuelle

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Dlimiter lunit maximale de traitement


Difcult
Le terme phrase est tributaire dune longue tradition grammaticale La distinction entre phrase et nonc est loin dtre consensuelle Certaines relations de coordination de phrase sont difcile dmler

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Dlimiter lunit maximale de traitement


Difcult
Le terme phrase est tributaire dune longue tradition grammaticale La distinction entre phrase et nonc est loin dtre consensuelle Certaines relations de coordination de phrase sont difcile dmler

Une srie de rgles

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Dlimiter lunit maximale de traitement


Difcult
Le terme phrase est tributaire dune longue tradition grammaticale La distinction entre phrase et nonc est loin dtre consensuelle Certaines relations de coordination de phrase sont difcile dmler

Une srie de rgles


1 verbe ni indpendant = 1 phrase

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Dlimiter lunit maximale de traitement


Difcult
Le terme phrase est tributaire dune longue tradition grammaticale La distinction entre phrase et nonc est loin dtre consensuelle Certaines relations de coordination de phrase sont difcile dmler

Une srie de rgles


1 verbe ni indpendant = 1 phrase Pas de coordination de phrases

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Dlimiter lunit maximale de traitement


Difcult
Le terme phrase est tributaire dune longue tradition grammaticale La distinction entre phrase et nonc est loin dtre consensuelle Certaines relations de coordination de phrase sont difcile dmler

Une srie de rgles


1 verbe ni indpendant = 1 phrase Pas de coordination de phrases Pas de partage de complments entre les verbes (ratachement au plus proche)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Dlimiter lunit maximale de traitement


Difcult
Le terme phrase est tributaire dune longue tradition grammaticale La distinction entre phrase et nonc est loin dtre consensuelle Certaines relations de coordination de phrase sont difcile dmler

Une srie de rgles


1 verbe ni indpendant = 1 phrase Pas de coordination de phrases Pas de partage de complments entre les verbes (ratachement au plus proche)

Consquences
Des postulats qui affectent toute lanalyse et refusent toute exception Une analyse limite

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Le projet en quelques mots Objectif et matriaux Principes gnraux de lanalyse Un modle dpendanciel Principes gnraux Dlimiter lunit maximale de traitement Structures particulires Prpositions, conjonctions de subordination Amalgames Pronom relatif Coordinations

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Prpositions, conjonctions de subordination


Units de relation nommes relateurs
Relateurs coordonnants (RelC, cf. infra) Relateurs non coordonnants (RelNC)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Prpositions, conjonctions de subordination


Units de relation nommes relateurs
Relateurs coordonnants (RelC, cf. infra) Relateurs non coordonnants (RelNC)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Prpositions, conjonctions de subordination


Units de relation nommes relateurs
Relateurs coordonnants (RelC, cf. infra) Relateurs non coordonnants (RelNC)

Le RelNC subordonnant dpend du verbe comme les complments (pas de translation ou de rection)

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Prpositions, conjonctions de subordination


Units de relation nommes relateurs
Relateurs coordonnants (RelC, cf. infra) Relateurs non coordonnants (RelNC)

Le RelNC subordonnant dpend du verbe comme les complments (pas de translation ou de rection) Le RelNC entretient une relation particulire [R]

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Prpositions, conjonctions de subordination


Units de relation nommes relateurs
Relateurs coordonnants (RelC, cf. infra) Relateurs non coordonnants (RelNC)

Le RelNC subordonnant dpend du verbe comme les complments (pas de translation ou de rection) Le RelNC entretient une relation particulire [R] Le RelNC peut introduire une phrase

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Amalgames
Fusion de deux fonctions
Une seule forme indcomposable graphiquement Plusieurs fonctions Lunit est duplique dans la reprsentation

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Amalgames
Fusion de deux fonctions
Une seule forme indcomposable graphiquement Plusieurs fonctions Lunit est duplique dans la reprsentation

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Amalgames
Fusion de deux fonctions
Une seule forme indcomposable graphiquement Plusieurs fonctions Lunit est duplique dans la reprsentation

nel contient lexpression de la ngation

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Amalgames
Fusion de deux fonctions
Une seule forme indcomposable graphiquement Plusieurs fonctions Lunit est duplique dans la reprsentation

nel contient lexpression de la ngation et lexpression de lobjet

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Amalgames
Fusion de deux fonctions
Une seule forme indcomposable graphiquement Plusieurs fonctions Lunit est duplique dans la reprsentation

nel contient lexpression de la ngation et lexpression de lobjet La relation de duplication [dupl] est explicite

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Pronom relatif
Traitement similaire aux amalgames
Une seule forme indcomposable graphiquement Plusieurs fonctions Lunit est duplique dans la reprsentation

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Pronom relatif
Traitement similaire aux amalgames
Une seule forme indcomposable graphiquement Plusieurs fonctions Lunit est duplique dans la reprsentation

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Pronom relatif
Traitement similaire aux amalgames
Une seule forme indcomposable graphiquement Plusieurs fonctions Lunit est duplique dans la reprsentation

La relative modie un nom (ModA) En tant que proposition, sa structure est analyse

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Pronom relatif
Traitement similaire aux amalgames
Une seule forme indcomposable graphiquement Plusieurs fonctions Lunit est duplique dans la reprsentation

La relative modie un nom (ModA) En tant que proposition, sa structure est analyse qui fonctionne comme un RelNC

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Pronom relatif
Traitement similaire aux amalgames
Une seule forme indcomposable graphiquement Plusieurs fonctions Lunit est duplique dans la reprsentation

La relative modie un nom (ModA) En tant que proposition, sa structure est analyse qui fonctionne comme un RelNC et comme un SjPer

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Pronom relatif
Traitement similaire aux amalgames
Une seule forme indcomposable graphiquement Plusieurs fonctions Lunit est duplique dans la reprsentation

La relative modie un nom (ModA) En tant que proposition, sa structure est analyse qui fonctionne comme un RelNC et comme un SjPer La relation de duplication [dupl] est explicite

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Coordinations
Spcicit de la relation
Sur un autre plan que la dpendance (orthogonal) Lie deux units qui dpendent dune mme autre

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Coordinations
Spcicit de la relation
Sur un autre plan que la dpendance (orthogonal) Lie deux units qui dpendent dune mme autre

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Coordinations
Spcicit de la relation
Sur un autre plan que la dpendance (orthogonal) Lie deux units qui dpendent dune mme autre

La coordination est une structure parallle qui nest pas dans le rseau de dpendance de Snt. Elle na pas de ralisation lexicale

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Coordinations
Spcicit de la relation
Sur un autre plan que la dpendance (orthogonal) Lie deux units qui dpendent dune mme autre

La coordination est une structure parallle qui nest pas dans le rseau de dpendance de Snt. Elle na pas de ralisation lexicale Les termes coordonns ne sont pas dpendants de la coordination

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Coordinations
Spcicit de la relation
Sur un autre plan que la dpendance (orthogonal) Lie deux units qui dpendent dune mme autre

La coordination est une structure parallle qui nest pas dans le rseau de dpendance de Snt. Elle na pas de ralisation lexicale Les termes coordonns ne sont pas dpendants de la coordination Le relateur coordonnant dpend du terme suivant

Le projet en quelques mots

Principes gnraux de lanalyse

Structures particulires

Coordinations
Spcicit de la relation
Sur un autre plan que la dpendance (orthogonal) Lie deux units qui dpendent dune mme autre

La coordination est une structure parallle qui nest pas dans le rseau de dpendance de Snt. Elle na pas de ralisation lexicale Les termes coordonns ne sont pas dpendants de la coordination Le relateur coordonnant dpend du terme suivant La relation de coordination [dupl] est explicite

Format des textes en deux mots

NotaBene

Exportation

TigerSearch

2e partie : Dmonstration

Format des textes en deux mots NotaBene Exportation TigerSearch

Format des textes en deux mots

NotaBene

Exportation

TigerSearch

Format des textes en deux mots

NotaBene

Exportation

TigerSearch

Format des textes en deux mots

NotaBene

Exportation

TigerSearch

Format des textes en deux mots

NotaBene

Exportation

TigerSearch

Format des textes en deux mots

NotaBene

Exportation

TigerSearch

Format des textes en deux mots

NotaBene

Exportation

TigerSearch

Format des textes en deux mots

NotaBene

Exportation

TigerSearch

Format des textes en deux mots

NotaBene

Exportation

TigerSearch

Vous aimerez peut-être aussi