Vous êtes sur la page 1sur 16

L'analyse en unités discursives de base : pourquoi et

comment ?
Anne Catherine Simon, Liesbeth Degand
Dans Langue française 2011/2 (n°170), pages 45 à 59
Éditions Armand Colin
ISSN 0023-8368
ISBN 9782200927080
DOI 10.3917/lf.170.0045
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

Article disponible en ligne à l’adresse


https://www.cairn.info/revue-langue-francaise-2011-2-page-45.htm

Découvrir le sommaire de ce numéro, suivre la revue par email, s’abonner...


Flashez ce QR Code pour accéder à la page de ce numéro sur Cairn.info.

Distribution électronique Cairn.info pour Armand Colin.


La reproduction ou représentation de cet article, notamment par photocopie, n'est autorisée que dans les limites des conditions générales d'utilisation du site ou, le
cas échéant, des conditions générales de la licence souscrite par votre établissement. Toute autre reproduction ou représentation, en tout ou partie, sous quelque
forme et de quelque manière que ce soit, est interdite sauf accord préalable et écrit de l'éditeur, en dehors des cas prévus par la législation en vigueur en France. Il est
précisé que son stockage dans une base de données est également interdit.
Anne Catherine Simon
Université catholique de Louvain / Institut Langage & Communication / Centre de
recherche VALIBEL – Discours et Variation
Liesbeth Degand
Université catholique de Louvain / Institut Langage & Communication / Centre de
recherche VALIBEL – Discours et Variation

L’analyse en unités discursives de base : pourquoi


et comment ?

1. RAISON D’ÊTRE DE L’ANALYSE EN UNITÉS DISCURSIVES DE


BASE 1
Cette contribution s’inscrit dans le cadre d’une recherche sur la segmentation
du discours (oral) en unités de base. Le premier objectif est théorique et vise à
mieux rendre compte de la structure du discours oral en vue de modéliser son
interprétation par l’auditeur. Le second est méthodologique et propose une pro-
cédure d’analyse rigoureuse, basée sur des indices syntaxiques et prosodiques
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


observables, et susceptible d’être appliquée de manière fiable et reproductible.
Le cadre théorique de notre approche suppose de concilier une représentation
(statique) de la structure du discours (découpage en unités de rection, représen-
tation sémantique) et une prise en compte de son déroulement dynamique et
de sa présentation de surface (découpage prosodique permettant de construire
une représentation de la structure du texte). L’unité discursive que nous définis-
sons de la sorte est l’unité discursive de base (BDU, pour Basic Discourse Unit)
(Degand & Simon 2005, 2009), à savoir “the segments that speakers use to build a
representation (interpretation) of the discourse, i.e. a kind of ‘minimal discourse
interpretation segments”’ (Degand & Simon 2009a). En fondant cette segmen-
tation sur les structures syntaxiques et prosodiques de surface, nous proposons
une méthode explicite et reproductible, qui rend compte à la fois du discours
oral comme processus (construit en direct par un locuteur dans une situation
plus ou moins interactive) et comme produit (nécessitant des structures achevées
et interprétables).

1. Nous remercions le relecteur anonyme pour ses commentaires qui nous ont permis de clarifier ou de préciser
certains aspects de notre propos. Le second auteur est maître de recherche du FRS-FNRS (Fonds de recherche
scientifique). Cette recherche est soutenue financièrement par un crédit F.R.F.C n° 2.4524.11 (17468261).

LANGUE FRANÇAISE 170 rticle on line 45


Unités syntaxiques et unités prosodiques

Nos recherches se situent dans le prolongement des travaux en analyse du


discours où il est généralement admis que le discours est hiérarchiquement
structuré : un fragment de discours est composé d’un ensemble de segments
plus petits reliés les uns aux autres d’une manière cohérente. Ce qui diffère
par contre d’un modèle à l’autre, c’est la manière dont on définit ces segments
constitutifs des discours : énoncés (Reboul & Moeschler 1998), unités de dis-
cours élémentaires (Asher & Lascarides 2003), actes discursifs (Roulet et al. 2001),
actes discursifs de base (Steen 2005), unités minimales du discours (Degand &
Simon 2005, 2008 ; Hannay & Kroon 2005), unités discursives de base (Degand &
Simon 2009). Les auteurs qui prennent au sérieux le problème théorique de la
définition des unités discursives reconnaissent leur double statut (voir Berren-
donner, ce numéro), avec une face linguistique (sous la forme d’une construc-
tion syntaxique dotée d’un contour intonatif) et une face discursive (sous la
forme d’unités informationnelles contextualisées). La distinction entre micro- et
macro–syntaxe a souvent été utilisée pour rendre compte de cette double articu-
lation (voir Avanzi (2007) pour une revue détaillée), étant entendu que les plus
grandes unités microsyntaxiques (rection verbale) ne correspondent pas néces-
sairement aux unités minimales de discours (Hannay & Kroon 2005). En d’autres
termes, on admet qu’il n’existe pas de frontière nette entre les niveaux linguis-
tique et discursif (Roulet 2002). C’est à cette frontière syntactico-discursive que
nous situons le rôle fonctionnel de nos unités discursives de base. Les hypothèses
théoriques qui guident nos travaux sont les suivantes :
– La segmentation du discours en BDU correspond aux étapes de production
et de traitement du discours (fonction cognitive) (van Dijk 1997 ; Berrendon-
ner 2002).
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


– Ni la complétude syntaxique (Roulet 1991), ni la complétude prosodique
(Chafe 1994) ne sont une condition suffisante pour délimiter une BDU (Hal-
ford 1996 ; Selting 2000).
– Il existe différents types de BDU selon la manière dont les frontières syn-
taxiques et les frontières intonatives se correspondent (ou non).
– Les types de BDU se distribuent différemment selon les genres de discours.
– Les différents types de BDU correspondent à des stratégies discursives.
Notre méthode d’identification des BDU a été éprouvée sur un corpus com-
posé de quatre genres de discours (Degand & Simon 2009b). Dans la suite de cet
article, nous l’appliquons au corpus Anita Musso 2 en présentant la segmenta-
tion syntaxique (2.1) d’abord, et prosodique (2.2) ensuite. Nous nous attardons
aussi sur le traitement des hésitations et le rôle que celles-ci peuvent jouer dans
cette segmentation (2.3). La section 3 fait le relevé des différents types de BDU

2. Issu du Corpus du français parlé parisien des années 2000 (CFPP2000), cet extrait d’interview sociolin-
guistique a été proposé par Florence Lefeuvre et Estelle Moline dans le cadre de la journée d’études « Unités
syntaxiques et unités prosodiques » (19 mars 2010, Paris). Les différents contributeurs à cette journée y ont
appliqué leurs propositions d’analyse. L’extrait analysé peut être consulté sur le site du Corpus de Français Parlé
Parisien (CFPP2000, [11-01], Anita Musso, http://cfpp2000.univ-paris3.fr/index.html). Pour une présentation
du corpus, cf. Branca et al. (2009).

46
Analyse en unités discursives de base : pourquoi et comment ?

rencontrés dans le corpus d’étude, suivi d’une analyse comparée du corpus


Anita Musso avec un corpus multi-genres (4). Enfin, nous donnerons une série
de remarques conclusives.

2. IDENTIFICATION DES UNITÉS DISCURSIVES DE BASE DANS LE


CORPUS ANITA MUSSO

2.1. Analyse syntaxique


Pour l’annotation syntaxique de nos données, nous nous inscrivons dans le
cadre d’une grammaire de dépendance développée depuis les années 70 par le
groupe aixois de recherche en syntaxe (GARS) autour de C. Blanche-Benveniste
(Blanche-Benveniste et al. 1990). Il s’agit pour nous de segmenter le flux oral en
séquences plus petites, que nous appelons unités de rection (UR). Celles-ci sont
elles-mêmes segmentées en séquences fonctionnelles, selon un découpage décrit
par M. Bilger et E. Campione (2002). Les critères de découpage que nous avons
développés sont reproductibles et doivent pouvoir s’appliquer à n’importe quel
corpus de français parlé.
La segmentation syntaxique que nous effectuons est largement détaillée dans
L. Degand et A. C. Simon (2009a) et L. Degand et al. (2010). Elle se fait de manière
totalement manuelle. Nous présentons ici brièvement le découpage en unités de
rection, qui seul intervient dans notre définition de l’unité discursive de base.
Selon leur composition interne, nous dégageons cinq types d’unités de rec-
tion 3 : les unités de rection complètes (URC), les unités de rection inachevées
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


(URI), les unités de rection elliptiques (URE), les unités de rection averbales
(URA) et les unités de rection « plus » (URC+). Dans les conventions de trans-
cription, les unités de rection sont notées entre crochets droits [ ] ; les adjoints
(éléments se rapportant à une construction verbale mais non régis par celle-ci,
parfois dénommé « associés »), marqueurs de discours, connecteurs et hésita-
tions sont représentés entre crochets angulaires < >. Les unités de rection sont
de taille très variable : cela peut aller d’un seul mot (le cas des impératifs par
exemple) à plusieurs dizaines de mots. La longueur ne détermine pas l’apparte-
nance d’une unité de rection à l’un ou l’autre type.
Une unité de rection complète est une unité qui apparaît comme achevée,
syntaxiquement et sémantiquement : les compléments obligatoires sont présents,
les séquences entamées sont complètes (exemples 1, 3 et 4, infra).
(1) [je reviens sur cette <euh> ce problème qui est un problème <euh> voilà de
d’être chez moi]URC
(2) [sur ce domaine oui]URA

3. Sauf mention explicite, tous les exemples que nous citons proviennent du corpus Anita Musso.

LANGUE FRANÇAISE 170 47


Unités syntaxiques et unités prosodiques

(3) <à mon avis> [c’est pas très malin]URC [faudrait je]URI [c’est une habitude
<en tous cas> que j’aimerais changer]URC+

Le corpus Anita Musso comprend 43 unités de rection complètes (voir


Annexe 4 ). Une variante est l’unité de rection complète « plus » qui contient
des éléments qui ne sont pas dans la rection du verbe, mais qui sont associés à
celle-ci : des marqueurs du discours, éléments associés ou insertions (voir l’élé-
ment entre crochets angulaires dans l’exemple 3). Nous en comptabilisons trois
dans le corpus. Une unité de rection est inachevée soit parce qu’une des places
obligatoires de la valence n’est pas instanciée, soit parce que l’un des syntagmes
de l’UR (qu’il soit obligatoire ou non) est inachevé. Dans l’exemple 3, il s’agit
d’un cas de valence non instanciée. Nous avons relevé sept unités de rection
inachevées et nous reviendrons toutefois sur cette notion dans le paragraphe 2.3.
À la différence d’une URC, le noyau d’une unité de rection averbale n’est pas
un verbe, mais un nom, un pronom, un adjectif, un adverbe ou encore une
interjection. Il y en a onze dans le corpus étudié. En ce qui concerne les unités
de rection elliptiques, nous les définissions strictement comme des unités de
rection dans lesquelles une séquence fonctionnelle 5 est omise, sans pour autant
que l’UR en question forme une unité inachevée. La notion même d’unité de
rection elliptique appelle quelques commentaires. Le cas d’ellipse le plus cou-
rant est l’ellipse du sujet (ou « séquence sujet » dans notre annotation). Nous
ne comptons pas comme URE les énoncés dont le sujet (référentiellement vide)
dans certaines locutions impersonnelles n’est pas exprimé, tels que Fallait pas
venir ou Pas question d’arriver en retard 6 . Nous ne comptabilisons pas non plus
comme URE les ellipses dites « discursives » « qui font l’économie d’éléments
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


et de structures déjà exprimées dans le contexte immédiatement antérieur. Par
exemple, dans les séquences question partielle-réponse » (Riegel, Pellat & Rioul,
2004 : 133), tels que – Où est Marie ? – Dans son bureau. Seules seront donc comp-
tées comme URE (par omission de la séquence sujet), les unités de rection dont
le sujet est coréférentiel au sujet d’un verbe qui lui est relié syntaxiquement dans
« des assemblages qui mettent en facteur commun initial les sujets coréférentiels
d’une suite de phrases juxtaposées ou coordonnées » (Riegel et al., 2004 : 133).
Nous n’en relevons aucun cas dans le corpus Anita Musso. L’omission d’autres
types de séquence peut également donner lieu à une URE, comme par exemple
l’ellipse de la séquence verbe (Jean aimait les poires, Marie les bananes) ou d’une
séquence régie (Demain il va neiger et les routes seront verglacées). Par contre, dans
le cas de coordination de séquences verbales, nous estimons que la coordination

4. Nous n’avons analysé que les énoncés produits par l’interviewée.


5. Nous empruntons à Bilger & Campione (2002) la notion de séquence fonctionnelle, à savoir « les consti-
tuants fonctionnels rencontrés dans les textes sans entrer dans le détail de leur composition » (Bilger &
Campione, 2002 : 118). Nous en distinguons six types : séquence sujet, séquence objet, séquence verbe,
séquence régie, séquence associée et séquence incise.
6. À vrai dire, il n’y a pas de séquence sujet dans ce cas puisque seuls les sujets lexicalisés peuvent constituer
une séquence sujet, les sujets (et objets) pronominaux étant intégrés dans la séquence verbe.

48
Analyse en unités discursives de base : pourquoi et comment ?

est interne à l’unité de rection complète, et qu’il n’y a donc pas URE 7 . C’est, par
exemple, le cas dans (4) :
(4) [il faudrait que j’aille à ma banque et que je m’en occupe]URC <quand même>

En fin de compte, nous ne relevons donc aucun cas d’URE dans le corpus Anita
Musso.

2.2. Analyse prosodique


L’annotation prosodique se fait de manière semi-automatisée grâce au logiciel
Prosogram (Mertens 2004) et à une série de scripts qui permettent de détecter
les syllabes proéminentes selon leur durée relative, leur hauteur mélodique
(montée dynamique dans une syllabe ou hauteur relative) ou la durée de la
pause subséquente. L’hypothèse est que certaines proéminences, selon leurs para-
mètres acoustiques et leur localisation dans la chaîne parlée, sont porteuses de
frontières de différents degrés (Mertens 1993 ; Lacheret-Dujour & Victorri 2002 ;
Simon 2004 ; Lacheret et al. ce numéro). Sur cette base, et selon une série de
règles détaillées ci-dessous, on découpe les suites de syllabes en unités intona-
tives de différents degrés : unités majeures ‘///’ (UIM), intermédiaires ‘//’ et
mineures ‘/’ (voir Simon & Mertens 2009).
Toute syllabe proéminente en position finale de mot lexical (plein) est poten-
tiellement une frontière d’UIM si elle répond à une des contraintes suivantes :
– elle est suivie par une pause silencieuse d’une durée minimale de 200ms ;
– elle est allongée (trois fois plus longue que la durée moyenne des syllabes qui
précèdent) ;
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


– elle porte un contour mélodique montant particulièrement saillant (montée
ou hauteur relative entre 5 et 10 demi-tons).
La Figure 1 illustre le résultat de l’annotation automatique en trois degrés de
frontières. Seules les frontières majeures (///) sont retenues pour l’analyse en
unités discursives de base.
L’annotation automatique, outre l’attribution d’un degré de frontière (///,
// ou /), indique quels paramètres sont responsables de la perception de la
frontière 8 . Cette annotation automatique est ensuite comparée à l’annotation
manuelle et validée par un expert. Les divergences entre annotation automa-
tique et identification auditive des frontières concernent principalement les cas
suivants :

7. Dans le guide d’annotation du projet Rhapsodie (http://rhapsodie.ilpga.fr/wiki/Accueil), on parle « d’entas-


sement ».
8. Par exemple, « P » correspond à une frontière due à une pause silencieuse ; « 2 » ou « L » (lengthening)
correspondent à des frontières dues à des allongements syllabiques ; « R » (rise) ou « T » (top) indiquent une
frontière due à une montée mélodique ou à une hauteur mélodique relative supérieure à 5 demi-tons, etc.

LANGUE FRANÇAISE 170 49


Unités syntaxiques et unités prosodiques

11 12 13 14
asyll, G=0.32/T2, DG=20, dmin=0.035

90
150 Hz

80
mwa Z@m ko~ di sjOn da~mo~ na paR t@ ma~a~mdi za~ _ Zi vE apje
70
moi je me conditionne dans
mon appartement en
me disant _ j y vais àpied
60 / 2// L/ P///
Prosogram v2.7
musso-anita

15 16 17
asyll, G=0.32/T2, DG=20, dmin=0.035

90
150 Hz ⊗
80
pje mwa ma vwa ty RE le ga Re da~ la Ry Ze 9~s ta sjOn ma~Re zi da~ _
70
pied moi ma voiture elleest garée dans la rue j aiun stationnement résident _
60 RT/// L/ RT// P///
Prosogram v2.7
musso-anita

Figure 1 : Prosogramme d’un extrait du corpus Anita Musso (secondes 10 à 17)


avec l’annotation en frontières prosodique majeures (///),
intermédiaires (//) et mineures (/)

– certaines frontières dues à une pause silencieuse sont annulées dans la percep-
tion à cause de la présence d’une hésitation précédant la pause ;
– les contours descendants à valeur terminale sont très difficilement détectés
dans la procédure automatique, parce qu’ils ne sont pas toujours suivis d’une
pause et parce que la syllabe qui les porte est parfois très réduite phonétique-
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


ment (dévoisement, creaky voice 9 , etc.). Ces contours ont pourtant une valeur
de frontière perceptivement très saillante.
Dans ces cas de divergence entre détection automatique et annotation
manuelle, c’est l’annotation manuelle qui prime. Une analyse comparée des
résultats des deux types d’annotation est disponible dans A. C. Simon et P. Mer-
tens (2009).
Le corpus Anita Musso contient 38 unités intonatives majeures. Leur interac-
tion avec les frontières des unités de rection est détaillée à la section 3.

2.3. Traitement des interruptions


Notre typologie des unités syntaxiques contient une catégorie pour les « uni-
tés de rection inachevées » (URI). À partir de quel moment doit-on considé-
rer qu’une construction est interrompue ? Cette question est complexe car la
continuité du discours se construit simultanément aux différents niveaux syn-
taxique, prosodique et discursif. Nous allons l’examiner à partir des cas de figure

9. Dans la « voix craquée », la vibration des cordes vocales est irrégulière et a une fréquence très basse, ce qui
rend difficile l’analyse instrumentale de la fréquence fondamentale.

50
Analyse en unités discursives de base : pourquoi et comment ?

suivants : les interruptions avec reprise différée, les interruptions avec reprise
immédiate et les interruptions simples.
Les interruptions avec reprise différée. Au niveau syntaxique, on pourrait
considérer, dans l’exemple (5), que la construction rectionnelle « je crois que je
suis » est interrompue par la locutrice au profit d’une nouvelle unité de rection
« comme j’ai jamais fait quasi de vélo ».
(5) <mais> [(je crois) (que je suis)] [(comme) (j’ai jamais fait quasi de vélo) (de
ma vie//) <euh> (en tant que vraie parisienne et/// en étant très peu partie
à la campagne//) (je suis pas pas très à l’aise//)] <mais///>

Une disposition « en grille » (inspirée de C. Blanche-Benveniste et al. (1990),


voir Figure 2) de ce même extrait permet de montrer que la construction inter-
rompue est ensuite réutilisée (recyclée) et poursuivie par la locutrice sous la
forme « je suis pas très à l’aise ».

Figure 2 : Analyse en grille de l’exemple (5)


© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


Plusieurs auteurs (Auer 2003 ; Simon 2004 ; Apothéloz non publié 10 ) ont
analysé ce type d’éléments amorcés en montrant que les locuteurs les prennent
en compte dans leur interprétation du discours et ne les traitent pas comme
« effacés » parce qu’inachevés 11 . Dans notre exemple, on considère que l’amorce
« je crois que je suis » trouve son achèvement dans la construction « je suis pas
très à l’aise ». Si cette suite est réalisée plus tardivement dans le discours, c’est
parce que la locutrice a eu besoin de faire précéder son assertion d’arguments la
justifiant (Simon, 2004 : 235 sv. ; Berrendonner 1993 ; Roulet 2002).
Quel traitement syntaxique donner à ces constructions provisoirement inter-
rompues et réutilisées dans la suite du tour de parole ? La technique d’annotation
que nous utilisons est linéaire : on délimite des séquences successives qui se
combinent en unités de rection (voir 2.1). L’outil utilisé (une tire d’annotation
dans un TextGrid 12 ) rend difficile l’association de segments discontinus, sans

10. Cet auteur utilise la notion de « reformulation réparatrice ».


11. C’est le contraire de ce que préconisent Roulet et al. (2001) qui ne font pas apparaître les actes interrompus
dans la structure hiérarchique finale d’un discours.
12. Annotation textuelle multi-couche d’un fichier son, générée sous le logiciel Praat (www.praat.org).

LANGUE FRANÇAISE 170 51


Unités syntaxiques et unités prosodiques

parler de leur identification (semi-)automatique qui se révélerait complexe 13 .


Dans l’état présent de notre travail, nous considérons « je crois que je suis »
comme une unité de rection interrompue. Cependant, au niveau discursif, c’est-
à-dire au niveau où on postule que se réalise l’interprétation du discours, les
deux segments syntaxiques (interrompu et réutilisé) se trouvent dans la même
unité discursive de base et sont donc traités conjointement. L’intégration des
segments amorcés et repris, et donc la réalisation d’une forme de continuité, sont
atteintes au niveau prosodique, puisqu’aucune frontière prosodique majeure
n’intervient dans l’exemple (5).
À côté de ces interruptions avec reprise différée, les interruptions avec
reprise immédiate offrent un traitement plus simple dans le schéma d’anno-
tation linéaire qui est le nôtre. Dans ces cas, on considère que l’hésitation, sous la
forme d’une répétition partielle ou totale d’un ou plusieurs segments, se produit
à l’intérieur d’une unité de rection.
(6) <euh> [(il faut me mettre) (des li)] [(il faut) (quand même) (me mettre) (des
limites///) (pour// m’empêcher// de prendre la voiture//)]
(7) [(il y a) (quand même)] [(il y a il y a) (des sous) (sur le compte//)]
(8) [(elles marchent//)] [(elles)] <non> <non> [(elles ont tendance à)] <hum>
<non> <non> [(elles adorent marcher///)]

Les interruptions simples peuvent se confondre avec l’une ou l’autre des


deux catégories précédentes, selon la « reconstruction » que l’analyste peut faire
des segments observables.
(9) [(faudrait je)] [(c’est une habitude) (en tous cas) (que j’aimerais chan-
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


ger///)]

Dans cet exemple, le pronom « je » est présent dans le segment interrompu et


dans le second segment. On pourrait reconstruire le premier segment comme
projetant une construction du type « faudrait que je change cette habitude » et
donc considérer que la suite réutilise le segment interrompu (interruption avec
reprise différée). Dans l’exemple (10), la répétition du segment « il y avait » sous
la forme « il y a » nous incite à l’analyser comme une interruption avec reprise
immédiate.
(10) [(il y avait des pf)] <oui//> [(il y a) (un côté// de facilité// de passer devant
sa voiture//)]

En conclusion, ces trois catégories ne sont pas étanches et l’analyste intervient


pour trancher. Dans notre annotation syntaxique, les interruptions avec reprise
différée et les interruptions simples sont annotées comme des unités de rection
inachevées. Les interruptions avec reprise immédiate sont intégrées à l’unité de
rection (complète) dans laquelle elles se produisent.

13. En effet, quel nombre maximal d’éléments autoriser entre les parties d’une construction partiellement
répétée ?

52
Analyse en unités discursives de base : pourquoi et comment ?

Enfin, on doit ajouter que le découpage et l’analyse syntaxiques n’épuisent


pas le traitement des interruptions : notre méthode tient également compte du
groupement intonatif des segments. Si un segment interrompu syntaxiquement
est intégré intonativement à ce qui suit, il sera interprétativement traité avec
cette suite, faisant partie de la même BDU.

3. TYPES D’UNITÉS DISCURSIVES DE BASE


Au niveau méthodologique, nous avons choisi de séparer strictement les volets
syntaxique et prosodique pour l’annotation des données. Les unités discursives
de base résultent de la mise en correspondance des deux types de segmenta-
tion et se répartissent en quatre types selon la (non)-congruence entre unités
syntaxiques et prosodiques. Les BDU sont dites congruentes, ou non marquées,
lorsqu’une unité de rection correspond à une unité prosodique majeure (11) ;
les BDU groupées par la syntaxe correspondent à une unité de rection découpée
en plusieurs unités prosodiques majeures (12), tandis que les BDU groupées par
l’intonation correspondent à plusieurs unités de rection regroupées dans une
unité prosodique (13). Un cas particulier, les BDU régulatives, concerne les uni-
tés contenant un élément syntaxiquement non régi (par ex. adverbe de phrase,
connecteur, marqueur de discours) et isolé par une frontière prosodique (14).
Enfin, une catégorie regroupe les restes de l’analyse, c’est-à-dire les BDU ne
correspondant à aucun des types précités parce que plusieurs unités de rection
et unités prosodiques se chevauchent sans que leurs frontières coïncident (15).
(11) BDU-C : [(combien de fois) (ça m’est arrivé///)]
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


(12) BDU-S : [(je suis pour///) (en rentrant// dans un processus que je n’aime
pas trop vis-à-vis de moi///)]
(13) BDU-I : [(moi)] [(ma voiture)] [(elle est garée) (dans la rue//)] [(j’ai) (un
stationnement résident///)]
(14) BDU-A : <c’est-à-dire que///>
(15) BDU-X : [(sur le coup///) (je me dis//)] [(je vais mettre) (cinq minutes///)]

Nous avons démontré ailleurs (Degand & Simon 2009b) que les types de
BDU correspondent à des stratégies discursives dont la distribution varie en
fonction du genre discursif en présence. Ces stratégies se résument comme suit :
– BDU-C : présentation de l’information d’une manière directe et relativement
neutre ;
– BDU-I : création d’une macro-unité informationnelle ;
– BDU-S : style emphatique, style didactique ou résultant de la planification
discursive ;
– BDU-A : régulation (interactionnelle ou métadiscursive).
Dans la section suivante, nous analysons la structure interne des BDU dans
le corpus Anita Musso et leur distribution entre les différents types. Ces données
sont ensuite comparées à celles issues de l’analyse d’un corpus multi-genres.

LANGUE FRANÇAISE 170 53


Unités syntaxiques et unités prosodiques

4. ANALYSE ET DISTRIBUTION DES BDU DANS LE CORPUS ANITA


MUSSO
La structure interne et la distribution des différents types de BDU au sein d’un
discours peuvent servir de base à la comparaison de différents genres discursifs
(Degand & Simon 2009b). Par structure interne, nous entendons le nombre de
tokens par BDU, par unité de rection et par séquence, ainsi que le nombre d’unités
de rection par BDU. Ensemble, ces moyennes sont indicatives de la complexité
interne des BDU et donc de la charge cognitive qu’elles impliquent dans le
processus de production du discours (et/ou d’interprétation si on adopte le
point de vue de l’auditeur).
Le nombre moyen de tokens par BDU dans le corpus Anita Musso est de
15,9 ; le nombre de tokens par unité de rection est de 6,2 ; le nombre de tokens
par séquence est de 3,3 ; et le nombre d’unités de rection par BDU est de
2,3. Le Tableau 1 permet de contraster ces données à celles observées pour
les quatre genres discursifs analysés par L. Degand et A. C. Simon (2009b) :
l’allocution politique, le journal parlé radiophonique, la conférence scientifique
et la narration conversationnelle. Cette comparaison établit la proximité étroite
entre le corpus Anita Musso et la narration conversationnelle (rappelons que
nous avons analysé uniquement les séquences de l’interviewée) : unités de
rection et séquences assez courtes et nombre moyen d’unités de rection par BDU
plus important, typiques de la production de parole spontanée non préparée.

Tableau 1 : Description quantifiée des unités de discours (BDU : unité


discursive de base ; UR : unité de rection)
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


Note : La déviation standard est donnée en italiques
Genre politique journal radio conférence conversation Musso
# tokens/ 16,9 20,5 26,7 16,2 15,9
BDU (11,1) (12,3) (17,8) (11,1) (11,5)
15,6 16,7 15,1 6,2 6,2
# tokens/ UR
(11,1) (11,3) (13,7) (6,3) (5,3)
6 5,6 6,9 3,6 3,3
# tokens/ séquence
(7,1) (6) (9,3) (3,2) (2,58)
# UR/BDU 1,1 1,2 1,7 2,4 2,3

Si l’on se réfère maintenant à la distribution des différents types de BDU


dans le corpus Anita Musso, le constat se confirme que cet échantillon est (sta-
tistiquement) similaire à la narration conversationnelle, se caractérisant par une
prépondérance de BDU congruentes et de BDU liées par l’intonation. C’est la
fréquence de ce dernier type de BDU et la quasi absence de BDU liées par la syn-
taxe, qui distinguent le discours conversationnel des autres genres (Figure 2) :
les locuteurs mettent en œuvre une règle de production particulière qui consiste
à délivrer leur message en unités discursives présentant plusieurs unités syn-
taxiques comme une et une seule unité informative, que l’on pourrait considérer
comme une macro-unité informative. Dans L. Degand et A. C. Simon (2009b),
nous avons argumenté qu’il peut s’agir d’une stratégie discursive permettant
d’établir une cohérence interne sans la marquer explicitement : en d’autres mots,

54
Analyse en unités discursives de base : pourquoi et comment ?

“by using intonation for grouping unrelated syntactic clauses the speaker can
signal in an alternative way that a coherence relation should be established
between the clauses” (op. cit. : 97). Il nous reste à démontrer que ces relations
de cohérence internes aux BDU sont d’une nature différente des relations de
discours observables entre BDU.

Distribution des types de BDU

100%
90%
80%
70% BDU a
60% BDU x
50% BDU i
40% BDU s
30% BDU c
20%
10%
0%
politique journal radio conférence conversation Musso

Figure 3 : Distribution des types de BDU dans le corpus Anita Musso et


comparaison avec un corpus multi-genre (Degand & Simon 2009b)
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


Les données reprises à la Figure 3 montrent bien qu’il y a deux situations
de parole, l’une que l’on pourrait caractériser de non préparée (conversation et
corpus Anita Musso) et l’autre de préparée (politique, journal radiophonique
et conférence scientifique). Les BDU groupées par la syntaxe, et donc « sur-
segmentées » intonativement, sont typiques de genres où le locuteur délivre
un message préparé, qu’il le lise (discours politique, radio) ou non (conférence
scientifique).

5. CONCLUSION
Partant du corpus Anita Musso, commun à l’ensemble des contributions de ce
numéro, nous avons montré qu’une segmentation en unités discursives, basée
sur des indices observables, permet de valider objectivement l’apparentement
de ce corpus particulier au genre « narration conversationnelle ». L’illustration a
été faite que la méthodologie est réplicable et (assez) stable, même si la réflexion
théorique et méthodologique se poursuit. En effet, le cas des hésitations et leur
impact sur l’identification d’unités de rection tantôt inachevées, tantôt complètes
montre, si besoin en était, que le rôle de l’analyste dans le processus interprétatif
reste crucial.

LANGUE FRANÇAISE 170 55


Unités syntaxiques et unités prosodiques

Nous postulons que, au-delà de leur fonction d’indice d’un genre discursif
particulier mettant en œuvre des stratégies discursives propres, les BDU pos-
sèdent une double face au niveau de la structure discursive : d’une part, les BDU
résultent du processus de production de parole dépendant de la situation com-
municative spécifique (mise en œuvre de stratégies discursives particulières),
d’autre part, elles servent d’input au processus interprétatif. En ce sens, pour
reprendre les termes de G. J. Steen (2005), les BDU sont les manifestations dis-
cursives d’actes individuels : “They are typically verbal acts by people who are
coordinating their behaviour with other people while they are engaged in a more
or less conventionalized genre of communication” (Steen, 2005 : 306). Selon cet
auteur (op. cit. : 308), la réalisation de BDU joue un rôle dans le traitement du
discours au niveau de la gestion des intentions communicatives (illocutions), de
la conceptualisation (propositions) et de la production matérielle du discours
(en créant des foyers successifs d’attention, voir Chafe 1994). À ces différents
niveaux, des phases de « clôture » sont importantes pour le traitement du dis-
cours en cours et la gestion interactive des prises de parole (Selting 2000). La
question de la validité cognitive des BDU en tant qu’unité interprétative mini-
male fait l’objet de recherches en cours.

Références bibliographiques

APOTHÉLOZ D. (non publié), « La parole comme brouillon continu : les reformulations réparatrices »,
Manuscrit non publié.
ASHER N. & LASCARIDES A. (2003), Logics of Conversation, Cambridge: Cambridge University
Press.
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


AUER P. (2003), “Delayed self-repairs as a structuring device for complex turns in conversation”,
in A. Hakulinen & M. Selting (eds), Syntax and Lexis in Conversation, Amsterdam: Benjamins,
75-102.
AVANZI M. (2007), « Regards croisés sur la notion de macro-syntaxe », Tranel 47, 39-58.
BERRENDONNER A. (1993), « Périodes », in H. Parret (éd), Temps et discours, Louvain-la-Neuve :
Presses Universitaires de Louvain, 47-61.
BERRENDONNER A. (2002), « Les deux syntaxes », Verbum XXIV (1/2), 23-36.
BERRENDONNER A. (2011), « Unités syntaxiques & unités prosodiques”, Langue française 170,
Paris : Armand Colin (ce numéro).
BILGER M. & CAMPIONE E. (2002), « Propositions pour un étiquetage en ‘séquences fonctionnel-
les’ », Recherches sur le français parlé 17, 117-136.
BLANCHE-BENVENISTE C., BILGER M., ROUGET C., VAN DEN EYNDE K. & MERTENS P. (1990), Le français
parlé : études grammaticales, Paris : Éditions du CNRS.
BRANCA S., FLEURY S., LEFEUVRE F. & PIRES M. (2009), Constitution et exploitation d’un corpus de
français parlé parisien. [http://cfpp2000.univ-paris3.fr/Presentation.html]
CHAFE W. L. (1994), Discourse, consciousness, and time, Chicago: University of Chicago Press.
DEGAND L. & SIMON A. C. (2005), “Minimal Discourse Units: Can we define them, and why should
we?”, in M. Aurnague, M. Bras, A. Le Draoulec & L. Vieu (eds), Proceedings of SEM-05.
Connectors, discourse framing and discourse structure: from corpus-based and experimental
analyses to discourse theories, Biarritz, 65-74.

56
Analyse en unités discursives de base : pourquoi et comment ?

DEGAND L. & SIMON A. C. (2008), “Minimal Discourse Units in Spoken French: Unco-
vering Genre-bound Segmentation Strategies”, in W. Ramm & C. Fabricius-Hansen
(eds), Linearisation and Segmentation in Discourse, Oslo: University of Oslo, 31-42.
[http://www.hf.uio.no/ilos/forskning/konferanser/mad08/proceedings.html]
DEGAND L. & SIMON A. C. (2009a), “Minimal discourse units in spoken French: On
the role of syntactic and prosodic units in discourse segmentation”, Discours 4
[http://discours.revues.org/index.html]
DEGAND L. & SIMON A. C. (2009b), “Mapping prosody and syntax as discourse strategies: How
Basic Discourse Units vary across genres”, in A. Wichmann, D. Barth-Weingarten & N. Dehé
(eds), Where prosody meets pragmatics: research at the interface, Bingley: Emerald, 79-105.
DEGAND L., DISTER A. & SIMON A. C. (2010), Guide de codage pour le projet MDU. Partie
syntaxique : découpage en unités de rection et en séquences fonctionnelles, Document
non publié (21 p.). [www.uclouvain.be/valibel]
HALFORD B. K. (1996), Talk Units: The Structure of Spoken Canadian English, Tübingen: Narr.
HANNAY M. & KROON C. (2005), “Acts and the relationship between discourse and grammar”,
Functions of Language 12, 87-124.
LACHERET-DUJOUR A. & VICTORRI B. (2002), « La période intonative comme unité d’analyse pour
l’étude du français parlé : modélisation prosodique et enjeux linguistiques », Verbum XXIV
(1/2), 55-72.
LACHERET-DUJOUR A., KAHANE S., PIETRANDREA P., AVANZI M. & VICTORRI B. (2011), « Oui mais elle
est où la coupure, là ? Quand syntaxe et prosodie s’entraident ou se complètent », Langue
française 170, Paris : Armand Colin (ce numéro).
MERTENS P. (1993), « Accentuation, intonation et morphosyntaxe », Travaux de linguistique 26,
21-69.
MERTENS P. (2004), « Un outil pour la transcription de la prosodie dans les corpus oraux »,
Traitement Automatique des langues 45 (2), 109-130.
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


REBOUL A. & MOESCHLER J. (1998), La pragmatique aujourd’hui. Une nouvelle science de la
communication, Paris : Éditions du Seuil.
RIEGEL M., PELLAT J.-C. & RIOUL R. (2004), Grammaire méthodique du français, Paris : Presses
Universitaires de France (3e éd.).
ROULET E. (1991), « À propos des niveaux de l’analyse linguistique », in R. Liver, I. Werlen &
P. Wunderli (éds), Sprachtheorie und Theorie der Sprachwissenschaft, Tübingen : Gunter
Narr Verlag, 221-230.
ROULET E. (2002), « Le problème de la définition des unités à la frontière entre le syntaxique et
le textuel », Verbum XXIV (1/2), 161-178.
ROULET E., FILLIETTAZ L., GROBET A. & BURGER M. (2001), Un modèle et un instrument d’analyse
de l’organisation du discours, Bern : Peter Lang.
SELTING M. (2000), “The construction of units in conversational talk”, Language in Society 29,
477-517.
SIMON A. C. (2004), La structuration prosodique du discours en français, Bern : Peter Lang.
SIMON A. C. & MERTENS P. (2009), “Automatic detection of prosodic boundaries in spoken French.
A step towards the identification of basic discourse units”, Unpublished Ms (16 p.).
STEEN G. J. (2005), “Basic discourse acts: Towards a psychological theory of discourse
segmentation”, in F. R. de Mendoza Ibáñez & M. S. Peña Cervel (eds), Cognitive linguistics:
Internal dynamics and interdisciplinary interaction, Berlin: Mouton de Gruyter, 283-312.
VAN DIJK T. (1997), “Cognitive context models and discourse”, in M. Stamenow (ed.), Language
Structure, Discourse and the Access to Consciousness, Amsterdam: Benjamins, 189-226.

LANGUE FRANÇAISE 170 57


Unités syntaxiques et unités prosodiques

Annexe : analyse du corpus Anita Musso en unités discursives de base


Chaque ligne du tableau correspond à une BDU (unité discursive de base) :
– Unités de rection [ ]: URC (complètes ; éventuellement avec insert, adjoint,
etc.), URA (averbales), URI (inachevées), URE (elliptiques).
– Séquences ( ) : séquence sujet, séquence verbe, séquence objet (valentiel),
séquence régie, insert.
– Autres < > : adjoints/associés, marqueurs de discours et connecteurs, hésita-
tions.
Analyse Transcription étiquetée
bdu-i 1 [(oui)] [(je reviens) (sur cette euh ce problème// qui est un problème//) <euh> (voilà//)
(ura+urc+) (de d’être chez moi///)]
bdu-c 2
[(combien de fois) (ça m’est arrivé///)]
(urc)
bdu-i 3
<bon> <bon> <ben là> [(tu vas) (boulevard Voltaire//)] [(c’est pas loin//)] [(c’est pas
(md+euh+urc+
loin//)] [(euh tu tu j’y vais à pied//)] [(je suis) (chez moi)] [(je me conditionne//) (dans
urc+euh+ urc+
mon appartement) (en me disant///)]
urc+urc)
bdu-c 4
[(j’y vais à pied///)]
(urc)
bdu-i 5 <moi> <ma voiture> [(elle est garée) (dans la rue//)] [(j’ai) (un stationnement
(a+a+urc+urc) résident///)]
bdu-c 6
[(je passe) (devant///)]
(urc)
[(je ne peux pas m’empêcher d’ouvrir//) <euh> (la porte)] <et> [(de monter dedans)]
bdu-c 7
<et> <et> [(d’aller//) <euh> (à) <euh> <voilà//> (cinq minutes en voiture// ce qui me
(urc+)
mettrait peut-être) (un petit quart d’heure à pied///)]
bdu-c 8
<donc> [(au dernier moment//) (je prends) (ma voiture///)]
(md+urc)
interloc
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


bud-x 9
[(sur le coup///) (je me dis//)] [(je vais mettre) (cinq minutes///)]
(urc+urc)
bdu-c 10 <mais//> <le temps de me garer de tourner de faire des ronds// pour pas mal me garer
(md+a+urc) et tout//> [(je sais) (que je suis perdante///)]
bdu-c 11
[(je le sais//)] <que je suis perdante///>
(urc+a)
interloc
bdu-i 12
(uri+md+urc+
[(il y avait des pf)] <oui//> [(il y a) (un côté// de facilité// de passer devant sa voiture//)]
md+md+euh+
<et> [(de se dire//)] <bon> <ben> [(je la prends//)] <et> <euh> <et> <euh> <et> <voilà>
urc+md+euh+
<quoi///>
md+euh+md+
md+md)
bdu-i 13 <à mon avis> [(c’est pas très malin//)] [(faudrait je)] [(c’est une habitude) (en tous cas)
(a+urc+uri+urc) (que j’aimerais changer///)]
interloc
bdu-c 14
<ah> <ben> [(je je suis pour///)]
(euh+urc)
interloc

bdu-s 15 [(je suis pour///) (en rentrant// dans un processus que je


(urc) 1 n’aime pas trop vis-à-vis de moi///)]

58
Analyse en unités discursives de base : pourquoi et comment ?

bdu-a 16
<c’est-à-dire que///>
(md)
<euh> [(il faut me mettre) (des li) (il faut) (quand même) (me mettre) (des limites///)
bdu-x 17
(pour// m’empêcher// de prendre la voiture//)] <alors que> [(ça devrait venir) (de
(urc+md+urc)
moi///)]
interloc
bdu-c 18
[(sur ce domaine) (oui///)]
(ura)
bdu-c 19
<parce que> [(je pense//) (que je suis très malade///)]
(md+urc)
bdu-i 20 [(c’est)] [(j’aurais) <bon> (j’aurais pas) (toujours) <euh> (cette) <euh> (pensée) (sur
(uri+urc) d’autres domaines//)] <euh> <mais///>
bdu-c 21
[(sur celle-là//) (oui///)]
(ura)
bdu-c 22 <voilà//> <par contre> [(j’ai essayé) (le vélib) (deux trois fois//) (en mettant ma carte
(md+md+urc) bleue///)]
bdu-i 23
<et> [(c’est) (un mystère) (pour moi)] <donc> [(il faudrait que j’aille) (à ma banque) <et>
(md+urc+md+
(que je m’en occupe//)] <quand même///>
urc+md+)
bdu-a 24 <euh> <puisque> <(ma caution) (quand on met sa carte bleue qu’on n’a pas de carte
(euh+md+a) d’abonné//) (ma caution)>
bdu-i 25
<euh> <mais> [(il y a écrit) (caution// cent cinquante euros//)] [(je valide//)] <et> [(elle
(euh+md+urc+
m’est refusée///)]
urc+md+urc)
bdu-c 26
<même si> <euh> [(il y a) (quand même) (il y a il y a) (des sous) (sur le compte//)] <donc>
(md+euh+urc++
<euh> <voilà///>
md+euh+md)
bdu-i 27
(md+uri+euh+ <donc> [(je n’ai pas eu droit//) (encore//)] <euh> [(j’ai pas réussi à accéder///)]
urc)
interloc
bdu-x 28 [(le vélo//) (si)] [(pour essayer une fois//) (non)] <mais> [(je crois) (que je suis)] [(comme)
© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)

© Armand Colin | Téléchargé le 08/01/2024 sur www.cairn.info (IP: 41.141.86.145)


(ura+ure+md+ (j’ai jamais fait quasi de vélo) (de ma vie//) <euh> (en tant que vraie parisienne et/// en
uri+urc+md) étant très peu partie à la campagne//) (je suis pas pas très à l’aise//)] <mais///>
bdu-c 29
[(pour faire) (les petites distances///)] <euh>
(uri+euh)
interloc
bdu-c 30
<alors)> [(dix-sept et demi// et quinze///)]
(md+ura)
interloc
bdu-c 31
<euh> [(non///)]
(euh+ura)
bdu-i 32 [(elles marchent//)] [(elles) <non> <non> (elles ont tendance à) <hum> <non> <non>
(urc+euh+urc+) (elles adorent marcher///)]
bdu-i 33
(md+euh+md+ <puisque> <hum> <voilà> [(je peux me dire)] <mais> [(je viens te chercher//)] [(tu finis)
urc+md+urc+ (tard//)] [(tu seras)] <voilà///>
urc+uri+md)
bdu-i 34
[(non non non//)] [(laisse-moi marcher//)] [(laisse-moi marcher)] <donc> <euh> [(non
(ura+urc+urc+
non///)]
md+euh+ura)
bdu-i 35 [(paraît) (qu’elles marchent)] [(elles prennent pas) (le métro//) (pour faire quatre cinq
(urc+urc+urc+ urc) stations)] [(elles prennent pas) (le métro//)] [(elles y vont) (à pied///)]

1. Ou urc+a, auquel cas la BDU-s est réanalysée en BDU-c suivie d’une BDU-a.

LANGUE FRANÇAISE 170 59

Vous aimerez peut-être aussi