Vous êtes sur la page 1sur 40

Analyse outillée des données

textuelles et genre de
discours
Dominique Dias

AGES
Machines /Maschinen
Nantes 2017
Introduction

• Rapport humain/machine :
 Accroissement de performance ou changement de paradigme?
• Rapport humain/science :
 Nouveaux observables ou cadre (trop) rigide?
- Plan -

• 1. Cadre théorique
• 2. La machine comme outil d’exploration
• 3. Le genre à l’épreuve de la machine
Discours

Humain Machine

1. Cadre théorique
De nouvelles méthodes pour des outils nouveaux
• Méthodologie pour la constitution de corpus
Langage et société (2011) « Méthodes d’analyse des discours »
Tranel (2011/n°55) « La linguistique de corpus – de l’analyse quantitative à
l’interprétation qualitative »
Langages (2012/n°187) « L’analyse de corpus face à l’hétérogénéité des données »
Rastier 2011
CORELA (2014) « Complémentarité des approches qualitatives et quantitatives
dans l’analyse des discours »
• Méthodologie pour l’exploitation de corpus
Poudat & Landragin 2017
Constat d’opposition qualitatif/quantitatif
Qualitatif Quantitatif

Point de vue du subjectif objectif


sujet
Possibilité de singulier universel
généralisation
Valeur de vérité transférabilité/crédibilité validité/neutralité
Raisons de cette opposition
• Dichotomie entre sciences naturelles et sciences humaines
• « Croyance basée sur le sens commun » (Del Ré & Nogarini Hilari 2014 : 3)
• La machine garante de scientificité ?
« L’inventaire systématique en machine et le calcul lexicométrique permettent
seuls de « refroidir » ce domaine brûlant du discours de pouvoir où l’on
s’interroge sur les mots pour le dire… ou le contredire. Relevons, comptons,
comparons ; nous interpréterons ultérieurement » (Tournier 1996 : 183).
Dépasser l’opposition?

3 possibilités
Alterner les démarches
Construire une méthode hybride
Cumuler les deux démarches (« triangulation des méthodes », Duchastel &
Laberge 2014)

Hypothèse =
Qualitatif vs quantitatif  textes vs données
2. La machine comme outil d’exploration
Les adjectifs évaluatifs dans les recensions
Les outils
Etude de cas n° 1 : les adjectifs évaluatifs dans les
recensions

• Contexte = étude de la subjectivité dans les recensions


• Problématique =
• A) Formulations routinières ? (cf. recensions scientifiques)
• B) Grille d’évaluation : quel horizon d’attente ?
• Méthode = Exploration du corpus sous forme de requêtes CQL (Corpus
Query Langage) avec TXM = démarche top-down
Liste des adjectifs les plus fréquents du corpus

[depos=“ADJA”]
Catégorie des adjectifs les plus fréquents
(au moins 40 occurrences)

Subjectifs
Objectifs Évaluatifs
Affectifs
Non axiologiques Axiologiques
deutsch neu gut
letzt- jung schön
ganz groß besser
eigen alt ernst
erst- klein modern
französisch lang
einzig kurz
nächst literarisch
schwarz deutlich
zufällig schwer
zweit schnell
tot frei
Occurrences du lemme « gut »

[delemma=“gut”]
ADJ + ROMAN/BUCH/WERK

[depos=“ADJA”] [delemma=“Roman|Buch|Werk”]
ADJ +
ROMAN/BUCH/WERK/ART/WEISE/SPRACHE

[depos="ADJA"] [delemma="Roman|Buch|Werk|Art|Weise|Sprache"]
ADJ évaluatifs associés à des substantifs récurrents (1)
Substantif Adjectifs subjectifs associés

Roman im besten und emphatischen Sinn aufklärerisch; klug; eindrucksvoll; großartig; poetisch; wunderbar turbulent; traurig;
konventionell; gelungen; beeindruckend; lebensklug; packend; vielschichtig; perfekt durchkonstruiert; traumschön;
ungewöhnlich ambitioniert; soziologische Forschung ersetzend; romanlos; sehr genau recherchiert; dickleibig;
ausgereiftest-; ungeheuer; durchschnittlich bürgerlich; erschütternd; richtig gut; schillernd; flott; neu; ungemein
unterhaltsam verspielt; still bohrend; wunderbar; meisterlich; stimmungsvoll und kunstreich; sympathisch; meditativ;
hoffnungslos; modern; zweifelnd skeptisch; apokalyptisch; irritierend; wenig inspirierend; im Grunde fesselnd;
ungewöhnlich; anmutig; hübsch; zauberhaft; bildkräftig; vergnüglich; ambitioniert; gelenkig; außergewöhnlich;
fabelhaft; geheimnisvoll; ziseliert; berührend; kämpferisch; bemerkenswert; skandalträchtig; erstaunlich lebensklug;
wunderbar lebensvoll; human; herrlich; eiskalt; liebenswert verschroben; intelligent; geglückt; charmant verspielt;
ergreifend; ungewöhnlich; lebensprall; schlecht; desillusionierend;
Buch von falschem Pathos durchdrungen; wunderbar; melancholisch; traurig; ganz außergewöhnlich; klug; spannend;
amüsant; sympathisch; lustig; kaltblutig; exzellent; grandios; verstörend; großartig; rätselhaft; witz- und listenreich;
ziemlich beunruhigend; sentimental; elegant; beunruhigend; überraschend vielschichtig; merkwürdig; subtil;
mitreißend; phantastisch;
Werk zwielichtig; wuchtig; ausgesprochen trist-; denkbar seltsamst-; odysseisch; wunderbar austariert; außergewöhnlich;
achtbar; herzreißend;
ADJ évaluatifs associés à des substantifs
récurrents (2)
Art entspannt; gewohnt zielgerichtet; tumb; pedantisch enthemmt; unsentimental; offen; schweigsam handfest; herkömmlich;
ruhig; kokett; angenehm pragmatisch; intelligent; affig; rechtwinklig; kantig;

Weise merkwürdig; interessant; abenteuerlich illegal; anrührend; wundersam; brillant; virtuos; unschön; grandios; kurios;
geheimnisvoll; einzigartig; klassisch; gespenstisch; unerträglich; klug; entsetzlich; dramatisch; schwebend; majestätisch;
undurchsichtig; sinnlich; zwerchfellerschütternd; verblüffend; außergewöhnlich; stupend; unkonventionell; plakativ;
verstörend; ambitioniert; sinister; raffiniert; unerklärbar; klassisch realistisch; existenzialistisch; unblutig; unheimlich;
schwindelerregend; drastisch; pervers; präzis; zauberhaft; entsetzlich; beeindruckend; unsentimental; albern; subtil;
traditionell; faszinierend; beschämend; universell;

Sprache mattgrau; unverwechselbar; neu; lakonisch präzis; ganz in der Gegenwartsform gehalten; gerühmt; erstaunlich artifiziell;
merkwürdig traumhaft; üppig; dicht; kraftvoll; schnörkellos; lapidar; behutsam; derb komisch; schlicht; sanft; vorwitzig;
geschmeidig; klangvoll; glitzernd; elementar; respektlos; schlank nüchtern; reduziert; verstümmelt; naiv; lakonisch; stets
stilsicher; karg; eruptiv; poetisch; kraftvoll;
4 groupes d’adjectifs

• Les adjectifs qui s’organisent sur un ensemble scalaire allant du négatif au positif
(perfekt durchkonstruiert; stets stilsicher; sehr genau recherchiert) ;
• Les adjectifs désignant une qualité ou un défaut (polarité : klug, interessant…) ;
• Les adjectifs relatifs à une réaction provoquée chez le destinataire (erstaunlich,
beeindruckend…) ;
• Les adjectifs exprimant la (non-)conformité à une norme (außergewöhnlich,
konventionnell; unkonventionnell; ungewöhnlich…).
Critères d’évaluation récurrents
Pôle positif (+) Pôle négatif (-)
Forme (clarté, perfekt durchkonstruiert; elegant; unschön; romanlos;
construction…) raffiniert; schnörkellos; präzis;
klug; lebensklug; wunderbar lebensvoll; albern;
bildkräftig; soziologische Forschung
Fond (pertinence)
ersetzend;

eindrucksvoll; beeindruckend; packend; wenig inspirierend; verstörend;


berührend; faszinierend; herzreißend; beschämend;
Effet produit
unsentimental;

ungewöhnlich ambitioniert; konventionell; durchschnittlich


Originalité außergewöhnlich; bürgerlich; traditionell;
Bilan

• Outil exploratoire avec données chiffrées


• Méthode de l’exploration par requête : je ne trouve que ce que je cherche
• Etude qualitative (élaboration d’une hypothèse de travail > recherche
outillée dans le corpus > extraction de concordancier > retour au (con-)texte
> analyse et interprétation des résultats).
3. Le genre à l’épreuve de la machine
Etude de cas n° 2 : le discours de la critique
journalistique

• Contexte = étude quantitative du discours de la critique


• Problématique =
• A) Peut-on observer des différences notables entre les supports, les locuteurs, les
romans critiqués ?
• B) Comment se définit le genre de la recension ?
• Méthode = Exploration du corpus sous forme d’analyse factorielle des
correspondances* (AFC) avec Iramuteq = Démarche bottum-up.
Der Spiegel
Ijoma Mangold Gerald Spörl (Spiegel) Ulrich Schmidt (NZZ)
(Die Zeit)

Jana Simon
(Die Zeit)
Die Elenden von Lodz

Imperium
Bilan

• Outil « boussole » permet de faire apparaître de nouveaux observables


• Méthode de l’exploration par AFC : je peux trouver ce que je ne cherchais
pas
• Etude quantitative (élaboration d’un corpus plus ou moins homogène >
exploration de ce corpus par calcul > analyse et interprétation des résultats).
• Approche intéressante, mais parfois limitée (vérification des hypothèses,
surinterprétation des résultats)
• Difficile de concevoir la notion de genre au niveau textuel
Bibliographie
ADAM Jean-Michel, 2015 [1999], La linguistique textuelle, Paris, Armand Colin.
BATTACHI Marco W., SUSLOW Thomas, RENNA Margherita, 1996, Emotion und Sprache: zur Definition der Emotion und
ihren Beziehungen zu kognitiven Prozessen, dem Gedächtnis und der Sprache, Francfort, Peter Lang.
BÖHEIM Gabriele, 1987, Zur Sprache der Musikkritiken: Ausdrucksmöglichkeiten der Bewertung und/oder Beschreibung,
Innsbruck : Institut für Germanistik, Universität Innsbruck.
DALMAS Martine, 1999, « Nichtdestoweniger bleibt das Verdienst...: Zum Schlusswort in Rezensionen », Cahiers d’études
germaniques 37, p. 75-88.
DALUD-VINCENT Monique, 2011, « Alceste comme outil de traitement d’entretiens semi-directifs : essai et critiques
pour un usage en sociologie », Langage et société, 135,1, p. 9-28.
DEL RÉ Alessandra & NOGARINI HILARI Rosângela, 2014, « Concilier les données qualitatives et quantitatives : un défi
pour les recherches en acquisition du langage », Corela HS-15.
DIAS Dominique, 2016a, « L’actualisation de l’évaluation et son effet structurant dans les critiques littéraires
journalistiques », in GALLÈPE T. (éd.), Discours, texte et langue. La fabrique des formes et du sens. Frankfurt am Main,
Peter Lang, p. 61-72.
DIAS Dominique, 2016b, Le discours de la critique littéraire journalistique. Étude du marquage de l’hétérogénéité énonciative et des
relations métatextuelles, Thèse de doctorat, Université Bordeaux Montaigne.
DIAS Dominique, à paraître, « Formen der Redezirkulation am Beispiel des Romans Imperium von Christian Kracht »
Kwartalnik neofilologiczny.
DUCHASTEL Jules & LABERGE Danielle, 2014, « Au delà de l’opposition quantitatif/qualitatif. Convergence des
opérations de la recherche en analyse du discours », Corela HS-15.
ELMIGER Daniel & KAMBER Alain, 2011, « Einleitung », Travaux neuchâtelois de linguistique, 55, p. 1-6.
ENZENSBERGER Hans Magnus, 1957, « Die Sprache des Spiegel », Der Spiegel 10/1957.
GARRIC Nathalie & LONGHI Julien, 2012, « L’analyse de corpus face à l’hétérogénéité des données : d’une
difficulté méthodologique à une nécessité épistémologique », Langages, 187, 3, p. 3-11.
GARRIC Nathalie & LÉGLISE Isabelle, 2005, « La place du corpus, de l’analyste, du logiciel : exemple d’une
analyse de discours patronal à deux voix », in WILLIAMS G. (éd.) La linguistique de corpus, Rennes, PU
Rennes, p. 101-113.
GUILBERT Thierry, 2014, « Les genres du discours dans l’articulation des approches qualitatives et
quantitatives », Corela HS-15.
JACQUES Marie-Paule, 2005, « Pourquoi une linguistique de corpus ? », in WILLIAMS G. (éd.) La linguistique de
corpus, Rennes, PU Rennes, p. 21-30.
KAUFFER Maurice, 1992, « Linguistique, statistique, graphiques », in Le texte et l’image, Actes du XXVe congrès
de l’AGES, Université de Savoie, Chambéry, p. 147-161.
KAUFFER Maurice, 1994, « La linguistique et la statistique », Nouveaux Cahiers d’Allemand, 1, p. 55-90.
KERBRAT-ORECCHIONI Catherine, 2009 [1980], L’énonciation de la subjectivité dans le langage, Paris, Armand
Colin.
LONGHI Julien, 2012, « Types de discours, formes textuelles et normes sémantiques : expression et doxa dans
un corpus de données hétérogènes », Langages, 187,3, p. 41-58.
MAINGUENEAU Dominique, 2011, « Pertinence de la notion de formation discursive en analyse de discours »,
Langage et société, 135, p. 87-99.
MAYAFFRE Damon, 2014, « ‘Ca suffit comme ça ! ’. La fausse opposition quantitatif/qualitatif à l’épreuve du
discours sarkozyste », Corela HS-15.
MAYAFFRE Damon, 2012, « Quand le nombre fait sens. Adverbes et adverbialisation du discours politique
contemporain : étude logométrique », Travaux neuchâtelois de linguistique, 55, p. 95-109.
PINCEMIN Bénédicte, 2012, « Hétérogénéité des corpus et textométrie », Langages, 187,3, p. 13-26.
POUDAT Céline & LANDRAGIN Frédéric, 2017, Explorer un corpus textuel. Méthodes – pratiques – outils, Louvain-la-
Neuve, De Boeck Supérieur.
QUASTHOFF Uwe & ECKART Thomas, 2011, « Vergleichbarkeit von sprachstatistischen Messungen », Travaux
neuchâtelois de linguistique, 55, p. 45-57.
RASTIER François, 2011, La mesure et le grain. Sémantique de corpus, Paris, Champion.
RASTIER François, 2005, « Enjeux épistémologiques de la linguistique de corpus », in WILLIAMS G. (éd.) La
linguistique de corpus, Rennes, PU Rennes, p. 31-45.
RASTIER François & PINCEMIN Bénédicte, 1999, « Des genres à l’intertexte », Cahiers de praxématique, 33, p. 83-
111.
TOURNIER Maurice, 1996, « Les discours sociopolitiques et l’analyse lexicométrique », in Henri Boyer (éd.),
Sociolinguistique Territoire et objets, Lausanne, Delachaux et Niestlé, p. 179-215.
Merci pour votre attention !

Vous aimerez peut-être aussi