Vous êtes sur la page 1sur 18

Typologie Linguistique

Module 3
Méthodologie
Combien de langues parle un linguiste ?

La recherche compte sur des données. Les


données ne sont pas disponible seulement
sur la connaissance des locuteurs natifs.

Il est pratiquement impossible de parler


toutes les langues qu’on examine.

On utilise des sources secondaires.


Sources secondaires
Grammaires descriptives: l’une des principales sources de données

- contiennent des analyses complètes et compréhensives


- mais toujours une approximation! Certaines informations seront toujours absentes.
- locuteurs natifs ou agents enquêteurs (fieldworker)
- Il faut faire attention aux partialités (bias), à la terminologie utilisée par les auteurs (le
contexte théorique)

À quoi ressemble la fonctionnalité X dans cette langue ? → On suppose que X existe

ex. “Quels tons trouve-t-on en anglais?”


Göksel, A., & Kerslake, C. (2004).
Turkish: A comprehensive grammar.
Routledge.
Elicitation: un linguiste pose des questions à des locuteurs natifs sur certaines
caractéristiques de la langue étudiée
- consultant linguistique ou informateur/trice (informant)

- pas une méthode pratique, pas de langage naturel, des questions hors contexte

- l’introspection

- dépend des questions posées par le linguist (probabilité de rater des détails)

- communication entre l’informateur/trice et le linguist → traduction


Paradoxe de l’Observateur (Observer’s Paradox)
- William Labov (1927-)

- la simple présence d'un linguiste influence la langue qu'il étudie

- les locuteurs deviennent conscients d’eux-mêmes

- les questionnaires sont utilisées pour éviter la paradoxe

L’effet Hawthorne (The Hawthorne Effect)


Textes:
sources écrites:
- pas disponible dans toutes les langues
- pour les langues avec une tradition écrite, on trouve une grande quantité de données
- utilisées pour des analyses quantitatives
transcription de discours:

- conversations, récits, monologues de rituels


- prend du temps, nécessite un travail de terrain ou d'archivage
- enregistrements dans des situations naturelles
- le paradoxe de l’observateur n'est pas éliminé; les locuteurs savent qu'ils sont enregistrés
- pour éviter les méthodes contraires à l'éthique il faut prévenir les locuteur avant d’enregistrer
Idéalement, nous devrions utiliser toutes les sources, mais cela est rarement possible.
7000 langues → seulement ⅓ de ces langues sont décrites adéquatement (une grammaire
descriptive et une dictionnaire)

Plusieurs langues sont en danger de disparition. Avec le taux actuel, environ la moitié
(certains disent 60-90%) des langues seront perdues d'ici la fin de ce siècle.

Mise en danger de la biodiversité → savoirs culturels accumulés au fil des générations,


manières spécifiques de résoudre des problèmes, d'interagir avec le monde telles que les
compétences et les perspectives mathématiques et les conseils et astuces agricoles.
Une langue « sûre » ou stable → soutien officiel de l'État; utilisée dans les écoles, les médias,
dans la communication écrite; une population importante de locuteurs

Une langue en danger → nombre de locuteurs en baisse, de moins en moins de locuteurs


transmettant la langue à la génération suivante

Pourtant! La taille seule n'est pas une garantie pour la stabilité d'une langue.
Navajo (Na-Dene (Athapascan) : États-Unis) Féroïen (Indo-Européen (Germanique) : îles Féroé,
Danemark)
- 150 000 locuteurs
- moins de 50 000 locuteurs
- En 1968, environ 90% des enfants de première
année avaient le navajo comme langue - Le féroïen n'est pas en danger : la plupart des
maternelle.
enfants féroïens apprennent le féroïen comme
- En 1998, seulement une génération plus tard, ce
nombre était tombé à 30%. langue maternelle, utilisent le féroïen à l'école,
écrivent des textes en féroïen, rencontrent le
- Quand personne n'apprend Navajo comme féroïen dans les médias et grandissent pour
langue maternelle, Navajo sera une langue parler le féroïen à leurs propres enfants.
éteinte.
- immigration et besoin d'assimilation
- conversion/assimilation linguistique
- monolinguisme forcé et discrimination
- urbanisation
- génocides
Documentation Linguistique
travail de terrain: procédure d'acquisition de données linguistiques auprès d'informateurs dans
leur environnement habituel

- un linguiste passe du temps avec une communauté dans un lieu exotique, documentant et
enregistrant une langue peu connue d'une communauté avec l'aide d'informateurs locaux

comment avoir le consentement des informateurs


comment être accepté dans la communauté
comment travailler/communiquer avec les consultants
comment rassembler les données
problèmes pratiques et logistiques : se rendre sur place, y séjourner, les équipements etc.

The Rosetta Project Language Documentation and Conservation


Échantillonnage (sampling) et types d’échantillons
Inclure toutes les langues dans une étude n'est pas possible. Il faut construire un échantillon représentatif en
fonction de notre objectif.

Echantillon de probabilité (Probability sample)

- pour déduire des tendances statistiques et corrélations


- On choisit les variables (caractéristiques) et construit l'échantillon en fonction de la présence ou de
l'absence de ces variables. Important à contrôler pour l'équilibre régional et généalogique.

Les variables pour la reduplication


(i) la langue n'a pas de réduplication ;
(ii) la langue n'a que la réduplication partielle ;
(iii) la langue n'a que la réduplication complète ;
(iv) le langage a la réduplication partielle et complète.
Echantillon de variétés (Variety sample)
- découvrir les variables d’un trait peu connu
- on décide sur le trait à explorer et essaie de trouver autant de variables que possible

Les langues dans l’échantillon peuvent avoir la même origine, tant qu'elles ont des valeurs différentes
pour la caractéristique en question.

Il est crucial d'essayer de capturer toutes les valeurs (ou au moins autant que possible) pour la
caractéristique qui est étudiée.
Echantillon de convenance (Convenience sample):
- Vous incluez tout ce à quoi vous avez accès.

- Si aucune information n'est disponible pour la langue souhaitée, elle ne peut tout simplement pas
être incluse dans l'échantillon.

- Nous pouvons toujours essayer de rendre ces échantillons de commodité aussi équilibrés que
possible sur le plan généalogique et géographique.
Types de biais
bibliographique: à cause des langues non documentées

génétique: surreprésentation de certaines familles (peut être un effet de biais bibliographique), les
caractéristiques héritées peuvent sembler plus courantes qu'elles ne le sont en réalité. ex. les tons dans la famille
Niger-Congo

géographique: surreprésentation de langues de la même région (Sprachbund), les effets de contact linguistique

La région Balkanique → genera différents de l’Indo-Européen

a) les articles postposés contrairement aux langues en dehors de Sprachbund et de la famille linguistique
b) un type spécifique du temps futur

Est-il possible d’établir une relation/corrélation entre ces deux traits?


Les déclarations statistiquement valides → basées sur des échantillons aléatoires

La nature des données linguistiques ne permet pas à un choix au hasard → risque de modèles
partiellement asymétriques

Un échantillon totalement exempt de biais est peu probable

Vous aimerez peut-être aussi