Académique Documents
Professionnel Documents
Culture Documents
Tizi-Ouzou
* LE CORPUS
* OUTILS INFORMATIQUES EN RECHERCHE TERMINOGRAPHIQUE
AHMED AZOUR
Le corpus
Définition
1.Ensemble de textes établi selon un principe de
documentation exhaustive, un critère thématique ou
exemplaire en vue de leur étude linguistique.
http://www.cnrtl.fr/definition/corpus
http://www.tsrali.com/Main.aspx?cc=true
(TransSearch) (version d’essai gratuite de 5 jours).
À vérifier.
Extraction terminologique à partir
de corpus bilingues
Exemple de méthodologie (étapes)
1. Élaboration des corpus: constitution d’une base
de documents.
Exp: Retenir 5 textes en français avec 5 textes en
anglais et deux textes de référence.
2. Outils utilisés pour l’extraction et l’analyse
Exemple: Concordanciers
3. Traitement des corpus: listes des fréquences,
concordances et tris conceptuels.
4. Phase d’extraction et d’analyse des termes (mots
clés).
5. Élaboration d’un glossaire bilingue (anglais-
français pour notre cours).
6. Analyse des résultats.
Par exemple Est-ce que tous les termes alignés ont
eu un équivalent dans le corpus sélectionné? Le
pourcentage, procédure suivie pour chercher des
équivalents aux canddats termes dans d’autres
sources, etc.