FicheTechnique2006 Ok

8, Rue du prado - 31 100 Toulouse - France
Tél: +33 (0)5 61 33 10 07 - Fax: + 33 (0)5 61 33 10 43

Web : www.image-zafar.com
8, Rue du prado - 31 100 Toulouse - France

Tél : 33 (0)5 61 33 10 07 Fax : 33 (0)5 61 33 10 43 www.image-zafar.com
PREMIERE PARTIE : LA METHODOLOGIE ALCESTE
VOCABULAIRE DE BASE
Avertissement : Ce document comporte deux parties, une présentation Le corpus
théorique et un exemple d’application, qui peuvent être lues indépendamment. On entendra par corpus un ensemble de textes réunis. On suppose que cet ensemble
a été réuni en fonction d’un objectif particulier, autrement dit, qu’il constitue un objet
Introduction pour l’analyste, par exemple, un ensemble d’entretiens ou de réponses à une question
L’utilisation de l’analyse des données pour la description des structures ouverte, une oeuvre littéraire, un ensemble d’articles sur un thème donné, etc.
textuelles date du début même de cette discipline (Benzécri 1962);
cependant, ce n’est que bien plus tard que des logiciels d’analyse de Unité de Contexte Initiale (U.C.I.)
données textuelles apparaissent. Les unités de contexte initiales que l’on note U.C.I. sont des divisions
naturelles du corpus, par exemple les réponses à une question ouverte,
Les études effectuées ont plutôt été orientées vers une approche purement
chaque entretien d’une enquête, les différents chapitres d’un livre, etc.
formelle des structures textuelles (Lebart, Salem), il s’agit principalement de
forment des U.C.I.(Cf page 9), elles sont introduites par une ligne contenant
comparer les distributions de mots entre différents textes; cela n’empêche pas
les variables signalétiques appelée ligne étoilée.
des différences de point de vue dépendantes du type de corpus traité, du type
de contenu à révéler, point de vue qui, en définitive, imprime sa marque sur Unité de Contexte Elémentaire (U.C.E.)
la manière dont on définit les contextes et les unités textuelles à dénombrer.
L’unité de contexte élémentaire notée U.C.E. est composée d’une ou de
Quelles formes graphiques doivent être retenues? Doit-on ou non en plusieurs lignes de texte consécutives. L’unité de contexte élémentaire est
rejeter certaines de l’analyse? Cherche-t-on à comparer leur distribution sur considérée comme l’unité statistique essentielle par Alceste.
plusieurs textes ou, au contraire, à décrire leur organisation dans un corpus
particulier? Quel type de découpage retenir pour l’étude des distributions? Unité de Contexte (U.C.)
La méthodologie ALCESTE apporte des réponses à ces questions. Elle Les unités de contexte sont à la base de la classification sous Alceste.
porte la marque d’une double expérience (approche formelle, catégorisation L’objectif de l’analyse est leur classement en type de contexte, elles
conceptuelle) et si les difficultés rencontrées ont éloigné la méthodologie de peuvent être définies a priori par l’utilisateur, ou calculées par Alceste.
l’analyse de contenu traditionnelle pour la rapprocher d’un type d’analyse Les unités de contexte sont calculées par concaténation des unités de contexte
plus lexical, certains schémas méthodologiques ont cependant été conservés élémentaires (U.C.E.) de sorte que chaque unité de contexte (U.C.) contienne
comme par exemple la notion d’unité de contexte. un nombre de mots analysés différents*. On effectue ensuite une Classification
Descendante Hiérarchique sur le tableau qui découle de cette concaténation.
On entend par unité de contexte, tout segment de texte pouvant servir de
support à l’étude des cooccurrences*. Ces unités sont de petite dimension, et Classification simple
seront considérées comme des «instantanés» dans le mouvement du sens, On effectue une seule classification sur les unités de contexte (U.C.),
de la même manière qu’une photo donne un instantané dans le mouvement l’utilisateur peut alors définir à priori ses unités de contexte. En général
d’un lieu, l’objectif de l’analyse est de fournir une description typologique de une classification simple convient bien lorsque le corpus est de petite
ces instantanés à l’aide des liens entre ces unités de contexte, impliqués taille ou lorsque l’on traite des réponses à des questions ouvertes.
par les cooccurrences entre les formes (l’hypothèse étant que les unités de
contexte associées au même type de formes proviennent plus probablement Classification double
d’un même domaine d’usage que nous appellerons «monde»). Comme l’indique son nom, on effectue deux classifications successives sur
Pour cette description, on utilise une méthode de classification descendante des unités de contexte de grandeur légèrement différente. La longueur de
hiérarchique, qui permet de différencier plusieurs niveaux de partition sur ces unités de contexte en nombre de mots est calculée par Alceste suivant
l’ensemble des unités de contexte retenues, la différenciation des classes d’unités la taille et la nature du corpus à traiter. Une classification double a pour
de contexte de même profil pouvant servir de base à une analyse dans le corpus. avantage d’écarter tout risque dû au découpage et d’assurer la stabilité. Une
telle classification convient bien dans le cas des corpus de grande taille.
* On appelle occurrence l’apparition d’un élément de la langue dans un texte.
On appelle cooccurrence l’apparition simultanée de deux unités linguistiques.
* Ce nombre de mots analysés différents doit être supérieur à un seuil λ, la valeur de λ est calculée par le
© IMAGE
1 logiciel suivant la taille du texte à analyser.
© IMAGE
2
La Classification Descendante Hiérarchique (C.D.H.)
Exemple : Voici un exemple de regroupement d’unités de contexte
élémentaires U.C.E. en unités de contexte U.C. pour une classification
Pour construire les classes d’énoncés significatifs, on utilise une méthode de
double, ce regroupement se fait bien sûr à l’intérieur de chaque U.C.I.
classification descendante hiérarchique. Elle permet de traiter des tableaux
logiques de grande dimension mais de faible effectif.
U.C.I.
U.C.E. 1 U.C.E. 2 U.C.E. 3 U.C.E. 4 U.C.E. 5 U.C.E. 6 La procédure proposée se situe au carrefour de plusieurs techniques
d’analyse des données : segmentation, classification hiérarchique,
U.C. 1 U.C. 2 U.C. 3 dichotomie d’après une analyse factorielle des correspondances, nuées
dynamiques (Reinert 1983, Benzécri 1970).
On observe ainsi que dans ce cas le regroupement des U.C.E. aboutit à 3
U.C., les unités de contexte U.C.1, U.C.2, et U.C.3 ainsi constituées sont Schématiquement, il s’agit d’une procédure itérative : la première classe
destinées à une Classification Descendante Hiérarchique. analysée comprend toutes les unités de contexte retenues, ensuite, à chaque
pas, on cherche la partition en deux de la plus grande des classes restantes,
Mots hors corpus ou mots étoilés maximisant un certain critère (le Chi-deux* du tableau des marges). La
procédure s’arrête lorsque le nombre d’itérations demandé est épuisé.
Lors de la préparation du corpus, l’utilisateur peut introduire des informations
hors corpus caractérisant chaque U.C.I., par exemple, l’âge, le sexe, la Ci-dessous un schéma donnant 4 classes terminales à partir d’un tableau
catégorie socio-professionnelle s’il s’agit de réponses à une question ouverte. initial :
Ces informations sont introduites à l’aide de mots commençant par le
symbole étoile (*Sexe, *Age, etc.), d’où l’appellation mots étoilés ou mots
hors corpus (Cf page 9).
Remarque : Dans le document `Comment préparer son corpus`, vous trou-
verez de plus amples informations sur la préparation et le nettoyage d’un
corpus. Ce document peut être téléchargé sur le site www.image.cict.fr.
Les formes et leur réduction (lemmatisation)

On appelle lemmatisation, l’opération qui consiste à remplacer une forme
textuelle par sa forme réduite, telle que standardisée dans les dictionnaires
de langue.
Cette réduction a pour objectif d’améliorer l’analyse statistique et notamment
le classement des U.C.E.
Exemple :
Une forme verbale est réduite en Infinitif mangerai → manger
Un substantif pluriel est réduit en Singulier chevaux → cheval
Un adjectif au féminin est réduit en Masculin bleues → bleu
Une forme élidée est réduite sans élision l’ → le
* Le Chi2 ou Chi-deux ou χ2 de Karl Pearson est utilisé pour tester l’indépendance des lignes et
des colonnes du tableau, on parle aussi de la métrique ou de la distance du Chi2.
© IMAGE
3 © IMAGE
4
DÉCOMPOSITION DE LA CLASSIFICATION DU TABLEAU INITIAL L’Analyse Factorielle des Correspondances (A.F.C.)
Après la reconnaissance des formes et le découpage en unités de contexte du corpus,
J.P. Benzécri, le créateur de cette méthode d’analyse des données, écrivait il
Alceste constitue un tableau à double entrée : en ligne on représente les unités de contexte
y a plus de 20 ans : « C’est principalement en vue de l’étude des langues que
U.Cj, et en colonne les formes ou les mots analysés Formei. Ci-dessous ce tableau :
nous nous sommes engagés dans l’analyse factorielle des correspondances»
[A.D/tome 2/p 327] ou encore :« L’analyse des correspondances a été
Forme Forme .........Formei..................Formep initialement proposée comme une méthode inductive d’analyse des
1 2
données linguistiques » [Histoire et Préhistoire de l’Analyse des Données].
U.C.
1
U.C. .2 1 si la forme est présente dans U.C.
......... Cette méthode est utilisée pour décrire à l’aide de quelques facteurs la
U.C..
δij δij =
structure d’un tableau de cooccurrences. Les tableaux soumis à l’A.F.C.
j 0 si la forme est absente dans U.C.
......... dans Alceste croisent le vocabulaire retenu avec des classes d’U.C.E. Notre
U.C.
n
objectif est de donner une représentation spatiale schématique des relations
entre classes.
Ce tableau (I x J) destiné à la classification est un tableau binaire de présence-absence.
Le tableau est partitionné ensuite en deux parties distinctes suivant les lignes comme
La Classification Ascendante Hiérarchique (C.A.H.)
l’indique le schéma ci-dessous :
Cette technique n’est utilisée dans la méthodologie Alceste qu’en deux
occasions:
( I1 x J ) a) en complément à une aide à la représentation des liens entre classes;
I1 et I2 : les deux parties de I
b) pour présenter des relations locales entre formes d’une même classe.
J : l’ensemble des formes analysées.
( I2 x J ) Pour le détail de cette procédure nous renvoyons à la bibliographie. Le
tableau de départ est toujours un tableau de présence-absence. L’objectif
est de représenter par un arbre des relations entre les profils colonnes de
A partir de cette partition, on crée deux sous ensemble J1 et J2 des formes de ce tableau. Pour cela, les colonnes sont représentées par des points dans
telle sorte que les tableaux (I1 x J1) et (I2 x J2) aient la plus forte densité de «1». un espace particulier. Un tableau de distances est calculé entre points.
On obtient alors le schéma suivant : On agrège ensuite à chaque pas les deux points les plus voisins en les
remplaçant par un point moyen. On procède ainsi jusqu’à ne plus avoir
qu’un seul point résultant. Le critère de distance utilisé est ici l’inertie intra-
( I1 x J1 ) classe calculée avec la métrique du Chi-deux, la classification ainsi obtenue
forte densité en «1»
≈0 est représentée par un arbre hiérarchique appelé dendrogramme de la
classification ascendante (voir exemple détaillé page 14).
( I2 x J2 )
≈0 forte densité en «1»
A l’étape suivante, l’analyse portera sur le plus grand des sous-tableaux (en nombre de
lignes). Dans ce cas, on travaillera sur les tableaux (I1 x J1) ou (I2 x J2), ainsi de suite
jusqu’à l’obtention d’un nombre de classes terminales prédéfini à l’avance, par défaut 10
classes; l’utilisateur peut modifier ce paramètre en fonction de la nature de son corpus.
© IMAGE
5 6
© IMAGE
PRESENTATION DES DIFFERENTES ETAPES DEUXIEME PARTIE : ALCESTE PAR L’EXEMPLE
Une fois l’analyse achevée, Alceste vous propose une large palette de fichiers
Introduction
résultats. Certains sont purement techniques et d’autres ne vous intéresseront
que si vous voulez modifier les conditions de l’analyse. Une analyse comporte
quatre grandes étapes : Nous avons évoqué dans la première partie les fondements et
l’originalité de la méthodologie Alceste, qui est basée sur la manière
• L’étape A : durant cette étape Alceste reconnaît les unités de contexte de découper les unités de contexte et leur classification descendante
initiales (U.C.I.) que vous avez vous-même définies, ainsi que les mots étoilés. hiérarchique. C’est cette méthodologie qui fait d’Alceste un logiciel
pertinent d’analyse et d’aide à l’interprétation des données textuelles.
Différents dictionnaires permettent d’identifier les locutions, les mots outils et
d’effectuer une lemmatisation des formes textuelles identifiées.
Le logiciel Alceste trouve ses applications en de multiples domaines :
Cette étape établit un dictionnaire du vocabulaire de votre corpus, puis Traitements d’enquêtes, Sociologie, Psychologie, Conseils en Marketing,
un dictionnaire des «formes réduites». Par exemple elle va rassembler les Publicité, Analyse de discours, Journalisme, Analyse de Presse, Histoire,
formes «cache», «cachées», «cachaient», sous le même radical «cach+er» Droit, Médecine, Recherche Documentaire, etc.
dont la fréquence sera prise en compte.
On peut citer de nombreux exemples de traitements, parmi lesquels des
• L’étape B : durant cette étape Alceste découpe le corpus en unités de
analyses d’interviews, de réponses à des questions ouvertes, de débats
contexte et effectue leur classification en fonction de la distribution du
télévisés lors des élections présidentielles, de récits d’enfants, de rêves, de
vocabulaire.
récits de cauchemars, d’analyse de textes techniques, de comptes-rendus,
Cette étape est essentielle puisque c’est sur ces classes, caractérisées par de pannes et de messages techniques en informatique, de messageries, de
leur vocabulaire dominant, que va s’appuyer votre interprétation. forums de discussion sur internet, de diagnostics médicaux, des analyses et
synthèses d’oeuvres littéraires, de poésies, de pièces de théâtre, de textes
• L’étape C : cette étape fournit les principaux fichiers résultats. On y trouve philosophiques, etc.
les différentes classes retenues, leur dépendance mutuelle, le vocabulaire
dominant, les mots étoilés et les mots outils caractéristiques de chacune des Alceste traite donc tout type de texte, saisi à l’aide d’un traitement de texte,
classes. C’est sur ces éléments que vous baserez votre interprétation. d’un scanner ou par reconnaissance vocale, et dans différentes langues.
• Enfin l’étape D : après l’obtention définitive de la classification, cette étape La deuxième partie de ce fascicule présente à l’aide d’un exemple les
effectue des calculs complémentaires sur chacune des classes, comme fonctionnalités et la puissance du logiciel Alceste.
la liste des unités de contexte élémentaires, la classification ascendante, les
segments répétés, le calcul de concordances, etc.
Comme exemple d’application, nous avons choisi l’extrait d’une enquête
menée auprès d’adolescents toulousains.
• Un module de consultation ergonomique et convivial, permet de décrire
l’ensemble des fichiers et les graphiques comme les arbres de classifications
Le corpus est formé de 61 réponses à la question « Quels sont vos projets
descendantes et ascendantes, l’Analyse Factorielle des Correspondances,
d’avenir dans le domaine professionnel, familial ou autre ? ».
la cartographie du texte, les représentations en secteurs des variables, etc.
F
© IMAGE
7 © IMAGE
8
Voici un extrait de ce jeu de données: Voici le premier écran dit écran de synthèse regroupant les trois classes d’énoncés retenues :
0001 *sexe_m *association_oui [U.C.I. n°1, sexe masculin, adhérent d’association]

je voudrais continuer mes études, mais pas trop longtemps, je veux passer mon brevet, et
ensuite voir du coté d’une formation technique, un truc de mécanicien, enfin des études
pas longues. ma vie sentimentale, je pense me marier, après mes études, après avoir
une super maison et aussi une ou plein de voitures. je suis ceinture noire de judo, et je
voudrais continuer à consacrer du temps pour la compétition, dans le club ou je suis je
donne des cours à des enfants
0002 *sexe_m *association_non [U.C.I. n°2, sexe masculin, non adhérent d’association]
dans cinq ans, avoir un travail, le faire pendant deux ans, puis avoir un accident du travail
pour toucher de l’argent tranquillement. je veux me marier cinq fois, avoir une maison
secondaire une masse de voitures, rentrer dans la politique pour dormir, avoir un énorme
lit pour dormir avec plein de femmes, et des femmes de chambre pour faire tout le travail,
tuer les personnes qui m’agacent et mourir vieux sans donner d’argent à personne
0003 *sexe_m *association_non [U.C.I. n°3, sexe masculin, non adhérent d’association]
je veux continuer mes études jusqu’au baccalauréat et faire un boulot qui me plaît je veux
avoir une belle voiture de sport, une femme et un enfant minimum
0004 *sexe_f *association_non [U.C.I. n°4, sexe féminin, non adhérent d’association]
je voudrais faire de longues études, et avoir un bon métier, aussi passer mon permis un
appartement être indépendante et avoir un chat, il ne faut pas que je fasse tout en même
temps je ne veux pas me sentir bousculer, pour la famille l’idéal c’est d’avoir un mari et
des enfants, après je mets de l’argent de côté pour pouvoir partir en voyage. j’ai fais un
voyage dernièrement et j’aime bien, c’est pour cela que je veux voyager, bon je veux faire
des longues études dans le grand cycle, après je me marie mais je profite de la vie avant Figure n°1
de m’attacher Cet écran permet de découvrir la synthèse des résultats de l’analyse par
Alceste.
0005 *sexe_f *association_oui [U.C.I. n°5, sexe féminin, adhérent d’association] On observe sur la partie gauche le nom du texte, avenir.txt, sa date de
ce que je veux faire comme projet depuis toujours, avoir un bon métier qui paie, ne pas modification, sa taille 25Ko, le plan d’analyse avenir.pl (Pour chaque analyse
avoir d’enfants, ne pas me marier, avoir mon indépendance, avoir une super voiture, par Alceste, il faut un plan d’analyse contenant l’ensemble des paramètres
être biologiste, ça depuis l’âge de quinze ans, aller depuis toujours en Amérique, depuis de l’analyse en question).
toujours, aller en haut, ça aussi à l’âge de quinze ans, depuis toujours avoir plein de Le texte est formé de 61 entretiens, 4280 mots, dont 826 formes distinctes
téléphones dans mon appartement, depuis toujours, avoir la pilule quand j’aurai envie de qui se décomposent après réduction du vocabulaire en 96 formes réduites,
faire l’amour avec un mec, avoir un corps d’athlète, depuis toujours, avoir mon permis 84 formes supplémentaires qui vont être des mots outils (articles, pronoms,
provisoire depuis trois mois. marqueurs de temps, de lieu, d’espace) et 7 modalités de variables.
Dans la partie sélection des U.C.E., on trouvera 67,5% d’U.C.E. classées, en
d’autres termes 67,5% de discours retenu et classé.
A partir de ce corpus toiletté et formaté, on lance l’analyse. Après différents La partie droite de l’écran présente les trois classes obtenues, qui
calculs, Alceste nous fournit un ensemble important de résultats qui vous correspondent aux trois types de discours (présences significatives des
seront présentés de manière didactique dans l’ordre logique d’aide à l’inter- formes dans la classe, leurs absences significatives, et les catégories
prétation. grammaticales correspondantes).
Après avoir validé cet écran, on retrouve un écran panoramique permettant
9 © IMAGE
10
© IMAGE
de naviguer et de consulter en détail l’ensemble des résultats : dans l’élaboration d’un projet d’avenir, ci-dessous un extrait des U.C.E. de cette classe :
Figure n°2
Comme on l’observe, cet écran se décompose en fenêtres indépendantes Figure n°3
et autonomes. Chaque fenêtre représente un résultat important. Ces U.C.E. sont numérotées suivant l’ordre du texte, ce qui permet de
On peut passer d’une classe à l’autre à l’aide des boutons situés en bas de l’écran. localiser leur emplacement d’origine dans le corpus. On lit également pour
On observe dans la fenêtre de classification descendante (figure n°1) que la classe chaque U.C.E. sa valeur de Chi2 d’association dans la classe. Plus la valeur
n°2 est la première à être dissociée. Cette classe est plutôt issue de garçons du Chi2 est grande, plus le lien est fort.
appartenant à une association de quartier, car l’on trouve les deux modalités
de variables, à savoir sexe masculin et membre d’une association (*sexe_m, Nous retrouvons les termes ˝métier˝, ˝réaliser˝ , ˝projet˝ dans les U.C.E.
*assoc_oui) dans les présences significatives. Le discours de cette classe est n°111 et 87 avec les Chi2 d’association les plus forts, ce qui confirme leur
centré autour de termes tels que ˝formation˝,˝technique˝, ˝examen˝,˝continuer˝, ce appartenance à la classe n°3.
qui évoque l’avenir scolaire et professionnel des jeunes.
S’oppose à la classe n°2, la classe n°1 qui elle aussi est issue de garçons mais Pour visualiser et afficher la totalité des formes caractéristiques (présences
qui ne font pas partie d’une association. Les termes que l’on y trouve sont totalement significatives) d’une classe, il suffit de cliquer sur le bouton correspondant
différents de ceux de la classe n°2. Le vocabulaire est axé autour des mots
dans la barre d’outils :
˝maison˝,˝voiture˝,˝belle˝,˝femme˝, dans un monde imaginaire, voire publicitaire.
La classe n°3 , quant à elle, est une classe féminine, dont le discours caractéristique
est formé des termes ˝métier˝, ˝réaliser˝ , ˝projet˝. En observant les énoncés
spécifiques de la classe on comprend que ces mots évoquent les difficultés
© IMAGE
11 © IMAGE
12
Voici par exemple les formes significatives associées à la classe n°1 : De même, en cliquant sur , on obtient la classification ascendante par classe :
Figure n°4 Figure n°5
Pour chaque forme on obtient son Chi2 d’association ainsi que son La classification ascendante par classe nous permet de mettre en évidence
effectif dans la classe, son effectif total, sa catégorie grammaticale et des groupes de mots suivant leur distance de proximité.
son concordancier.
Comme l’indique la figure ci-dessus pour la classe n°1, on a positionné la
Vous observez sur cet écran le concordancier du mot «belle», c’est-à- réglette à un niveau de coupure donné, afin de mettre en évidence des
dire les unités textuelles qui contiennent le mot belle. paquets de mots agrégés comme : (belle-femme), (maison-voiture-marier),
(monde-devenir). En cliquant sur chacune des branches on obtiendra une
Remarque : concordance multiple des mots formant la branche.
En ce qui concerne les catégories grammaticales, si une classe est marquée Voici quelques concordonciers pour la branche de l’arbre formée des mots
par des adjectifs son discours sera plutôt descriptif. De même, la présence belle et femme : Mes projets seraient d’avoir une belle maison , une femme,
significative de marqueurs de temps, de lieux et d’espace donnera des un enfant. Je compte me marier avec une femme brune qui aura de beaux
indications importantes pour l’interprétation des résultats. yeux, et belle physiquement , je veux avoir une belle voiture de sport, une
femme et un enfant minimum, etc.
© IMAGE
13 © IMAGE
14
Voici le module d’Analyse Factorielle des Correspondances : Dans un cas où l’on a 3 axes, on obtiendra le graphique suivant :
Figure n°8
Figure n°7 Ce module nous permet de visualiser les relations entre les classes dans un
espace en trois dimensions, par des représentations en corrélations, contri-
Le module d’Analyse Factorielle des Correspondances nous donne les butions et coordonnées. Les possibilités de zoom, de rotation du graphique,
représentations en corrélations, contributions et coordonnées des classes, de modification des axes de projection ou des options de visualisation des
des individus et des formes. En cliquant sur un point, on affichera le mot classes font de ce module un outil indispensable pour l’aide à l’interprétation.
associé. On peut également filtrer les formes en fonction de leur effectif, de
leur Chi2 (χ2) d’association à la classe, modifier les axes factoriels pour les
projections, etc.
L’Analyse Factorielle des Correspondances confirme la forte opposition
entre le discours de la classe n°1 et celui de la classe n°2, on constate
ainsi l’impact que pourraient avoir les associations sur le comportement des
jeunes. La classe n°3 est proche du centre d’inertie, d’où un discours peu
marqué.
Par ailleurs, un module 3D permet de visualiser les graphiques d’A.F.C., bien
sûr lorsque le nombre d’axes est supérieur ou égal à 3.
© IMAGE
15 © IMAGE
16
Le module statistique nous présente l’écran ci-dessous : Voici le dictionnaire des formes complètes :
Figure n°9 Figure n°10
On pourra par un double-click sur un mot demander une concordance dans

Le module statistique présente différents graphiques portant sur les le texte. On peut également obtenir des concordances multiples.
répartitions des classes dans le corpus en fonction des unités de contexte
classées et non-classées. Bien sûr Alceste ne s’arrête pas là, il tient aussi sa puissance de ses
modules de paramétrage, suivant les valeurs de paramètres, l’outil adapte
Indépendamment des classes obtenues, on a accès au dictionnaire des votre corpus à une analyse plus fine et donc riche. Deux paramétrages sont
formes, que ce soient les formes complètes ou les formes réduites, avec possibles, à savoir le paramétrage simplifié pour tous, et un paramétrage
leurs effectifs respectifs. expert pour les utilisateurs plus avertis.
17 18
© IMAGE
© IMAGE
L’écran de paramétrage simplifié se présente de la manière suivante : BIBLIOGRAPHIE
Achard Pierre, La sociologie du langage, Que sais-je ? P.U.F., Paris, 1993
Benzécri Jean-Paul, Histoire et préhistoire de l’Analyse des Données, DUNOD, 1982
Benzécri Jean-Paul, L’Analyse des Données (tome 1 et 2), DUNOD, Paris, 1973.
Benzécri Jean-Paul, Pratique de l’Analyse des Données : linguistique et lexicologie, DUNOD, Paris, 1981
Blanchet Alain & col, Recherches sur le langage en psychologie clinique, Dunod, 1997
Bolasco Sergio, Vers une interprétation sémiotique de l’analyse des données,
METRON, 1982, vol XL, n° 1-2, p 93-102
Bourdieu, P., Ce que parler veut dire, Fayard, 1982
Lacan J., Encore ; Le séminaire : livre 20, Editions du Seuil, 1975
Lafon Pierre, Salem André , L’inventaire des segments répétés d’un texte, Mots, 1983, 6,161-177.
Lebart Ludovic, Les questions ouvertes, outils de contrôle, d’évaluation, de valorisation, Les
langages du politique, Mots, 1990, 23,76-91
Lebart Ludovic, Salem André, statistiques textuelles, DUNOD, Paris, 1994.
Looze (de) M.-A., Roy A., Coronni R., Reinert M., Jouve O., Two measures
for identifying the perception of risk associated with the introduction of transgenic
plants, Scientometrics, , Elsevier Science, 1999, vol 44, n° 3, 401-426.
Reinert Max,1983, Une méthode de classification descendante hiérarchique : Application
à l’analyse lexicale par contexte. Cahiers de l’Analyse des Données, 1983, 3,187-198.
Reinert Max,1986, Classification descendante hiérarchique: un algorithme
pour le traitement des tableaux logiques de grandes dimensions, in E. Diday &
coll. (Eds.), Data analysis and informatics, Elsevier Science,1986, p. 23-28
Reinert Max,1986, Présentation du logiciel ALCESTE à l’aide d’un exemple.
Psychologie et Education, 1986- X (2), 58-73.
Reinert Max,1987, Classification descendante hiérarchique et analyse
lexicale par contexte: application au corpus des poésies d’A. Rimbaud. Bull.
Figure n°11 de Méthodo. Sociol., 1987, 13, 53-90.
Reinert Max,1987, Un logiciel d’analyse lexicale (ALCESTE). Cahiers Analyse des Données, 1987, 4, 471-484.
Vous observez que les 4 étapes de calcul sont cochées, ainsi que les valeurs des Reinert Max,1990, Une méthode de classification des énoncés d’un corpus
différents types d’analyse, ces valeurs pouvant être modifiées suivant le besoin de présentée à l’aide d’une application, Cahiers Analyse des Données, 1990, 1, 21-36.
l’utilisateur. Par exemple, un utilisateur peut ne pas faire une classification double et Reinert Max,1991, une analyse informatique d’un corpus de 44 poèmes d’A. Rimbaud, in G.
lancer une classification simple, dans le but de traiter des réponses aux questions Maurand, Poésie et Modernité, Colloques d’Albi Langages & Signification, 1991, p 303-325 .
ouvertes, ou désactiver une lemmatisation, etc. Reinert Max,1993, Les mondes lexicaux et leur logique à travers l’analyse statistique
d’un corpus de récits de cauchemars, Langage et Société, 1993, 66, 5-39
Le paramétrage expert est représenté dans un écran muni de petites cases contenant les Reinert Max,1993, Quelques problèmes méthodologiques posés par
différentes valeurs des paramètres : c’est une approche intelligente et d’une grande transparence l’analyse de tableaux «Enoncés x Vocabulaire», in Bécue, Lebart, Rajadell
qui permet à l’utilisateur de modifier à tout moment une ou plusieurs valeurs données dans (Eds), JADT 1993 (Journées Internationales d’Analyse des Données
ce tableau, puis de relancer l’analyse pour aller encore plus loin dans l’interprétation. Textuelles), Montpellier, Telecom Paris 93 S 003, 1993, p 539-549
Pour faire un tri-croisé sous Alceste, il suffit de croiser les modalités d’une variable avec le Reinert Max,1994, L’approche des mondes lexicaux dans «AURELIA» de G. de
Nerval, in Martin, E., Les Textes et L’informatique, Didier Erudition, 1994, 145-175
corpus, afin d’obtenir des classes propres à chaque modalité, ou alors de croiser un mot Reinert Max,1995, Quelques aspects du choix des unités d’analyse et de leur
avec le texte, afin de scinder le texte en partie contenant le mot et partie ne le contenant pas. contrôle dans la méthode «Alceste», in Bolasco, Lebart, Salem (Eds), Analisi
Enfin Alceste est le logiciel d’Analyse de données textuelles pouvant travailler en Statistica dei Dati Testali (JADT 1995), CISU, Roma, 1993, p. 27-34
différentes langues (Français, Anglais, Allemand, Italien, Portugais, Espagnol), grâce Reinert Max,1997, Les «Mondes lexicaux» des six numéros de la revue «Le
à ses dictionnaires de langue. Il suffit alors de sélectionner un dictionnaire donné pour Surréalisme au Service de la Révolution» , Mélusine N° XVI, Editions L’Age
d’Homme, Lausanne, 1997, p 270-302.
pouvoir analyser dans cette langue. Ces dictionnaires restent ouverts, l’utilisateur peut
Salem André, Pratique des segments répétés , klincksieck, Paris, 1987.
les modifier ou les enrichir à sa volonté. De même, de nombreux autres modules de
traitement existent sous Alceste, que nous ne pouvons pas tous détailler dans un
document aussi synthétique.
© IMAGE
19 © IMAGE
20

FicheTechnique2006 Ok

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

FicheTechnique2006 Ok

Transféré par

Droits d'auteur :

Formats disponibles

8, Rue du prado - 31 100 Toulouse - France

Tél: +33 (0)5 61 33 10 07 - Fax: + 33 (0)5 61 33 10 43

8, Rue du prado - 31 100 Toulouse - France

Les formes et leur réduction (lemmatisation)

0001 sexe_m association_oui [U.C.I. n°1, sexe masculin, adhérent d’association]

Figure n°4 Figure n°5

Figure n°9 Figure n°10

On pourra par un double-click sur un mot demander une concordance dans

Vous aimerez peut-être aussi