Vous êtes sur la page 1sur 26

Langages

Problmes de l'analyse de contenu


Paul Henry, Mr Serge Moscovici

Citer ce document / Cite this document :

Henry Paul, Moscovici Serge. Problmes de l'analyse de contenu. In: Langages, 3 anne, n11, 1968. Socio-linguistique. pp.
36-60;

doi : 10.3406/lgge.1968.2900

http://www.persee.fr/doc/lgge_0458-726x_1968_num_3_11_2900

Document gnr le 31/05/2016


PAUL HENRY et SERGE MOSCOVICI
cole Pratique des Hautes tudes

PROBLMES DE L'ANALYSE DE CONTENU

1. Les conditions de production des textes et leur analyse.


1.0. L'analyse de contenu est un ensemble disparate de techniques
utilises pour traiter des matriaux linguistiques. Ces matriaux peuvent
avoir t recueillis au moyen d'enqutes ou d'interviews ou bien ce sont
des matriaux naturels , regroups en vue d'une recherche, tels que
des articles de journaux, des rcits, des tmoignages, des discours
politiques, des uvres littraires, etc. Tout ce qui est dit ou crit 1 est
susceptible d'tre soumis une analyse de contenu.
Considre globalement, bien qu'elle puisse s'appliquer en principe
au traitement de tous les matriaux linguistiques, l'analyse de contenu
ne conduit pas une tude du langage (en tant que facult individuelle
par exemple) ou de sa manifestation comme telle. Elle ne dbouche pas
non plus sur une tude de la langue (en tant qu'institution ou produit
socioculturel par exemple). C'est un instrument analytique sans
ambitions, sinon sans fondements, thoriques.
1.1. L'analyse de contenu sert analyser des textes, c'est--dire des
crits ou des paroles enregistres et transcrites. Toutefois une analyse de
contenu ne s'applique pas au traitement de n'importe quels textes, mais
de textes dlibrment choisis. Lorsque les textes sont obtenus au moyen
d'enqutes ou d'interviews, ce choix se manifeste dans la formulation des
questions et dans l'chantillonnage de la population soumise l'enqute,
ou dans le choix des thmes d'interviews et la conduite de ces derniers.
Lorsque l'analyse est applique des textes naturels , ceux-ci sont
soigneusement choisis (V. un exemple dans Holsti et al., 1963, pp. 39-41).

1. Nous excluons du champ d'application de l'analyse de contenu tout ce qui


n'est pas proprement linguistique tel que films, reprsentations picturales,
comportements (considrs comme symboliques ), etc., bien que, certains gards, le
traitement de ces matriaux pose des problmes apparents ceux de l'analyse de contenu.
Nous excluons du champ de notre tude des pratiques analytiques, parfois appe-
! les analyses de contenu , utilises en linguistique ou en recherche documentaire.
Enfin, nous nous concentrerons principalement sur les mthodes utilises en
psychologie sociale.
37

Ce choix est ncessaire car toute analyse de contenu vise, non l'tude
de la langue et du langage, mais la dtermination, plus ou moins
partielle, de ce que nous appellerons les conditions de production des textes
qui en sont l'objet. Ce qu'on cherche caractriser ce sont ces conditions
de production et non les textes eux-mmes. L'ensemble des conditions
de production constitue le champ des dterminations des textes. Nous j
prfrons l'expression condition de production celles qui sont com-'
munment utilises et qui font rfrence soit la situation de
communication, soit l'environnement socioculturel, soit la psychologie
individuelle. Ces dernires expressions ont toutes l'inconvnient de restreindre
arbitrairement le champ des dterminations possibles des textes en
mettant l'accent sur tel ou tel aspect particulier.
Les conditions de production sont multiples et dans la pratique on
ne s'intresse qu' quelques-unes d'entre elles. Par exemple, la situation
d'interview est une condition de production (nous devrions dire un
ensemble de conditions de production) lorsque les textes sont obtenus
par ce procd. Cette situation influe sur certaines particularits des
textes, mais ne les dtermine que partiellement. Ce n'est qu'une condition
de production parmi d'autres, on ne s'y intresse qu'indirectement (d'un
point de vue mthodologique) et il est toujours possible d'envisager
d'autres modes de dtermination. Ainsi, lorsqu'on cherche, par l'analyse
des textes, dfinir l'attitude d'une ou plusieurs personnes l'gard d'un
objet (marque de savon, coopration technique , ou dmocratie peu
importe), il est toujours suppos que cette attitude existe
indpendamment des textes et qu'elle en a dtermin certains aspects (ceux sur
lesquels devra s'appuyer l'analyse). On peut donc dire que cette attitude
figure parmi les conditions de production des textes. Mme lorsque
l'analyse de contenu se rduit une analyse stylistique, on suppose que le
style existe indpendamment du texte, ce qui permettra, par comparaison,
de dire s'il est lgitime ou non d'attribuer un texte anonyme un auteur
connu (Hart, 1934). Le style, ou tout au moins certains de ses aspects,
est considr comme une condition de production des textes en ce sens
qu'il affecte tous les textes produits (ou productives) par un auteur
des fins prcises (par exemple littraires).
1.2. Ces exemples, proposs titre illustratif, ne suffisent pas donner
au concept de condition de production une signification prcise : il
n'a pour l'instant qu'une valeur oprationnelle. Il nous permet
d'examiner les procdures d'analyse de contenu en rfrence deux plans
fondamentaux. Le premier plan de rfrence est celui de l'analyse des
conditions de production. Le psychologue, le psychologue social, le
sociologue disposent d'un vocabulaire thorique ou plus exactement d'un
modle d'analyse plus ou moins prcis de ces conditions de production
qui constituent leurs objets d'tude. Ce modle sert structurer le
premier plan de rfrence que nous appellerons par commodit de langage,
le plan vertical. Le second plan de rfrence est celui de l'analyse des
38

textes dont on ne retient que certains lments ou certains traits; nous


l'appellerons le plan horizontal.
1.3. Nous sommes maintenant en mesure d'noncer le problme
fondamental de l'analyse de contenu. Il est clair que les deux plans de
rfrence que nous venons de dfinir ne sont pas indpendants. C'est
ce qui simultanment rend l'analyse possible et fait problme. Selon le
plan horizontal, la procdure analytique est dtermine par le plan
vertical; le choix des lments du texte que^l'on retiendra dpend
naturellement des objectifs de l'analyse, c'est--dire de celles parmi les conditions
de production que l'on veut tudier ainsi que de la manire de les dfinir.
Inversement, le plan vertical est dtermin par le plan horizontal. En
effet, les conditions de production sont caractrisgg. partir des lments
distingus dans le texte et les possibilits'cie cette caractrisation dpend
de leur dfinition. En l'absence de dfinition autonome de la
structuration de ces deux plans et de leurs rapports, on aboutit une impasse
mthodologique et thorique.
1.4. Tous les problmes de l'analyse de contenu drivent de celui-ci.
Les pratiques analytiques ne sont que des moyens d'chapper la
circularit de cette problmatique sans pour autant la rsoudre. L'ensemble
de cet article sera consacr l'examen de ce problme sous ses diverses
formes. Afin de l'noncer d'une manire moins abstraite et plus prcise,
nous commencerons par prsenter succinctement les mthodes existantes.
Dans la mme perspective, nous examinerons plus en dtail une tude
entreprise par W. Ackermann et R. Zygouris dans le cadre du Centre
d'tudes et de Recherches psychotechniques. Puis nous esquisserons des
solutions thoriques.

2. Trois types d'analyse de contenu.

2.0. Pour prsenter les mthodes utilises en analyse de contenu, nous


allons naturellement faire usage des concepts oprationnels que nous
avons introduits. Les procdures analytiques seront classes en fonction
de la structuration de leur plan vertical (c'est--dire en fonction de la
caractrisation des conditions de production qu'elles servent tudier)
et de leur plan horizontal (c'est--dire en fonction de leur analyse des
textes) ainsi que des relations qu'elles postulent entre ces deux plans.
Nous obtiendrons ainsi trois grandes familles de procdures que nous
aborderons dans l'ordre de la complexit croissante (laquelle se trouve
concider grossirement avec l'ordre chronologique de leur apparition).
2.1. Les procdures les plus simples ont t minutieusement dcrites
par Berelson (1952). Leur caractristique fondamentale est qu'elles
privilgient le plan vertical au dtriment du plan horizontal en n'envisageant
que des rapports simples entre ces deux plans. La description des textes
est commande par la dfinition des conditions de production consid-
39

res et par la manire de les caractriser. Ces conditions de production,


ce sont principalement les attitudes l'gard d'objets dtermins, les
opinions et croyances sur un sujet prcis et dlimit et des variables
plus contingentes telles que les intentions ou les motivations. Les
attitudes sont caractrises par leurs composantes, leurs directions et leurs
intensits. Classiquement on distingue dans les attitudes des composantes
affectives (ou valuatives) et cognitives. Les opinions ont un caractre
plus exclusivement cognitif et n'ont pas, en principe, de composante
affective. Ces composantes globales peuvent tre subdivises en sous-
composantes dont la dfinition est plus directement lie aux attitudes
particulires considres. Par direction, on entend par exemple favorable
oppos dfavorable ou bien, dans un cas particulier, autoritarisme
oppos galitarisme. Par intensit, on entend le caractre plus ou moins
saillant d'une composante dans une direction donne. L'attitude, comme
l'opinion, est toujours une attitude ou une opinion l'gard de quelque
chose de prcis mais qui peut tre abstrait comme la dmocratie
ou concret comme un produit de consommation. Si l'on cherche
dfinir les attitudes l'gard d'un objet par l'analyse de textes, cet
objet doit faire partie (explicitement ou implicitement) du rfrent des
textes. C'est le critre de choix des textes.
L'analyse de contenu est une mthode trs utilise dans l'tude et
la catgorisation des attitudes, opinions et croyances. Envisage comme
condition de production des textes, l'attitude ou l'opinion n'est qu'une
condition relativement peu dterminante. De ce point de vue l'analyse
est donc trs partielle pour ne pas dire ponctuelle. En contrepartie seuls
certains lments isols des textes sont retenus. On repre des mots ou
des fragments de textes qui sont regroups en classes thmatiques ou
classs par items. Les mots, les fragments de textes sont retenus dans
la mesure o ils dnotent quelque chose de pertinent du point de vue
de l'attitude considre, c'est--dire en fonction de la possibilit de les
rattacher l'une des composantes ou sous-composantes de cette attitude.
Composantes et directions dfinissent les catgories thmatiques. Le
dnombrement des lments de chaque catgorie doit en principe
caractriser l'intensit de l'attitude selon telle ou telle composante et dans
telle ou telle direction.
La description empirique des attitudes et des opinions fournit dans
ce cas un cadre analytique dans lequel sont classs certains lments
des textes. Il n'y a aucune dfinition autonome de la structuration du
plan horizontal, mais les problmes poss par ces mthodes intressent
aussi bien le plan vertical que le plan horizontal ou les rapports entre
ces plans. En ce qui concerne le plan vertical, il est clair que la validit
de l'analyse dpend essentiellement de la valeur de la description
empirique des conditions de production considres. Pour le plan horizontal,
se pose le problme de la dimension des units de contenu. Les mthodes
qui reposent sur le reprage de mots isols ne tiennent pas compte du
40

contexte dans lequel ces mots apparaissent. Or ce contexte peut modifier


considrablement leur signification. Les mthodes qui utilisent des units
de contenu plus larges ngligent les nuances de l'expression et mme,
puisqu'il est difficile de parler de nuances lorsqu'on substitue tout un
paragraphe ou plusieurs pages de texte un seul item pour les
reprsenter, altrent profondment la signification. Le rle de l'interprtation
est considrable. Enfin et surtout, il n'est jamais tenu compte des
relations entre les diffrentes units de contenu, de leurs rapports mutuels.
En ce qui concerne les rapports entre les deux plans, la validit de
l'analyse dpend entirement de la possibilit de dcider ce que l'emploi
de tel ou tel mot ou expression dnote quanct l'attitude considre.
A la limite, il faudrait pouvoir faire a priori l'inventaire de tous les mots
ou de toutes les expressions qui rvlent les diffrents aspects des
attitudes ou opinions. Or, si on s'intresse par exemple l'attitude l'gard
de la coopration technique telle qu'on peut la dfinir partir d'articles
de presse, on ne peut mme pas dcider de ne retenir que les jugements
de valeur par exemple (on y serait enclin du fait que, dans toute attitude,
il y a une composante affective ou evaluative). Le fait que certains aspects
de la coopration sont ou ne sont pas abords dans le texte est en lui-
mme significatif. On n'est pas en mesure de faire l'inventaire de tout ce
qu'on pourrait dire sur un tel sujet, donc de dterminer les manques
mme l'intrieur d'un systme de catgories pr-tabli.
On a cherch tourner ces obstacles de plusieurs manires. La
premire consiste avoir recours une sorte de pr-analyse qu'on pourrait
qualifier de sauvage ou d'intuitive. Cette analyse aurait pour but
d'explorer le contenu global des textes et d'en dterminer empiriquement
les dimensions saillantes par rapport aux conditions de production
considres. On peut galement procder par approximations successives en
alternant analyse systmatique et retour aux textes. La seconde manire
de contourner les difficults revient considrer que l'analyse a un but
principalement comparatif. Il ne s'agit plus de caractriser, ou de
mesurer des attitudes ou des opinions mais de comparer/d'un texte l'autre
ou d'un ensemble de textes l'autre, ces attitudes et ces opinions. Pour
tester des hypothses ou des prdictions thoriques, on s'intresse plus
souvent aux changements ou aux diffrences d'attitudes ou d'opinions
qu' leurs caractristiques intrinsques. Utiliser l'analyse de contenu
des fins comparatives rpond donc un besoin pratique de la recherche.
On vite du mme coup la question des manques mais on n'limine pas
les autres difficults car les critres de comparaison sont dfinis partir
de descriptions psychologiques empiriques et ce choix laisse peu de place
la comparaison directe des textes. Il faut mentionner enfin que, pour
rsoudre la question de la structuration du plan vertical, on a tent de
constituer des systmes de catgories universelles (en particulier Laswell,
1938, et White, 1951). La construction de ces grilles repose entirement
sur des considrations empiriques trangres au problme de l'infrence
41

partir de textes; leur utilisation pose avec une acuit accrue le


problme des rapports entre les deux plans d'analyse comme l'ont fait
remarquer divers auteurs (Pool, 1959).
Comme nous l'avions annonc en abordant la prsentation de cette
premire famille de mthodes, leur caractristique fondamentale est
l'importance qu'elle accorde la structuration du plan vertical, laquelle ne
s'accompagne pas d'un effort parallle d'analyse du texte. Cette
structuration n'a t possible que parce qu'elle concerne un ensemble trs
dlimit et particulier de conditions de production en faisant abstraction
de toutes les autres. Elles postulent que les conditions de production
prises en considration sont indpendantes des autres dterminations des
textes. C'est, pour une part, en raction contre ces diffrentes limitations
et pour chapper leurs consquences que les mthodes que nous allons
maintenant examiner ont t conues.
2.2. Ces mthodes n'ont pas t construites dans le seul but de
surmonter des difficults mthodologiques : elles devaient en premier lieu
rpondre des exigences nouvelles issues des dveloppements de la
psychologie et de la psychologie sociale. La validation des hypothses thoriques
ne reposait plus sur la mesure de certains carts isols mais ncessitait
l'tude des systmes de variables interdpendantes. Ainsi, dans le
prolongement du paragraphe prcdent, la thorie des attitudes s'intressait
dsormais aux relations entre attitudes l'gard d'objets diffrents. Cette
volution, qui n'intresse pas que la thorie des attitudes, impliquait
une nouvelle structuration du plan vertical et surtout du plan horizontal.
Les techniques d'analyse devaient prendre en considration les relations
entre les lments des textes, c'est--dire tenir compte des contextes.
Elles sont donc caractrises par une analyse plus approfondie des textes,
analyse qui fait appel parfois simultanment des techniques inspires
par la thorie de l'information et par la linguistique structurale et aux
possibilits de traitement automatique sur calculateur lectronique.
Il est possible de dfinir de trs nombreux types de relations entre
lments d'un texte. Les techniques varient selon le type de relation
considr et corrlativement selon la manire de dfinir les contextes,
c'est--dire les units de contenu. La thorie de l'information et la
linguistique ont fourni des modles oprationnels pour dfinir ces relations.
Dans d'autres cas (celui du General Inquirer en particulier), on ne
s'intresse qu'aux relations marques dans le texte entre certains aspects
dfinis des conditions de production considres : c'est alors le plan
vertical qui commande la dlimitation des units de contenu.
La varit des modles utiliss pour structurer le plan horizontal
a pour corollaire une grande diversit dans les mthodes; nous devrons
nous limiter l'examen de quelques types reprsentatifs.
2.2. a Un premier type de relation entre mots d'un texte est dfini
partir de la frquence des co-occurrences dans un contexte de dimension
fixe arbitrairement. Imaginons par exemple qu'on ait recueilli une srie
42

d'interviews non directifs dans le but de dterminer les attitudes l'gard


de plusieurs objets et les relations entre ces attitudes. On structure le
plan vertical comme prcdemment, c'est--dire qu'on dfinit des
catgories thmatiques correspondant divers aspects des attitudes. On repre
non seulement les mots ou les squences de chaque catgorie, mais les
co-occurrences de mots ou de squences de catgories diffrentes dans des
contextes de dimension fixe arbitrairement (par exemple la phrase : on
estime que, si les occurrences de termes sont trop espaces, il ne peut y
avoir d'interfrences entre elles). On peut ainsi dresser des matrices de
frquence des co-occurrences des lments de chaque catgorie pour chaque
texte et la matrice des frquences moyennes des co-occurrences pour
l'ensemble des textes. Cette dernire matrice fournit une sorte de point de
rfrence; on considre que les diffrences interindividuelles s'annulent
les unes les autres. Il est alors possible de rpartir les co-occurrences
dans un texte particulier en deux catgories, d'une part celles dont la
frquence est significativement suprieure la moyenne pour l'ensemble
des textes et d'autre part celles dont la frquence est significativement
infrieure cette moyenne.
A partir de l, on peut conclure l'existence d'associations ou
d'exclusions entre catgories. Une telle procdure permet de rpondre des
questions telles que :
a) Pour une personne dtermine, l'objet A voque-t-il l'objet B ou
au contraire le fait de penser ou de mentionner un objet A empche-t-il
de penser simultanment un objet B ou de le mentionner?
b) Telle direction dans une composante de l'attitude l'gard d'un
objet est-elle lie telle direction dans une autre composante de cette
attitude, etc.?
On ne peut mettre en vidence par cette mthode que des proprits
relatives, dfinies par comparaison la moyenne d'un chantillon, d'une
population ou d'un groupe de juges . La validit de cette
comparaison est base sur des considrations empiriques qui ont t soutenues
par le dveloppement de la thorie de l'information. Pour justifier de
l'emploi d'une mthode apparente celle que nous venons de dcrire,
Osgood (1952) s'appuie sur Shannon et Weaver pour affirmer que les
mots n'apparaissent pas au hasard mais par paquets, qu'on peut
reconstituer les mots manquant dans un texte mutil en se basant, non sur le
sens, mais sur un modle de la langue qui fixe la frquence d'association
des mots. Tout cart par rapport cette norme gnratrice est
considr comme porteur d'une signification contingente, c'est--dire qu'il
n'est pas dtermin par la langue ou par la culture mais par d'autres
conditions de production, propres au producteur particulier du texte.
Dans cette direction peut tre envisage une gnralisation de ces
mthodes qui liminerait le caractre relatif des rsultats. Des
dictionnaires de frquence d'apparition des mots ont t constitus pour la
plupart des langues usuelles partir de trs vastes corpus. A partir de l,
43

on peut calculer des frquences de co-occurrences statistiquement


normales par rapport cette distribution de frquence pour certains corpus
de mots slectionns, puis comparer les frquences de co-occurrences de
ces termes dans un texte dtermin cette frquence thorique. La
conception d'un tel instrument suscite deux remarques complmentaires :
(a) Quelle est la signification des frquences normales de co-occurrence;
autrement dit, parvient-on par ce procd reprsenter oprationnelle-
ment ce qui, dans le modle hypothtique lgitimant la procdure,
intresse les lments retenus? (b) L'instrument est trop grossier car le corpus
de rfrence est trop gnral : la structure qu'il dtermine par projection
sur l'chantillon est trop lche pour cerner les variables. Tout au plus,
selon nous, on peut talonner l'chantillon, la population ou le groupe
de juges , dlimiter un thme dans un complexe culturel.
Tout en tant instructives car elles posent les questions du corpus
et des relations entre les textes rassembls en vue de l'analyse et un
ensemble culturel plus vaste (questions sur lesquelles nous reviendrons),
ces objections ont peu de poids compares celles qui portent sur la
structuration du plan vertical et l'inventaire des catgories thmatiques.
Sur ce point, les difficults sont identiques celles que nous avons
rencontres propos des mthodes plus simples. Il en est de nouvelles qui
tiennent (a) la ncessit d'une prparation du texte ( dition ) par
exemple il est ncessaire de mettre sur le mme plan les mots et leurs
modalits (pronom, etc.) pour que le dnombrement des co-occurrences
ait une quelconque signification (b) au dcoupage arbitraire du point
de vue linguistique des units de contenu la dlimitation des contextes
soulve de grandes difficults lorsqu'on a affaire des phrases de
structures complexes.
2.2. b Une mthode propose par Osgood sous le titre Evaluative
Association Analysis (EAA, Osgood et al., 1956) se heurte aux mmes
difficults linguistiques et leur apporte une solution normative au
niveau de l'dition des textes. L encore il s'agit d'une technique
d'analyse des attitudes, l'accent tant mis sur la composante affective.
L'dition, c'est--dire la prparation des textes, a pour but de donner aux
squences retenues dans les textes une structure canonique. Celle-ci peut
avoir deux formes :

(a) AOi C P
(b) AU! C A02

(ces formes sont dites affirmatives ; en anglais assertives ).


(AOj) est un objet sur lequel porte une attitude de mme que (A02)
( Attitude Object ), C est un connecteur verbal, P un prdicat d'un
type particulier (common meaning term). Les objets d'attitude sont des
symboles dont l'valuation (evaluative meaning) varie d'une personne
l'autre (par exemple : la dmocratie, le capitalisme, une marque d'essence,
44

le cinma, un film, etc.). Les prdicats considrs (common meaning


terms) sont des symboles dont l'valuation est stable (par exemple, bon,
tratre, efficace, etc.). Objets d'attitude et prdicats sont plus des
catgories thmatiques que des units linguistiques. Des quivalences entre
noms sont poses par le codeur au moment de l'dition en fonction du
contexte.
De par la dfinition mme des units de contenu, on ne retient des
textes que des jugements de valeur. Le choix de ces formes canoniques
est troitement li la structuration du plan vertical. Cette structuration
est fonde sur une technique multidimensionnelle de mesure des attitudes
qu'Osgood a propose. C'est une gnralisation des techniques connues
sous le nom d'chelles d'attitudes . Les chelles utilises par Osgood
sont des chelles en sept points aux extrmits desquelles figurent deux
prdicats antinomiques (exemple bon-mauvais). Lorsqu'on veut
dterminer l'attitude d'une personne l'gard d'un objet, il lui est demand
d'valuer cet objet sur une srie d'chelles en indiquant le point de chaque
chelle, entre les extrmes, qui lui semblent le caractriser. Osgood a
tudi la distribution des rponses des sries d'chelles en les
soumettant des analyses factorielles et a dgag trois dimensions indpendantes
(valuation : bon-mauvais ou beau-laid; activit : rapide-lent ou tendu-
relch; puissance : fort-faible ou lourd-lger), ce qui ouvrait la voie
une caractrisation multidimensionnelle des attitudes. De plus, il s'est
intress aux rapports entre attitudes : schmatiquement le principe de
congruit nonce que, lorsqu'une relation est perue entre deux objets,
leur valuation dpend de cette relation et de son sens (relation
associative ou disjunctive).
Le rapport entre cette technique de mesure des attitudes et la EAA
est dfini par une pondration des connecteurs verbaux (indice du poids
et du sens de la liaison entre deux objets ou entre un objet et un prdicat)
et des prdicats (valuation des objets) sur des chelles en sept points
(pour dterminer ces pondrations on a encore recours des groupes de
juges). Connaissant les pondrations, on calcule indirectement
l'valuation dans chaque dimension des objets des attitudes, valuation qui tient
compte des relations entre les diffrents objets telles qu'elles sont mesures
par la pondration des connecteurs.
Les problmes que soulve la mise en uvre de cette technique sont
d'une part la dtermination des quivalences entre termes l'intrieur
d'une catgorie thmatique et d'autre part la rduction des squences
utiles en formes canoniques. Cette rduction normative est plus fonde
sur une interprtation que sur une analyse des textes bien que la
dfinition de la forme des units de contenu se rapproche d'une dfinition
linguistique. Les autres objections qu'on pourrait formuler portent sur les
rapports entre les deux plans d'analyse. Elles concernent en fait les
techniques de mesure des attitudes au moyen d'chelles et nous nous
contenterons ici de les mentionner.
45

Les deux types de mthode que nous venons d'esquisser mesure


des frquences des co-occurrences et EAA ont de nombreux points
communs. Entre autres, elles ncessitent l'une et l'autre une prparation
ou dition des textes qui prcde l'analyse proprement dite. Cette
caractristique, nous la retrouverons dans un troisime type de mthode conue
en vue du traitement automatique sur ordinateur.
2.2. c Cette mthode comporte en fait un trs grand nombre de
variantes. Toutes ces variantes sont cependant drives d'un systme
d'analyse documentaire baptis le General Inquirer , lequel est un
sous-systme du langage artificiel COM IT . De trs nombreux ouvrages
ont t consacrs aux diffrentes versions du General Inquirer et
ses applications (Stone et al., 1966); nous devrons nous contenter ici
d'noncer les principes. A bien des gards, les systmes General Inquirer
apparaissent comme une synthse et une systmatisation des mthodes
examines jusqu'ici. Cette systmatisation est lie l'automatisation,
laquelle contraint de rendre explicite des rgles qui restaient jusque-l
dans le domaine des proccupations mthodologiques. Les systmes
General Inquirer se prsentent comme des outils permettant de traduire les
donnes empiriques, extraites des textes, en donnes thoriques. Le cadre
thorique, c'est--dire la structuration du plan vertical, dans lequel ces
donnes vont tre organises, est l encore dfini d'une manire autonome.
Le rapport entre le plan vertical d'analyse des conditions de production
considres et le plan horizontal d'analyse du texte est dfini en partie
par un dictionnaire qui est enregistr, en mmoire. Ce dictionnaire fixe
des correspondances entre le vocabulaire thorique servant dcrire les
conditions de production et le vocabulaire des textes par l'intermdiaire
d'un systme de mots-clefs (tag concepts). Ces mots-clefs dsignent
les catgories de mots qui sont la trace de tel ou tel aspect des conditions
de production considres. Si la recherche a pour but de caractriser des
attitudes l'gard d'objets dfinis, le mot objet figurera dans le
vocabulaire thorique et les mots-clefs correspondants seront des classes
d'objets. Le dictionnaire est construit partir de l'inventaire des aspects des
conditions de production dont on doit tenir compte pour les besoins de
la recherche, c'est--dire qu'on commence par faire l'inventaire du
vocabulaire thorique lequel traduit la structuration du plan vertical. On
tablit ensuite les listes de mots-clefs correspondant chaque terme du
vocabulaire thorique. Le degr de gnralit de ces termes qui doit
tre homogne fixe la finesse de l'analyse. Enfin, par l'exploration
systmatique d'un thsaurus, on fait l'inventaire de tous les mots qui
peuvent apparatre dans les textes et qui peuvent tre considrs comme
autant d'indices de la prsence des variables reprsentes par les mots-
clefs. Ces listes d'entre peuvent tre enrichies aprs une premire
exploitation car les programmes prvoient l'tablissement de la liste de tous
les mots rejets. Il est donc possible de rajuster le dictionnaire. Ce
rajustement reste cependant partiel car il n'affecte ni le vocabulaire thorique
46

ni le systme de mots-clefs qui en dpend. En d'autres termes, on ne


peut pas modifier la dfinition du rapport entre les deux plans d'analyse.
Ce fait est videmment trs important car il a pour consquence qu'on
ne peut pas modifier, partir de l'analyse des textes, la structuration du
plan vertical, introduire de nouveaux aspects de conditions de production
autrement qu'en reconstruisant un nouveau dictionnaire, c'est--dire en
reprenant l'analyse thorique des conditions de production.
Le dictionnaire lui seul ne dfinit pas compltement les rapports
entre les deux plans d'analyse sauf dans les cas o on ne s'intresse qu'
la prsence et l'absence de certaines variables des conditions de
production parmi les dterminations des textes (et ventuellement leur
intensit mesure par des frquences d'apparition des mots d'entre pour
chaque mot-clef). Les systmes General Inquirer peuvent utiliser des
units de contenu plus larges que le mot. Celles-ci sont parfois appeles
thmes . Leur dfinition est l encore commande par le plan vertical
et non base sur des critres linguistiques (smantiques ou syntaxiques) :
la dimension de l'unit de contenu est fixe par le nombre maximum de
relations qui peuvent intervenir entre les diffrents aspects des conditions
de production apparaissant dans une mme unit de contenu. En pratique,
on fixe arbitrairement le nombre d'aspects des conditions de production
qui peuvent figurer simultanment dans une unit, ce qui revient au
mme. Dans une tude sur les conflits internationaux, R. Holsti (Holsti
et al., 1963) a dfini le thme comme tant une squence l'intrieur
de laquelle ne figurait pas simultanment plus d'un des quatre lments
suivants : (a) celui qui peroit l'action ou l'tat, (b) l'agent ou celui qui
est peru, (c) l'action, (d) le but de l'action ou la cible. La dfinition de
ces units de contenu de dimension fixe rend ncessaire une prparation
des textes dont le but est de sparer l'intrieur des phrases les units
de contenu. Par ailleurs, il est possible, connaissant le dictionnaire, de
faire un inventaire thorique a priori de tous les thmes possibles. Il
ne reste plus alors, l'aide d'une indexation approprie, qu' reprer
ces thmes manuellement dans les textes. (Cette procdure d'indexation
manuelle permet de faire l'conomie de la construction d'un dictionnaire
des thmes analogues au dictionnaire des mots. La liste des mots d'entre
sous chaque mot-clef pouvant comporter plusieurs dizaines d'units, la
simple combinatoire donnerait un dictionnaire des thmes de dimensions
considrables entranant des temps de recherches disproportionns.)
Les systmes General Inquirer rsultent d'une tentative dans la
construction d'un modle universel d'analyse de contenu. Leur
caractristique fondamentale est encore la prdominance du plan vertical sur le
plan horizontal et l'impossibilit de modifier la structuration du plan
vertical par inference partir de l'analyse des textes. On exprime parfois
ce fait en disant que ce sont des systmes interprtation close. -Par
ailleurs, le nombre des relations qui peuvent tre prises en considration
entre les lments d'interprtation est fix a priori, ceci tient au fait que
47

ces systmes ne sont pas dots d'une syntaxe autonome permettant de


construire, par exemple par imbrication, des units de contenu de
dimensions variables.

***

Les deux premires familles de procdure que nous avons examines


ont un point commun. Pour l'une comme pour l'autre, la structuration
du plan vertical commande l'analyse du texte. Dans le cas des procdures
du premier type, on ne cherche pas atteindre autre chose qu'une
description de conditions de production particulires. Le cadre thorique
de cette description est fourni par une analyse autonome de certaines
caractristiques psychologiques ou d'autres facteurs (description des
attitudes, catgories de Baies, 1950, par exemple) mais ceux-ci ne sont
considrs implicitement comme facteurs de production qu' l'occasion
de la procdure analytique. On ne repre donc dans les textes que des
indices de ces tats.
Avec les mthodes de la seconde famille, on quitte le stade
purement descriptif, leur but est de mettre l'preuve des hypothses
concernant par exemple les changements d'opinion, d'attitudes, les phnomnes
d'influence, etc. Cette ambition thorique implique qu'on a dfini
pralablement un certain nombre de variables des phnomnes correspondants.
La dfinition de ces variables est donne par exemple par la thorie des
attitudes (divers principes de consistance ou de congruit qui fixent
certaines liaisons thoriques entre divers aspects des attitudes) ou par
certaines hypothses concernant les processus d'interaction. Ces variables
ne sont pas dfinies en tant que facteurs des processus de production,
mais en tant que variables des phnomnes qui, mme lorsqu'ils font
intervenir le langage, sont supposs avoir leur lois propres. L encore,
ce n'est qu' l'occasion de la mise en uvre de la procdure analytique
que ces variables et leur relation sont considres en tant que facteur
de production. Dans ces conditions, les textes sont utiliss comme
fournissant un ensemble d'indices. La signification des lments apparaissant
(ou susceptibles d'apparatre) dans les textes dtermine leur qualit
d'indices de telle ou telle variable, la frquence de ces lments est l'indice
d'autres variables intensit ou degr de liaison.
Dans un cas comme dans l'autre, on est prisonnier du mode
thorique de description ou de modle thorique dfinissant les variables
prcisment parce qu'il n'y a d'ordre ou de variable que dans le plan
vertical. C'est la structuration du plan vertical qui fixe quels sont les
lments pertinents des textes, quelles sont les quivalences entre
lments l'intrieur des catgories thmatiques, quelles sont les relations
retenir entre catgories d'lments, quelle est la dimension des units
de contenu. La mise en uvre des procdures ne permet pas d'aboutir
la formulation d'hypothses nouvelles, la dfinition de variables qui
48

sortiraient du cadre thorique fix. Du point de vue de leur rentabilit


thorique, ces procdures dbouchent donc sur un systme clos
d'interprtation.
D'autre part, et c'est l leur seconde caractristique fondamentale,
leur validit sur le plan strictement mthodologique est suspendue la
lgitimit de l'utilisation des traits des textes comme indice de telle ou
telle variable particulire. Le mode de liaison entre les deux plans
d'analyse n'est pas systmatique; il est tabli par des interprtations ou doit
tre assujetti des preuves empiriques.
Ces deux faits suffisent expliquer qu'on ait cherch construire
d'autres systmes d'analyse qui, premirement, laissent ouvert le systme
d'interprtation et, deuximement et corrlativement, ne dfinissent pas
a priori les traits des textes susceptibles d'tre utiliss comme indices.
Les mthodes correspondantes, que l'on pourrait qualifier de procdures
de dcouvertes, doivent s'appuyer sur un mode d'analyse des texte, offrant,
de plus larges possibilits. En effet (du fait que jusqu'ici c'tait la
structuration du plan vertical qui commandait les caractristiques des mthodes),
la clture du systme d'interprtation correspondaient certaines
particularits du mode d'analyse des textes. Ceux-ci consistent en la rpartition
des lments retenus en un nombre fixe de catgories pr-tablies, ou
bien on utilise un systme de reprsentation driv d'un langage artificiel
un nombre fini d'tats, comme le COMIT. Or, la dfinition d'indices
dans un systme interprtation ouverte repose essentiellement sur la
mise en vidence de proprits des textes, de relations entre leurs
lments dfinissant des units fonctionnelles. C'est une mthode de ce
type que nous allons maintenant examiner en dtail.
2.3. Cette procdure a t utilise dans le cadre d'une enqute sur
l'assimilation des connaissances scientifiques. Cette enqute elle-mme
faisait suite une srie d'tudes traitant de la diffusion des
connaissances scientifiques, des transformations des modes de penser, des
mtamorphoses des notions scientifiques conscutives la diffusion de ces
connaissances (Barbichon et Moscovici, 1965). Le vocabulaire scientifique
comporte de nombreux termes qui ont une signification vulgaire ,
hors du champ de chaque spcialit (lumire, vitesses, poids, etc.). Les
objets de la connaissance scientifique font partie de l'environnement
naturel. Les techniques sont bouleverses par les progrs de la science.
En consquence, le domaine scientifique n'est pas un domaine clos que
l'on pourrait apprhender de l'intrieur sans qu'il y ait interfrence avec
une connaissance antrieure empirique ou dj thorique. L'assimilation
des connaissances doit tre envisage du point de vue de la rorganisation
des connaissances antrieures et de l'altration des connaissances
nouvelles (altration du point de vue de la source) ncessaires leur
intgration dans un contexte comportant des dbris du cadre prexistant.
Le but de l'enqute tait donc de clarifier, voire de rformer, les
conceptions classiques du mcanisme de l'assimilation en l'expliquant. Pourquoi
49

l'accueil est-il slectif? Quels sont les facteurs qui entranent le refus
de notions nouvelles? En quoi l'organisation nouvelle des connaissances
dpend de l'organisation ancienne? Quel est le processus de la
construction de cette nouvelle organisation? Enfin quel est le rapport existant
entre l'organisation des connaissances la source et chez celui qui a t
soumis l'influence de cette source? Autant de questions auxquelles on
ne sait donner que des rponses fragmentaires.
L'enqute (Ackermann et Zigouris, 1966-1967) a t effectue auprs
d'un groupe de stagiaires techniciens d'un centre de formation
professionnelle de l'AFPA. Une srie de questions relatives des phnomnes
qui leur taient familiers et dont l'explication faisait appel leurs
connaissances scientifiques et techniques a t soumise ces stagiaires deux
reprises, en dbut de stage et, quatre mois plus tard, en fin de stage.
Entre ces deux passations du questionnaire, les stagiaires avaient suivi
une formation thorique. L'analyse des rponses obtenues lors de la
premire passation devait permettre de dfinir l'organisation initiale des
connaissances et l'analyse du second groupe de rponses devait rvler
les transformations de cette organisation.
Dans une tude de ce genre, on ne dispose pas d'une structuration
prcise du plan vertical; les hypothses concernant les mcanismes
d'assimilation restent vagues. Tout au plus sait-on dans quelles directions on
doit les formuler. La procdure analytique doit donc tre exploratoire.
Alors que jusqu'ici c'tait la structuration du plan vertical qui avait
domin la dfinition de la procdure, dans le cas prsent, ce sera le choix
du systme de reprsentation et d'analyse des textes.
2 .3 . a L'instrument d'analyse des textes est driv d'un systme
gnral d'analyse documentaire, le SYNTOL (Cros, Gardin, Lvy, 1964).
Ce systme permet de construire l'aide d'un lexique organis et
d'un systme de relations syntaxiques des reprsentations condenses,
normalises et manipulables d'noncs scientifiques. Ces rgles fixent la
forme des reprsentations ainsi que les oprations et les transformations
auxquelles elles peuvent tre soumises. Il comporte deux axes de
rfrences. L'un, syntagmatique, dans lequel les relations entre les termes
sont explicitement marques l'aide des relations syntaxiques. L'autre,
paradigmatique, est li l'organisation hirarchique du lexique, laquelle
permet d'exprimer certaines relations implicites de voisinage ou
d'quivalence smantique. Les relations exprimes selon l'un et l'autre axe
sont de mme nature et jouent des rles complmentaires dans
l'expression de l'information. L'organisation paradigmatique est fixe une fois
pour toutes. Il est seulement possible, lors d'une recherche rtrospective,
et grce des instructions prcises, d'en tenir ou de ne pas en tenir
compte. Elle permet d'exprimer des relations stables, universellement
acceptes donc le plus souvent implicites. L'organisation syntagmatique
offre au contraire de grandes possibilits combinatoires propres exprimer
des rapports contingents, vrifis seulement dans un contexte particulier.
50

Un tel systme a l'avantage de ne pas fixer arbitrairement la


dimension des units de contenu mais laisse en suspens la question du
dcoupage de ces units. Par ailleurs, le systme des relations SYNTOL ne permet
pas d'exprimer la totalit des rgles rhtoriques du langage naturel, une
rduction est ncessaire. Celle-ci a pu au moins partiellement tre rendue
automatique par la construction d'algorithmes d'analyse automatique
oprant au niveau syntaxique (et applicable au franais). Dans ces
conditions, en thorie sinon en pratique, il n'est pas ncessaire d'avoir recours
des interprtations non systmatiques pour oprer ces rductions. Le
gros problme reste bien entendu la construction du lexique et le choix
de son organisation. Comme pour la dlimitation des units de contenu,
la nature et les buts de la recherche sont sur ce point dterminants, et
les deux questions ne sont pas indpendantes. En analyse documentaire,
cette construction ne soulve pas de problmes majeurs tant que n'est
pas pose la question de l'enrichissement du lexique. Les besoins
spcifiques de la recherche rtrospective des informations, d'une part, et la
connaissance du domaine scientifique sur lequel portent les documents
traits, d'autre part, fournissent les principes de slection des termes
et de leur organisation. Cette rfrence l'organisation du savoir
scientifique auquel renvoient les textes joue le rle d'une norme qui permet
la rduction des noncs et assure l'efficacit de l'exploitation en recherche
documentaire.
2.3. b Cet instrument ne peut pas tre utilis en analyse de contenu
sans un minimum d'adaptation. Il n'est pas possible d'introduire
brutalement la rfrence au savoir scientifique, la grille culturelle, sans
risquer de plaquer sur les textes une organisation des connaissances qui
n'existe que chez celui qui les analyse. Comme nous venons de la rappeler,
cette grille culturelle constitue en recherche documentaire, le paradigme
de la mthode d'analyse et le principe de normalisation. Le problme
est donc celui de la dfinition des critres de comparaison permettant
de considrer comme quivalentes des expressions distinctes quant leur
forme mais non quant ce qu'elles rvlent de l'organisation des
connaissances ou des mcanismes de leur assimilation. Or, c'est l prcisment
l'inconnue et on ne dispose pas d'un modle thorique de cette
organisation et de ces mcanismes.
Il ne nous est pas possible d'entrer dans les dtails de l'analyse
(Ackermann et Zygouris, 1966). Nous devrons nous limiter ce qui en
constitue les caractres saillants. Pour contourner la difficult, on a eu
recours une procdure d'approximation en se basant simultanment
sur la comparaison des rponses de l'ensemble des sujets (reprage des
invariants ou des squences recurentes et des commutations) et sur une
rfrence au savoir scientifique guide par cette comparaison. C'est par
la lecture des noncs qu'on a fix ce qu'on pourrait appeler le niveau
d'abstraction auquel il fallait se situer dans la formulation des thories
pour obtenir une norme de comparaison ni trop grossire ni trop fine.
51

Cette norme a t traduite par le choix des termes du lexique et par


l'organisation en arbre de ce lexique (les termes gnraux dominant les
termes plus particuliers selon le modle du SYNTOL) ainsi que par la
dtermination des units de contenu (squences constituant des rponses
minimales la question pose).
L'application de cette technique a permis de construire des
reprsentations des textes l'aide d'un ensemble de schmas-types lesquels
sont des constellations de concepts unis par des relations SYNTOL.
Partant de l, on a pu dfinir une typologie des rponses fonde sur
l'inventaire des schmas-types servant chacune les reprsenter. Cette
typologie a t exploite lors d'une comparaison systmatique des rponses
aux deux passations, comparaison qui a permis de mettre en vidence
certains faits intressants. On peut reprsenter la dmarche l'aide d'une

\(T)
Ce)
y
\
\
\
\ (S)
y \
\
yS \
y \
\

image graphique (laquelle vaut ce que vaut toute image). (P) et (S)
reprsentent respectivement les axes paradigmatiques (lexique
hirarchis) et syntagmatique (schma de reprsentation des textes), (C) est
l'axe de la comparaison des textes, (T) l'axe de rfrence aux thories
ou en d'autres termes le paradigme de l'interprtation par l'analyste de
la comparaison brute des textes 2. Le dcalage entre ces deux systmes
d'axes traduit la distance entre l'nonc brut et sa reprsentation. Plus
la rduction est pousse, plus le dcalage est grand. Une dition ou
prparation manuelle des textes est ncessaire pour passer d'un systme
l'autre. On construit un tat intermdiaire des textes entre leur tat
brut et leur reprsentation. Cet tat intermdiaire est une sorte de rsum
qui limine les variations stylistiques, les lments inanalysables et
prpare le dcoupage en unit de contenu.
2 . 3 . c Le passage des rsums aux schmas-types peut tre
systmatis mais non le passage des textes bruts leurs rsums. Ce biais rvle
ce qui est contestable du point de vue mthodologique dans la procdure
d'autant plus qu'un problme important, celui des erreurs, n'a pu tre
rsolu de manire satisfaisante. Ce problme ne se pose pas en analyse
documentaire ou ce qui n'est pas conforme la norme relve de l'inven-
2. On doit considrer que ces systmes d'axes sont situs dans le plan horizontal
de rfrence puisqu'ils dfinissent le mode d'analyse des textes.
52

tion et implique un enrichissement ou une modification de cette norme.


Ce n'est pas le cas ici et les textes noncs chappent la norme et ne
sont reprsentables que pour autant qu'ils sont corrigs. On n'a en effet
qu'une connaissance empirique des causes d'erreur (trs imparfaite du
reste) et non des systmes d'erreurs, ce qui fait que ces donnes ne peuvent
tre intgres la procdure analytique. La correction a pour effet de
morceler les textes, de briser les relations entre les lments puisque
c'est au niveau de ces relations (et non des termes qui sont toujours
pris dans leur sens usuel, comme en recherche documentaire) que se
manifestent ces erreurs. Les auteurs ont d reprsenter les noncs par
les schmas-types correspondant l'nonc corrig (en leur adjoignant
un indice pour signaler l'erreur), quitte revenir par la suite une
analyse autonome des erreurs.
En fin de compte, l'impossibilit de rendre compte des erreurs dans
le systme de reprsentation utilis ne remet pas en cause toute la
procdure. La question des erreurs est importante, ce n'est cependant pas la seule
question laquelle on peut s'intresser dans une tude sur les mcanismes
d'assimilation. Les questions du niveau et du degr d'organisation sont
non moins centrales. Ce sont ces problmes principalement qui ont pu
tre tudis, ce qui signifie que les consquences de la non-rsolution du
problme des erreurs ont pu tre circonscrites. Le vrai problme reste
celui de la coupure dans le passage des textes leur reprsentation au
niveau du rsum. Dans une dmarche exploratoire, ce fait revt une
importance particulire. En effet, on est en droit de s'inquiter de savoir
si les proprits des reprsentations rsultent ou non de l'introduction
de la norme qui rend ncessaire cette coupure. A fortiori, les inferences,
concernant les conditions de production, faites partir de ces proprits
risquent de manquer de fondement. On ne peut pas dcider a priori que
les oprations effectues sont illgitimes mais la procdure
d'approximation, bien qu'elle constitue un effort de systmatisation laisse une
marge d'incertitude.
2 . 3 . d Les problmes que nous venons d'voquer ne sont cependant pas
les plus importants du point de vue de l'analyse de contenu.
Le but d'une analyse de contenu n'est pas d'obtenir une
reprsentation systmatique des textes analyss. Tous les problmes de passage
des textes leur reprsentation sont mineurs car le vritable problme
est de savoir quel type de reprsentation fournira des indications utiles
aux progrs de la recherche entreprise (ici, l'tude des processus
d'assimilation des connaissances).
Nous avons dit que la procdure avait permis de construire une
typologie des rponses. On doit remarquer que, selon le point de vue o
l'on se serait plac, on aurait pu en obtenir d'autres sans qu'on puisse
dcider que l'une soit meilleure. Bien au contraire, on devrait convenir
qu'elles constituent autant de descriptions analytiques complmentaires
d'une mme ralit car les units de reprsentation, schmas-types ou
53

autres, ne constituent pas des variables mais tout au plus des indices.
Mme dans l'hypothse o l'on serait parvenu dfinir avec prcision
des transformations l'intrieur de l'ensemble des schmas-types qui
servent reprsenter les textes (en faisant apparatre certains d'entre
eux comme des dveloppements ou des synthses logiques de schmas
plus simples), rien ne permettrait d'affirmer que ces transformations
refltent celles qui permettent effectivement de passer d'un type de rponse
un autre. La question de l'adquation entre ces processus thoriques
et les processus rels resterait entire. En effet, si dans une telle
perspective les units de reprsentation apparaissent bien comme des variables
des systmes de transformation correspondants, ces transformations
comme ces variables ne sont dfinies qu'au niveau du plan horizontal :
elles ne concernent que les proprits propres des textes par rapport
la langue ou les unes par rapport aux autres. On fixe ainsi un mode
d'approche pour Yobservateur des textes analyser qui ne tient aucun compte
de l'unit phnomnale des processus tudis.
Ce type de problme n'est pas circonscrit un domaine de recherche
particulier. Il se pose dans les mmes termes, quelques nuances prs,
pour toutes les mthodes qui tentent d'atteindre une caractrisation
thorique des conditions de production partir d'une analyse autonome
des textes et de cela seulement. C'est en particulier le cas pour la
Discourse analysis de Harris (1952) qui, fonde sur la seule analyse
linguistique des textes en termes distributionnels et transformationnels,
ne peut fournir autre chose que des indices linguistiques devant tre
interprts en termes de condition de production, ce que Harris lui-mme
a fait remarquer en opposant analyse du discours et analyse de contenu.

Dans un autre ordre de faits, puisqu'il ne s'agit que de la


gnration linguistique des noncs, des remarques analogues peuvent tre faites
propos de certaines inferences faites par Chomsky (1967) partir de
la construction des modles thoriques de la gnration que constituent
les grammaires gnratives. Ces inferences concernent une rationalit
intrinsque du sujet parlant qui permettrait de rendre compte de
distinctions telles que celles qui ont t introduites entre modle fort et modle
faible. Cette rationalit intrinsque constituerait un ensemble de
conditions de production de tout nonc. Le fait important reste que des
variables concernant les rapports entre noncs sont dfinis par les
systmes de transformations introduits par Chomsky. Toutefois, les
tentatives faites pour tester l'adquation entre les processus thoriques de
gnration et les processus rels par Miller (1962), Miller et Me Kean
(1964) se sont soldes par des checs (Fodor et Garrett-Sutherland et
Cohen, 1966). Ces rsultats ngatifs n'excluent cependant pas, comme
nous le verrons, une utilisation rationnelle des systmes de
transformations dfinis entre noncs.
54

3. Perspectives thoriques : Analyse de contenu taxinomique et


analyse de contenu systmatique.
3.0. En examinant les principaux types de mthodes, notre objectif
tait de rassembler les lments ncessaires pour formuler avec prcision
les problmes de l'analyse de contenu.
La critique interne des mthodes peut tre poursuivie dans le sens
d'une remise en question des rapports entre l'instrument et les
phnomnes observs bien au-del de ce que nous en avons dit. On peut
chercher tenir compte plus encore de la lettre des textes en raffinant les
indices- linguistiques ou statistiques et simultanment on peut repenser
les conceptions thoriques qui structurent l'analyse des conditions de
production. Nous n'avons nullement t exhaustifs car ce n'tait pas notre
propos. Par la critique interne, on ne peut poser que des questions
mthodologiques, or les problmes de l'analyse de contenu ne sont pas
seulement des problmes de mthode. Tant qu'on tentera sur deux plans
spars d'amliorer l'analyse des conditions de production et l'analyse
des textes, on ne pourra juger ni de la valeur oprationnelle ni de la
lgitimit des oprations auxquelles conduit la mise en uvre des techniques.
Les problmes sont simultanment thoriques et pratiques. Thorique
en ce qui concerne la liaison entre les deux plans d'analyse, pratique en
ce que les mthodes n'offrent que des possibilits limites (a) dans la mise
l'preuve d'hypothses (b) dans la construction d'hypothses nouvelles.
Les mthodes correspondent en effet deux types de dmarches
analytiques que nous avons appeles respectivement procdures closes et
procdures exploratoires. Mettre en uvre une procdure close consiste
partir d'un cadre empirique ou thorique d'analyse de certains tats
psychologiques, psychosociologiques ou autres, qu'on cherche
particulariser ou bien propos desquels on a formul des hypothses ou des
questions. On rassemble des textes produits dans des conditions telles
que ces tats fassent partie de leurs conditions de production. Puis, on
observe ces textes travers le cadre thorique fix pour aboutir une
particularisation des conditions de production considres ou une mise
l'preuve des hypothses les concernant. Ces procdures sont dites
closes car le cadre pr-tabli ne peut tre modifi.
En ce qui concerne les procdures exploratoires, on commence
galement par rassembler des textes produits dans des situations
particulires correspondant aux tats qu'on veut observer. Le cadre d'analyse
de ces dernires n'est pas fix et on part de la mise en vidence de
proprits des textes. On dfinit des diffrences, des similitudes et
ventuellement des transformations faisant se correspondre les textes ou leurs
reprsentations. Les diffrences, les similitudes, les transformations doivent ensuite
tre interprtes pour aboutir une caractrisation des tats observs.
En rsum, ce qui spare procdure close et procdure d'exploration
c'est le fait que le principe d'organisation qui fixe le mode d'observation
55

est dans un cas fourni par ce que nous avons appel le plan vertical et
dans l'autre, le plan horizontal. Ces procdures se rejoignent en ce qu'elles
constituent les unes et les autres des techniques d'observation d'tats
qu'on ne cherche pas apprhender en tant que condition de production
des textes (bien qu'implicitement on les considre comme tels), mais en
quelque sorte en eux-mmes, indpendamment du fait qu'ils peuvent
intervenir dans le processus de production. Bien au contraire, ces tats
interviennent dans des phnomnes d'un tout autre ordre et, si on postule
l'existence d'une systmatique de ces tats, les procdures sont
ncessairement en marge de cette systmatique. Les techniques oprent en quelque
sorte par coups de sonde, la seule unit phnomnale l'chelle des textes
tant celle des processus de leur production et non celle des phnomnes
tudis. Dans ces conditions, il n'y a rien d'tonnant ce que les textes
ne puissent fournir que des indices des tats permettant de les classer en
tablissant entre eux des diffrences et des similitudes. La logique des
transformations entre tats est tablie ou postule sur un autre plan.
Pour cette raison, nous dirons que ces procdures sont des mthodes
d'analyse de contenu taxinomiques. Nous entendons ainsi insister sur ce
qui constitue la limite de leur rentabilit thorique.
3.1. Ce qui prcde nous permet du mme coup d'noncer quelle
condition on peut esprer s'affranchir de ces limitations. Le problme
est en fin de compte celui du rapport entre les processus de production
des textes et les phnomnes tudis. Nous allons commencer par
montrer que ce n'est l qu'une manire nouvelle d'noncer la problmatique
que nous avions pose au dbut de cet article.
D'une part, c'est bien la dimension des phnomnes tudis, celle du
champ dans lequel ils oprent, qui rend ncessaire la sparation
oprationnelle des deux plans d'analyse. Elle fait que ces phnomnes
apparaissent des moments de leur droulement dans le temps comme
conditions de production des textes. Le mode d'action de ces conditions de
production particulires sur les caractristiques des textes est fix par
les processus de production qui ont leur spcifit propre. Ce sont les lois
de ces processus qui dfinissent le rapport entre les deux plans d'analyse.
Les mthodes d'analyse de contenu taxinomique considrent les
processus de production comme un invariant dans la dmarche analytique.
En procdant de la sorte, on fait une double approximation.
Premirement, on postule que, quels que soient les phnomnes tudis, c'est--dire
la nature des conditions de production, les lois des processus de production
qui interviennent sont les mmes. Deuximement, on pose qu'il y a
indpendance entre les phnomnes tudis et les processus de production
que ces derniers n'en modifient pas le cours ou encore que le fait de la
verbalisation ne constitue pas un vnement en soi 3.

3. Il n'est pas tonnant que l'on considre alors le langage comme un mode
symbolique de comportement, c'est--dire dont l'ordre serait entirement
rductible celui d'autres phnomnes.
56

Dire que les phnomnes tudis et les processus de production ont


leurs lois propres ne revient pas poser ces deux ordres de phnomnes
comme indpendants. Simultanment c'est la condition de toute approche
scientifique des problmes poss.
3.2. Sur le plan thorique, que signifie le fait de considrer que les
processus de production des textes et les phnomnes qu'on tudie par
leur analyse ont leurs lois propres? Cela revient dire qu'il y a un ordre
des phnomnes tudis et un ordre du langage mme si, dans une
perspective thorique plus large, on doit poser que l'ordre du langage comme
tel rsulte de son intervention dans des phnomnes d'un autre ordre;
tels que le fonctionnement de la pense, la communication, les changes,
la culture, etc., et des conditions biologiques. C'est ce niveau que se
situe l'articulation relle entre les deux ordres.
Pratiquement, en ce qui concerne la dmarche analytique elle-mme,
on doit poser qu'il existe un systme de transformations (dont la logique
est celle des processus) qui permet de passer des conditions globales de
production aux textes. En fait, on ne s'intresse pas aux conditions
globales de production parmi lesquelles il faudrait ranger les caractristiques
de la langue (institution sociale), mais seulement celles d'entre elles
qui sont en rapport avec les phnomnes tudis. Corrlativement, on
ne s'intressera pas toutes les particularits des textes mais seulement
celles d'entre elles qui sont lies par l'intermdiaire des processus de
production ces conditions particulires.
En consquence, on ne peut se contenter de raffiner les indices
statistiques ou linguistiques puisque rien ne permet de savoir a priori si
ces indices ont une signification par rapport aux phnomnes tudis.
Le problme est bien celui du rapport entre les deux plans d'analyse et
renvoie une tude des processus de production.
3.3. L'tude de ces processus peut tre envisage dans deux
perspectives diffrentes. L'une est long terme et thorique. Elle vise la
constitution d'une thorie des processus de production. Cette entreprise dpasse
le cadre de chacune des disciplines qui s'intressent au langage ou utilisent
l'analyse de contenu, c'est--dire entre autres, la linguistique, la
psychologie, la sociologie, la psychologie sociale, l'ethnologie, etc., car il faudrait
tenir compte des conditions globales de production et de l'ensemble des
proprits linguistiques des textes. En fin de compte, la validation d'une
telle thorie (qui fournirait du mme coup une thorie de l'instrument
d'analyse) repose sur la pratique analytique ce qui nous renvoie la
seconde voie possible. Celle-ci est oprationnelle et court terme bien
qu'elle puisse fournir des lments de l'approche thorique. Elle consiste
isoler exprimentalement les variables des processus de production qui
sont lies aux phnomnes tudis. Autrement dit, il s'agit de dgager
le systme partiel de transformations permettant de passer des conditions
de production particulires lies aux phnomnes tudis aux traits
correspondants des textes. Dans cette voie, on doit avoir recours des pro-
57

cdures exprimentales qui permettent soit une manipulation des


conditions de production, non plus en tant que variables des phnomnes
tudis, mais des processus de production, soit un chantillonnage des
situations de production qui par recoupement a le mme effet. Dans le
champ des phnomnes tudis, les conditions de production considres
sont des variables de ces phnomnes organiss en fonction de la
connaissance partielle qu'on en a ou d'hypothses de recherches. Cette
organisation se traduit par exemple par le fait que certaines variables sont
considres comme indpendantes et d'autres comme dpendantes. De
la mme manire, en ne considrant que les textes dans leurs rapports avec
la langue, particulirement dans l'optique de la linguistique transforma-
tionnelle, on fait apparatre certains traits des textes comme variables.
Le dveloppement de ce qu'on pourrait appeler la linguistique traduc-
tive ou transformationnelle et la thorie des grammaires gnratives
(Chomsky et Miller, 1963; Quine, 1959) a permis de donner un sens prcis
au concept d' vnement linguistique l'intrieur du plan de la langue.
Par vnement, il faut entendre la manifestation de liaisons entre noncs
en relation d'expansion par exemple. Jusqu' une priode rcente, on ne
pouvait concevoir d'vnement linguistique que dans le cadre de la
linguistique diachronique et les phnomnes correspondants ne pouvaient
se manifester en synchronie que sous la forme des pressions l'intrieur
des structures synchroniques de la langue par le jeu des principes
fonctionnels ou d'conomie. Ces vnements ne pouvaient intresser des
procdures d'analyse de contenu puisque leur dimension dpassait largement
celle des phnomnes tudis. Pour l'analyse de contenu, la linguistique
restait descriptive et ne pouvait fournir que des indices (mme
l'intrieur du plan linguistique). Il n'en est plus de mme ds qu'on envisage
la construction de modles oprationnels du langage dfinissant les
transformations entre formes de sens donn, c'est--dire en relation smantique
d'expansion. Les formes deviennent alors des variables l'intrieur d'un
systme. Toutefois, de la mme manire que l'organisation des variables
dans le plan vertical est celle de l'ordre des phnomnes tudis, le systme
des variables du plan horizontal concerne l'ordre des noncs par rapport
la langue.
Du point de vue de l'tude des processus de production, le statut
de ces variables change. Globalement 4, les variables du plan vertical
deviennent des variables indpendantes, celles du plan horizontal,
dpendantes. En d'autres termes, on construit le plan horizontal comme plan de
variables dpendantes. Il n'en reste pas moins que, du point de vue des
phnomnes tudis, les variables du plan vertical gardent leur statut
et leur organisation. A cause de la sparation entre variables dpendantes
et indpendantes dans ce plan, la mise en uvre de procdures expri-

4. A quelques nuances prs, puisqu'il faut laisser la possibilit d'un retour


rendant compte de l'autodtermination des processus de production dans leur
droulement squentiel.
58

mentales de ce type peut conduire la construction de vritables mthodes


d'analyse de contenu que nous qualifierons de systmatiques.
En effet, bien qu'on ne puisse pas dterminer simultanment les
conditions de production et les manipuler, le fait qu'en tant que variables
des phnomnes tudis elles aient des statuts diffrentiels, qu'elles soient
hirarchises, permet de les dterminer dans leur relation avec les
phnomnes par une construction convenable du plan exprimental.
Les mthodes d'analyse de contenu systmatiques s'intressent
l'tude du langage et son fonctionnement du point de vue des conditions
de production exactement de la mme manire que la linguistique par
exemple vise l'ordre du discours et son fonctionnement du point de vue
de la langue 5. L'avantage de ces mthodes est qu'elles se situent dans
le cadre de la liaison fonctionnelle entre les deux plans d'analyse et qu'elles
permettent de faire se correspondre des variables sur ces deux plans.
Par ailleurs, il est possible de dlimiter avec prcision le champ
d'investigation alors que, dans le cas des mthodes taxinomiques, cette
dlimitation est toujours arbitraire.
Le passage des mthodes d'analyse de contenu taxinomiques celles
que nous venons de dfinir constitue un renversement. Les techniques
taxinomiques sont des mthodes d'observation, leur rentabilit thorique
est limite comme celle de toute mthode d'observation. L'introduction
de l'exprimentation dans les procdures correspond non seulement un
progrs mthodologique mais galement un stade plus avanc de la
recherche. Les techniques d'observation ont longtemps suffi au besoin
de celle-ci, elles s'avrent maintenant insuffisantes. En particulier
l'analyse de contenu systmatique devrait jouer un rle important dans l'tude
des processus cognitifs sur lesquels on sait peu de choses et qui pourtant
posent des problmes centraux en psychologie sociale.

De ce qui prcde, on peut dgager quatre types de problmes


intressant l'analyse de contenu.
En premier lieu, il faut choisir entre mthodes taxinomiques et
mthodes systmatiques. Les premires conduisent un classement
d'lments des textes en fonction de critres internes ou externes. Il reste
interprter la signification de ce classement du point de vue de la recherche
entreprise : l'tude de phnomnes particuliers. C'est choisir la voie de
l'induction laquelle ne peut conduire la construction de modles
thoriques parce que la liaison fonctionnelle entre les variables des deux plans
d'analyse lui chappe. L'analyse de contenu taxinomique est une
technique d'observation, elle ne peut tre utile qu' ce titre. Les mthodes
systmatiques ouvrent la voie une dmarche deductive en distinguant
clairement les phnomnes tudis et les processus de production des
5. Il est remarquable de constater que la linguistique s'est tourne vers l'tude
du fonctionnement du discours du point de vue de la langue au moment mme o
les techniques de traduction automatique et de fabrication de rsums automatiques
introduisaient en quelque sorte l'exprimentation en linguistique.
59

textes par l'analyse desquels est mene cette tude et en se pliant aux
dterminations des uns et des autres. Elles permettent en cernant les
liaisons entre les diffrentes variables de mettre l'preuve des modles
dynamiques des phnomnes tudis. Le choix entre mthodes taxino-
miques et systmatiques concide donc avec celui qui est pos l'occasion
de toute investigation entre observation et exprimentation.
Si on opte pour des mthodes systmatiques, c'est donc en fonction
des objectifs et de la nature de la recherche entreprise. Il reste qu'il ne
saurait y avoir de mthode gnrale d'analyse de contenu systmatique.
De par sa dfinition mme, l'instrument doit tre adapt au type de
phnomnes tudis. Ceci nous conduit distinguer deux autres catgories
de problmes, lesquels ont prcisment trait la mise en uvre des
mthodes systmatiques.
Le choix des modles dfinissant les variables sur les deux plans
d'analyse est fondamental. Il dpend pour les unes du dveloppement
antrieur de la thorie des phnomnes tudis et pour les autres de
l'analyse linguistique. Toutefois, ds ce stade, il est ncessaire de faire
ces hypothses sur les processus de production de manire pouvoir
considrer les variables dans le cadre de ces processus et non plus dans
leurs plans respectifs. Ce sont ces hypothses qui, en fin de compte,
dterminent le choix des modles particuliers sur l'un et l'autre plan d'analyse.
Elles devront tre formules partir de ce que l'on sait de la thorie des
processus de production et c'est parce qu'il s'agit d'hypothses drives
de cette thorie gnrale qu'on devra avoir recours l'exprimentation.
Il est donc clair qu'on ne doit pas confondre les manipulations que l'on
pourrait faire sur les variables en tant que variables de phnomnes
tudis et en tant que variables des processus de production.
En consquence, la mise en uvre des mthodes systmatiques
suppose qu'on ait clairement dfini les plans exprimentaux et construit des
situations exprimentales. En d'autres termes, la mthodologie
exprimentale doit ncessairement intervenir et tre adapte.
Il reste une dernire catgorie de problmes qui dcoulent du fait
que ces mthodes de recherche se situent au carrefour de la linguistique
et de la psychologie sociale. Ces deux disciplines se sont en quelque sorte
tournes le dos, les linguistes dnonant juste titre le psychologisme
et les psychologues assimilant le langage un ensemble quelconque
d'indices de phnomnes non linguistiques. On a donc confondu variables
des textes et variables des phnomnes tudis en niant, entre autres,
l'existence d'effets idologiques. On admet habituellement sans difficults
que la linguistique puisse apporter beaucoup la psychologie sociale,
mais inversement l'analyse de contenu systmatique devrait jouer vis-
-vis de la linguistique un rle analogue celui de la traduction
automatique. Elle conduit une mise l'preuve des concepts et des mthodes
et simultanment elle permet d'introduire dans la recherche linguistique
elle-mme une dimension nouvelle, celle des phnomnes dans lesquels
60

intervient le langage. Or, la prise en considration des dterminations


que ces phnomnes imposent la production du discours doit permettre
de rsoudre certains problmes strictement linguistiques qui, autrement,
resteraient obscurs. Nous croyons que les mthodes d'analyse
systmatique devraient fournir des indications utiles la thorie linguistique
de la gnration des noncs" et l'tude de la logique du langage.
Bales, R. F. (1950), A set of categories for the analysis of small group
research , Amer. Sociol. Rev., 1950, 15, 146-159.
Barbichon, G. et Moscovici, S. (1965), Diffusion des connaissances
scientifiques , Inf. Sciences Soc, 1965, 4-1, 7-22.
Berelson, B. (1952), Content analysis in communication research, The Free
Press, Glencoe.
Chomsky, N. et Miller, G. (1963), Introduction to the formal analysis of
natural language, in Luce, R. D., Bush, R. R., Galanter, E.
(eds), Handbook of mathematical psychology, Wiley, New York,
Londres, vol. 2, pp. 269-322.
Chomsky, N. (1967), Cartesian linguistics, Harper and Row, New York.
Cros, R. C., Gardin, J. C, Levy, F. (1964), V automation des recherches
documentaires, un modle gnral, le SYNTOL , Gauthier Villars, Paris.
Fodor, J. et Garrett, M. (1966), Some reflections on competence and
performance. Comment par Sutherland, N. S. et Cohen, L. J.,
in Psycholinguistics papers. Proceedings of the 1966 Edinburgh
conf. Lyons, J. et "Wales, R. J. (eds), Edinburgh University Press.
Harris, Z. S. (1952), Discourse analysis , Language, 28, 1-30.
Hart, A. (1934), Shakespeare and the homlies, Melbourne University Press.
Holsti, O. R., North, R. C, Zaninovich, H. G., Dinnes, D. A. (1963),
Content Analysis, Northwestern University Press.
Laswell, H. D. (1938), A provisional classification of symbol data ,
Psychiatry, 1938, 1, 197-204.
Miller, G. A. (1962), Some psychological studies of grammar , Amer.
Psychologist, 17, 748-762.
Miller, G. A., Me Kean, K. (1964), A chronometric study of some
relations between sentences , Quant. Journ. of Exp. Psychology.
Moscovici, S., Communication processes and the properties of language, in
Berkowitz L. (ed), Advances in Experimental Social Psychology,
1967, 3, Academic Press, New York et Londres.
Zygouris, R. et Ackermann, W. (1966), Reprsentation et assimilation des
connaissances scientifiques. Doc. n 3, rontyp CERP/AFPA.
Osgood, C. E. (1962), Symbols of Democracy, Stanford University Press.
Osgood, C. E., Saporta, S., Nunnaly, J. C. (1956), Evaluative
assertion Analysis , Litera, 3, 1956, 47-102.
Pool, I. de S. (1959), Trends in Content analysis, The University of Illinois
Press, Urbana, 111., 189-233.
Quine, N. V. (1959), Meaning and translation, In Brower, R. A. (ed),
On Translation, Havard University Press, Cambridge Mass.
Stone, P. J., Dunphy, D. C, Smith, M. S., Ogilire, D. M. (1966), The
general inquirer a computer approach to content analysis in the
behavioral sciences, Mit Press, Cambridge. Mass.
White, R. K. (1951), The study of behavior : Q-technique and its methodology, Glen
Gardner, New Jersey. The society for the psychological study of social
issues.
Zygouris, et Ackermann, W. R. (1967), Code d'analyse et domaine de
rfrence. Bulletin du CERP.

Vous aimerez peut-être aussi