Vous êtes sur la page 1sur 11

Communication et langages

Lisibilité et compréhension
Georges Henry

Résumé
Les enseignants français s'intéressent de plus en plus au problème de lisibilité ; et ceci, bien souvent en liaison avec les
recherches sur l'apprentissage de la lecture. Dans le précédent numéro de « Communication et langages », nous
présentions une formule d'efficacité élaborée par François Richaudeau, mettant plus spécialement en valeur des facteurs
syntaxiques du texte. Précédemment et dans plusieurs numéros de cette revue, nous avions rendu compte des travaux de
l'équipe de linguistes belges du laboratoire de pédagogie expérimentale de l'université de Liège, dirigé par Gilbert de
Landsheere. Nous sommes heureux de publier l'article de l'un des plus brillants chercheurs de ce laboratoire, qui a mis au
point une série de tests de lisibilité, originaux, spécialement conçus en fonction de la langue française : Georges Henry.

Citer ce document / Cite this document :

Henry Georges. Lisibilité et compréhension. In: Communication et langages, n°45, 1er trimestre 1980. pp. 7-16.

doi : 10.3406/colan.1980.1364

http://www.persee.fr/doc/colan_0336-1500_1980_num_45_1_1364

Document généré le 15/10/2015


LISIBILITE

ET

COMPREHENSION

par Georges Henry

Les enseignants français s'intéressent de plus en plus au problème de


lisibilité ; et ceci, bien souvent en liaison avec les recherches sur
l'apprentissage de la lecture. Dans le précédent numéro de « Communication et
langages », nous présentions une formule d'efficacité élaborée par François
Richaudeau, mettant plus spécialement en valeur des facteurs syntaxiques
du texte. Précédemment et dans plusieurs numéros de cette revue, nous
avions rendu compte des travaux de l'équipe de linguistes belges du
laboratoire de pédagogie expérimentale de l'université de Liège, dirigé par
Gilbert de Landsheere. Nous sommes heureux de publier l'article de l'un
des plus brillants chercheurs de ce laboratoire, qui a mis au point une
série de tests de lisibilité, originaux, spécialement conçus en fonction de
la langue française : Georges Henry.

Le but général des recherches sur la lisibilité est d'apprendre


à prédire et à contrôler la difficulté de compréhension que
présente un message pour une population déterminée. Ces
recherches permettent, dans certaines limites, l'amélioration,
voir l'optimisation, de l'efficacité de la communication écrite.
Dans les pays de langue anglaise, on dispose actuellement de
nombreuses techniques pour l'évaluation du niveau de lisibilité
des messages écrits. Ces outils tendent cependant à
s'introduire progressivement dans les pays francophones \ où deux
méthodes de mesure de la lisibilité ont été principalement
développées :
— La formule de Flesch-De Landsheere.
— Les formules de Georges Henry '.

Dans les pages qui suivent, nous tenterons d'apporter certains


éléments de réponse à plusieurs problèmes dont l'importance
pratique ou théorique n'est plus à démontrer :
— Quelle est la validité des différentes formules de lisibilité
lorsqu'on est amené à évaluer le degré de difficulté de textes
courts ?

1. Voir notamment les travaux de Georges Henry, Comment mesurer la


lisibilité (Paris, Nathan ; Bruxelles, Labor, 1974) et F. Richaudeau, la
Lisibilité (Retz, 1976).
Lisibilité et compréhension

— Le critère utilisé pour la construction des formules de


Georges Henry (test2 de closure) conduit-il à surestimer la
validité de ces formules de lisibilité ?
— Faut-il, comme le préconisent certains auteurs (J.R. Bormuth 3
en particulier), abandonner les critères de compréhension basés
sur des techniques de questionnement, au profit du seul test
de closure pour valider les formules de lisibilité ?

METHODE
Dans les pages qui suivent, nous décrirons successivement le
corpus de textes qui ont servi à notre étude, les techniques de
lisibilité utilisées, la manière dont les tests de compréhension
de lecture ont été construits et administrés à un échantillon
représentatif
(4e année primaire).
de la population
Nous tenterons
scolaireenfin
en Belgique
de déterminer
francophone
si les
différentes techniques de lisibilité prédisent correctement le
degré de difficulté des textes, tel qu'il est établi au moyen des
tests de compréhension.

CHOIX DES TEXTES


Nous avons utilisé, pour réaliser cette étude, un ensemble de
données recueillies au cours d'une vaste recherche destinée
à évaluer le rendement en lecture des élèves de l'enseignement
primaire belge francophone.
Les seize textes que nous avons retenus n'ont donc pas été
spécialement conçus en vue d'une étude de lisibilité. La longueur
des textes (environ 200 mots, mais avec une marge de variation
allant de 100 à 400 mots), constitue un facteur, insuffisamment
contrôlé qui. peut entraîner une. légère sous-estimation des
coefficients de corrélation. En contrepartie, les résultats sont
plus généralisâmes, puisque élaborés au départ d'un corpus
de textes en tous points semblable à celui utilisé
quotidiennement dans les classes.

LES ANALYSES DE LISIBILITE

1 ) La technique Flesch-De Landsheere *

Dans l'adaptation de la formule Flesch qu'a réalisée G. de


Landsheere, les variables (nombre de mots par phrase et nombre
de syllabes pour 100 mots), ainsi que les coefficients de

2. La formule de Flesch et de de Landsheere, ainsi que les formules d'Henry,


de Richaudeau et d'autres chercheurs sont décrites dans le récent ouvrage :
le Savoir Ecrire moderne, qui vient de paraître et édité par les éditions Retz.
3. J.R. Bormuth est l'un des plus importants chercheurs américains en
lisibilité ; il a notamment étudié longuement le test de closure et la validité
de l'utilisation de ce test pour mesurer la lisibilité des textes.
4. Description de la formule Flesch-De Landsheere d'après G. de Landsheere,
Introduction à la recherche en éducation (Liège, G. Thone, 1976), 48 éd.
Linguistique 9

pondération de Flesch ont été conservés, mais des changements


aux méthodes de comptage sont intervenus en raison des
différences linguistiques existant entre l'anglais et le français.
De quoi rendent compte ces deux éléments ? D'après Flesch,
la longueur des mots est un raccourci aisé pour évaluer leur
difficulté. En effet, en anglais, comme en français d'ailleurs,
les mots les plus fréquents et les plus familiers sont souvent
courts. Il serait certainement dangereux de tirer des
conclusions générales de cette observation. Il est néanmoins frappant
que beaucoup de mots savants sont construits à l'aide d'affixes,
alors que beaucoup de mots concrets sont monosyllabiques ou
dissyllabiques; la longueur moyenne des mots d'un texte
abstrait est presque toujours supérieure à celle d'un texte
concret.
Par ailleurs, les grands artifices de style s'accompagnent
souvent d'un allongement syntaxique résultant de
l'accumulation des compléments et de la multiplication des propositions
subordonnées.
Les comptages, d'apparence assez naïve, i qui conduisent à la
formule utilisée, permettent donc de sonder une réalité
beaucoup plus complexe qu'il n'y paraît d'abord.
La formule de Flesch s'écrit :

Score = 206,835 — (x + y)
avec x = nombre de mots par phrase X 1,815
y = nombre de syllabes pour cent mots X 0,846

L'échelle de difficulté, pour la langue française, va d'un maximum


de facilité égal à 80 à un minimum de facilité égal à — 20.

2) Les formules de G. Henry

Les formules de G. Henry (1977)"', destinées au traitement


automatique de textes par ordinateur, comportent six variables :
— Le nombre de mots par phrase ;
— Le type token ratio ;
— Le pourcentage de mots absents de la liste de Gougenheim;
— Le pourcentage de pronoms personnels de dialogue ;
— Le pourcentage d'indicateurs de dialogue ;
— Le pourcentage de noms présents dans une liste de noms
concrets.

5. Pour une description précise des formules, voir notamment G. Henry,


cité dans la note 1. La formule de base de la présente étude a été publiée
dans G. Henry, Une méthode de mesure par ordinateur de la lisibilité des
textes français (Scientia Paedagogica Experimental , XVI, 1, 1979). Elle est
semblable à la formule du premier ouvrage cité (1974), mais en ajoutant un
facteur supplémentaire : celui se rapportant aux mots concrets.
Lisibilité et compréhension

a) Le nombre de mots par phrase. La longueur d'une phrase


fournit un indice sûr de la difficulté syntaxique d'un texte. Afin
de standardiser la méthode de mesure de la longueur des
phrases, ont été repris, en ce qui concerne la phrase, les
principes de codage de G. de Landsheere. Une phrase se termine
par un point, un point d'exclamation ou un point d'interrogation,
suivis d'une majuscule.

b) Le type token ratio. Sur le plan théorique, on peut s'attendre


à ce qu'une redondance élevée facilite la compréhension.
L'estimation de la redondance des textes a été réalisée au départ
du type token ratio. Cette technique, utilisée notamment par
E.B. Coleman 6, est relativement ancienne; elle consiste à
calculer le rapport entre le nombre de mots différents et le
nombre total des mots d'un texte.

c) Le pourcentage de mots absents de la liste de Gougenheim.


La technique employée consiste à relever parmi les mots du
texte ceux qui ne figurent pas dans la. liste de Gougenheim7.
Lorsqu'un mot absent de la liste figure plusieurs fois dans le
texte, les différentes occurrences sont toutes prises en compte.

d) Le pourcentage de pronoms personnels de dialogue. Le


nombre de pronoms personnels de dialogue (première et
deuxième personnes :~ je, me, moi, tu, te, toi, nous, vous, j1,
m', t', (le) mien, (le) tien, (le) vôtre, (le) nôtre, donne une
indication quant au caractère dialogué ou didactique des textes.

e) Le nombre d'indicateurs de dialogue. Cette variable


composite est voisine de la précédente ; elle regroupe trois indicateurs
de dialogue :
— Le nombre de points d'exclamation ;
— Le nombre de guillemets (ou de tirets) ouvrant des
dialogues ;
— Le nombre de prénoms employés seuls (y compris les
répétitions d'un même prénom).

f) Le pourcentage de noms présents dans une liste de noms


concrets. Cette variable, à forte charge sémantique, constitue
un excellent indicateur de la difficulté des tests. Etablie selon
des critères empruntés à A.M. Gorman ", la liste a été créée

6. E.B. Coleman, Developing a Technology of Written Instruction : some


determiners of the complexity of prose, in E.Z. Rothkpf (Ed.), Symposium
of Verbal Learning Research and the Technology of Written Instruction
(New York, Rand Me Nally, 1963).
7. G. Gougenheim, P. Rivenc, R. Michea et A. Sauvageot, l'Elaboration du
français fondamental (Paris, Didier, 1967), pp. 69-113.
8. A.M. Gorman, Recognition memory for nouns as a function of abstract-
ness, in Journal of Experimental Psychology, 1961, vol. 61, n° 1, pp. 23-29.
Linguistique 11

sur la base de celle de Ters, Mayer et Reichenbach a (7 918 mots)


et en sélectionnant, au sein de celle-ci, des noms considérés
comme indiscutablement concrets.
Une analyse de régression multiple, portant sur soixante textes
et utilisant comme critère le test de closure, a permis d'établir
une formule destinée au niveau de l'enseignement primaire.
Cette formule utilise une combinaison linéaire des six variables
(ou plutôt de leurs transformations logarithmiques), qui se
traduit par un score de lisibilité exprimé en pourcentage de
réussite à un test de closure (validité correctionnelle : 0,89).

CONSTRUCTION ET ADMINISTRATION
DES TESTS DE COMPREHENSION

I. Construction
Les tests ont été construits en utilisant une liste d'objectifs
opérationnels structurés selon le schéma suivant :
— Identification du lieu et du moment où se passe l'histoire ;
— Identification des différents « actants » et des rapports de
parenté ou d'affinité entre les actants ;
— Identification des relations entre les actants et les objets,
et entre les actants eux-mêmes ;
— Identification du réseau sémantique incluant notamment :
• la compréhension du réseau anaphorique 10,
• la compréhension de la syntaxe en rappport avec la
sémantique,
• l'identification des relations causales
du contenu lexical (absentes pour Gougen-
— Choix du titre ; heim) ;
— Choix d'une phrase susceptible de commencer ou de
terminer le texte ;
— Identification de l'implicite contenu dans le texte.

L'utilisation d'une telle liste d'objectifs opérationnels tend en


effet à répondre aux critiques justifiées que J.R. Bormuth émet
à propos de l'emploi de taxonomies semblables à celle de
Davis, lorsqu'il s'agit de construire des tests de compréhension
de lecture.
En outre, d'après Bormuth ", non seulement les taxonomies
actuelles s'avèrent insuffisantes, mais les techniques
traditionnelles de construction de tests ne permettent pas de répondre
aux exigences suivantes :
9. F. Ters, G. Maer et D. Reichenbach, Vocabulaire orthographique de base
(Neuchâtel, Meisselier, 1964).
10. En syntaxe, un élément « anaphorique » est celui qui renvoie à un
contexte linguistique ; par exemple ce est anaphorique dans : le Livre était
sur la table ; ce livre était ouvert.
II. Taxonomie : science consistant à relever, à observer objectivement et à
classer les faits linguistiques en vue d'arriver à des classifications des
structures et des unités. La taxonomie décrit mais n'explique pas.
Lisibilité et compréhension

— les questions retenues devraient être représentatives de


l'ensemble des questions que l'on peut poser à partir des textes;
— la forme des questions ne devrait pas dépendre de la
subjectivité de la personne qui construit le test.
C'est pourquoi nous avons non seulement utilisé pour construire
nos tests une liste d'objectifs opérationnels, mais nous avons
aussi, dans toute la mesure du possible, tenté de réduire au
maximum les variations aléatoires, en sélectionnant le contenu
sur lequel portent les questions par des procédures aléatoires
et en standardisant la manière dont les questions sont posées.

2. Administration
Dans le cadre d'un survey national, les tests ont été soumis à
environ 150 enfants de 4e primaire appartenant à 50 écoles
différentes. Le plan d'échantillonnage avait été conçu de telle
façon n que les échantillons d'élèves recevant les différents
textes soient aussi semblables que possible.

ANALYSE DES RESULTATS


Nous présentons au tableau 1 les scores des seize textes
calculés en utilisant les techniques Flesch-De Landsheere et
Henry, ainsi que le pourcentage moyen de réussite au test de
compréhension de lecture.
Tableau 1

Numéro Score Henry Score Flesch-D.L. Pourcentage


du texte de réussite
1 18.1 30.87 34.36
2 30.0 47.32 61.70
3 14.7 33.82 48.15
4 21.4 35.02 48.91
5 21.7 42.44 53.04
6 32.6 57.42 59.09
7 27.3 56.53 53.92
8 26.6 44.43 63.22
9 30.9 46.49 62.86
10 32.3 63.80 50.84'
55.49
11 24.3 59.19
12 20.6 53.03 37.72
13 27.8 61.17 44.03
14 26.4 50.18 57.94
15 23.9 30.91 62.13
16 26.7 60.11 45.10

Au tableau 2, nous faisons appparaître les corrélations entre


ces trois variables, calculées au moyen de p de Spearman ".
12. Minimalisation de l'effet de plan {design effect) qui apparente
l'échantillon aléatoire simple.
13. Le psychologue anglais Charles Spearman (1863-1945) décrivit en 1904, dans
un article resté célèbre, une méthode mathématique, appelée analyse facto-
rielle, pouvant s'appliquer à la psychologie.
Linguistique 13

Tableau 2
Corrélations entre le score Flesch-De ILandsheere, le score Henry
et le pourcentage de réussite
Pourcentage
Score Flesch-D.L. Score Henry de réussite
Score Flesch-D.L. 1 0,65 — 0,08
Score Henry — 1 0,54
Pourcentage
de réussite — — 1

La formule de G. Henry (construite en prenant comme critère


de validation le test de closure) présente, avec le pourcentage
de réussite au test de compréhension, une corrélation de 0,54.
Cette corrélation, quoique statistiquement significative, peut
paraître faible si on la compare avec le coefficient de validité
calculé lors de l'étude expérimentale qui a permis de constuire
les formules de G. Henry (r = 0,89).
Néanmoins, ce coefficient de corrélation est affecté de deux
biais qui ont pour effet d'abaisser artificiellement sa valeur :
— La fidélité du classement des textes selon le pourcentage
de réussite diffère selon qu'on se situe dans le cadre de l'étude
expérimentale (0,95) ou dans le cadre de la présente étude
(0,79) ;
— Le corpus des textes étudiés dans cette recherche a une
dispersion moindre (a = 4,8) que le corpus des textes retenus
pour l'étude expérimentale (a = 10,5).
Afin de pouvoir comparer les deux coefficients, nous avons donc
corrigé le coefficient de corrélation obtenu au cours de notre
étude, à la fois pour le manque de fidélité du critère et pour
les différences de dispersion l*. Après correction, !a corrélation
s'élève à 0,85, soit une valeur étonnamment semblable à celle
trouvée lors de l'étude expérimentale. La diminution de 0,04
s'explique pa- la légère idiosyncrasie qui existe entre une
formule de lisibilité et l'échantillon de textes qui ont servi à sa
construction. Nous avions d'ailleurs établi lors de l'étude
expérimentale que, lorsqu'on appliquait nos formules à un échantillon
d'autres textes (validation croisée), la validité réelle trouvée
était non plus de 0,89, mais de 0,85 également.

CONCLUSIONS
L'étude que nous venons de décrire permet d apporter une
réponse aux trois questions que nous posions dès le début. .

1. Quelle est la validité des différentes formules de lisibilité


lorsqu'on est amené à évaluer le degré de difficulté de textes
courts ?
14. Ces corrections sont décrites dans J.P. Guilford et B. Fruchter,
Fundamental
5e éd., pp.Statistics
315-316inetPsychology
441-442. and Education (New York, Me Graw-Hill, 1973).
Lisibilité et compréhension

Le score Henry rend mieux compte des difficultés de


compréhension éprouvées par les élèves que ne le fait le score Flesch-
De Landsheere. Il convient cependant, d'être nuancé et de ne
pas rejeter d'emblée ce dernier score. En effet, s'il manque
certes de validité pour des textes courts ir> au niveau de
l'enseignement primaire, il conserve néanmoins une validité
élevée lorsqu'il s'agit de tester un corpus plus étendu, à
d'autres niveaux de la scolarité ou pour une population adulte.
Du point de vue de l'enseignant, le peu de validité du score
Flesch-De Landsheere pour des textes courts ne laisse
cependant pas d'être inquiétant, car c'est précisément ce genre de
textes que celui-ci est amené à manipuler quotidiennement
dans la classe.
Une analyse plus approfondie des données nous a permis de
constater que c'est la variable « nombre de mots par phrase »
qui, pour des textes courts, est responsable des anomalies
constatées dans le calibrage de certains textes (R = — 0,24).
Cette variable intervenant pour moitié dans le score Flesch-
De Landsheere et pour un sixième seulement dans le score
Henry, on peut aisément expliquer la différence de validité
prédictive des deux scores.

2. Le critère utilisé pour la construction des formules de


G. Henry (test de closure) conduit-il à surestimer la validité de
ces formules de lisibilité ?
Les critiques formulées à l'encontre du test de closure utilisé
comme moyen de mesure de lisibilité paraissent peu fondées.
En effet, contrairement à ce que certains. auteurs affirment, il
n'y a pas d'idiosyncrasie entre les formules créées au moyen
du test de closure et les caractéristiques particulières de ce
test. Les variables linguistiques ainsi que les coefficients de
pondération retenus ne sont donc pas liés à ce que le test de
closure aurait de spécifique par rapport à d'autres techniques
de mesure de la compréhension. En outre, on a constaté qu'il
n'y a pas de surestimation du coefficient de corrélation, puisque
la validation externe effectuée au moyen d'une autre technique
conduit à des résultats très voisins.
En conclusion, on savait déjà que le test de closure présentait
des avantages incontestables : facilité de construction et de
^correction, population de questions bien définie, non-intervention
du créateur du test dans la rédaction des questions, compara-
c bilité du test de closure d'un texte à l'autre. La présente
w recherche démontre en outre qu'il s'agit bien d'un instrument
c privilégié lorsqu'on veut constuire des formules de lisibilité.

| 15. Ce que nous avions par ailleurs déjà signalé dans notre ouvrage : Corn-
g ment mesurer la lisibilité.
Linguistique 15

3. Faut-il, comme le préconisent certains auteurs ((J.R. Bormuth


en particulier), abandonner les critères de compréhension basés
sur des techniques de questionnement au profit du seul test de
closure pour valider les formules de lisibilité ?
Nous faisons nôtres les objections formulées par J.R. Bormuth
à l'égard des techniques classiques de mesure de la
compréhension de la lecture. Néanmoins, notre étude démontre que,
lorsque des précautions suffisantes sont prises et dès lors
qu'un modèle d'objectifs opérationnels est mis en place, on peut
contrôler suffisamment le contenu et la forme des questions
posées, de manière à créer des tests qui restent comparables
d'un texte à l'autre.
Ce résultat est important à deux égards. En premier lieu, on
pourrait envisager de rechercher parmi un ensemble de variables
linguistiques décrivant des textes celles qui sont le plus liées
à tel ou tel ensemble d'objectifs. Une telle étude serait, nous
semble-t-il, susceptible d'appporter des renseignements
extrêmement intéressants dès qu'il ne s'agit plus d'évaluer la
difficulté d'un matériel linguistique, mais bien plutôt de tenter
d'en améliorer le degré de lisibilité. En second lieu, cette
étude démontre le rôle de premier plan qu'une liste d'objectifs
opérationnels définis et hiérarchisés pourrait jouer dans l'étude
expérimentale des processus de lecture.
G. Henry.
LE VIONDE NE PEUT ÉCHAPPER

A LA SPÉCIALISATION. STOP. A LA

LONGUE IL S'ÉTA3LIT DES LANG

AGES SPÉCIALISÉS. STOP. A LA

LONGUE LES SPÉCIALISTES ONT

UN PRO3LÉVIE DE COVIVIUNI

CATION. STOP. IL EXISTE HEUR

EUSEVIENT DES LIVRES QUI P

EMETTENT DE COVIPRENDRE

LE LANGAGE DES SPÉCIALISTES.

STOP.

COLLECTION LEXIQUES : OUVR

AGES PARUS: DROIT ADVIINIS

TRATIF. DROIT DE UUR3ANIS

VIE. PSYCHIATRIE. SÉVIIOTIQUE

SOCIOLOGIE POLITIQUE. STOP

A PARAÎTRE PROCHAÎNE VENT:

ÉCONOMIE GÉNÉRALE.
TERMINÉ. puf

Vous aimerez peut-être aussi