Vous êtes sur la page 1sur 13

Le Coran : quelques donnes lexicolexico-statistiques

statistiques1
Djamel Eddine Kouloughli2
0. PRAMBULE
Comme les textes sacrs des autres religions monothistes, le Coran a fait lobjet,
trs tt, et en tout cas bien avant linvention de lordinateur, de dcomptes statistiques minutieux portant sur tous les aspects de son organisation textuelle. Cest
ce quatteste par exemple un clbre rcit rapport dans Les Mille et une Nuits et
qui met en scne la docte Sympathie , belle et savante jeune femme quun
aropage de savants interroge, notamment sur le Coran. Voici un extrait de sa
rponse :
Elle rpondit : Le Korn est compos de cent quatorze sourates ou chapitres, dont soixante-dix ont t dicts La Mecque et quarante-quatre Mdine. Il est divis en six cent vingt-et-une divisions, appeles aschar, et en
six mille deux cent trente-six versets. Il renferme soixante dix-neuf mille
quatre cent trente-neuf mots, et trois cent vingt-trois mille six cent
soixante-dix lettres 3

Nos propres donnes, et nos moyens actuels de les traiter, ne confirment pas
cette description dans ses moindres dtails. Mais il faut bien reconnatre que tous
les ordres de grandeur voqus dans ce texte sont corrobors par nos propres
rsultats, ce qui, compte tenu du fait que tous les dcomptes taient faits la
main, ne peut que susciter ladmiration4.
Aujourdhui, des textes lectroniques du Coran sont trs faciles trouver et
tlcharger sur le web et, moyennant quelques manipulations, transformer en
corpus lectroniques susceptibles dtre analyss de faon exhaustive et systmatique. Ce sont essentiellement des rsultats de telles analyses qui seront prsents et comments dans les pages qui suivent.
Le corpus sur lequel nous avons travaill, comme la plupart des versions
lectroniques du Coran en circulation, correspond ce que lon dsigne parfois
sous le nom de Coran de Fouad . Cette dnomination fait rfrence la pre1. Le prsent texte corrige une version prcdente o des erreurs staient glisses dans
les donnes statistiques. Ces erreurs nous ont t signales par M. Tidjani Ngadi, du
dpartement de physique de luniversit dOran (Algrie). Quil trouve ici lexpression de
nos remerciements.
2. CNRS, HTL (Histoire des thories linguistiques), UMR 7597.
3. Histoire de la docte Sympathie (178e nuit). Les Mille et une Nuits, traduction Joseph
Charles Mardrus.
4. Surtout si lon tient compte du fait quune partie des divergences vient peut-tre de la
dfinition des observables (par exemple pour ce qui concerne les mots et les lettres ).

61

mire version imprime du Coran, laquelle a t labore sous lautorit des


ulam dal-Azhar et sous lgide du roi Fouad Ier dgypte en 1923. Elle correspond la lecture (qira) de af telle que transmise par im, traditionnellement en usage dans le pays du Nil, et devenue, par les vertus dmocratiques de
limprimerie, la version crite du Coran la plus largement diffuse dans le monde.
Le Coran relve, lorigine, de loralit, comme le suggre la probable tymologie de Qurn, rcitation voire appel, proclamation . De la relativement
longue priode o il a t essentiellement confi la transmission orale assure
par les porteurs du Coran (amalat al-Qurn), il a gard des variantes textuelles plus ou moins importantes auxquelles la tradition fait rfrence sous le nom
de aruf (idiomes), dune part, de qirt (rcitations, lectures), dautre part. Les
aruf, dont une tradition nous apprend que le Prophte aurait lui-mme dclar
que la rvlation en comportait sept, semblent concerner des diffrences relatives lidentit de certaines units lexicales du texte qui se manifestent dans le
ductus consonantique (rasm). Les qirt concernent plutt des diffrences dans
les marques diacritiques associes ce ductus (vocalisation et gmination consonantique). La fixation graphique dfinitive du Coran, qui ne se fait que progressivement, avec ladoption gnralise de la rforme de lcriture arabe dcide par
le Calife omeyyade Abd al-Malik Ibn Marwn (m. 705), saccompagnera dun net
recul de la tolrance, assez grande lorigine, lgard des variantes dans la rcitation du texte sacr. Au Xe sicle, linitiative du thologien Ibn Muhid
(m. 936), seules sept qirt canoniques sont codifies et retenues pour tre
reproduites. Les autres, mme si elles sont notes, sont dclares rares (a)
et pratiquement ostracises5. Des sept qirt reconnues, seules deux ont eu une
diffusion assez large dans la communaut musulmane sunnite, celle de af dont
nous avons dj parl, et celle de War, encore en usage au Maghreb. Le Coran
de Fouad semble avoir fait dfinitivement pencher la balance en faveur de la
premire.

1. PRSENTATION G
GNRALE
Dans sa version lectronique comme dans sa version imprime, le texte coranique est divis en 114 sourates (sra/suwar6) classes dans un ordre conventionnel (cest--dire non chronologique). Chaque sourate porte un ou plusieurs
noms, galement conventionnels7. Concernant le classement des sourates du
5. Sur lhistoire de la fixation du texte coranique on peut lire, dans les rfrences arabes
anciennes, louvrage de Ab Amr al-Dn, Al-Muqni f rasmi maifi al-amr, et dans les
rfrences modernes, par exemple Blachre (1958) ou Droche (2005).
6. Sur ltymologie du mot sra, il existe, tant en arabe que dans diverses langues europennes, une abondante littrature, abondance qui tmoigne surtout de labsence dexplication vraiment convaincante de la signification originelle du mot. Tout au plus peut-on
dire, avec certitude, que la racine <swr> laquelle est associ ce mot porte le contenu
smantique gnral de barrire, sparation .
7. Ainsi, la premire sourate du Coran, outre son nom de Ftia ( Introduction ), est
connue sous plus dune dizaine dautres dnominations. De mme, la sra 112, laquelle il

62

Coran, on dit souvent qu lexception de la premire, la Ftia, elles seraient classes par ordre de longueur dcroissante. Cela nest que tendanciellement vrai.
Dans le dtail, cette description ne tient pas : par exemple, la sourate 7 (al-Arf)
compte 204 versets alors que les trois sourates qui la prcdent en comptent
moins de 200. Elle est en outre suivie de la sourate 8 (al-Anfl) qui ne compte que
76 versets, alors que les quatre sourates suivantes (9, 10, 11 et 12) comptent toutes plus de 100 versets. On pourrait multiplier les exemples de ce genre, qui montrent que, stricto sensu, il est inexact de dire que les sourates du Coran sont
classes par ordre de longueur dcroissante.
Cela soulve, soit dit en passant, une question qui sort de lobjet de la prsente communication, mais qui a son importance, celle de savoir quel est le principe qui a prsid au classement des sourates du Coran tel quil nous est parvenu.
Deux hypothses au moins se proposent : la premire, assez superficielle, est quil
sagit dun classement visant optimiser les stratgies de mmorisation du texte.
La seconde, voque notamment par le grand compilateur de la culture arabe
traditionnelle que fut al-Suy (m. 1505), dans Asrr tartb al-Qurn ( Les secrets
du classement du Coran ), est que lanalyse thmatique interne des sourates
rvlerait un fil conducteur (voire plusieurs) conduisant dune sourate lautre
dans leur ordre de classement tel quil est attest. Cette dernire hypothse mriterait dtre explore systmatiquement.
En en-tte de chaque sourate on trouve, parfois, dans les versions lectroniques, et toujours dans les versions imprimes, une indication relative
lorigine, mecquoise ou mdinoise, de la sourate. Rappelons ce propos que le
Coran a t rvl au Prophte de lislam sur une dure de quelque 23 ans, et
quune partie de cette rvlation a t reue pendant quil rsidait La Mecque,
sa ville natale, et lautre Mdine o, partir de 622, il migre avec ses partisans
pour jeter les bases du futur tat islamique. Cest sur cette priodisation que se
fonde lindication de lorigine, mecquoise ou mdinoise, des sourates. Cette indication, qui donne une premire chronologie globale des sourates composant le
texte coranique, soulve bien sr la question du classement chronologique dtaill des sourates, cest--dire celle de lordre de succession exact des unes par rapport aux autres. Certains seront peut-tre surpris dapprendre que sur cette
question essentielle8, il ny a pas vraiment de consensus doctorum.
Par exemple, lun des textes les plus anciens relatifs la chronologie coranique, le Kitbu tanzli l-Qurn ( Livre de la rvlation du Coran ) dIbn ihb alZuhr (m. 741) indique que la Ftia aurait t rvle Mdine alors que presque
tous les auteurs postrieurs affirment quil sagit dune sourate mecquoise. Selon
est gnralement rfr comme srat al-Il, est connue sous une douzaine dautres
noms.
8. Cette question est essentielle, notamment dun point de vue juridique, dans la mesure
o certaines prescriptions coraniques ont t modifies au cours de la rvlation. Il importe donc de savoir laquelle des deux prescriptions diffrentes relatives au mme domaine (par exemple la consommation de vin) est chronologiquement la dernire et donc
celle dont le respect simpose.

63

al-Zuhr, le nombre des sourates rvles La Mecque est de 85 et celui des sourates mdinoises de 29, chiffres comparer avec ceux que donnait la docte
Sympathie dans le texte des Mille et une Nuits (supra) et qui reflte une position
traditionnelle courante. titre indicatif, voici la classification chronologique des
sourates selon al-Zuhr9 (le premier chiffre renvoie la classification conventionnelle, le second (aprs le slash) lordre chronologique selon al-Zuhr) :
Sourate mecquoises :
96/1;68/2;73/3;74/4;111/5;81/6;87/7;92/8;89/9;93/10;94/11;100/12;103/13;108/14;
102/15;107/16;109/17;105/18;113/19;114/20;112/21;53/22;80/23;97/24;91/25;85/26;
95/27;106/28;101/29;75/30;77/31;50/32;104/33;54/34;90/35;86/36;38/37;7/38;72/39;
36/40;25/41;35/42;19/43;20/44;56/45;26/46;27/47;28/48;17/49;10/50;11/51;12/52;
15/53;6/54;37/55;31/56;34/57;39/58;40/59;41/60;42/61;43/62;44/63;45/64;46/65;
51/66;88/67;18/68;16/69;71/70;14/71;21/72;23/73;32/74;52/75;67/76;69/77;70/78;
78/79;79/80;82/81;84/82;30/83;29/84;83/85;

Sourates mdinoises :
1/86;2/87;8/88;3/89;33/90;60/91;4/92;99/93;57/94;47/95;13/96;55/97;76/98;65/99;
98/100;59/101;110/102;24/103;22/104;63/105;58/106;49/107;66/108;62/109;64/110;
61/111;48/112;5/113;9/114.

Signalons quil existe une classification chronologique officielle dal-Azhar,


laquelle ne semble diffrer de celle dal-Zuhr que par la position accorde la
Ftia, considre comme mecquoise et cinquime sourate rvle. Dans le cadre
de cette classification, que nous adopterons dans les dcomptes prsents plus
loin, il y a 86 sourates mecquoises et 28 sourates mdinoises.
Certains arabisants occidentaux ont galement propos des classements
chronologiques des sourates du Coran en se fondant en partie sur les indications
fournies par les sources musulmanes traditionnelles et en partie sur la critique
textuelle interne du Coran. La tentative la plus marquante reste celle de Nldeke
poursuivie par Schwally. Voici, selon les mmes conventions de prsentation que
ci-dessus, la classification chronologique propose par Nldeke10 :
Sourate mecquoises :
96/1;74/2;111/3;106/4;108/5;104/6;107/7;102/8;105/9;92/10;90/11;94/12;93/13;97/14;86/15;
91/16;80/17;68/18;87/19;95/20;103/21;85/22;73/23;101/24;99/25;82/26;81/27;53/28;84/29;
100/30;79/31;77/32;78/33;88/34;89/35;75/36;83/37;69/38;51/39;52/40;56/41;70/42;55/43;112/44;10
9/45;113/46;114/47;1/48;54/49;37/50;71/51;76/52;44/53;50/54;20/55;26/56;15/57;19/58;38/59;36/6
0;43/61;72/62;67/63;23/64;21/65;25/66;17/67;27/68;18/69;32/70;41/71;45/72;16/73;30/74;
11/75;14/76;12/77;40/78;28/79;39/80;29/81;31/82;42/84;10/84;34/85;35/86;7/87;46/88;6/89;
13/90;

9. On pourra vrifier que, selon al-Zuhr, la Ftia est la 86e sourate rvle, et la premire
rvle Mdine. Signalons que, dans le texte publi dal-Zuhr auquel nous avons eu
accs, une erreur rend la classification chronologique inconsistante. Cette erreur rside
dans le fait que la sourate 7 (al-Arf) est classe en deux positions chronologiques diffrentes, car rfrence sous deux noms diffrents, alif-lm-mm-d dabord puis
al-Arf. Le reclassement systmatique que nous avons effectu montre quau lieu de alArf, dans la deuxime position, il faut lire al-Azb (sourate 33), moyennant quoi tout
rentre dans lordre.
10. On notera que pour Nldeke, la Ftia est bien mecquoise (48e sourate mecquoise), et
quil ny a que 24 sourates mdinoises.

64

Sourates mdinoises :
2/91;98/92;64/93;62/94;8/95;47/96;3/97;61/98;57/99;4/100;65/101;59/102;33/103;63/104;24/105;58
/106;22/107;48/108;66/109;60/110;110/111;49/112;9/113;5/114;

La distinction entre sourates mecquoises et sourates mdinoises a des manifestations textuelles que les analystes du texte coranique, anciens ou modernes, nont
pas manqu de souligner. La prose rime (sa) caractrise lensemble du texte
coranique et se manifeste par le fait que les formes pausales des fins de versets
dune mme sourate riment gnralement entre eux11. Mais ce phnomne
sexprime de faon beaucoup plus discrte dans les sourates mdinoises que dans
les sourates mecquoises, notamment en raison du fait que les sourates de la priode mdinoise sont en gnral plus longues que celles de la priode mecquoise,
et quen outre les versets y sont sensiblement plus longs. Les deux types de sourates prsentent galement un aspect stylistique et un contenu thmatique sensiblement diffrent :
les sourates mecquoises, en particulier les premires, ont souvent un
rythme rapide, saccad, et sont riches en performatifs (serments, menaces, interpellations). Avec le temps, le style en devient plus ample, plus imag, plus lyrique, mais les effets de rythme et de rime y restent toujours sensibles.
Globalement, le contenu thmatique des sourates mecquoises est nettement
orient vers des exhortations ladoption de la nouvelle foi, accompagnes
dvocations eschatologiques ou de rfrences des figures bibliques exemplaires ;
les sourates mdinoises prsentent des versets beaucoup plus amples, si
bien que les effets de la rime, toujours prsente en fin de verset, y sont nettement
plus discrets. Le style y devient plus dmonstratif et largumentation plus articule. Cest dans les sourates de cette priode que lon trouve les dveloppements
doctrinaux, juridiques et rglementaires qui vont servir de base lorganisation
de la socit musulmane. On y trouve aussi, cependant, de longs rcits difiants
reprenant et rinterprtant certains grands thmes des traditions monothistes
antrieures.
Au total, on se trouve, avec la structure gnrale du texte coranique dont
on vient desquisser la prsentation, et notamment avec la dichotomie sourates
mecquoises/sourates mdinoises, devant une dualit textuelle assez clairement
marque, mais dont les effets statistiques sont, dune certaine manire, neutraliss : les sourates mecquoises, gnralement moins longues mais aussi plus
nombreuses que les sourates mdinoises, lemportent finalement en couverture
textuelle . Les donnes statistiques suivantes illustrent cet tat de choses :

11. Il convient de noter que le type de rime dont fait usage le texte coranique, et que lon
appelle fila, se ralise sur les formes pausales des mots et est donc nettement diffrent
de la rime de la posie arabe classique, dite qfiya, qui se ralise sur les formes non pausales des mots.

65

Tableau des sourates mecquoises et mdinoises


Sourates Mk
Sourates Md
TOTAL

Nb. sourates % sourates Nb. versets % versets Nb. mots % mots


86
75 %
4 613
74 % 47 692 59 %
28
25 %
1 623
26 % 32 854 41 %
114
100 %
6 236
100 % 80 546 100 %

Dans le tableau ci-dessus comme dans les graphiques qui suivent, on a adopt les
abrviations suivantes : Nb = nombre ; Mk = mecquoises ; Md = mdinoises.

66

Pour clore le chapitre des gnralits sur le texte coranique et plus spcifiquement sur la version lectronique que nous avons soumise lanalyse, prcisons
que, par rapport certaines versions imprimes, cette version prsente deux
diffrences quil convient de souligner :
dune part, son orthographe est normalise et modernise , cest-dire quelle ne reproduit pas les variations orthographiques idiosyncrasiques que
certaines versions imprimes conservatrices exhibent et qui font que le mme
mot, par exemple le nom propre Ibrhm, peut apparatre sous plusieurs orthographes diffrentes ; de mme, lorthographe adopte pour un certain nombre de
mots, notamment ceux contenant une voyelle longue , que les graphies coraniques archaques pouvaient ignorer, sont systmatiquement rgularises conformment lorthographe arabe standard ;
dautre part, le texte lectronique, quoiquintgralement vocalis, ne
comporte pas les signes diacritiques vise spcifiquement orthopique, en particulier ceux qui rglementent les phnomnes dassimilation phontique et de
pause dans la lecture coranique traditionnelle12.

2. QUELQUES CARACT
CARACTRISTIQUES STATISTIQUES DU TEXTE
TEXTE CORANIQUE
Lanalyse13 dun corpus lectronique du texte coranique tel quil vient dtre caractris livre les rsultats statistiques rsums dans le tableau suivant :
Nombre de formes
Nombre doccurrences
Rapport occurrences/formes
Hapax legomena
Hapax dislegomena

17 503
77 874
4 449
10 899
2 694

Les occurrences sont les mots graphiques (squence de lettres spares par
deux sparateurs ). En arabe, langue agglutinante, il peut sagir de mots sim-

12. Sur ces signes dans le Coran de Fouad , voir Humbert (1980).
13. laide du logiciel danalyse de Corpus TACT, Lancashire et al. (1996).

67

ples ou de mots complexes14 constitus par un mot simple auquel sagglutinent


des prpositions ou conjonctions clitiques dune part, des pronoms clitiques
dautre part. Il y en a 77 874 dans le Coran analys ( comparer avec les rsultats
de la docte Sympathie ).
Les formes sont, en quelque sorte, les modles des occurrences, dcompts une seule fois, en sorte qu toutes les occurrences identiques est associe une seule forme. Le nombre des formes, ici 17 503, donne une ide du
vocabulaire total mobilis par le texte. Mais cette ide est imprcise et en
loccurrence trs survalue compte tenu de ce qui vient dtre dit sur la notion
doccurrence. Par exemple, les trois vocalisations syntaxiques dun mme nom
seront comptabilises comme trois formes diffrentes. De mme, toutes les formes cliticises dun mme mot. On comprend alors en quoi le nombre des formes
est une trs grosse survaluation du lexique rel dun texte, en tout cas en arabe.
Cependant, le rapport occurrences/formes donne une certaine ide de la
richesse lexicale dun texte, car tendanciellement, plus ce rapport est lev, plus
le taux de rptition dune mme forme est grand, et donc moins le texte est vari. En loccurrence, la valeur de ce rapport pour le Coran, proche de 4,5, est relativement leve, suggrant un assez fort taux de rptition. Nous verrons plus
loin que dautres indices confortent cette prdiction.
Les hapax legomena sont les mots graphiques qui napparaissent quune
seule fois dans le texte, ou si lon veut, les cas ou loccurrence est aussi la forme.
En principe, plus le taux dhapax legomena est lev, moins il y a de rptitions et
plus le texte est riche lexicalement. Le nombre dhapax legomena dans le Coran
est loin dtre ngligeable (prs de 11 000 formes sur 17 503). Mais cette valeur,
rapproche de celles qui prcdent, suggre paradoxalement que les formes restantes prsentent un taux de rptition dautant plus lev. En somme, le Coran
prsente prs de 11 000 formes qui napparaissent quune fois dans le texte, et
environ 6 500 formes ayant un taux de rptition gal ou suprieur 2. Les hapax dislegomena sont prcisment les mots graphiques qui napparaissent que
deux fois dans le texte.
Lexamen du texte laide dun logiciel de traitement de corpus permet
galement dtablir la liste des formes classe soit par ordre alphabtique, ce qui
est banal, soit par ordre frquentiel, ce qui est beaucoup plus clairant, et peut
notamment servir de point de dpart pour une exploration thmatique du texte.
Il ne saurait, bien sr, tre question de reproduire ici de telles listes, puisque les 17 503 formes du texte coranique, mme imprimes 100 lignes par page
(ce qui ne serait gure lisible), exigeraient 175 pages ! Nous nous contenterons
donc, pour en donner une petite ide, de reproduire les 37 premires lignes de la
liste frquentielle du texte coranique, et de faire dessus quelques commentaires
gnraux.

14. Sur cette notion et la structure des mots complexes, voir Kouloughli, 1994, chapitre 1.

68

Formes
Formes
(ordre lexicomtrique)
min
fiy
maa
ellaahi
laa
elxa@iyna
ellaahu
&alaY
ilxaa
walaa
wamaa
inxa
ellaaha
an
qaala
ilaY
man
lahum
in
yaa
cumxa
lakum
bihi
kaana
bimaa
qul
aw
@aalika
lahu
elxa@iy
huwa
hum
aamanuwe
qaaluwe
&an
fiyhaa
waman

Frquence
2 363
1 207
1056
828
816
810
734
669
662
658
645
607
591
539
416
404
402
373
357
350
337
336
327
323
296
293
280
280
275
268
265
260
253
250
244
240
240

Coran : liste des 37 premires formes les plus frquentes

69

Lexamen de la liste frquentielle15 permet, entre autres, les observations suivantes :


les formes les plus frquentes sont, typiquement, des mots grammaticaux (prpositions, conjonctions, relatifs, etc.). Cette proprit se retrouve dans
tout texte suffisamment long quel quen soit le sujet ou la langue ;
par contre, une caractristique tout fait frappante de la liste de formes
les plus frquentes du texte coranique est que le mot Allh (transcrit ici ellaah )
apparat avec une frquence exceptionnellement leve puisque, sous ses trois
formes flchies, il totalise 2 153 occurrences16, ce qui lui donne une frquence
doccurrence absolument unique pour une unit lexicale pleine ;
dautres mots pleins , noms ou verbes, apparaissent avec une frquence significativement leve dans cette liste, comme par exemple les noms
ar (terre) ou samwt (cieux) ou les verbes mana (croire) ou kafara (mcroire).
On voit certes, daprs leur smantisme, que les mots pleins frquence
doccurrence leve sont fortement thmatiques dans le texte coranique, et
que ceci peut expliquer cela. Mais nous allons voir, en explorant un autre paramtre statistique du texte, celui des segments rpts , que cette frquence
leve peut en partie sexpliquer par une autre proprit du texte coranique : son
taux lev de rptitions.
On entend par segment rpt (dsormais SR) toute suite de formes (au
sens dfini plus haut) dont la frquence est gale ou suprieure 2 dans un texte.
Le logiciel Lexico3 est dot dune fonctionnalit permettant de reprer et de
comptabiliser tous les segments rpts dun texte. Lexcution de cette fonctionnalit sur le corpus coranique rvle des proprits assez remarquables de ce
point de vue. En effet, ct de SR que lon peut considrer comme correspondant simplement des (fragments de) structures syntagmatiques de la langue
comme par exemple min badi ( aprs , 80 occurrences) ou al kulli ( sur tout ,
55 occurrences), on trouve des SR qui sont incontestablement lis au contenu
thmatique du texte comme allana man ( ceux qui ont cru , 184 occurrences) ou walahum abun almun ( et pour eux un chtiment douloureux ,
12 occurrences).
Ces SR sont de longueur variable, constitus de groupes pouvant aller jusqu 11 mots comme, par exemple, ill allana tb min badi lika waala
fainna allha gafrun ramun ( sauf ceux qui se repentiront ensuite et se rformeront car en effet Dieu est Pardonneur et Misricordieux , 2 occurrences). Les
SR les plus longs (longueur comprise entre 8 et 11) nont en gnral que des fr15. Cette liste a t produite par le logiciel de traitement de corpus Lexico3 (Andr Salem
et al.), partir dune version du texte coranique ayant subi une transcription phonographmatique , cest--dire une transcription qui respecte les conventions orthographiques de larabe. La lecture du texte transcrit ne devrait pas savrer trop difficile mme
pour le lecteur qui ne connat pas le dtail du systme.
16. Auxquelles il faudrait ajouter les formes cliticises comme waellaahu ou biellaahi, formes trs frquentes et qui viennent encore grossir le nombre total doccurrences du nom
divin dans le Coran.

70

quences doccurrence modestes17 (gnralement comprises entre 2 et 4). Mais


partir de la longueur 7 on peut trouver des frquences de 9, et la longueur 6 la
frquence peut approcher la vingtaine ! Et surtout, le nombre de ces SR est trs
important : souvent plusieurs dizaines pour chaque ordre de longueur !
Ces proprits du texte coranique que constituent le nombre, la longueur
et la frquence doccurrence de SR est sans doute rapporter son statut originel
de texte oral. En effet, nombre de ces SR sont, mutatis mutandis, les quivalents
des formules que les chercheurs ont mises en vidence dans la posie ancienne18. Cette proprit du texte coranique na en tout cas pas chapp aux
commentateurs anciens et modernes qui lui ont parfois consacr des tudes spcifiques19.

3. QUELQUES CARACT
CARACTRISTIQUES LEXICOGRAPHIQ
LEXICOGRAPHIQUES
EXICOGRAPHIQUES DU TEXTE CORANIQUE
Nous terminerons cette brve prsentation de donnes lexico-statistiques relatives au texte coranique par un examen plus spcifique de son lexique.
On sait que, dans le cas gnral, tout mot arabe sanalyse en une racine de
trois radicales consonantiques ou plus et en un schme constitu de voyelles et
ventuellement de consonnes se prfixant, sinfixant ou se suffixant sur les radicales constituant la racine.
On peut souhaiter, pour les besoins de la procdure de traitement statistique, faire en sorte que toute unit lexicale, mme si elle nest pas stricto sensu
analysable en racine et schme (cest le cas des particules de la grammaire
arabe traditionnelle), puisse se voir associer une pseudo-racine conventionnelle. Cette pseudo-racine pourrait tre constitue des consonnes qui forment
lunit considre : ainsi, la particule f, graphie  et transcrite phonographmatiquement fiy, se verrait associer la pseudo-racine conventionnelle
<fy>. Si en outre on poussait un peu plus loin ce principe, on conviendrait que les
lettres mystrieuses , qui occurrent linitiale de certaines sourates, et qui
sont gnralement dcomptes comme constituant en elles-mmes un verset
coranique, que ces lettres donc ont le statut de formes du lexique coranique, et
doivent ce titre se voir associer une pseudo-racine conventionnelle. Ainsi, la
lettre qui occurre comme la premire forme du premier verset de la sourate
du mme nom (sourate 50) se verra associer la pseudo-racine <q>. videmment
cela conduit admettre lexistence de pseudo-racines biconsonantiques et mme
monoconsonantiques.
Si lon adopte les conventions ci-dessus et que lon se livre, sur cette base,
lanalyse morphologique de lensemble du corpus coranique, on aboutit aux r-

17. Mais un SR de longueur 10 a, dans le Coran, une frquence de 6 ! Il sagit du SR qla y


qawm bud llha m lakum min ilhin ayruhu ( mon peuple adorez Dieu, vous navez
pas dautre dieu que lui ).
18. Voir par exemple Monroe (1972).
19. Par exemple, Muammad Ibn amza al-Kirmn (m. 1111), Asrr al-takrr f l-Qurn.

71

sultats suivants : le corpus coranique compte 1 767 racines et pseudo-racines


ainsi ventiles :
Pseudo-racines monoconsonantiques
Pseudo-racines biconsonantiques
Racines (ou pseudo-racines20) triconsonantiques
Racines (ou pseudo-racines) quadriconsonantiques
Racines (ou pseudo-racines) pentaconsonantiques
Racines (ou pseudo-racines) hexaconsonantiques
Racines (ou pseudo-racines) de 7 consonnes21
Racines (ou pseudo-racines) de longueur suprieure 7

4
33
1 637
65
22
3
3
0

En ce qui concerne le nombre de formes auxquelles ces racines22 donnent naissance, voici quelques valeurs significatives :
503 racines ne sont associes qu une seule forme.
245 racines ne fournissent que 2 formes.
145 racines ne fournissent que 3 formes.
100 racines fournissent 4 formes.
101 racines fournissent 5 formes.
57 racines fournissent 6 formes.
52 racines fournissent 7 formes.
47 racines fournissent 8 formes.
51 racines fournissent 9 formes.
27 racines fournissent 10 formes.

15 racines fournissent plus de 100 formes.

La racine <ty>, la plus productive, fournit 227 formes.


En ce qui concerne le nombre doccurrences : 413 racines ne fournissent quune
seule occurrence (et bien sr, quune seule forme).
213 racines ne fournissent que 2 occurrences (de 1 ou 2 formes).
125 racines fournissent 3 occurrences (de 1 3 formes).
95 racines fournissent 4 occurrences (de 1 4 formes).
89 racines fournissent 5 occurrences (de 1 5 formes).
55 racines fournissent 6 occurrences (de 1 6 formes).
36 racines fournissent 7 occurrences (de 1 7 formes).
29 racines fournissent 8 occurrences (de 1 8 formes).
39 racines fournissent 9 occurrences (de 1 9 formes).
29 racines fournissent 10 occurrences (de 1 10 formes).

10 racines fournissent plus de 1000 occurrences.

La racine <qwl> fournit 1 722 occurrences pour 120 formes.


20. Il faut prvoir lexistence de pseudo-racines de trois consonnes ou plus car certaines
squences de lettres mystrieuses ont des longueurs suprieures 2 : cest le cas par
exemple du premier verset de la sourate 2 (longueur 3) ou de celui de la sourate 7 (longueur 4).
21. Il sagit, on laura peut-tre devin, des pseudo-racines associes aux noms propres
ibrhm, isrl et isml.
22. Ou pseudo-racines. Cette prcision sera sous-entendue dans la suite.

72

La racine (ou pseudo-racine) la plus riche en occurrences est <n>, associe aux
formes nombreuses et diverses des particules inna, anna, an, in et qui fournit
4 037 occurrences. Elle est suivie de la pseudo-racine <mn>, associe aux formes
min et man et qui fournit 3 099 occurrences. Vient ensuite la racine <lh>, associe
aux diverses formes du nom divin et qui fournit 2 851 occurrences.
Signalons en passant que sur les 1 767 racines et assimiles dcomptes
dans le Coran, 1 200 fournissent des formes verbales. Sur ces 1 200 racines, 15
sont quadriconsonantiques, et toutes les autres triconsonantiques23.

lments de bibliographie
Sources anciennes
Al-Qurn al-karm, Le Caire, 1923.
Ab Amr al-Dn (m. 1052), Al-Muqni f rasmi maifi al-amri, Le Caire, Maktabat alKulliyyt al-azhariyya, 1978.
Ibn Muhid (m. 936), Kitb al-saba f l-qirt, Le Caire, Dr al-Marif, 1979.
Muammad Ibn amza al-Kirmn (m. 1111), Asrr al-takrr f l-Qurn, Le Caire, Dr alfala, 1977.
all al-Dn al-Suy (m. 1505), Asrr tartb al-Qurn, Le Caire, al-Maktaba al-ariyya li-liba wa-l-nar, 2003.
Ibn ihb al-Zuhr (m. 741), Kitbu tanzli l-Qurn, Beyrouth, Dr al-kitb al-jadd, 1980.

Sources modernes
BLACHRE R., 1958, Introduction au Coran, Paris, Maisonneuve et Larose.
CHOUMI M., 1966, Le verbe dans le Coran, Paris, Klincksieck.
DROCHE F., 2005, Le Coran, Paris, PUF (Que sais-je ?).
HUMBERT G., 1980, Essai dinterprtation linguistique des conventions orthographiques
du Coran (dition gyptienne) , mmoire de matrise (non publi), Universit
Paris 8.
KOULOUGHLI D. E., 1982, Sur la phonographmatique arabe, Analyses/thorie, n 1, p. 79-151.
1994, Grammaire de larabe daujourdhui, Paris, Presse Pocket.
LANCASHIRE I. et al., 1996, Using TACT with electronic texts, New York, The Modern Language
Association of America.
MARDRUS J.-C. (traducteur), 1899, Les Mille et une Nuits, Paris, Laffont.
MONROE J. T., 1972, Oral composition in pre-islamic poetry , Journal of Arabic Literature,
vol. III, p. 1-54.
NLDEKE T. et Schwally F., 1909/1919/1926, Geschichte des Qorans, Leipzig, Dieterich'sche
Verlagsbuchhandlung. Traduction arabe : Tr al-Qurn, 2004, Beyrouth, KonradAdenauer Stiftung.
SALEM A. et al., 2005, Lexico3, quipe CLA2T, Universit Paris 3.

23. Pour une tude dtaille des racines verbales du Coran, voir Choumi (1966).

73

Vous aimerez peut-être aussi