Vous êtes sur la page 1sur 23
L'année psychologique 640 homophones et leurs caractéristiques Ludovic Ferrand Citer ce document / Cite this

Citer ce document / Cite this document :

Ferrand Ludovic. 640 homophones et leurs caractéristiques. In: L'année psychologique. 1999 vol. 99, n°4. pp. 687-708;

Fichier pdf généré le 19/04/2018

https://www.persee.fr/doc/psy_0003-5033_1999_num_99_4_28503 Fichier pdf généré le 19/04/2018

L'Année psychologique, 1999, 99, 687-708

NOTE MÉTHODOLOGIQUE

Laboratoire de Psychologie expérimentale CNRS URA 316, EPHE, Université René-Descartes, Paris F1

640 HOMOPHONES

ET LEURS CARACTÉRISTIQUES

par Ludovic FERRAND

SUMMARY : 640 French homophones and their characteristics.

Homophones have interesting linguistic properties that make them useful

in many experiments involving language.

This paper presents a

set

of

640 homophones and their statistical properties. Statistics include word frequency, number of orthographic neighbors, and bigram frequency. Also, we provide the phonological form and the syntactic category for each homophone.

Key words : homophones, norms, word recognition.

INTRODUCTION

Les homophones se définissent comme des mots se prononçant exactement de la même façon mais qui ne partagent pas la même orthographe et la même signification (par ex. SOT, SEAU, SAUT, SCEAU). Les homophones ne doivent pas être confondus avec les homographes, qui correspondent à des mots partageant la même orthographe mais ayant plusieurs sens (par ex. LOUER un appartement, et LOUER un dieu). La plupart du temps, les homographes sont homophones (c'est-à-dire qu'ils se prononcent de la même façon), mais certains homographes sont parfois

688

Ludovic Ferrand

hétérophones (par ex. un fils /fis/ et des fils /fil/). Contrairement à l'intuition, les homophones ne constituent pas une classe obscure d'items linguistiques. Au contraire, les homophones sont intéressants de par leur abondance en français (environ 1 200 en comptant les formes verbales1 ; Bertrand, 1990). Par ailleurs, ils constituent un défi aux modèles de l'identification des mots écrits, ainsi qu'aux modèles de prononciation (Grainger et Ferrand, 1994, 1996). Les homophones sont largement utilisés en Psycholinguistique, que ce soit pour l'étude de l'accès au lexique dans la reconnaissance visuelle des mots (Ferrand, 1995 ; Ferrand et Grainger, 1996 ; Grainger et Ferrand, 1994 ; McRae, Jared, et Seidenberg, 1990 ; Rubenstein, Lewis, et Rubenstein,

1971 ;

Van

Orden, 1987) ou au cours

de la production de la

parole (Dell, 1988 ; Ferrand, 1997 ; Ferrand, Segui, et Grainger,

1995 ; Ferrand,

Humphreys, et Segui,

1998 ; Jescheniak et

Levelt, 1994). En anglais, il existe déjà plusieurs recueils d'homophones (voir en particulier Whitford, 1966, et Ferreira et Cutting,

1997)2.

En français, il n'existe aucune norme de fréquence publiée pour les homophones. Nous pensons que nos tables seront utiles pour les chercheurs qui désirent utiliser des homophones. Nous reportons les caractéristiques de 640 homophones.

METHODE

Le corpus de mots utilisés est la base de données informatisée Brulex développée par Content, Mousty, et Radeau (1990). Bru- lex contient 35 746 entrées lexicales ; ce corpus a été créé en 1986 en sélectionnant la majeure partie des mots listés dans le Dictionnaire Micro-Robert (Robert, 1986). Les noms propres et les affixes sont exclus. Les verbes sont représentés sous leur forme infinitive seulement. La forme féminine des noms et des

1. Les 1 200 homophones répertoriés par Bertrand (1990) comprennent les

formes verbales. Nous avons décidé de ne pas inclure ces formes verbales dans notre article, car ces dernières ne sont pas disponibles dans Brulex.

2. Voir également sur Internet : http://dasparc.cogsci.uiuc.edu/~jcut-

ting/homophones.html, ainsi que : http://www.finifter.com/tracy/homo- nym.html.

640 homophones et leurs caractéristiques

689

adjectifs est représentée séparément. Pour chaque mot, une information différente est disponible, comme la forme orthographique, la forme phonologique, la classe grammaticale, la fréquence d'occurrence, la valeur d'imagerie, le nombre de lettres, de phonèmes, de syllabes, d'homographes, d'homophones et de sens. Les fréquences d'occurrences dans Brulex sont extraites du corpus du Trésor de la langue française (Imbs, 1971). Ce corpus contient 23,5 millions de mots sélectionnés parmi une large gamme de livres publiés entre 1919 et 1964 (il s'agit de romans, d'essais, de recueils de poèmes et œuvres dramatiques). Nous n'avons retenu que les caractéristiques suivantes : la forme phonologique (d'après Warnant, 1987), la catégorie grammaticale, la fréquence d'occurrences, le nombre de voisins orthographiques, ainsi que la fréquence des digrammes. Les

caractéristiques des 640 homophones sont présentées dans le tableau I. Dans le tableau II, nous présentons la liste des abréviations concernant la catégorie grammaticale. La fréquence d'occurrences introduites dans ces tables est reprise des tables publiées par le Centre de recherche pour un trésor de la langue française (Imbs, 1971). Elle représente le nombre d'occurrences d'un mot rapporté à un total de 100 millions. Selon la définition établie par Coltheart, Davelaar, Jonas- son, et Besner (1977), les voisins orthographiques d'un mot donné correspondent à tous les mots de même longueur qui diffèrent par une lettre seulement, toutes les lettres communes

restant aux mêmes positions (par ex. le mot

orthographiques LAC, SAC, BEC, BIC, BAR, BAL, etc.). Les fréquences des digrammes correspondent aux moyennes des logarithmes décimaux des fréquences textuelles de tous les digrammes constituant le mot (voir Content et Radeau, 1988). Cette mesure donne une indication du degré de régularité séquentielle de la forme orthographique.

BAC a pour voisins

690

Ludovic Ferrand

TABLEAU I. — Normes pour 640 homophones

Norms for 640 homophones

Forme Orthographique

Forme Phonologique

Catégorie

Fréquence

N

Digrammes

aile

/El/

n.f.

6883

11

3.01

elle

/el/

pronom

693928

1

3.23

ailé

/de/

adj.

531

2

2.39

héler

/•ele/

V.

361

2

2.64

aine

/en/

n.f.

123

7

3.03

haine

/W

n.f.

8202

5

3.04

air

/er/

n.

m.

58360

2

3.12

aire

/er/

n.

f.

999

12

3.18

ère

/er/

n.

f.

884

2

1.97

hère

/•er/

n.

m.

59

3

1.31

haleine

/alen/

n.f.

2352

1

2.84

alêne

/alen/

n.f.

 

allée

/aie/

n.f.

4688

1

2.56

aller

/aie/

V.

216341

0

3.15

haler

/aie/

V.

170

5

2.97

allô

/alo/

interj.

1

2.16

halo

/"alo/

n.

m.

608

2

1.92

amande

/amând/

n.f.

404

2

3.03

amende

/amând/

n.f.

378

2

3.12

amen

/amen/

n.

m.

272

2

2.90

amène

/amen/

adj.

38

2

1.48

an

/a/

n.

m.

52855

6

4.61

en

/a/

prép.

5

6.64

en

/à/

pron.

5

6.64

ancre

/ânkr/

n.f.

612

3

2.87

encre

/ânkr/

n.f.

1825

2

3.10

antre

/ântr/

n.

m.

280

4

3.22

entre

/ântr/

prép.

93254

2

3.45

appas

/apa/

n.

m.

0

2.61

appât

/apa/

n.

m.

399

0

1.37

apprêt

/âpre/

n.

m.

246

0

2.24

après

/âpre/

prép.

90085

1

1.30

après

/âpre/

adv.

1

1.30

art

/ar/

n.

m.

24585

2

2.59

are

/ar/

n.

m.

216

7

3.25

arrhes

/ar/

n.f.

25

0

2.25

(') Fréquence (d'après Brulex) ; N (nombre de voisins orthographiques) — (fréquence non répertoriée dans Brulex).

640 homophones et leurs caractéristiques

Tableau I (suite)

691

Forme Orthographique

Forme Phonologique

Catégorie

Fréquence

Digrammes

eau

loi

n.

f.

36625

2.31

haut

l'ol

adj.

2.56

haut

l'ol

n.

41539

2.56

os

loi

n.

m.

3050

3.34

ho!

l'ol

interj.

23581

4.05

oh!

loi

interj.

0.00

au, aux

loi

art.

0.00

ô

loi

interj.

 

0.00

hôtel

/otel/

n.

m.

12954

0

2.19

autel

/otel/

n.

m.

2220

0

2.91

auteur

/otœr/

n.

m.

11912

4

3.12

hauteur

/otcer/

n.f.

6704

1

2.88

bas

/ba/

adj.

-

15

2.70

/ba/

n.

m.

21122

15

2.70

/ba/

n.

m.

72

3

0.80

bah!

/ba/

interi.

1208

6

1.41

balle

/bal/

n.f.

3799

8

2.96

bal

/bal/

n.

m.

1859

12

2.50

balade

/balad/

n.

f.

85

2

2.72

ballade

/balad/

n.

f.

199

0

2.79

balai

/baie/

n.

m.

723

0

2.42

ballet

/baie/

n.

m.

782

3

2.93

banc

/bâV

n.

m.

4786

0

2.62

ban

/bä/

n.

m.

242

10

2.27

bar

/bar/

n.

m.

2173

8

2.58

barre

/bar/

n.f.

2225

6

2.95

basilique

/bazilik/

n.f.

293

0

2.77

basilic

/bazilik/

n.

m.

76

0

2.43

beau

Ibol

adj.

3

2.59

beau

Ibol

n.

74063

3

2.59

baud

Ibol

n.

m.

bot

Ibol

adj.

25

14

2.34

baux

Ibol

n.

m.

246

3

2.57

bon

Ibol

adj.

-

15

3.06

bon

Ibôl

n.

m.

53493

15

3.06

bond

Ibol

n. m.

2365

5

2.83

bouchée

/buje/

n.f.

608

1

2.58

boucher

/buje/

n.

m.

957

6

2.93

boucher

/buje/

V.

846

6

2.93

692

Tableau I (suite)

Ludovic Ferrand

Forme Orthographique

Forme Phonologique

Catégorie

Fréquence

N

Digrammes

boue

/bu/

n.f.

3267

10

3.23

bout

/bu/

n.

m.

26542

5

2.98

boulot

/bulo/

adj.

3

2.72

boulot

/bulo/

n.

850

3

2.72

bouleau

/bulo/

n.

m.

484

1

2.86

bourrer

/bure/

V.

697

2

3.09

bourrée

/bure/

n.f.

127

3

2.78

boxe

/boks/

n.f.

319

3

1.63

box

/boks/

n.

m.

106

7

1.30

brie

/bri/

n.

m.

46

4

2.71

bris

/bri/

n.

m.

21

9

2.85

sa

/sa/

adj.

340691

11

5.66

ça

/sa/

pron.

106907

9

4.16

cahot

/kao/

n.

m.

276

5

2.03

chaos

/kao/

n.

m.

1527

0

2.07

camp

quand

/kâ/

n.

m.

5598

2

2.18

/kâ/

conj.

139737

1

3.01

quand

/kâ/

adv.

1

3.01

quant

/kâ/

loc. prép.

12550

5

3.21

canot

/kano/

n.

m.

684

7

2.59

canaux

/kano/

n.

m.

2488

1

2.80

canne

/kan/

n.f.

1667

6

3.08

cane

/kan/

n.f.

119

10

3.22

cape

/kap/

n.

f.

777

11

2.35

cap

/kap/

n.

m.

782

4

1.75

car

/kar/

n.

m.

80577

6

2.76

car

/kar/

conj.

6

2.76

quart

/kar/

n.

m.

5909

1

2.89

se

/sa/

pron.

1184231

10

6.69

ce

/sa/

pron.

755650

8

6.81

ce

/sa/

adj.

490873

8

6.81

celle

/sel/

pron.

59122

6

3.24

selle

/sel/

n.f.

795

6

3.23

sel

/sel/

n.

m.

2054

7

3.00

scène

/sen/

n.f.

13601

0

1.35

saine

/sen/

adj.

2748

6

3.22

cent

/sa/

n.

21531

5

3.45

sang

sans

/sa)

n.

m.

17685

4

2.77

/sa/

prép.

248436

4

3.21

640 homophones et leurs caractéristiques

693

Tableau I (suite)

Forme Orthographique

cèpe

cep

cerf

serre

ces

ses

cession

session

cette

sept

set

chaîne

chêne

chair

chaire

cher

chère

chambrer

chambrée

champ

chant

chat

chas

chaud

chaud

chaux

chique

chic

chic

chlore

clore

choeur

coeur

chute

chut

chut!

cire

sire

Forme Phonologique

Catégorie

Fréquence

N

Digrammes

/sep/

n.

m.

123

2

0.70

/sep/

n.

m.

404

4

1.86

/ser/

n.

m.

382

2

2.37

/s er/

n.

f.

774

5

3.21

/se/

adj.

218642

5

3.33

/se/

adj.

274208

8

3.31

/sesjà/

n.

f.

131

1

3.08

/sesjô/

n.

f.

131

1

3.07

/set/

adj.

327239

5

3.04

/set/

n.

8887

0

2.29

/set/

n.

m.

29

8

3.42

/Jen/

n.f.

4050

0

2.54

/Jen/

n.

m.

2807

0

1.99

/Jer/

n.f.

10886

3.11

/Jer/

n.f.

965

3.15

/Jer/

adj.

18723

3.14

/Jer/

5445

1.73

/Jâbre/

V.

51

0

2.78

/Jâbre/

n.f.

259

0

2.52

/Ja/

n.

m.

14468

0

2.32

/ja/

n.

m.

6785

1

3.09

/Ja/

n.

m.

4326

4

2.54

/Ja/

n.

m.

25

3

2.84

/Jo/

adj.

2

2.33

/Jo/

adv.

2

2.33

/Jo/

n.f.

859

2

2.71

/Jik/

n.f.

199

5

2.80

/Jik/

n.

m.

1008

2

2.15

/Jik/

adj.

2

2.15

/klor/

n.

m.

42

1

2.59

/kbr/

V.

497

2

2.93

/kœr/

n.

m.

2607

0

2.73

/koer/

n.

m.

60462

1

2.95

/Jyt/

n.

m.

4028

0

2.67

/Jyt/

n.

m.

/Jyt/

interj .

646

1

2.51

/sir/

n.f.

1255

11

3.09

/sir/

n. m.

842

12

3.28

694

Tableau I (suite)

Ludovic Ferrand

Forme Orthographique

Forme Phonologique

Catégorie

Fréquence

N

Digrammes

cité

/site/

n.f.

5066

5

2.71

citer

/site/

V.

4722

3

3.03

claque

/klak/

n.

f.

557

6

2.62

clac!

/klak/

interj .

119

3

2.00

clair

/kler/

n.

m.

137741

4

2.92

clair, e

/kler/

adj.

4

2.92

clerc

/kler/

n.

m.

1952

0

2.29

close

/kloz/

adj.

5194

4

2.65

clause

/kloz/

n.f.

467

1

2.64

clique

/klak/

n.f.

161

4

2.76

clic!

/klak/

interj.

 

coi

/kwa/

adj.

229

12

3.06

quoi

/kwa/

pron.

54166

1

2.75

quoi!

/kwa/

interj.

 

coin

/kwë/

n.

m.

12941

4

3.27

coing

coq

coque

/kwê/

n.

m.

68

1

2.92

/kok/

n.

m.

1842

5

1.94

/kok/

n.f.

863

4

2.86

coke

/kok/

n.

m.

46

3

1.13

col

/kol/

n.

m.

3773

14

2.46

colle

/kol/

n.f.

348

4

3.18

collet

/kole/

n.

m.

527

3

3.11

colley

/kole/

n.

m.

content

/kôtâv

adj.

8423

3.28

content

/kôtâ/

n.

m.

-

comptant

/kôtâ/

n.

m.

608

2.97

comptant

/kôtâ/

adv.

-

2.97

conte

/kôt/

n.

m.

2390

11

3.22

comte

/kôt/

n.

m.

4403

7

2.60

compte

/kôt/

n.

m.

22079

1

2.87

conter

/kôte/

V.

1735

3

3.32

comté

/kôte/

n.

m.

336

2

2.53

compter

/kôte/

V.

18276

2

3.01

conteur

/kôtœr/

n. m.

280

2

3.22

compteur

/kôtœr/

n.

m.

195

1

2.97

contrée

/kôtre/

n.f.

1965

1

3.03

contrer

/kôtre/

V.

119

3

3.33

640 homophones et leurs caractéristiques

695

Tableau I (suite)

Forme Orthographique

coolie

coulis

coulis

cor

corps

cornée

corné

corner

cote

cotte

cou

coup

coût

couper

coupé

cour

cours

court

court

couver

couvée

crack

crac!

krach

cric

crique

croiser

croisé

croisée

cru

cru

crue

cuir

cuire

curé

curer

curée

Forme Phonologique

Catégorie

Fréquence

N

Digrammes

/kuli/

n.

m.

195

0

2.43

/kuli/

n.

m.

38

1

3.10

/kuli/

adj.

1

3.10

/kor/

n.

m.

706

7

2.55

/kor/

n.

m.

54417

0

2.65

/korne/

n.f.

123

7

2.68

/korne/

adj.

46

5

2.68

/korne/

V.

6

3.04

/kat/

n.f.

421

8

2.98

/kot/

n.f.

208

11

2.93

/ku/

n.

m.

6670

11

2.97

/ku/

n.

m.

62653

2

3.02

/ku/

n.

m.

1650

5

2.16

/kupe/

V.

6066

4

3.08

/kupe/

n.

m.

3037

2

2.61

/kur/

n.

f.

11193

3.45

/kur/

n.

m.

14719

3.17

/kur/

n.

m.

11567

3.14

/kur/

adj.

3.14

/kuve/

V.

787

2

3.30

/kuve/

263

4

2.75

/krak/

n.

m.

21

0

2.15

/krak/

interj.

76

7

2.30

/krak/

n.

m.

0

1.51

/krik/

n.

m.

76

5

2.33

/krik/

n.f.

170

6

2.91

/krwaze/

V.

2995

0

3.12

/krwaze/

adj.

1710

0

2.82

/krwaze/

n. f.

757

0

2.75

/kry/

n.

m.

1619

4

1.84

/kry/

adj.

1169

2

2.73

/kry/

n.f.

221

2

2.73

/kyir/

n.

m.

2926

2

2.77

/kyir/

V.

914

3

2.91

/kyre/

n.

m.

6704

3

2.35

/kyre/

V.

370

6

2.94

/kyre/

n.f.

680

7

2.49

696

Tableau I (suite)

Ludovic Ferrand

Forme Orthographique

Forme Phonologique

Catégorie

Fréquence

N

Digrammes

cygne

/siji/

n.

m.

821

1

1.82

signe

/siji/

n.

m.

19778

4

2.79

dans

/da/

prép.

838996

2

3.18

dent

/da/

n.f.

8466

5

3.62

danse

/das/

n.

f.

4228

3

3.11

dense

/das/

adj.

1280

1

3.35

date

/dat/

n.f.

5211

4

3.02

datte

/dat/

n.

f.

165

6

2.95

/de/

n.

m.

10

7.75

des

/de/

art.

1063000

4

3.58

descente

/desät/

n.f.

1561

0

3.01

décente

/desät/

adj.

595

4

2.92

déférer

/defere/

V.

59

1

2.68

déferrer

/defere/

V.

0

2

3.16

défiler

/defile/

V.

1518

0

2.82

défilé

/defile/

n.

m.

1059

0

2.38

desceller

/desele/

V.

29

1

3.31

desseller

/desele/

V.

0

2

3.16

dessin

/des!/

n.

m.

4883

1

3.10

dessein

/desê/

n.

m.

3322

0

3.00

détoner

/détone/

V.

42

0

2.89

détonner

/détone/

V.

89

0

2.86

différent

/diferâ/

adj.

17234

1

2.73

différend

/diferä/

n.

m.

238

1

2.62

do

/do/

n.

m.

323

5

3.29

dos

/do/

n.

m.

10823

7

2.35

dom

/dö/

n.

m.

212

6

2.24

don

/dô/

n.

m.

6645

11

3.17

dont

/dô/

pron.

130616

5

3.18

du

/dy/

art.

717556

10

5.90

/dy/

n.

m.

22467

3

2.83

hanter

/'ante/

V.

1289

2

3.15

hanté, e

/'ante/

adj.

hêtre

/etr/

n.

m.

446

0

2.41

être

/etr/

n. m.

2593105

1

3.61

être

/Etr/

V.

1

3.61

oeufs

I0I

n.

m.

3488

0

1.76

eux

I0I

pr.

60883

1

2.38

640 homophones et leurs caractéristiques

Tableau I (suite)

697

Forme Orthographique

Forme Phonologique

Catégorie

Fréquence

N

Digrammes

express

/ekspres/

n.

m.

425

0

2.21

expresse

/ekspres/

adj.

 

faim

/fè/

n.f.

5768

3

2.40

fin

/fë/

adj.

5

2.71

fin

/fè/

n.f.

36956

5

2.71

faire

/fer/

V.

410087

6

3.33

fer

/fer/

n.

m.

10184

7

3.09

fard

/far/

n.

m.

591

4

2.82

phare

/far/

n.

m.

1293

1

2.85

far

/far/

n.

m.

fausse

/fos/

adj.

14473

2

2.90

fosse

/fos/

n.f.

1080

6

2.90

fil

/fil/

n.

m.

4756

7

2.91

file

/fil/

n.f.

1523

10

2.99

filtre

/filtr/

n.

m.

148

0

2.89

philtre

/filtr/

n.

m.

144

0

2.67

flan

/fia/

n.

m.

93

5

2.27

flanc

/fia/

n.

m.

3794

2

2.53

foc

/fok/

n.

m.

59

8

1.91

phoque

/fok/

n.

m.

289

0

2.46

foi

/fwa/

n.f.

15987

11

2.74

foie

/fwa/

n.

m.

1191

5

2.99

fois

/fwa/

n.f.

100100

6

3.12

for

/for/

n.

m.

872

8

2.22

fors

/for/

prép.

93

7

2.84

fort

/for/

n.

m.

47010

6

2.79

fort

/for/

adj.

-

6

2.79

fort

/for/

adv.

6

2.79

forêt

/fore/

n.f.

7823

1

2.33

foret

/fore/

n.

m.

4

5

3.07

fourré

/fure/

n.

m.

370

1

2.79

fourrer

/fure/

V.

774

1

3.11

fumée

/fyme/

n.f.

5743

3

2.11

fumer

/fyme/

V.

4160

3

2.73

gué

/ge/

n.

m.

272

2

1.82

gai

/ge/

adj.

3480

7

2.09

galon

/galôV

n.

m.

667

5

2.79

gallon

/galôV

n.

m.

8

4

2.85

698

Ludovic Ferrand

Tableau I (suite)

Forme Orthographique

gaz

gaze

geai

jais

jet

gêne</